您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. TicTacToe:井字游戏,旨在用于通过强化学习(DQN)训练深度神经网络。 它也可以由2个人玩,并具有硬编码的AI,该AI永不松动,如果您不对其进行完美的游戏,则将获胜。-源码

  2. 深度Q学习井字游戏 该程序实现了一个PyGame TicTacToe,该游戏可以由两个人玩,一个人对一个算法AI,一个人对一个通过对付算法AI训练的神经网络。 训练算法使用Deep Mind的DQN建议: 重播经验记忆已实现,上限为250,000次 每轮训练都使用来自重播记忆库的大量随机经验 使用辅助神经网络来计算未来的Q值,然后每10场游戏用主网络的权重对其进行更新。 有关更多信息: :
  3. 所属分类:其它

    • 发布日期:2021-03-10
    • 文件大小:3145728
    • 提供者:weixin_42181693