您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. TicTacToe_game-源码

  2. 我制作的井字游戏的图形版本! 可以通过强化学习训练与完美的AI(玩家1或2)对抗。 如果您想了解更多有关如何训练/自己训练的详细信息,请参阅我的其他仓库“ TicTacToe” 也可以玩人与人。 使用pygame制作,纯在python中。 只需运行main.py文件。 您需要安装pygame,就是这样。 注意:我无法上传exe文件,因为它太大(45mb)无法在此处上传。 对不起。
  3. 所属分类:其它

    • 发布日期:2021-03-15
    • 文件大小:835584
    • 提供者:weixin_42099302
  1. Numerical_TicTacToe_Agent_using_Reinforcement_Learning:建立一个学习弹奏数字井字游戏的RL(强化学习)代理。 代理通过Q-Learning学习游戏-源码

  2. 数值_井字棋_代理_使用_强化_学习 建立一个学习弹奏数字井字游戏的RL(强化学习)代理。 代理通过Q-Learning学习游戏。 游戏( 是最受欢迎和持久的游戏之一。 由于它的熟悉性,该游戏通常被用作数学决策过程的入门示例。 它的简洁性使其成为一个完美的游戏,可以说明思考前瞻和学习每个决策的结果所带来的收益。 井字游戏有多种变体。 最经典的是X和O,每个玩家都希望将他们的三个标记放在3x3网格的水平,垂直或对角线行中。 该游戏的另一个流行变体是数字井字游戏。 使用数字1到9代替X和O。
  3. 所属分类:其它

    • 发布日期:2021-03-13
    • 文件大小:24117248
    • 提供者:weixin_42123296
  1. TicTacToe:井字游戏,旨在用于通过强化学习(DQN)训练深度神经网络。 它也可以由2个人玩,并具有硬编码的AI,该AI永不松动,如果您不对其进行完美的游戏,则将获胜。-源码

  2. 深度Q学习井字游戏 该程序实现了一个PyGame TicTacToe,该游戏可以由两个人玩,一个人对一个算法AI,一个人对一个通过对付算法AI训练的神经网络。 训练算法使用Deep Mind的DQN建议: 重播经验记忆已实现,上限为250,000次 每轮训练都使用来自重播记忆库的大量随机经验 使用辅助神经网络来计算未来的Q值,然后每10场游戏用主网络的权重对其进行更新。 有关更多信息: :
  3. 所属分类:其它

    • 发布日期:2021-03-10
    • 文件大小:3145728
    • 提供者:weixin_42181693
  1. 井字游戏使用强化学习:井字游戏强化模型-源码

  2. 井字游戏使用强化学习 井字形加固模型 井字游戏的Q学习实施
  3. 所属分类:其它

    • 发布日期:2021-02-19
    • 文件大小:380928
    • 提供者:weixin_42109598
  1. 井字游戏使用强化学习-源码

  2. 井字游戏使用强化学习 问题陈述 井字游戏是有史以来最受欢迎和最持久的游戏之一。 该游戏通常被用作数学分析决策过程的开始示例。 井字游戏有多种变体。 最经典的是X和O,每个玩家都希望将他们的三个标记放置在3x3网格的水平,垂直或对角线上。 该游戏的另一个流行变体是数字井字游戏。 使用数字1到9代替X和O。 在3x3网格中,数字1到9被填充,每个单元格中都有一个数字。 第一个玩家使用奇数游戏,第二个玩家使用偶数游戏,即玩家1只能在单元格中输入一个奇数,而玩家2可以在其余单元格中输入一个偶数。 每
  3. 所属分类:其它

    • 发布日期:2021-02-13
    • 文件大小:198656
    • 提供者:weixin_42109178
  1. 井字游戏-源码

  2. 井字游戏 Python程序提供了可以智能地玩TicTacToe游戏的AI。 欢迎使用我的TicTacToe AI! 该AI正在使用强化学习。 AI以随机移动模式玩数千个游戏并将其保存,以将奖励与每个游戏相关联。 报酬与举动的重要性成正比。 程序中有一些解释和注释,请遵循#。 我将使用找到最佳学习率的程序上载笔记本。 随意使用它。 告诉我您将在哪个疯狂的项目中使用它或提出任何建议! 再见 ! PS:特别感谢alexandrefresnais,他帮助理解了该主题。
  3. 所属分类:其它

    • 发布日期:2021-02-12
    • 文件大小:4096
    • 提供者:weixin_42138780