搜索资源 - TicTacToe:井字游戏，旨在用于通过强化学习（DQN）训练深度神经网络。它也可以由2个人玩，并具有硬编码的AI，该AI永不松动，如果您不对其进行完美的游戏，则将获胜。-源码

搜索资源列表

TicTacToe:井字游戏，旨在用于通过强化学习（DQN）训练深度神经网络。它也可以由2个人玩，并具有硬编码的AI，该AI永不松动，如果您不对其进行完美的游戏，则将获胜。-源码
深度Q学习井字游戏该程序实现了一个PyGame TicTacToe，该游戏可以由两个人玩，一个人对一个算法AI，一个人对一个通过对付算法AI训练的神经网络。训练算法使用Deep Mind的DQN建议：重播经验记忆已实现，上限为250,000次每轮训练都使用来自重播记忆库的大量随机经验使用辅助神经网络来计算未来的Q值，然后每10场游戏用主网络的权重对其进行更新。有关更多信息： :
所属分类：其它
- 发布日期：2021-03-10
- 文件大小：3145728
- 提供者：weixin_42181693