您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. PokerRL:扑克中多智能体深度强化学习的框架-源码

  2. 扑克RL 扑克游戏中的多智能体深度强化学习框架。 背景 解决不完善的信息游戏的研究主要围绕直到最近才遍历整个游戏树的方法(例如,请参见 , , )。 神经虚拟自我播放(NFSP) ,后悔策略梯度(RPG) ,深反事实后悔最小化(Deep CFR) 和单深CFR 等新算法最近将深(强化)使用常规方法(例如CFR和虚拟游戏)进行学习,以仅在访问游戏状态的一小部分时即可了解近似的纳什均衡。 PokerRL框架 PokerRL算法的组成部分 您的算法由相互交互的工作人员(绿色)组成。 训练运
  3. 所属分类:其它

    • 发布日期:2021-02-04
    • 文件大小:332800
    • 提供者:weixin_42110469