您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. DeepRL:基于UC Berkeley的CS285的深度强化学习笔记-源码

  2. 深度强化学习 说明:注释内容基于加州大学伯克利分校的CS285。 内容清单 简介与概述 行为监督学习 Tensorflow和神经网络 强化学习导论 政策梯度 演员关键算法 值函数方法 具有Q功能的Deep RL 高级策略梯度 基于模型的计划 基于模型的强化学习 基于模型的政策学习 变异推理和生成模型 控制为推理 逆向强化学习 转移和多任务学习 分布式RL 探索(第1部分) 探索(第2部分) 元学习 信息论,未解决的问题
  3. 所属分类:其它

    • 发布日期:2021-02-17
    • 文件大小:5242880
    • 提供者:weixin_42124743
  1. 逆向深度q学习-源码

  2. 创建三个玩Reversi游戏的AI代理(也称为商标Othello)。 由python撰写 game_play.py 该文件将播放两个AI代理。 从命令行,使用以下命令调用此函数: python gameplay.py [-t ] [-v] [-r] player1 player2 其中player1.py和player2.py是包含nextMove和nextMoveR的python文件。 标志-v代表详细输出(每转之后显示板,已经实现),标志-r代表“反转”(使用nextMoveR而不是n
  3. 所属分类:其它

    • 发布日期:2021-02-13
    • 文件大小:8192
    • 提供者:weixin_42099530