您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. drl_p2_continuous-control-源码

  2. drl_p2_continuous-control 该存储库的内容表示“ Udacity深度强化学习”课程的项目2。 在此项目中,我们正在解决由控制双关节手臂的运动组成的触手环境。 通过在此双关节臂上执行操作,我们可以了解最佳控制策略。 为了执行此训练,我们使用深度确定性策略梯度(DDPG)算法。 我们在多主体情况下解决该算法,目标是使用20个主体,至少连续100次情节维持+30的奖励。 可以通过打开笔记本的Continuous_Control.ipynb并运行所有单元格来运行代码。 多代
  3. 所属分类:其它

    • 发布日期:2021-03-13
    • 文件大小:482304
    • 提供者:weixin_42128315