您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. DRLND-project-2:Udacity的深度强化学习纳米学位项目2的实施-源码

  2. DRLND-project-2 该存储库包含项目2的实现。 项目详情 到达者 该项目实现了PPO,用于解决Unity环境中的连续控制问题-使机械臂跟随旋转的航点-在具有20个代理的变体版本上。 最终执行记录: 当手臂末端位于目标球体内/目标航路点的固定范围内时,每个代理随时间累积的奖励。 代理的目标是遵循路标。 对于每个代理,状态空间具有33个维度,而动作空间具有4个连续维度。 该任务是情节性的,当特工在100个连续情节中获得+30的平均分数时,该任务被认为已解决。 履带式 该项目的可
  3. 所属分类:其它

    • 发布日期:2021-02-15
    • 文件大小:15728640
    • 提供者:weixin_42120563