您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. p2_continuous-control:Udacity深度强化学习NanoDegree-项目2-机械手臂控制-源码

  2. 项目2:连续控制 介绍 对于此项目,您将使用环境。 ![训练有素的经纪人] [image1] 在这种环境下,双臂可以移动到目标位置。 对于代理人的手在目标位置中的每一步,将提供+0.1的奖励。 因此,座席的目标是在尽可能多的时间步中保持其在目标位置的位置。 观察空间由33个变量组成,分别对应于手臂的位置,旋转,速度和角速度。 每个动作是一个带有四个数字的向量,对应于适用于两个关节的扭矩。 动作向量中的每个条目都应为-1和1之间的数字。 分布式培训 对于此项目,我们将为您提供两个单独的Uni
  3. 所属分类:其它

    • 发布日期:2021-02-15
    • 文件大小:1048576
    • 提供者:weixin_42135773