您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. transition:论文“学习复杂技能的学习过渡政策”的正式代码(ICLR 2019)-源码

  2. 通过学习过渡政策来构成复杂技能 内容描述 此项目是TensorFlow实施,,已在发布。 我们提供本文中提出的模型,环境和基线的代码。 人类通过利用先前学习的技能并在它们之间进行转换来获得复杂的技能。 为了赋予机器这种能力,我们提出了一种方法,该方法可以学习过渡策略,该策略可以有效地连接原始技能以执行顺序任务,而无需手工奖励。 为了有效地训练我们的过渡政策,我们引入了接近度预测器,这些预测器会诱使人们将奖励衡量为接近下一个技能的合适初始状态。 在传统的策略梯度方法难以解决的两足运动和机械臂操
  3. 所属分类:其它

    • 发布日期:2021-03-17
    • 文件大小:5242880
    • 提供者:weixin_42120541