文件名称:
transition:论文“学习复杂技能的学习过渡政策”的正式代码(ICLR 2019)-源码
开发工具:
文件大小: 5mb
下载次数: 0
上传时间: 2021-03-17
详细说明:通过学习过渡政策来构成复杂技能
内容描述
此项目是TensorFlow实施,,已在发布。 我们提供本文中提出的模型,环境和基线的代码。
人类通过利用先前学习的技能并在它们之间进行转换来获得复杂的技能。 为了赋予机器这种能力,我们提出了一种方法,该方法可以学习过渡策略,该策略可以有效地连接原始技能以执行顺序任务,而无需手工奖励。 为了有效地训练我们的过渡政策,我们引入了接近度预测器,这些预测器会诱使人们将奖励衡量为接近下一个技能的合适初始状态。
在传统的策略梯度方法难以解决的两足运动和机械臂操纵中,对一组复杂的连续控制任务进行了评估。 我们证明了过渡政策使我们能够有效地将复杂技能与现有原始技能结合在一起。 通过提供比环境稀疏奖励更密集的信息,使用邻近预测器计算的拟议诱导奖励进一步提高了训练效率。
目录
存储库的结构:
./rl :模型,训练和评估脚本
./gym:MuJoCo中的操纵和
(系统自动生成,下载前可以参看下载内容)
下载文件列表
相关说明
- 本站资源为会员上传分享交流与学习,如有侵犯您的权益,请联系我们删除.
- 本站是交换下载平台,提供交流渠道,下载内容来自于网络,除下载问题外,其它问题请自行百度。
- 本站已设置防盗链,请勿用迅雷、QQ旋风等多线程下载软件下载资源,下载后用WinRAR最新版进行解压.
- 如果您发现内容无法下载,请稍后再次尝试;或者到消费记录里找到下载记录反馈给我们.
- 下载后发现下载的内容跟说明不相乎,请到消费记录里找到下载记录反馈给我们,经确认后退回积分.
- 如下载前有疑问,可以通过点击"提供者"的名字,查看对方的联系方式,联系对方咨询.