文件名称:
AI_Dresses_Itself:这是Sirtube Raval在YouTube上发布的“可以自己打扮的AI”的代码-源码
开发工具:
文件大小: 8kb
下载次数: 0
上传时间: 2021-03-18
详细说明:概述
这是Siraj Raval在YouTube上录制的视频的代码。这是研究人员在视频中使用的“信任区域策略优化”算法的实现。但是,他们没有公开其完整代码。因此,这是应用于游戏环境的技术。有人可以将其用作重新创建代码的起点。同时-嗨,研究人员:)继续发布它,社区对此表示赞赏。
TRPO的PyTorch实施
除非您出于某些特定原因需要TRPO,否则请尝试此实现(又名TRPO的更新更好的变体)。
这是的PyTorch实现。
这是大多数代码从移植而来的代码。与,该实现方式使用精确的Hessian向量乘积而不是有限差分近似。
会费
捐款很受欢迎。如果您知道如何使此代码更好,请随时发送请求请求。
用法
python main.py --env-name "Reacher-v1"
推荐的超级参数
倒立摆-v1:5000
Reacher-v1,InvertedDoublePendulum-v1:15
(系统自动生成,下载前可以参看下载内容)
下载文件列表
相关说明
- 本站资源为会员上传分享交流与学习,如有侵犯您的权益,请联系我们删除.
- 本站是交换下载平台,提供交流渠道,下载内容来自于网络,除下载问题外,其它问题请自行百度。
- 本站已设置防盗链,请勿用迅雷、QQ旋风等多线程下载软件下载资源,下载后用WinRAR最新版进行解压.
- 如果您发现内容无法下载,请稍后再次尝试;或者到消费记录里找到下载记录反馈给我们.
- 下载后发现下载的内容跟说明不相乎,请到消费记录里找到下载记录反馈给我们,经确认后退回积分.
- 如下载前有疑问,可以通过点击"提供者"的名字,查看对方的联系方式,联系对方咨询.