文件名称:
udacity_deep_reinforcement_learning_project2-源码
开发工具:
文件大小: 1mb
下载次数: 0
上传时间: 2021-02-09
详细说明:总览
该存储库包含我为Udacity的纳米计划“深度强化学习”于2020年末开始的“ Project 2”提交内容。
它提供了解决“ Reacher”环境的学习代理的实现:
项目详情
在“ Reacher”环境中,代理是一个双臂,试图将目标尽可能长时间地定位在目标位置。 状态空间有33个维度,其中包含手臂的位置,旋转,速度和角速度。 利用此状态信息,代理必须通过选择手臂关节的动作来最大化总回报。 在每个时间步长,这四个可用动作对应于与代理手臂的两个关节相关的扭矩。 每个转矩作用与[-1,1]范围内的值相关。
该任务是情节性的,这意味着它具有清晰的开始和结束,并且在每个情节开始时都会重置所有
(系统自动生成,下载前可以参看下载内容)
下载文件列表
相关说明
- 本站资源为会员上传分享交流与学习,如有侵犯您的权益,请联系我们删除.
- 本站是交换下载平台,提供交流渠道,下载内容来自于网络,除下载问题外,其它问题请自行百度。
- 本站已设置防盗链,请勿用迅雷、QQ旋风等多线程下载软件下载资源,下载后用WinRAR最新版进行解压.
- 如果您发现内容无法下载,请稍后再次尝试;或者到消费记录里找到下载记录反馈给我们.
- 下载后发现下载的内容跟说明不相乎,请到消费记录里找到下载记录反馈给我们,经确认后退回积分.
- 如下载前有疑问,可以通过点击"提供者"的名字,查看对方的联系方式,联系对方咨询.