文件名称:
ReAgent:推理系统的平台(强化学习,语境匪徒等)-源码
开发工具:
文件大小: 3mb
下载次数: 0
上传时间: 2021-03-08
详细说明:应用强化学习 Facebook
概述
ReAgent是一个用于Facebook上开发和使用的应用强化学习(RL)的开源端到端平台。 ReAgent是用Python构建的,并使用PyTorch进行建模和培训,并使用TorchScript进行模型服务。 该平台包含用于训练流行的深度RL算法的工作流,包括数据预处理,功能转换,分布式训练,反事实策略评估和优化服务。 有关ReAgent的更多详细信息,请参见的白皮书。
该平台曾被命名为“ Horizon”,但最近我们采用了“ ReAgent”这个名称,以强调其在决策和推理方面的广泛范围。
支持的算法
离散动作
参数动作DQN
, ,
分布RL: 和
(TD3)
(SAC)
安装
ReAgent可以通过安装。 Docker或手动。 有关如何安装ReAgent的详细说明,请参见。
用法
有关如何使用ReAgent模型的详细说明,请
(系统自动生成,下载前可以参看下载内容)
下载文件列表
相关说明
- 本站资源为会员上传分享交流与学习,如有侵犯您的权益,请联系我们删除.
- 本站是交换下载平台,提供交流渠道,下载内容来自于网络,除下载问题外,其它问题请自行百度。
- 本站已设置防盗链,请勿用迅雷、QQ旋风等多线程下载软件下载资源,下载后用WinRAR最新版进行解压.
- 如果您发现内容无法下载,请稍后再次尝试;或者到消费记录里找到下载记录反馈给我们.
- 下载后发现下载的内容跟说明不相乎,请到消费记录里找到下载记录反馈给我们,经确认后退回积分.
- 如下载前有疑问,可以通过点击"提供者"的名字,查看对方的联系方式,联系对方咨询.