softlearning：Softlearning是用于在连续域中训练最大熵策略的强化学习框架。包 - 点数信息

点数信息

注册会员 | 设为首页 | 加入收藏夹

您好，欢迎光临本网站！[请登录] ！[注册会员]！

热门搜索： 源码 Android 整站插件识别 p2p 游戏算法更多...

在线客服QQ:632832888

当前位置：

文件名称: softlearning：Softlearning是用于在连续域中训练最大熵策略的强化学习框架。包括Soft Actor-Critic算法的正式实现-源码

所属分类: 其它

开发工具:

文件大小: 157kb

下载次数: 0

上传时间: 2021-02-04

提供者: weixin_********

不能下载？报告错误

详细说明：软学习软学习是一种深度强化学习工具箱，用于在连续域中训练最大熵策略。该实现相当薄，并且主要针对我们自己的开发目的进行了优化。对于大多数模型类（例如策略和值函数），它都使用tf.keras模块。我们使用Ray进行实验编排。 Ray Tune和Autoscaler实现了几项简洁的功能，使我们能够无缝运行与用于本地原型制作的实验脚本相同的实验脚本，以在任何选定的云服务（例如GCP或AWS）上启动大规模实验，并智能地并行化和分发培训以提高效率。资源分配。此实现使用Tensorflow。对于软参与者批评的PyTorch实现，请看一下。入门先决条件该环境可以使用conda在本地运行，

(系统自动生成,下载前可以参看下载内容)

下载文件列表

相关说明

本站资源为会员上传分享交流与学习,如有侵犯您的权益,请联系我们删除.
本站是交换下载平台，提供交流渠道，下载内容来自于网络，除下载问题外，其它问题请自行百度。
本站已设置防盗链，请勿用迅雷、QQ旋风等多线程下载软件下载资源，下载后用WinRAR最新版进行解压.
如果您发现内容无法下载，请稍后再次尝试；或者到消费记录里找到下载记录反馈给我们.
下载后发现下载的内容跟说明不相乎，请到消费记录里找到下载记录反馈给我们，经确认后退回积分.
如下载前有疑问，可以通过点击"提供者"的名字，查看对方的联系方式，联系对方咨询.

相关搜索: softlearning：Softlearning是用于在连续域中训练最大熵策略的强化学习框架。包括SoftActor-Critic算法的正式实现-源码

下载资源分类

移动开发

开发技术

课程资源

网络技术

操作系统

安全技术

数据库

行业

服务器应用

存储

信息化

考试认证

云计算

大数据

跨平台

音视频

游戏开发

人工智能

区块链

资源分类

Actionscript

C

C#

C++

Delphi

Java

Javascript

Perl

PHP

Python

VB

Web开发

硬件开发

其它

本站统计

资源总数：630万个
资源大小：15TB
今日更新：468个
注册人数：225万
今日注册：838

加入“点数信息”会员

　　“点数信息”是专业的,大型的源码,编程资源等搜索,交换平台,旨在帮助软件开发人员提供源码,编程资源下载,技术交流等服务!目前源码资源大小已超过8TB。
　　超值价格，购买下载积分，即时到帐，无需等待马上可以下载你所需的资料。无限期使用，一次购买越多越优惠！

免费获取积分

　　免费获得积分的途径是通过会员下载您上传的资料，您的帐户即增加积分。
　　立即上传资料，越多越好，被搜索到的机会越大！越早上传越早得积分，下载次数越多，您的积分越多。

合作伙伴