搜索资源 - TRPO - 点数信息

点数信息

注册会员 | 设为首页 | 加入收藏夹

您好，欢迎光临本网站！[请登录] ！[注册会员]！

热门搜索： 源码 Android 整站插件识别 p2p 游戏算法更多...

在线客服QQ:632832888

当前位置：

搜索资源 - TRPO

下载资源分类

移动开发

开发技术

课程资源

网络技术

操作系统

安全技术

数据库

行业

服务器应用

存储

信息化

考试认证

云计算

大数据

跨平台

音视频

游戏开发

人工智能

区块链

资源分类

搜索资源列表

TRPO算法论坛
该文档为AI学习中强化学习的TRPO算法论文，PDF格式的内容。
所属分类：机器学习
- 发布日期：2018-05-02
- 文件大小：1026048
- 提供者：tan_zhichao

deep q_learning
# Deep Reinforcement Learning for Keras [![Build Status](https://api.travis-ci.org/matthiasplappert/keras-rl.svg?branch=master)](https://travis-ci.org/matthiasplappert/keras-rl) [![Documentation](https://readthedocs.org/projects/keras-rl/badge/)](ht
所属分类：深度学习
- 发布日期：2018-06-19
- 文件大小：10485760
- 提供者：weixin_37949195

Trust Region Policy Optimization PDF论文下载
TRPO算法的论文，是强化学习算法PPO、DPPO的基础，论文中对算法优化原理进行了比较详细的推导
所属分类：机器学习
- 发布日期：2018-10-07
- 文件大小：974848
- 提供者：kaigemime

Approximately Optimal Approximate Reinforcement Learning PDF下载
论文Trust Region Policy Optimization最重要的参考文献之一，TRPO原理的来源和依据之一
所属分类：机器学习
- 发布日期：2018-10-07
- 文件大小：232448
- 提供者：kaigemime

Reinforcement learning合集
this file contains:Advanced Deep Learning with Keras_ Apply deep learning techniques, autoencoders, GANs, variational autoencoders, deep reinforcement learning, policy gradients, and more (2018, Packt Publishing.pdf Deep Reinforcement Learning for W
所属分类：深度学习
- 发布日期：2019-04-25
- 文件大小：184549376
- 提供者：wang1062807258

Deep Reinforcement Learning Hands-On 英文
美国亚马逊评价很好的一本强化学习书，全英文。Deep Reinforcement Learning Hands-On: Apply modern RL methods, with deep Q-networks, value iteration, policy gradients, TRPO, AlphaGo Zero and more
所属分类：深度学习
- 发布日期：2019-06-22
- 文件大小：12582912
- 提供者：sgcc_zhs

Python-深度强化学习PyTorch实现集锦
This repository contains most of classic deep reinforcement learning algorithms, including - DQN, DDPG, A3C, PPO, TRPO. (More algorithms are still in progress)
所属分类：其它
- 发布日期：2019-08-11
- 文件大小：3145728
- 提供者：weixin_39841365

Algorithm-Deep-reinforcement-learning-with-pytorch.zip
Algorithm-Deep-reinforcement-learning-with-pytorch.zip,Pythorch实现DQN、AC、Acer、A2C、A3C、PG、DDPG、TRPO、PPO、SAC、TD3和….,算法是为计算机程序高效、彻底地完成任务而创建的一组详细的准则。
所属分类：其它
- 发布日期：2019-09-17
- 文件大小：72351744
- 提供者：weixin_38744207

Algorithm-reinforcement-learning-algorithms.zip
Algorithm-reinforcement-learning-algorithms.zip,此存储库包含大多数基于pytorch实现的经典深度强化学习算法，包括-dqn、ddqn、决斗网络、ddpg、a3c、ppo、trpo。（更多算法仍在进行中）,算法是为计算机程序高效、彻底地完成任务而创建的一组详细的准则。
所属分类：其它
- 发布日期：2019-09-17
- 文件大小：3145728
- 提供者：weixin_38743737

HIGH-DIMENSIONAL CONTINUOUS CONTROL USING GENERALIZED ADVANTAGE ESTIMATION.pdf
HIGH-DIMENSIONAL CONTINUOUS CONTROL USING GENERALIZED ADVANTAGE ESTIMATIONPublished as a conference paper at ICLR 2016 Here, the subscr ipt of e enumerates the variables being integrated over, where states and actions are sampled sequentially from th
所属分类：讲义
- 发布日期：2019-09-02
- 文件大小：1048576
- 提供者：m0_37384317

Noisy Networks for Exploration.pdf
关于Noisy Networks for Exploration dqn的原始论文，适合初学者对深度强化学习Noisy Networks for Exploration dqn的认识和了解Published as a conference paper at ICLR 2018 T is assessed by the action-value function Q defined as Q"(.a)=配 ∑ rR(t, at) (1) where E is the expectation ove
所属分类：讲义
- 发布日期：2019-09-02
- 文件大小：5242880
- 提供者：m0_37384317

Deep.Reinforcement.Learning.Han.-.Maxim.Lapan.pdf
Deep Reinforcement Learning Hands-On by Maxim LapanTable of contents Deep reinforcement Learning Hands-On Why subscribe? Packtpub.com Contributors about the author about the reviewers Packt is Searching for Authors Like You Preface Who this book is f
所属分类：深度学习
- 发布日期：2019-08-18
- 文件大小：12582912
- 提供者：wanghui499917270

Python-PyTorchv040实现了典型的策略梯度PG算法
Policy Gradient algorithms (REINFORCE, NPG, TRPO, PPO)
所属分类：其它
- 发布日期：2019-08-09
- 文件大小：138412032
- 提供者：weixin_39841848

TRPO、PPO解读.docx
内含原文（.pdf）加中文详细解读解读（.doc），主要是对openai与deepmind的算法，进行完全解读（中文版），简单易懂
所属分类：机器学习
- 发布日期：2019-07-04
- 文件大小：358400
- 提供者：circleyuanquan

trpo-3-源码
trpo-3
所属分类：其它
- 发布日期：2021-03-15
- 文件大小：37888
- 提供者：weixin_42139302

trpo：使用TensorFlow和OpenAI Gym优化信任区域策略-源码
广义优势估计的信任域策略优化帕特里克·科迪（Patrick Coady）：概要注意：代码已重构为使用TensorFlow 2.0和PyBullet（而不是MuJoCo）。请参阅tf1_mujoco分支以获取旧版本。该项目的最初目标是使用相同的算法来“解决” 。并且，具体地说，要在不手动调整每个环境的超参数（网络大小，学习速率和TRPO设置）的情况下实现此目的。这是具有挑战性的，因为环境的范围从具有单个控制输入的简单手推车杆问题到具有17个受控关节和44个观察变量的类人动物。该项
所属分类：其它
- 发布日期：2021-02-06
- 文件大小：652288
- 提供者：weixin_42114046

带有火炬的深度增强学习：DQN，AC，ACER，A2C，A3C，PG，DDPG，TRPO，PPO，SAC，TD3和PyTorch实施...-源码
状态：活动（在活动开发中，可能会发生重大更改）该存储库将实现经典且最新的深度强化学习算法。该存储库的目的是为人们提供清晰的pytorch代码，以供他们学习深度强化学习算法。将来，将添加更多最先进的算法，并且还将保留现有代码。要求 python = 0.10 火炬> = 0.4 请注意，tensorflow不支持python3.7 安装 pip install -r requirements.txt 如果失败：安装健身房 pip install gym 安装pytorc
所属分类：其它
- 发布日期：2021-01-30
- 文件大小：5242880
- 提供者：weixin_42131443

强化学习算法：此存储库包含大多数基于pytorch实现的经典深度强化学习算法，包括-DQN，DDQN，Dualling Network，DDPG，SAC，A2C，PPO，TRPO。（更多算法仍在进行中）-源码
深度强化学习算法该存储库将使用PyTorch实现经典的深度强化学习算法。该存储库的目的是为人们提供清晰的代码，以供他们学习深度强化学习算法。将来，将添加更多算法，并且还将保留现有代码。当前实施深度Q学习网络（DQN）基本DQN 双Q网络决斗网络架构深度确定性策略梯度（DDPG）优势演员评判（A2C）信任区域策略梯度（TRPO）近端政策优化（PPO）使用克罗内克因素信任区域（ACKTR）的演员评论家软演员评论（SAC）更新信息 :triangu
所属分类：其它
- 发布日期：2021-01-30
- 文件大小：3145728
- 提供者：weixin_42117150

MusicPlayer-using-Python:这是一个专门为我的音乐播放器存储库来作为我的TRPO高中项目-源码
使用Python的MusicPlayer 这是我的音乐播放器专用的存储库，这是我为TRPO编写的高中项目。该音乐播放器将使用诸如pygame的混音器（用于音乐部分），Tkinter（用于GUI）之类的库构建。
所属分类：其它
- 发布日期：2021-03-31
- 文件大小：7168
- 提供者：weixin_42128393

TRPO-源码
TRPO
所属分类：其它
- 发布日期：2021-03-29
- 文件大小：2048
- 提供者：weixin_42116705

« 12 »