您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. TRPO算法论坛

  2. 该文档为AI学习中强化学习的TRPO算法论文,PDF格式的内容。
  3. 所属分类:机器学习

    • 发布日期:2018-05-02
    • 文件大小:1026048
    • 提供者:tan_zhichao
  1. deep q_learning

  2. # Deep Reinforcement Learning for Keras [![Build Status](https://api.travis-ci.org/matthiasplappert/keras-rl.svg?branch=master)](https://travis-ci.org/matthiasplappert/keras-rl) [![Documentation](https://readthedocs.org/projects/keras-rl/badge/)](ht
  3. 所属分类:深度学习

    • 发布日期:2018-06-19
    • 文件大小:10485760
    • 提供者:weixin_37949195
  1. Trust Region Policy Optimization PDF论文下载

  2. TRPO算法的论文,是强化学习算法PPO、DPPO的基础,论文中对算法优化原理进行了比较详细的推导
  3. 所属分类:机器学习

    • 发布日期:2018-10-07
    • 文件大小:974848
    • 提供者:kaigemime
  1. Approximately Optimal Approximate Reinforcement Learning PDF下载

  2. 论文Trust Region Policy Optimization最重要的参考文献之一,TRPO原理的来源和依据之一
  3. 所属分类:机器学习

    • 发布日期:2018-10-07
    • 文件大小:232448
    • 提供者:kaigemime
  1. Reinforcement learning合集

  2. this file contains:Advanced Deep Learning with Keras_ Apply deep learning techniques, autoencoders, GANs, variational autoencoders, deep reinforcement learning, policy gradients, and more (2018, Packt Publishing.pdf Deep Reinforcement Learning for W
  3. 所属分类:深度学习

    • 发布日期:2019-04-25
    • 文件大小:184549376
    • 提供者:wang1062807258
  1. Deep Reinforcement Learning Hands-On 英文

  2. 美国亚马逊评价很好的一本强化学习书,全英文。Deep Reinforcement Learning Hands-On: Apply modern RL methods, with deep Q-networks, value iteration, policy gradients, TRPO, AlphaGo Zero and more
  3. 所属分类:深度学习

    • 发布日期:2019-06-22
    • 文件大小:12582912
    • 提供者:sgcc_zhs
  1. Python-深度强化学习PyTorch实现集锦

  2. This repository contains most of classic deep reinforcement learning algorithms, including - DQN, DDPG, A3C, PPO, TRPO. (More algorithms are still in progress)
  3. 所属分类:其它

    • 发布日期:2019-08-11
    • 文件大小:3145728
    • 提供者:weixin_39841365
  1. Algorithm-Deep-reinforcement-learning-with-pytorch.zip

  2. Algorithm-Deep-reinforcement-learning-with-pytorch.zip,Pythorch实现DQN、AC、Acer、A2C、A3C、PG、DDPG、TRPO、PPO、SAC、TD3和….,算法是为计算机程序高效、彻底地完成任务而创建的一组详细的准则。
  3. 所属分类:其它

    • 发布日期:2019-09-17
    • 文件大小:72351744
    • 提供者:weixin_38744207
  1. Algorithm-reinforcement-learning-algorithms.zip

  2. Algorithm-reinforcement-learning-algorithms.zip,此存储库包含大多数基于pytorch实现的经典深度强化学习算法,包括-dqn、ddqn、决斗网络、ddpg、a3c、ppo、trpo。(更多算法仍在进行中),算法是为计算机程序高效、彻底地完成任务而创建的一组详细的准则。
  3. 所属分类:其它

    • 发布日期:2019-09-17
    • 文件大小:3145728
    • 提供者:weixin_38743737
  1. HIGH-DIMENSIONAL CONTINUOUS CONTROL USING GENERALIZED ADVANTAGE ESTIMATION.pdf

  2. HIGH-DIMENSIONAL CONTINUOUS CONTROL USING GENERALIZED ADVANTAGE ESTIMATIONPublished as a conference paper at ICLR 2016 Here, the subscr ipt of e enumerates the variables being integrated over, where states and actions are sampled sequentially from th
  3. 所属分类:讲义

    • 发布日期:2019-09-02
    • 文件大小:1048576
    • 提供者:m0_37384317
  1. Noisy Networks for Exploration.pdf

  2. 关于Noisy Networks for Exploration dqn的原始论文,适合初学者对深度强化学习Noisy Networks for Exploration dqn的认识和了解Published as a conference paper at ICLR 2018 T is assessed by the action-value function Q defined as Q"(.a)=配 ∑ rR(t, at) (1) where E is the expectation ove
  3. 所属分类:讲义

    • 发布日期:2019-09-02
    • 文件大小:5242880
    • 提供者:m0_37384317
  1. Deep.Reinforcement.Learning.Han.-.Maxim.Lapan.pdf

  2. Deep Reinforcement Learning Hands-On by Maxim LapanTable of contents Deep reinforcement Learning Hands-On Why subscribe? Packtpub.com Contributors about the author about the reviewers Packt is Searching for Authors Like You Preface Who this book is f
  3. 所属分类:深度学习

    • 发布日期:2019-08-18
    • 文件大小:12582912
    • 提供者:wanghui499917270
  1. Python-PyTorchv040实现了典型的策略梯度PG算法

  2. Policy Gradient algorithms (REINFORCE, NPG, TRPO, PPO)
  3. 所属分类:其它

    • 发布日期:2019-08-09
    • 文件大小:138412032
    • 提供者:weixin_39841848
  1. TRPO、PPO解读.docx

  2. 内含原文(.pdf)加中文详细解读解读(.doc),主要是对openai与deepmind的算法,进行完全解读(中文版),简单易懂
  3. 所属分类:机器学习

    • 发布日期:2019-07-04
    • 文件大小:358400
    • 提供者:circleyuanquan
  1. trpo-3-源码

  2. trpo-3
  3. 所属分类:其它

    • 发布日期:2021-03-15
    • 文件大小:37888
    • 提供者:weixin_42139302
  1. trpo:使用TensorFlow和OpenAI Gym优化信任区域策略-源码

  2. 广义优势估计的信任域策略优化 帕特里克·科迪(Patrick Coady): 概要 注意:代码已重构为使用TensorFlow 2.0和PyBullet(而不是MuJoCo)。 请参阅tf1_mujoco分支以获取旧版本。 该项目的最初目标是使用相同的算法来“解决” 。 并且,具体地说,要在不手动调整每个环境的超参数(网络大小,学习速率和TRPO设置)的情况下实现此目的。 这是具有挑战性的,因为环境的范围从具有单个控制输入的简单手推车杆问题到具有17个受控关节和44个观察变量的类人动物。 该项
  3. 所属分类:其它

    • 发布日期:2021-02-06
    • 文件大小:652288
    • 提供者:weixin_42114046
  1. 带有火炬的深度增强学习:DQN,AC,ACER,A2C,A3C,PG,DDPG,TRPO,PPO,SAC,TD3和PyTorch实施...-源码

  2. 状态:活动(在活动开发中,可能会发生重大更改) 该存储库将实现经典且最新的深度强化学习算法。 该存储库的目的是为人们提供清晰的pytorch代码,以供他们学习深度强化学习算法。 将来,将添加更多最先进的算法,并且还将保留现有代码。 要求 python = 0.10 火炬> = 0.4 请注意,tensorflow不支持python3.7 安装 pip install -r requirements.txt 如果失败: 安装健身房 pip install gym 安装pytorc
  3. 所属分类:其它

    • 发布日期:2021-01-30
    • 文件大小:5242880
    • 提供者:weixin_42131443
  1. 强化学习算法:此存储库包含大多数基于pytorch实现的经典深度强化学习算法,包括-DQN,DDQN,Dualling Network,DDPG,SAC,A2C,PPO,TRPO。 (更多算法仍在进行中)-源码

  2. 深度强化学习算法 该存储库将使用PyTorch实现经典的深度强化学习算法。 该存储库的目的是为人们提供清晰的代码,以供他们学习深度强化学习算法。 将来,将添加更多算法,并且还将保留现有代码。 当前实施 深度Q学习网络(DQN) 基本DQN 双Q网络 决斗网络架构 深度确定性策略梯度(DDPG) 优势演员评判(A2C) 信任区域策略梯度(TRPO) 近端政策优化(PPO) 使用克罗内克因素信任区域(ACKTR)的演员评论家 软演员评论(SAC) 更新信息 :triangu
  3. 所属分类:其它

    • 发布日期:2021-01-30
    • 文件大小:3145728
    • 提供者:weixin_42117150
  1. MusicPlayer-using-Python:这是一个专门为我的音乐播放器存储库来作为我的TRPO高中项目-源码

  2. 使用Python的MusicPlayer 这是我的音乐播放器专用的存储库,这是我为TRPO编写的高中项目。 该音乐播放器将使用诸如pygame的混音器(用于音乐部分),Tkinter(用于GUI)之类的库构建。
  3. 所属分类:其它

    • 发布日期:2021-03-31
    • 文件大小:7168
    • 提供者:weixin_42128393
  1. TRPO-源码

  2. TRPO
  3. 所属分类:其它

    • 发布日期:2021-03-29
    • 文件大小:2048
    • 提供者:weixin_42116705
« 12 »