您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. 深度强化学习论文

  2. DQN的论文
  3. 所属分类:其它

    • 发布日期:2017-03-17
    • 文件大小:6291456
    • 提供者:caimouse
  1. Associative Learning from Replayed Experience

  2. 描述了强化学习在游戏中获胜的关键性技巧的论文。对于提高强化学习算法的稳定性,有效性和高效具有决定性的帮助。
  3. 所属分类:深度学习

    • 发布日期:2018-01-05
    • 文件大小:831488
    • 提供者:coolrainman
  1. 强化学习入门必读论文(DQN相关)

  2. 整理了强化学习入门时必看的论文,主要是有关DQN算法的,致力于强化学习的小伙伴应该必看这些论文的
  3. 所属分类:机器学习

    • 发布日期:2018-05-05
    • 文件大小:13631488
    • 提供者:thenorther
  1. 强化学习入门经典论文(DQN相关).rar

  2. 强化学习必读论文
  3. 所属分类:深度学习

    • 发布日期:2020-03-26
    • 文件大小:13631488
    • 提供者:weixin_42913025
  1. Deep Reinforcement Learning with Double Q-learning论文分享.pdf

  2. The popular Q-learning algorithm is known to overestimate action values under certain conditions. It was not previously known whether, in practice, such overestimations are common, whether they harm performance, and whether they can generally be prev
  3. 所属分类:机器学习

    • 发布日期:2020-05-16
    • 文件大小:726016
    • 提供者:weixin_43975408
  1. 深度强化学习 DQN系列论文

  2. 深度强化学习系列论文,包括最基础的DQN,DQN模型改进,DQN算法改进,分层DRL,基于策略梯度的深度强化学习等等,论文基本源自顶会
  3. 所属分类:深度学习

    • 发布日期:2020-01-31
    • 文件大小:72351744
    • 提供者:weixin_43333326
  1. Hindsight Experience Replay.pdf

  2. 关于Hindsight Experience Replay的原始论文,适合初学者对深度强化学习Hindsight Experience Replay的认识和了解is to periodically set the weights of the target network to the current weights of the main network(e. g Mnih et al. (2015)) or to use a polyak-averaged(Polyak and Judits
  3. 所属分类:讲义

    • 发布日期:2019-09-02
    • 文件大小:2097152
    • 提供者:m0_37384317
  1. Rainbow dqn.pdf

  2. 关于Rainbow dqn的原始论文,适合初学者对深度强化学习Rainbow dqn的认识和了解
  3. 所属分类:讲义

    • 发布日期:2019-09-02
    • 文件大小:1048576
    • 提供者:m0_37384317
  1. Noisy Networks for Exploration.pdf

  2. 关于Noisy Networks for Exploration dqn的原始论文,适合初学者对深度强化学习Noisy Networks for Exploration dqn的认识和了解Published as a conference paper at ICLR 2018 T is assessed by the action-value function Q defined as Q"(.a)=配 ∑ rR(t, at) (1) where E is the expectation ove
  3. 所属分类:讲义

    • 发布日期:2019-09-02
    • 文件大小:5242880
    • 提供者:m0_37384317
  1. dueldqn.pdf

  2. 关于duelingdqn的原始论文,适合初学者对深度强化学习duelingdqn的认识和了解Dueling Network Architectures for Deep Reinforcement Learning et al.(2016). The results of Schaul et al.(2016) are the 2.1. Deep Q-networks current published state-of-the-art The value functions as descri
  3. 所属分类:讲义

    • 发布日期:2019-09-02
    • 文件大小:688128
    • 提供者:m0_37384317
  1. double_deep_reinforcement_learning.pdf

  2. 关于dqn的原始论文,适合初学者对深度强化学习double dqn的认识和了解
  3. 所属分类:讲义

    • 发布日期:2019-09-02
    • 文件大小:789504
    • 提供者:m0_37384317
  1. leedeeprl-notes:李宏毅《深度强化学习》笔记,在线阅读地址:https-源码

  2. 李宏毅深度强化学习笔记(LeeDeepRL-注意事项) 李宏幽默老师的《深度强化学习》是强化学习领域经典的中文视频之一。李老师幽默风趣的上课风格让晦涩难懂的强化学习理论变得轻松易懂,他会通过很多有趣的例子例证解强化学习理论。某些老师经常会用玩Atari游戏的例子解释解解强化学习算法。如此,为了课程的补充,我们整理了周博磊老师的《强化学习纲要》,李科浇老师的《百度强化学习》。以及多个强化学习的经典资料作为补充。对于想入门强化学习又想看中文讲解的人来说绝对是非常推荐的。 使用说明 第4章到第11章为
  3. 所属分类:其它

    • 发布日期:2021-03-18
    • 文件大小:141557760
    • 提供者:weixin_42175776
  1. 基线:OpenAI基线:强化学习算法的高质量实现-源码

  2. 状态:维护(预计错误修复和次要更新) 基准线 OpenAI Baselines是强化学习算法的一组高质量实现。 这些算法将使研究团体更容易复制,完善和识别新思想,并创建良好的基线以在其上进行研究。 我们的DQN实施及其变体与已发表论文的得分大致相当。 我们希望它们将被用作添加新想法的基础,以及将新方法与现有方法进行比较的工具。 先决条件 基线需要带有开发标头的python3(> = 3.5)。 您还需要系统软件包CMake,OpenMPI和zlib。 可以按以下方式安装 的Ubuntu
  3. 所属分类:其它

    • 发布日期:2021-02-12
    • 文件大小:4194304
    • 提供者:weixin_42127020
  1. deep-rl-tensorflow:深度强化学习论文的TensorFlow实现-源码

  2. TensorFlow中的深度强化学习 TensorFlow实施深度强化学习论文。 该实现包含: [1] [2][3][4][5](进行中) [6](正在进行中) [7](进行中) [8](正在进行中) 要求 Python 2.7 或 用法 首先,使用以下命令安装必备组件: $ pip install -U 'gym[all]' tqdm scipy 不要忘了还要安装最新的 。 还请注意,您需要安装所需的依赖项gym[all] 在没有gpu的情况下使用所述的DQN模型进行训练: $
  3. 所属分类:其它

    • 发布日期:2021-02-06
    • 文件大小:580608
    • 提供者:weixin_42133329
  1. 机器学习:我在PyTorch,Keras,Tensorflow,scikit学习和Python中进行机器学习的项目-源码

  2. 机器学习 我的项目,Kaggle竞赛和一些流行的机器学习算法的实现。 我还列出了我在ML / DL / AI领域策划的研究论文清单。 指数: 内容: 专案 以下是我在机器学习领域完成的项目: 名称 描述 实现不同的强化学习算法,例如DQN,Double-DQN,Dualling-DQN,蒙特卡洛,时间差等。 能够在基于Unity ML-Agents的Banana Collector环境中获得最大回报的Deep-Q Learning代理 深度确定性策略梯度学习代理,能够在基于Unity ML
  3. 所属分类:其它

    • 发布日期:2021-02-05
    • 文件大小:22020096
    • 提供者:weixin_42099633
  1. nn::brain:带有并行注释的深度学习论文的最小实现教程; 包括变压器(原始,xl,开关,反馈),优化器(adam,radam,adabelief),gans(dcgan,cyclgan),强化学习(ppo,dqn),capsnet,s

  2. 这是神经网络和相关算法的简单PyTorch实现的集合。 这些实现带有说明文档, 将这些内容作为并排格式的注释呈现。 我们相信这些可以帮助您更好地理解这些算法。 我们正在积极维护此仓库,并几乎每周都会添加新的实现。 进行更新。 模组 :sparkles: 包含用于实现和。 :sparkles: :sparkles: :sparkles: :sparkles: :sparkles: :sparkles: :sparkles: 具有 带有,和双Q网络的 Q网络。 :spar
  3. 所属分类:其它

    • 发布日期:2021-02-05
    • 文件大小:1048576
    • 提供者:weixin_42143806
  1. rl:深度强化交易学习-源码

  2. 笔记本和代码张贴在强化学习上。 玩Tic-Tac-Toe的基于表的强化学习,类似于无意义的深度学习算法 Keras从零开始构建深度强化学习算法,用于CartAI和LunarLander等OpenAI环境。 DQN 策略梯度(REINFORCE) 用基线加强 , 仅运行保存的好模型,不进行训练 与UC Berkeley Ray项目相似但具有最先进的RL 受戈登·里特(Gordon Ritter)论文《机器学习交易》的启发, 交易假市场数据。 这应该在运行。 典型安装过程: 安装 p
  3. 所属分类:其它

    • 发布日期:2021-02-04
    • 文件大小:12582912
    • 提供者:weixin_42112894
  1. MP-DQN:论文的源代码-Source code learning

  2. 多通道深度Q网络 该存储库包括用于参数化动作空间MDP的几种强化学习算法: P-DQN MP-DQN SP-DQN PA-DDPG 豪 Q-PAMDP 多遍深层Q网络(MP-DQN)通过使用几次遍历(并行批处理)将动作参数输入分配到Q网络来解决P-DQN的过度参数化问题。 拆分深度Q网络(SP-DQN)是一种慢得多的解决方案,它使用具有/不具有共享特征提取层的多个Q网络。 还为P-DQN提供了加权索引的动作参数损失函数。 依存关系 Python 3.5+(已通过3.5和3.6
  3. 所属分类:其它

    • 发布日期:2021-03-25
    • 文件大小:64512
    • 提供者:weixin_42166626
  1. easy-rl:强化学习中文教程,在线阅读地址:https-源码

  2. Easy-RL 李宏幽默老师的《深度强化学习》是强化学习领域经典的中文视频之一。李老师幽默风趣的上课风格让晦涩难懂的强化学习理论变得轻松易懂,他会通过很多有趣的例子例证解强化学习理论。某些老师经常会用玩Atari游戏的例子解释解解强化学习算法。如此,为了课程的补充,我们整理了周博磊老师的《强化学习纲要》,李科浇老师的《百度强化学习》。以及多个强化学习的经典资料作为补充。对于想入门强化学习又想看中文讲解的人来说绝对是非常推荐的。 使用说明 第4章到第11章为的部分; 第1章和第2章根据整理而来;
  3. 所属分类:其它

    • 发布日期:2021-03-20
    • 文件大小:141557760
    • 提供者:weixin_42174176