搜索资源 - dqn论文 - 点数信息

点数信息

注册会员 | 设为首页 | 加入收藏夹

您好，欢迎光临本网站！[请登录] ！[注册会员]！

热门搜索： 源码 Android 整站插件识别 p2p 游戏算法更多...

在线客服QQ:632832888

当前位置：

搜索资源 - dqn论文

下载资源分类

移动开发

开发技术

课程资源

网络技术

操作系统

安全技术

数据库

行业

服务器应用

存储

信息化

考试认证

云计算

大数据

跨平台

音视频

游戏开发

人工智能

区块链

资源分类

搜索资源列表

深度强化学习论文
DQN的论文
所属分类：其它
- 发布日期：2017-03-17
- 文件大小：6291456
- 提供者：caimouse

Associative Learning from Replayed Experience
描述了强化学习在游戏中获胜的关键性技巧的论文。对于提高强化学习算法的稳定性，有效性和高效具有决定性的帮助。
所属分类：深度学习
- 发布日期：2018-01-05
- 文件大小：831488
- 提供者：coolrainman

强化学习入门必读论文（DQN相关）
整理了强化学习入门时必看的论文，主要是有关DQN算法的，致力于强化学习的小伙伴应该必看这些论文的
所属分类：机器学习
- 发布日期：2018-05-05
- 文件大小：13631488
- 提供者：thenorther

强化学习入门经典论文（DQN相关）.rar
强化学习必读论文
所属分类：深度学习
- 发布日期：2020-03-26
- 文件大小：13631488
- 提供者：weixin_42913025

Deep Reinforcement Learning with Double Q-learning论文分享.pdf
The popular Q-learning algorithm is known to overestimate action values under certain conditions. It was not previously known whether, in practice, such overestimations are common, whether they harm performance, and whether they can generally be prev
所属分类：机器学习
- 发布日期：2020-05-16
- 文件大小：726016
- 提供者：weixin_43975408

深度强化学习 DQN系列论文
深度强化学习系列论文，包括最基础的DQN，DQN模型改进，DQN算法改进，分层DRL，基于策略梯度的深度强化学习等等，论文基本源自顶会
所属分类：深度学习
- 发布日期：2020-01-31
- 文件大小：72351744
- 提供者：weixin_43333326

Hindsight Experience Replay.pdf
关于Hindsight Experience Replay的原始论文，适合初学者对深度强化学习Hindsight Experience Replay的认识和了解is to periodically set the weights of the target network to the current weights of the main network(e. g Mnih et al. (2015)) or to use a polyak-averaged(Polyak and Judits
所属分类：讲义
- 发布日期：2019-09-02
- 文件大小：2097152
- 提供者：m0_37384317

Rainbow dqn.pdf
关于Rainbow dqn的原始论文，适合初学者对深度强化学习Rainbow dqn的认识和了解
所属分类：讲义
- 发布日期：2019-09-02
- 文件大小：1048576
- 提供者：m0_37384317

Noisy Networks for Exploration.pdf
关于Noisy Networks for Exploration dqn的原始论文，适合初学者对深度强化学习Noisy Networks for Exploration dqn的认识和了解Published as a conference paper at ICLR 2018 T is assessed by the action-value function Q defined as Q"(.a)=配 ∑ rR(t, at) (1) where E is the expectation ove
所属分类：讲义
- 发布日期：2019-09-02
- 文件大小：5242880
- 提供者：m0_37384317

dueldqn.pdf
关于duelingdqn的原始论文，适合初学者对深度强化学习duelingdqn的认识和了解Dueling Network Architectures for Deep Reinforcement Learning et al.(2016). The results of Schaul et al.(2016) are the 2.1. Deep Q-networks current published state-of-the-art The value functions as descri
所属分类：讲义
- 发布日期：2019-09-02
- 文件大小：688128
- 提供者：m0_37384317

double_deep_reinforcement_learning.pdf
关于dqn的原始论文，适合初学者对深度强化学习double dqn的认识和了解
所属分类：讲义
- 发布日期：2019-09-02
- 文件大小：789504
- 提供者：m0_37384317

leedeeprl-notes:李宏毅《深度强化学习》笔记，在线阅读地址：https-源码
李宏毅深度强化学习笔记（LeeDeepRL-注意事项）李宏幽默老师的《深度强化学习》是强化学习领域经典的中文视频之一。李老师幽默风趣的上课风格让晦涩难懂的强化学习理论变得轻松易懂，他会通过很多有趣的例子例证解强化学习理论。某些老师经常会用玩Atari游戏的例子解释解解强化学习算法。如此，为了课程的补充，我们整理了周博磊老师的《强化学习纲要》，李科浇老师的《百度强化学习》。以及多个强化学习的经典资料作为补充。对于想入门强化学习又想看中文讲解的人来说绝对是非常推荐的。使用说明第4章到第11章为
所属分类：其它
- 发布日期：2021-03-18
- 文件大小：141557760
- 提供者：weixin_42175776

基线：OpenAI基线：强化学习算法的高质量实现-源码
状态：维护（预计错误修复和次要更新）基准线 OpenAI Baselines是强化学习算法的一组高质量实现。这些算法将使研究团体更容易复制，完善和识别新思想，并创建良好的基线以在其上进行研究。我们的DQN实施及其变体与已发表论文的得分大致相当。我们希望它们将被用作添加新想法的基础，以及将新方法与现有方法进行比较的工具。先决条件基线需要带有开发标头的python3（> = 3.5）。您还需要系统软件包CMake，OpenMPI和zlib。可以按以下方式安装的Ubuntu
所属分类：其它
- 发布日期：2021-02-12
- 文件大小：4194304
- 提供者：weixin_42127020

deep-rl-tensorflow：深度强化学习论文的TensorFlow实现-源码
TensorFlow中的深度强化学习 TensorFlow实施深度强化学习论文。该实现包含： [1] [2][3][4][5]（进行中） [6]（正在进行中） [7]（进行中） [8]（正在进行中）要求 Python 2.7 或用法首先，使用以下命令安装必备组件： $ pip install -U 'gym[all]' tqdm scipy 不要忘了还要安装最新的。还请注意，您需要安装所需的依赖项gym[all] 在没有gpu的情况下使用所述的DQN模型进行训练： $
所属分类：其它
- 发布日期：2021-02-06
- 文件大小：580608
- 提供者：weixin_42133329

机器学习：我在PyTorch，Keras，Tensorflow，scikit学习和Python中进行机器学习的项目-源码
机器学习我的项目，Kaggle竞赛和一些流行的机器学习算法的实现。我还列出了我在ML / DL / AI领域策划的研究论文清单。指数：内容：专案以下是我在机器学习领域完成的项目：名称描述实现不同的强化学习算法，例如DQN，Double-DQN，Dualling-DQN，蒙特卡洛，时间差等。能够在基于Unity ML-Agents的Banana Collector环境中获得最大回报的Deep-Q Learning代理深度确定性策略梯度学习代理，能够在基于Unity ML
所属分类：其它
- 发布日期：2021-02-05
- 文件大小：22020096
- 提供者：weixin_42099633

nn：:brain:带有并行注释的深度学习论文的最小实现教程；包括变压器（原始，xl，开关，反馈），优化器（adam，radam，adabelief），gans（dcgan，cyclgan），强化学习（ppo，dqn），capsnet，s
这是神经网络和相关算法的简单PyTorch实现的集合。这些实现带有说明文档，将这些内容作为并排格式的注释呈现。我们相信这些可以帮助您更好地理解这些算法。我们正在积极维护此仓库，并几乎每周都会添加新的实现。进行更新。模组 :sparkles: 包含用于实现和。 :sparkles: :sparkles: :sparkles: :sparkles: :sparkles: :sparkles: :sparkles: 具有带有，和双Q网络的 Q网络。 :spar
所属分类：其它
- 发布日期：2021-02-05
- 文件大小：1048576
- 提供者：weixin_42143806

rl：深度强化交易学习-源码
笔记本和代码张贴在强化学习上。玩Tic-Tac-Toe的基于表的强化学习，类似于无意义的深度学习算法 Keras从零开始构建深度强化学习算法，用于CartAI和LunarLander等OpenAI环境。 DQN 策略梯度（REINFORCE）用基线加强，仅运行保存的好模型，不进行训练与UC Berkeley Ray项目相似但具有最先进的RL 受戈登·里特（Gordon Ritter）论文《机器学习交易》的启发，交易假市场数据。这应该在运行。典型安装过程：安装 p
所属分类：其它
- 发布日期：2021-02-04
- 文件大小：12582912
- 提供者：weixin_42112894

MP-DQN:论文的源代码-Source code learning
多通道深度Q网络该存储库包括用于参数化动作空间MDP的几种强化学习算法： P-DQN MP-DQN SP-DQN PA-DDPG 豪 Q-PAMDP 多遍深层Q网络（MP-DQN）通过使用几次遍历（并行批处理）将动作参数输入分配到Q网络来解决P-DQN的过度参数化问题。拆分深度Q网络（SP-DQN）是一种慢得多的解决方案，它使用具有/不具有共享特征提取层的多个Q网络。还为P-DQN提供了加权索引的动作参数损失函数。依存关系 Python 3.5+（已通过3.5和3.6
所属分类：其它
- 发布日期：2021-03-25
- 文件大小：64512
- 提供者：weixin_42166626

easy-rl:强化学习中文教程，在线阅读地址：https-源码
Easy-RL 李宏幽默老师的《深度强化学习》是强化学习领域经典的中文视频之一。李老师幽默风趣的上课风格让晦涩难懂的强化学习理论变得轻松易懂，他会通过很多有趣的例子例证解强化学习理论。某些老师经常会用玩Atari游戏的例子解释解解强化学习算法。如此，为了课程的补充，我们整理了周博磊老师的《强化学习纲要》，李科浇老师的《百度强化学习》。以及多个强化学习的经典资料作为补充。对于想入门强化学习又想看中文讲解的人来说绝对是非常推荐的。使用说明第4章到第11章为的部分；第1章和第2章根据整理而来；
所属分类：其它
- 发布日期：2021-03-20
- 文件大小：141557760
- 提供者：weixin_42174176