您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. 如何理解A3C算法

  2. 如何理解深度强化学习基本概念:value-based,policy-based,off-policy,on-policy。以及A3C算法
  3. 所属分类:机器学习

  1. deep q_learning

  2. # Deep Reinforcement Learning for Keras [![Build Status](https://api.travis-ci.org/matthiasplappert/keras-rl.svg?branch=master)](https://travis-ci.org/matthiasplappert/keras-rl) [![Documentation](https://readthedocs.org/projects/keras-rl/badge/)](ht
  3. 所属分类:深度学习

    • 发布日期:2018-06-19
    • 文件大小:10485760
    • 提供者:weixin_37949195
  1. 强化学习算法与应用

  2. 强化学习知识算法与应用、讲解的算法有DDPG、DQN、A3C以及相关场景的应用
  3. 所属分类:其它

    • 发布日期:2018-08-08
    • 文件大小:23068672
    • 提供者:weixin_41362649
  1. Asynchronous Methods for Deep Reinforcement Learning

  2. 增强学习 经典算法 A3C 论文摘要: We propose a conceptually simple and lightweight framework for deep reinforcement learning that uses asynchronous gradient descent for optimization of deep neural network controllers. We present asynchronous variants of four stan
  3. 所属分类:机器学习

    • 发布日期:2018-02-01
    • 文件大小:2097152
    • 提供者:ningweikang
  1. 深度强化学习 - Actor-Critic

  2. Actor-Critic Asynchronous Advantage Actor-Critic (A3C) Pathwise Derivative Policy Gradient
  3. 所属分类:深度学习

    • 发布日期:2019-01-30
    • 文件大小:1048576
    • 提供者:mozart_cai
  1. A3C-PyTorch-master

  2. 应用Pytorch平台的深度学习算法和实现该算法的python程序
  3. 所属分类:深度学习

    • 发布日期:2019-02-11
    • 文件大小:2097152
    • 提供者:linkapp
  1. 深度强化学习必读文献

  2. 深度强化学习的入门经典文献: 包括DQN、DDPG、A3C/A2C/PPO/ACKTR等; 包括模仿学习,也包括几篇综述性的文章。
  3. 所属分类:机器学习

    • 发布日期:2019-02-22
    • 文件大小:33554432
    • 提供者:weixin_41754912
  1. Python-实现MetaRLA3C算法

  2. 实现Meta-RL A3C算法
  3. 所属分类:其它

    • 发布日期:2019-08-11
    • 文件大小:832512
    • 提供者:weixin_39840914
  1. pytorcha3c是A3C算法的一个PyTorch实现

  2. pytorch-a3c是A3C算法的一个PyTorch实现。A3C算法是2015年DeepMind提出的相比DQN更好更通用的一个深度增强学习算法。A3C算法完全使用了Actor-Critic框架,并且引入了异步训练的思想,在提升性能的同时也大大加快了训练速度。
  3. 所属分类:其它

    • 发布日期:2019-08-11
    • 文件大小:192512
    • 提供者:weixin_39840588
  1. Python-用pytorchmultiprocessing实现简单的A3C

  2. 用pytorch multiprocessing实现简单的A3C
  3. 所属分类:其它

    • 发布日期:2019-08-11
    • 文件大小:139264
    • 提供者:weixin_39840387
  1. 欧姆龙按钮开关(带灯·不带灯) (圆型φ12) A3C.pdf

  2. 欧姆龙按钮开关(带灯·不带灯) (圆型φ12) A3Cpdf,欧姆龙按钮开关(带灯·不带灯) (圆型φ12) A3C:柱体长20mm、圆型φ12系列。高亮度的均一面发光。由于是圆型所以容易打孔。小型化,操作触感好。
  3. 所属分类:其它

    • 发布日期:2019-09-20
    • 文件大小:2097152
    • 提供者:weixin_38743602
  1. 欧姆龙 按钮开关A3C/M2C产品样本.pdf

  2. 欧姆龙 按钮开关A3C/M2C产品样本pdf,长20mm、圆型φ12系列,高亮度的均一面发光。由于是圆型所以容易打孔。小型化,操作触感好。
  3. 所属分类:其它

    • 发布日期:2019-09-24
    • 文件大小:173056
    • 提供者:weixin_38744375
  1. rl_a3c_pytorch, A3C LSTM Atari与Pytorch加3g设计.zip

  2. rl_a3c_pytorch, A3C LSTM Atari与Pytorch加3g设计 新增加的3g A3G新的gpu/cpu架构,以大大加速训练 ! A3C Pytorch 新添加的3g !利用GPU提高训练速度的A3C新实现。 我们可以拨打 3g电话。 它的他版本的A3C相反,每个代理都有自己的
  3. 所属分类:其它

    • 发布日期:2019-10-09
    • 文件大小:30408704
    • 提供者:weixin_38744270
  1. breakout-ai:AI使用LSTM-A3C玩Breakout-源码

  2. 突围 AI使用LSTM-A3C玩Breakout
  3. 所属分类:其它

    • 发布日期:2021-03-21
    • 文件大小:8192
    • 提供者:weixin_42134143
  1. 类似于a3c:类似于a3c的RL代理接口-源码

  2. 类似于a3c:类似于a3c的RL代理接口
  3. 所属分类:其它

    • 发布日期:2021-02-16
    • 文件大小:6144
    • 提供者:weixin_42168555
  1. AI博客:让我们制作DQN A3C系列的随附存储库-源码

  2. AI博客:让我们制作DQN A3C系列的随附存储库
  3. 所属分类:其它

    • 发布日期:2021-02-06
    • 文件大小:14336
    • 提供者:weixin_42136477
  1. Super-mario-bros-A3C-pytorch:超级马里奥兄弟的异步优势Actor-Critic(A3C)算法-源码

  2. [PYTORCH]扮演超级马里奥兄弟的非同步优势演员评判(A3C) 介绍 这是我的python源代码,用于训练特工玩超级马里奥兄弟。 通过使用纸异步方法用于深强化学习引入异步优势演员,评论家(A3C)算法。 样品结果 动机 在我实施该项目之前,有多个存储库可以很好地重现本文的结果,这些存储库可以在Tensorflow,Keras和Pytorch等不同的常见深度学习框架中进行。 我认为,其中大多数都很棒。 但是,它们似乎在许多方面都过于复杂,包括图像的预处理,环境设置和权重初始化,这使
  3. 所属分类:其它

    • 发布日期:2021-02-05
    • 文件大小:314572800
    • 提供者:weixin_42100129
  1. 硕士论文:自动驾驶中的深度强化学习:用于使汽车学习在TORCS中驾驶的A3C算法; Python 3.5,Tensorflow,张量板,numpy,gym-torcs,ubuntu,乳胶-源码

  2. 自动驾驶中的深度强化学习 最适合离散操作:4名工人,学习率1e-4 无法使其在连续动作空间中正常工作; 它产生的动作出了问题 A3C创意 总览 人工神经网络的架构
  3. 所属分类:其它

    • 发布日期:2021-02-04
    • 文件大小:234881024
    • 提供者:weixin_42114041
  1. 带有火炬的深度增强学习:DQN,AC,ACER,A2C,A3C,PG,DDPG,TRPO,PPO,SAC,TD3和PyTorch实施...-源码

  2. 状态:活动(在活动开发中,可能会发生重大更改) 该存储库将实现经典且最新的深度强化学习算法。 该存储库的目的是为人们提供清晰的pytorch代码,以供他们学习深度强化学习算法。 将来,将添加更多最先进的算法,并且还将保留现有代码。 要求 python = 0.10 火炬> = 0.4 请注意,tensorflow不支持python3.7 安装 pip install -r requirements.txt 如果失败: 安装健身房 pip install gym 安装pytorc
  3. 所属分类:其它

    • 发布日期:2021-01-30
    • 文件大小:5242880
    • 提供者:weixin_42131443
  1. 基于A3C的无线异构网络自适应视频流传输控制方法

  2. 比特率自适应(ABR)算法已经成为视频传输中研究的热点之一。然而,由于5G无线异构网络具有信道带宽波动大、不同网络间差异明显等特点,多终端协同的自适应视频流传输面临着巨大挑战。提出了一种基于深度强化学习的自适应视频流传输控制方法。首先,建立了视频流动态规划模型,对传输码率以及分流策略进行联合优化。由于该优化问题的求解依赖于精确的信道估计,这在信道状态动态变化的网络中很难实现。因此,将动态规划问题改进为强化学习任务,并采用A3C算法,动态决策视频码率和分流策略。最后,根据实测的网络数据进行仿真,与
  3. 所属分类:其它

    • 发布日期:2021-01-19
    • 文件大小:983040
    • 提供者:weixin_38606811
« 12 3 »