搜索资源 - A3C - 点数信息

点数信息

注册会员 | 设为首页 | 加入收藏夹

您好，欢迎光临本网站！[请登录] ！[注册会员]！

热门搜索： 源码 Android 整站插件识别 p2p 游戏算法更多...

在线客服QQ:632832888

当前位置：

搜索资源 - A3C

下载资源分类

移动开发

开发技术

课程资源

网络技术

操作系统

安全技术

数据库

行业

服务器应用

存储

信息化

考试认证

云计算

大数据

跨平台

音视频

游戏开发

人工智能

区块链

资源分类

搜索资源列表

如何理解A3C算法
如何理解深度强化学习基本概念：value-based，policy-based，off-policy，on-policy。以及A3C算法
所属分类：机器学习
- 发布日期：2017-12-03
- 文件大小：2097152
- 提供者：yangshaokangrushi

deep q_learning
# Deep Reinforcement Learning for Keras [![Build Status](https://api.travis-ci.org/matthiasplappert/keras-rl.svg?branch=master)](https://travis-ci.org/matthiasplappert/keras-rl) [![Documentation](https://readthedocs.org/projects/keras-rl/badge/)](ht
所属分类：深度学习
- 发布日期：2018-06-19
- 文件大小：10485760
- 提供者：weixin_37949195

强化学习算法与应用
强化学习知识算法与应用、讲解的算法有DDPG、DQN、A3C以及相关场景的应用
所属分类：其它
- 发布日期：2018-08-08
- 文件大小：23068672
- 提供者：weixin_41362649

Asynchronous Methods for Deep Reinforcement Learning
增强学习经典算法 A3C 论文摘要： We propose a conceptually simple and lightweight framework for deep reinforcement learning that uses asynchronous gradient descent for optimization of deep neural network controllers. We present asynchronous variants of four stan
所属分类：机器学习
- 发布日期：2018-02-01
- 文件大小：2097152
- 提供者：ningweikang

深度强化学习 - Actor-Critic
Actor-Critic Asynchronous Advantage Actor-Critic (A3C) Pathwise Derivative Policy Gradient
所属分类：深度学习
- 发布日期：2019-01-30
- 文件大小：1048576
- 提供者：mozart_cai

A3C-PyTorch-master
应用Pytorch平台的深度学习算法和实现该算法的python程序
所属分类：深度学习
- 发布日期：2019-02-11
- 文件大小：2097152
- 提供者：linkapp

深度强化学习必读文献
深度强化学习的入门经典文献：包括DQN、DDPG、A3C/A2C/PPO/ACKTR等；包括模仿学习，也包括几篇综述性的文章。
所属分类：机器学习
- 发布日期：2019-02-22
- 文件大小：33554432
- 提供者：weixin_41754912

Python-实现MetaRLA3C算法
实现Meta-RL A3C算法
所属分类：其它
- 发布日期：2019-08-11
- 文件大小：832512
- 提供者：weixin_39840914

pytorcha3c是A3C算法的一个PyTorch实现
pytorch-a3c是A3C算法的一个PyTorch实现。A3C算法是2015年DeepMind提出的相比DQN更好更通用的一个深度增强学习算法。A3C算法完全使用了Actor-Critic框架，并且引入了异步训练的思想，在提升性能的同时也大大加快了训练速度。
所属分类：其它
- 发布日期：2019-08-11
- 文件大小：192512
- 提供者：weixin_39840588

Python-用pytorchmultiprocessing实现简单的A3C
用pytorch multiprocessing实现简单的A3C
所属分类：其它
- 发布日期：2019-08-11
- 文件大小：139264
- 提供者：weixin_39840387

欧姆龙按钮开关(带灯·不带灯) (圆型φ12) A3C.pdf
欧姆龙按钮开关(带灯·不带灯) (圆型φ12) A3Cpdf,欧姆龙按钮开关(带灯·不带灯) (圆型φ12) A3C：柱体长20mm、圆型φ12系列。高亮度的均一面发光。由于是圆型所以容易打孔。小型化，操作触感好。
所属分类：其它
- 发布日期：2019-09-20
- 文件大小：2097152
- 提供者：weixin_38743602

欧姆龙按钮开关A3C/M2C产品样本.pdf
欧姆龙按钮开关A3C/M2C产品样本pdf,长20mm、圆型φ12系列，高亮度的均一面发光。由于是圆型所以容易打孔。小型化，操作触感好。
所属分类：其它
- 发布日期：2019-09-24
- 文件大小：173056
- 提供者：weixin_38744375

rl_a3c_pytorch, A3C LSTM Atari与Pytorch加3g设计.zip
rl_a3c_pytorch, A3C LSTM Atari与Pytorch加3g设计新增加的3g A3G新的gpu/cpu架构，以大大加速训练！ A3C Pytorch 新添加的3g ！利用GPU提高训练速度的A3C新实现。我们可以拨打 3g电话。它的他版本的A3C相反，每个代理都有自己的
所属分类：其它
- 发布日期：2019-10-09
- 文件大小：30408704
- 提供者：weixin_38744270

breakout-ai:AI使用LSTM-A3C玩Breakout-源码
突围 AI使用LSTM-A3C玩Breakout
所属分类：其它
- 发布日期：2021-03-21
- 文件大小：8192
- 提供者：weixin_42134143

类似于a3c：类似于a3c的RL代理接口-源码
类似于a3c：类似于a3c的RL代理接口
所属分类：其它
- 发布日期：2021-02-16
- 文件大小：6144
- 提供者：weixin_42168555

AI博客：让我们制作DQN A3C系列的随附存储库-源码
AI博客：让我们制作DQN A3C系列的随附存储库
所属分类：其它
- 发布日期：2021-02-06
- 文件大小：14336
- 提供者：weixin_42136477

Super-mario-bros-A3C-pytorch：超级马里奥兄弟的异步优势Actor-Critic（A3C）算法-源码
[PYTORCH]扮演超级马里奥兄弟的非同步优势演员评判（A3C）介绍这是我的python源代码，用于训练特工玩超级马里奥兄弟。通过使用纸异步方法用于深强化学习引入异步优势演员，评论家（A3C）算法。样品结果动机在我实施该项目之前，有多个存储库可以很好地重现本文的结果，这些存储库可以在Tensorflow，Keras和Pytorch等不同的常见深度学习框架中进行。我认为，其中大多数都很棒。但是，它们似乎在许多方面都过于复杂，包括图像的预处理，环境设置和权重初始化，这使
所属分类：其它
- 发布日期：2021-02-05
- 文件大小：314572800
- 提供者：weixin_42100129

硕士论文：自动驾驶中的深度强化学习：用于使汽车学习在TORCS中驾驶的A3C算法； Python 3.5，Tensorflow，张量板，numpy，gym-torcs，ubuntu，乳胶-源码
自动驾驶中的深度强化学习最适合离散操作：4名工人，学习率1e-4 无法使其在连续动作空间中正常工作；它产生的动作出了问题 A3C创意总览人工神经网络的架构
所属分类：其它
- 发布日期：2021-02-04
- 文件大小：234881024
- 提供者：weixin_42114041

带有火炬的深度增强学习：DQN，AC，ACER，A2C，A3C，PG，DDPG，TRPO，PPO，SAC，TD3和PyTorch实施...-源码
状态：活动（在活动开发中，可能会发生重大更改）该存储库将实现经典且最新的深度强化学习算法。该存储库的目的是为人们提供清晰的pytorch代码，以供他们学习深度强化学习算法。将来，将添加更多最先进的算法，并且还将保留现有代码。要求 python = 0.10 火炬> = 0.4 请注意，tensorflow不支持python3.7 安装 pip install -r requirements.txt 如果失败：安装健身房 pip install gym 安装pytorc
所属分类：其它
- 发布日期：2021-01-30
- 文件大小：5242880
- 提供者：weixin_42131443

基于A3C的无线异构网络自适应视频流传输控制方法
比特率自适应（ABR）算法已经成为视频传输中研究的热点之一。然而，由于5G无线异构网络具有信道带宽波动大、不同网络间差异明显等特点，多终端协同的自适应视频流传输面临着巨大挑战。提出了一种基于深度强化学习的自适应视频流传输控制方法。首先，建立了视频流动态规划模型，对传输码率以及分流策略进行联合优化。由于该优化问题的求解依赖于精确的信道估计，这在信道状态动态变化的网络中很难实现。因此，将动态规划问题改进为强化学习任务，并采用A3C算法，动态决策视频码率和分流策略。最后，根据实测的网络数据进行仿真，与
所属分类：其它
- 发布日期：2021-01-19
- 文件大小：983040
- 提供者：weixin_38606811

« 12 3 »