点数信息
www.dssz.net
注册会员
|
设为首页
|
加入收藏夹
您好,欢迎光临本网站!
[请登录]
!
[注册会员]
!
首页
移动开发
云计算
大数据
数据库
游戏开发
人工智能
网络技术
区块链
操作系统
模糊查询
热门搜索:
源码
Android
整站
插件
识别
p2p
游戏
算法
更多...
在线客服QQ:632832888
当前位置:
资源下载
搜索资源 - 强化学习算法
下载资源分类
移动开发
开发技术
课程资源
网络技术
操作系统
安全技术
数据库
行业
服务器应用
存储
信息化
考试认证
云计算
大数据
跨平台
音视频
游戏开发
人工智能
区块链
在结果中搜索
所属系统
Windows
Linux
FreeBSD
Unix
Dos
PalmOS
WinCE
SymbianOS
MacOS
Android
开发平台
Visual C
Visual.Net
Borland C
CBuilder
Dephi
gcc
VBA
LISP
IDL
VHDL
Matlab
MathCAD
Flash
Xcode
Android STU
LabVIEW
开发语言
C/C++
Pascal
ASM
Java
PHP
Basic/ASP
Perl
Python
VBScript
JavaScript
SQL
FoxBase
SHELL
E语言
OC/Swift
文件类型
源码
程序
CHM
PDF
PPT
WORD
Excel
Access
HTML
Text
资源分类
搜索资源列表
各种强化学习算法
各种强化学习算法
所属分类:
C/C++
发布日期:2012-03-28
文件大小:111616
提供者:
gudumeke
强化学习算法在供应链环境下的库存控制中的应用
强化学习算法在供应链环境下的库存控制中的应用,介绍强化算法的应用
所属分类:
专业指导
发布日期:2014-09-05
文件大小:278528
提供者:
oopoop0010
强化学习算法汇总.rar
代码中包含13种强化学习算法,所调用的环境不仅包含gym下面的一些简单环境,还可以自己设计环境(简单的迷宫游戏),简洁明了,适合算法学习的同学使用,其中A3C与PPO还涉及了并行运算的算法。
所属分类:
机器学习
发布日期:2019-12-31
文件大小:3145728
提供者:
circleyuanquan
Python-OpenAIBaselines强化学习算法的高质量实现
OpenAI Baselines: 强化学习算法的高质量实现
所属分类:
其它
发布日期:2019-08-09
文件大小:4194304
提供者:
weixin_39840387
强化学习算法在分阶段组合投资决策中的应用_党兴华.pdf
强化学习算法在分阶段组合投资决策中的应用_党兴华.pdf
所属分类:
金融
发布日期:2020-11-19
文件大小:329728
提供者:
qq_18822147
高引用逆强化学习算法在对象世界中的比较与实现
高引用逆强化学习算法在对象世界中的比较与实现
所属分类:
其它
发布日期:2021-03-25
文件大小:465920
提供者:
weixin_38536349
drone_search:多主体深度强化学习算法-源码
drone_search 多主体深度强化学习算法
所属分类:
其它
发布日期:2021-03-17
文件大小:564224
提供者:
weixin_42097914
DeepReinforcementLearning:pytorch中的深度强化学习算法!!-源码
DeepReinforcementLearning:pytorch中的深度强化学习算法!!
所属分类:
其它
发布日期:2021-03-15
文件大小:26624
提供者:
weixin_42117116
基于梯度的多协作智能强化学习算法
基于梯度的多协作智能强化学习算法
所属分类:
其它
发布日期:2021-03-08
文件大小:524288
提供者:
weixin_38742421
交互:深度强化学习算法的实现-源码
相互作用 Interact包含几种深度强化学习算法的实现。 安装 可以按以下方式安装Interact: git clone https://github.com/rystrauss/interact cd interact pip install . 如果要使用Gym默认未安装的Gym环境,则需要自己安装(例如pip install gym[atari] )。 用法 训练 可以使用以下命令来训练代理: python -m interact.train --config 该软件包使用配置实
所属分类:
其它
发布日期:2021-03-03
文件大小:63488
提供者:
weixin_42181693
RobocodeTank:具有完全连接的神经网络和强化学习算法的Robocode储罐-源码
RobocodeTank:具有完全连接的神经网络和强化学习算法的Robocode储罐
所属分类:
其它
发布日期:2021-02-20
文件大小:17408
提供者:
weixin_42131342
RL-Pytorch:不同强化学习算法的实现-源码
强化学习算法-PyTorch 针对OpenAI体育馆环境的不同强化学习算法的PyTorch实现。 用法 要测试预先训练的网络:运行test.py或test_continuous.py 训练新网络:运行train.py或train_continuous.py 所有超参数都在train.py或train_continuous.py文件中 如果您尝试在操作维数= 1的环境中对其进行训练,请确保检查PPO类的update函数中的张量维,因为我已经使用过torch.squeeze()多次。 torc
所属分类:
其它
发布日期:2021-02-20
文件大小:4194304
提供者:
weixin_42108054
DeepReinforcementLearning-DDPG-for-RoboticsControl:这是名为深度确定性策略梯度(DDPG)的深度强化学习算法的实现,以训练4自由度机械臂达到移动目标。 动作空间是连续的,学习的特工为机器人输
DDPGforRoboticsControl 这是名为深度确定性策略梯度(DDPG)的深度强化学习算法的实现,用于训练4自由度机械臂以达到移动目标。 动作空间是连续的,学习的代理会输出扭矩以使机器人移动到特定的目标位置。 环境 一个包含20个相同代理的,每个代理都有其自己的环境副本。 在这种环境下,双臂可以移动到目标位置。 对于代理人的手在目标位置中的每一步,将提供+0.1的奖励。 因此,座席的目标是在尽可能多的时间步中保持其在目标位置的位置。 观察空间由33个变量组成,分别对应于手臂的位置
所属分类:
其它
发布日期:2021-02-17
文件大小:20971520
提供者:
weixin_42141437
FloPyArcade:模拟地下水流动环境以测试强化学习算法-源码
FloPyArcade提供了由驱动的简单的地下水街机类型的模拟环境。 它基于的功能,MODFLOW及其相关软件的预处理和后处理。 该想法是为地下水社区提供基准测试环境和示例,以允许对算法进行实验以寻求最佳控制。 概括地说,这很重要的原因:可以将这里的游戏中所包含的内容设想为给定模型(集成)的任意地下水系统的真实操作。 您可以类似地优化和测试策略模型,例如用于站点的实时操作。 为时已晚,几十年前的街机游戏达到顶峰,您会认为吗? 明显地。 但是随着的出现使他们重新获得了兴趣,它可以通过强化学习为
所属分类:
其它
发布日期:2021-02-14
文件大小:52428800
提供者:
weixin_42166626
基线:OpenAI基线:强化学习算法的高质量实现-源码
状态:维护(预计错误修复和次要更新) 基准线 OpenAI Baselines是强化学习算法的一组高质量实现。 这些算法将使研究团体更容易复制,完善和识别新思想,并创建良好的基线以在其上进行研究。 我们的DQN实施及其变体与已发表论文的得分大致相当。 我们希望它们将被用作添加新想法的基础,以及将新方法与现有方法进行比较的工具。 先决条件 基线需要带有开发标头的python3(> = 3.5)。 您还需要系统软件包CMake,OpenMPI和zlib。 可以按以下方式安装 的Ubuntu
所属分类:
其它
发布日期:2021-02-12
文件大小:4194304
提供者:
weixin_42127020
基于内在动机的强化学习算法在两轮机器人中的研究
基于内在动机的强化学习算法在两轮机器人中的研究
所属分类:
其它
发布日期:2021-02-10
文件大小:294912
提供者:
weixin_38686245
强化学习:强化学习算法的实现。 Python,OpenAI Gym,Tensorflow 萨顿书和戴维·西尔弗课程的练习和解决方案-源码
总览 该存储库提供了流行的强化学习算法的代码,练习和解决方案。 这些旨在作为一种学习工具来补充来自 中的每个文件夹对应于上述教科书和/或课程的一个或多个章节。 除了练习和解决方案之外,每个文件夹还包含学习目标列表,简要概念摘要以及指向相关阅读材料的链接。 所有代码均使用Python 3编写,并使用RL环境。 先进的技术将用于神经网络实现。 目录 (WIP) (WIP) 学习与计划(WIP) 勘探与开发(WIP) 实施算法清单 优先体验重播(WIP)的深度Q学习 连续操作空间(WIP)的确
所属分类:
其它
发布日期:2021-02-10
文件大小:1048576
提供者:
weixin_42130786
RLcode:自我实现的强化学习算法-源码
RL代码 自我实现的强化学习算法。
所属分类:
其它
发布日期:2021-02-10
文件大小:5120
提供者:
weixin_42100032
健身房:用于开发和比较强化学习算法的工具包-源码
状态:维护(预计错误修复和次要更新) OpenAI Gym是用于开发和比较强化学习算法的工具包。 这是gym开放源代码库,可让您访问一组标准化的环境。 gym不对代理的结构进行任何假设,并且与任何数字计算库(例如TensorFlow或Theano)兼容。 您可以从Python代码中使用它,很快就可以从其他语言中使用它。 如果您不确定从哪里开始,建议您从我们网站上的开始。 另请参阅。 有关OpenAI Gym的白皮书,请访问 ,这是一个BibTeX条目,您可以在出版物中引用它: misc
所属分类:
其它
发布日期:2021-02-07
文件大小:1048576
提供者:
weixin_42109178
DeepRL-TensorFlow2:using使用TensorFlow2轻松实现各种流行的深度强化学习算法-源码
TensorFlow2中的深度强化学习 是一个使用实现各种流行的深度强化学习算法的存储库。 该存储库的关键是易于理解的代码。 因此,如果您是学生或研究深度强化学习的研究人员,我认为这是使用此存储库学习的最佳选择。 一种算法仅依赖于一个python脚本文件。 因此,您不必进出不同的文件即可研究特定的算法。 该存储库将不断更新,并将继续添加新的“深度强化学习”算法。 演算法 DQN 纸上 作者Volodymyr Mnih,Koray Kavukcuoglu,David Silver,Alex
所属分类:
其它
发布日期:2021-02-06
文件大小:387072
提供者:
weixin_42146888
«
1
2
3
4
5
6
7
8
9
10
...
30
»