搜索资源 - 强化学习算法 - 点数信息

点数信息

注册会员 | 设为首页 | 加入收藏夹

您好，欢迎光临本网站！[请登录] ！[注册会员]！

热门搜索： 源码 Android 整站插件识别 p2p 游戏算法更多...

在线客服QQ:632832888

当前位置：

搜索资源 - 强化学习算法

下载资源分类

移动开发

开发技术

课程资源

网络技术

操作系统

安全技术

数据库

行业

服务器应用

存储

信息化

考试认证

云计算

大数据

跨平台

音视频

游戏开发

人工智能

区块链

资源分类

搜索资源列表

各种强化学习算法
各种强化学习算法
所属分类：C/C++
- 发布日期：2012-03-28
- 文件大小：111616
- 提供者：gudumeke

强化学习算法在供应链环境下的库存控制中的应用
强化学习算法在供应链环境下的库存控制中的应用,介绍强化算法的应用
所属分类：专业指导
- 发布日期：2014-09-05
- 文件大小：278528
- 提供者：oopoop0010

强化学习算法汇总.rar
代码中包含13种强化学习算法，所调用的环境不仅包含gym下面的一些简单环境，还可以自己设计环境（简单的迷宫游戏），简洁明了，适合算法学习的同学使用，其中A3C与PPO还涉及了并行运算的算法。
所属分类：机器学习
- 发布日期：2019-12-31
- 文件大小：3145728
- 提供者：circleyuanquan

Python-OpenAIBaselines强化学习算法的高质量实现
OpenAI Baselines: 强化学习算法的高质量实现
所属分类：其它
- 发布日期：2019-08-09
- 文件大小：4194304
- 提供者：weixin_39840387

强化学习算法在分阶段组合投资决策中的应用_党兴华.pdf
强化学习算法在分阶段组合投资决策中的应用_党兴华.pdf
所属分类：金融
- 发布日期：2020-11-19
- 文件大小：329728
- 提供者：qq_18822147

高引用逆强化学习算法在对象世界中的比较与实现
高引用逆强化学习算法在对象世界中的比较与实现
所属分类：其它
- 发布日期：2021-03-25
- 文件大小：465920
- 提供者：weixin_38536349

drone_search:多主体深度强化学习算法-源码
drone_search 多主体深度强化学习算法
所属分类：其它
- 发布日期：2021-03-17
- 文件大小：564224
- 提供者：weixin_42097914

DeepReinforcementLearning:pytorch中的深度强化学习算法！！-源码
DeepReinforcementLearning:pytorch中的深度强化学习算法！！
所属分类：其它
- 发布日期：2021-03-15
- 文件大小：26624
- 提供者：weixin_42117116

基于梯度的多协作智能强化学习算法
基于梯度的多协作智能强化学习算法
所属分类：其它
- 发布日期：2021-03-08
- 文件大小：524288
- 提供者：weixin_38742421

交互：深度强化学习算法的实现-源码
相互作用 Interact包含几种深度强化学习算法的实现。安装可以按以下方式安装Interact： git clone https://github.com/rystrauss/interact cd interact pip install . 如果要使用Gym默认未安装的Gym环境，则需要自己安装（例如pip install gym[atari] ）。用法训练可以使用以下命令来训练代理： python -m interact.train --config 该软件包使用配置实
所属分类：其它
- 发布日期：2021-03-03
- 文件大小：63488
- 提供者：weixin_42181693

RobocodeTank：具有完全连接的神经网络和强化学习算法的Robocode储罐-源码
RobocodeTank：具有完全连接的神经网络和强化学习算法的Robocode储罐
所属分类：其它
- 发布日期：2021-02-20
- 文件大小：17408
- 提供者：weixin_42131342

RL-Pytorch：不同强化学习算法的实现-源码
强化学习算法-PyTorch 针对OpenAI体育馆环境的不同强化学习算法的PyTorch实现。用法要测试预先训练的网络：运行test.py或test_continuous.py 训练新网络：运行train.py或train_continuous.py 所有超参数都在train.py或train_continuous.py文件中如果您尝试在操作维数= 1的环境中对其进行训练，请确保检查PPO类的update函数中的张量维，因为我已经使用过torch.squeeze()多次。 torc
所属分类：其它
- 发布日期：2021-02-20
- 文件大小：4194304
- 提供者：weixin_42108054

DeepReinforcementLearning-DDPG-for-RoboticsControl：这是名为深度确定性策略梯度（DDPG）的深度强化学习算法的实现，以训练4自由度机械臂达到移动目标。动作空间是连续的，学习的特工为机器人输
DDPGforRoboticsControl 这是名为深度确定性策略梯度（DDPG）的深度强化学习算法的实现，用于训练4自由度机械臂以达到移动目标。动作空间是连续的，学习的代理会输出扭矩以使机器人移动到特定的目标位置。环境一个包含20个相同代理的，每个代理都有其自己的环境副本。在这种环境下，双臂可以移动到目标位置。对于代理人的手在目标位置中的每一步，将提供+0.1的奖励。因此，座席的目标是在尽可能多的时间步中保持其在目标位置的位置。观察空间由33个变量组成，分别对应于手臂的位置
所属分类：其它
- 发布日期：2021-02-17
- 文件大小：20971520
- 提供者：weixin_42141437

FloPyArcade：模拟地下水流动环境以测试强化学习算法-源码
FloPyArcade提供了由驱动的简单的地下水街机类型的模拟环境。它基于的功能，MODFLOW及其相关软件的预处理和后处理。该想法是为地下水社区提供基准测试环境和示例，以允许对算法进行实验以寻求最佳控制。概括地说，这很重要的原因：可以将这里的游戏中所包含的内容设想为给定模型（集成）的任意地下水系统的真实操作。您可以类似地优化和测试策略模型，例如用于站点的实时操作。为时已晚，几十年前的街机游戏达到顶峰，您会认为吗？明显地。但是随着的出现使他们重新获得了兴趣，它可以通过强化学习为
所属分类：其它
- 发布日期：2021-02-14
- 文件大小：52428800
- 提供者：weixin_42166626

基线：OpenAI基线：强化学习算法的高质量实现-源码
状态：维护（预计错误修复和次要更新）基准线 OpenAI Baselines是强化学习算法的一组高质量实现。这些算法将使研究团体更容易复制，完善和识别新思想，并创建良好的基线以在其上进行研究。我们的DQN实施及其变体与已发表论文的得分大致相当。我们希望它们将被用作添加新想法的基础，以及将新方法与现有方法进行比较的工具。先决条件基线需要带有开发标头的python3（> = 3.5）。您还需要系统软件包CMake，OpenMPI和zlib。可以按以下方式安装的Ubuntu
所属分类：其它
- 发布日期：2021-02-12
- 文件大小：4194304
- 提供者：weixin_42127020

基于内在动机的强化学习算法在两轮机器人中的研究
基于内在动机的强化学习算法在两轮机器人中的研究
所属分类：其它
- 发布日期：2021-02-10
- 文件大小：294912
- 提供者：weixin_38686245

强化学习：强化学习算法的实现。 Python，OpenAI Gym，Tensorflow 萨顿书和戴维·西尔弗课程的练习和解决方案-源码
总览该存储库提供了流行的强化学习算法的代码，练习和解决方案。这些旨在作为一种学习工具来补充来自中的每个文件夹对应于上述教科书和/或课程的一个或多个章节。除了练习和解决方案之外，每个文件夹还包含学习目标列表，简要概念摘要以及指向相关阅读材料的链接。所有代码均使用Python 3编写，并使用RL环境。先进的技术将用于神经网络实现。目录（WIP）（WIP）学习与计划（WIP）勘探与开发（WIP）实施算法清单优先体验重播（WIP）的深度Q学习连续操作空间（WIP）的确
所属分类：其它
- 发布日期：2021-02-10
- 文件大小：1048576
- 提供者：weixin_42130786

RLcode：自我实现的强化学习算法-源码
RL代码自我实现的强化学习算法。
所属分类：其它
- 发布日期：2021-02-10
- 文件大小：5120
- 提供者：weixin_42100032

健身房：用于开发和比较强化学习算法的工具包-源码
状态：维护（预计错误修复和次要更新） OpenAI Gym是用于开发和比较强化学习算法的工具包。这是gym开放源代码库，可让您访问一组标准化的环境。 gym不对代理的结构进行任何假设，并且与任何数字计算库（例如TensorFlow或Theano）兼容。您可以从Python代码中使用它，很快就可以从其他语言中使用它。如果您不确定从哪里开始，建议您从我们网站上的开始。另请参阅。有关OpenAI Gym的白皮书，请访问，这是一个BibTeX条目，您可以在出版物中引用它： misc
所属分类：其它
- 发布日期：2021-02-07
- 文件大小：1048576
- 提供者：weixin_42109178

DeepRL-TensorFlow2：using使用TensorFlow2轻松实现各种流行的深度强化学习算法-源码
TensorFlow2中的深度强化学习是一个使用实现各种流行的深度强化学习算法的存储库。该存储库的关键是易于理解的代码。因此，如果您是学生或研究深度强化学习的研究人员，我认为这是使用此存储库学习的最佳选择。一种算法仅依赖于一个python脚本文件。因此，您不必进出不同的文件即可研究特定的算法。该存储库将不断更新，并将继续添加新的“深度强化学习”算法。演算法 DQN 纸上作者Volodymyr Mnih，Koray Kavukcuoglu，David Silver，Alex
所属分类：其它
- 发布日期：2021-02-06
- 文件大小：387072
- 提供者：weixin_42146888

« 12 3 4 5 6 7 8 9 10 ... 30 »