您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. 各种强化学习算法

  2. 各种强化学习算法
  3. 所属分类:C/C++

    • 发布日期:2012-03-28
    • 文件大小:111616
    • 提供者:gudumeke
  1. 强化学习算法在供应链环境下的库存控制中的应用

  2. 强化学习算法在供应链环境下的库存控制中的应用,介绍强化算法的应用
  3. 所属分类:专业指导

    • 发布日期:2014-09-05
    • 文件大小:278528
    • 提供者:oopoop0010
  1. 强化学习算法汇总.rar

  2. 代码中包含13种强化学习算法,所调用的环境不仅包含gym下面的一些简单环境,还可以自己设计环境(简单的迷宫游戏),简洁明了,适合算法学习的同学使用,其中A3C与PPO还涉及了并行运算的算法。
  3. 所属分类:机器学习

    • 发布日期:2019-12-31
    • 文件大小:3145728
    • 提供者:circleyuanquan
  1. Python-OpenAIBaselines强化学习算法的高质量实现

  2. OpenAI Baselines: 强化学习算法的高质量实现
  3. 所属分类:其它

    • 发布日期:2019-08-09
    • 文件大小:4194304
    • 提供者:weixin_39840387
  1. 强化学习算法在分阶段组合投资决策中的应用_党兴华.pdf

  2. 强化学习算法在分阶段组合投资决策中的应用_党兴华.pdf
  3. 所属分类:金融

    • 发布日期:2020-11-19
    • 文件大小:329728
    • 提供者:qq_18822147
  1. 高引用逆强化学习算法在对象世界中的比较与实现

  2. 高引用逆强化学习算法在对象世界中的比较与实现
  3. 所属分类:其它

    • 发布日期:2021-03-25
    • 文件大小:465920
    • 提供者:weixin_38536349
  1. drone_search:多主体深度强化学习算法-源码

  2. drone_search 多主体深度强化学习算法
  3. 所属分类:其它

    • 发布日期:2021-03-17
    • 文件大小:564224
    • 提供者:weixin_42097914
  1. DeepReinforcementLearning:pytorch中的深度强化学习算法!!-源码

  2. DeepReinforcementLearning:pytorch中的深度强化学习算法!!
  3. 所属分类:其它

    • 发布日期:2021-03-15
    • 文件大小:26624
    • 提供者:weixin_42117116
  1. 基于梯度的多协作智能强化学习算法

  2. 基于梯度的多协作智能强化学习算法
  3. 所属分类:其它

    • 发布日期:2021-03-08
    • 文件大小:524288
    • 提供者:weixin_38742421
  1. 交互:深度强化学习算法的实现-源码

  2. 相互作用 Interact包含几种深度强化学习算法的实现。 安装 可以按以下方式安装Interact: git clone https://github.com/rystrauss/interact cd interact pip install . 如果要使用Gym默认未安装的Gym环境,则需要自己安装(例如pip install gym[atari] )。 用法 训练 可以使用以下命令来训练代理: python -m interact.train --config 该软件包使用配置实
  3. 所属分类:其它

    • 发布日期:2021-03-03
    • 文件大小:63488
    • 提供者:weixin_42181693
  1. RobocodeTank:具有完全连接的神经网络和强化学习算法的Robocode储罐-源码

  2. RobocodeTank:具有完全连接的神经网络和强化学习算法的Robocode储罐
  3. 所属分类:其它

    • 发布日期:2021-02-20
    • 文件大小:17408
    • 提供者:weixin_42131342
  1. RL-Pytorch:不同强化学习算法的实现-源码

  2. 强化学习算法-PyTorch 针对OpenAI体育馆环境的不同强化学习算法的PyTorch实现。 用法 要测试预先训练的网络:运行test.py或test_continuous.py 训练新网络:运行train.py或train_continuous.py 所有超参数都在train.py或train_continuous.py文件中 如果您尝试在操作维数= 1的环境中对其进行训练,请确保检查PPO类的update函数中的张量维,因为我已经使用过torch.squeeze()多次。 torc
  3. 所属分类:其它

    • 发布日期:2021-02-20
    • 文件大小:4194304
    • 提供者:weixin_42108054
  1. DeepReinforcementLearning-DDPG-for-RoboticsControl:这是名为深度确定性策略梯度(DDPG)的深度强化学习算法的实现,以训练4自由度机械臂达到移动目标。 动作空间是连续的,学习的特工为机器人输

  2. DDPGforRoboticsControl 这是名为深度确定性策略梯度(DDPG)的深度强化学习算法的实现,用于训练4自由度机械臂以达到移动目标。 动作空间是连续的,学习的代理会输出扭矩以使机器人移动到特定的目标位置。 环境 一个包含20个相同代理的,每个代理都有其自己的环境副本。 在这种环境下,双臂可以移动到目标位置。 对于代理人的手在目标位置中的每一步,将提供+0.1的奖励。 因此,座席的目标是在尽可能多的时间步中保持其在目标位置的位置。 观察空间由33个变量组成,分别对应于手臂的位置
  3. 所属分类:其它

    • 发布日期:2021-02-17
    • 文件大小:20971520
    • 提供者:weixin_42141437
  1. FloPyArcade:模拟地下水流动环境以测试强化学习算法-源码

  2. FloPyArcade提供了由驱动的简单的地下水街机类型的模拟环境。 它基于的功能,MODFLOW及其相关软件的预处理和后处理。 该想法是为地下水社区提供基准测试环境和示例,以允许对算法进行实验以寻求最佳控制。 概括地说,这很重要的原因:可以将这里的游戏中所包含的内容设想为给定模型(集成)的任意地下水系统的真实操作。 您可以类似地优化和测试策略模型,例如用于站点的实时操作。 为时已晚,几十年前的街机游戏达到顶峰,您会认为吗? 明显地。 但是随着的出现使他们重新获得了兴趣,它可以通过强化学习为
  3. 所属分类:其它

    • 发布日期:2021-02-14
    • 文件大小:52428800
    • 提供者:weixin_42166626
  1. 基线:OpenAI基线:强化学习算法的高质量实现-源码

  2. 状态:维护(预计错误修复和次要更新) 基准线 OpenAI Baselines是强化学习算法的一组高质量实现。 这些算法将使研究团体更容易复制,完善和识别新思想,并创建良好的基线以在其上进行研究。 我们的DQN实施及其变体与已发表论文的得分大致相当。 我们希望它们将被用作添加新想法的基础,以及将新方法与现有方法进行比较的工具。 先决条件 基线需要带有开发标头的python3(> = 3.5)。 您还需要系统软件包CMake,OpenMPI和zlib。 可以按以下方式安装 的Ubuntu
  3. 所属分类:其它

    • 发布日期:2021-02-12
    • 文件大小:4194304
    • 提供者:weixin_42127020
  1. 基于内在动机的强化学习算法在两轮机器人中的研究

  2. 基于内在动机的强化学习算法在两轮机器人中的研究
  3. 所属分类:其它

    • 发布日期:2021-02-10
    • 文件大小:294912
    • 提供者:weixin_38686245
  1. 强化学习:强化学习算法的实现。 Python,OpenAI Gym,Tensorflow 萨顿书和戴维·西尔弗课程的练习和解决方案-源码

  2. 总览 该存储库提供了流行的强化学习算法的代码,练习和解决方案。 这些旨在作为一种学习工具来补充来自 中的每个文件夹对应于上述教科书和/或课程的一个或多个章节。 除了练习和解决方案之外,每个文件夹还包含学习目标列表,简要概念摘要以及指向相关阅读材料的链接。 所有代码均使用Python 3编写,并使用RL环境。 先进的技术将用于神经网络实现。 目录 (WIP) (WIP) 学习与计划(WIP) 勘探与开发(WIP) 实施算法清单 优先体验重播(WIP)的深度Q学习 连续操作空间(WIP)的确
  3. 所属分类:其它

    • 发布日期:2021-02-10
    • 文件大小:1048576
    • 提供者:weixin_42130786
  1. RLcode:自我实现的强化学习算法-源码

  2. RL代码 自我实现的强化学习算法。
  3. 所属分类:其它

    • 发布日期:2021-02-10
    • 文件大小:5120
    • 提供者:weixin_42100032
  1. 健身房:用于开发和比较强化学习算法的工具包-源码

  2. 状态:维护(预计错误修复和次要更新) OpenAI Gym是用于开发和比较强化学习算法的工具包。 这是gym开放源代码库,可让您访问一组标准化的环境。 gym不对代理的结构进行任何假设,并且与任何数字计算库(例如TensorFlow或Theano)兼容。 您可以从Python代码中使用它,很快就可以从其他语言中使用它。 如果您不确定从哪里开始,建议您从我们网站上的开始。 另请参阅。 有关OpenAI Gym的白皮书,请访问 ,这是一个BibTeX条目,您可以在出版物中引用它: misc
  3. 所属分类:其它

    • 发布日期:2021-02-07
    • 文件大小:1048576
    • 提供者:weixin_42109178
  1. DeepRL-TensorFlow2:using使用TensorFlow2轻松实现各种流行的深度强化学习算法-源码

  2. TensorFlow2中的深度强化学习 是一个使用实现各种流行的深度强化学习算法的存储库。 该存储库的关键是易于理解的代码。 因此,如果您是学生或研究深度强化学习的研究人员,我认为这是使用此存储库学习的最佳选择。 一种算法仅依赖于一个python脚本文件。 因此,您不必进出不同的文件即可研究特定的算法。 该存储库将不断更新,并将继续添加新的“深度强化学习”算法。 演算法 DQN 纸上 作者Volodymyr Mnih,Koray Kavukcuoglu,David Silver,Alex
  3. 所属分类:其它

    • 发布日期:2021-02-06
    • 文件大小:387072
    • 提供者:weixin_42146888
« 12 3 4 5 6 7 8 9 10 ... 30 »