您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. mbpo_pytorch:基于模型的强化学习算法MBPO的pytorch复制-源码

  2. 概述 这是pytorch中基于模型的RL算法MBPO的重新实现,如下文所述:。 该代码基于的使用张量流集成模型重现了结果,但使用pytorch集成模型却表现出明显的性能下降。 这段代码使用pytorch重新实现了集成动力学模型,并缩小了差距。 转载结果 比较是在两个任务上完成的,而其他任务没有经过测试。 但是在经过测试的两个任务上,与官方的tensorflow代码相比,pytorch实现获得了类似的性能。 依存关系 MuJoCo 1.5和MuJoCo 2.0 用法 python main_mb
  3. 所属分类:其它

    • 发布日期:2021-03-25
    • 文件大小:176128
    • 提供者:weixin_42168830
  1. rl代码:强化学习代码段-源码

  2. 强化学习代码段 如何运行 安装要求 pip install -r requirements.txt 运行代码 cd value-based/tabular # test sarsa code python -m sarsa # if running in terminal without display, use blow command xvfb-run -a -s " -screen 0 1400x900x24 " python -m raw_dqn 1. 1.1 1.2 2.基于策略
  3. 所属分类:其它

    • 发布日期:2021-02-20
    • 文件大小:99614720
    • 提供者:weixin_42097668
  1. rl-medical:使用PyTorch进行通信性多主体深度强化学习以进行解剖地标检测-源码

  2. RL医疗 使用PyTorch进行解剖标志检测的多主体深度强化学习。 这是用于的纸上的代码。 介绍 准确检测解剖标志是几个医学成像任务中必不可少的步骤。 该存储库实施了一种新颖的通信多主体强化学习(C-MARL)系统,以自动检测3D医学图像中的界标。 C-MARL通过在所有代理之间共享体系结构的某些权重,使代理能够学习显式通信信道以及隐式通信信号。 除了C-MARL,该代码还支持没有通信通道的单代理和多代理(名为Network3d)。 这段代码最初是一个fork。 为了方便起见,在data文件
  3. 所属分类:其它

    • 发布日期:2021-02-11
    • 文件大小:100663296
    • 提供者:weixin_42131861