您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. mbpo_pytorch:基于模型的强化学习算法MBPO的pytorch复制-源码

  2. 概述 这是pytorch中基于模型的RL算法MBPO的重新实现,如下文所述:。 该代码基于的使用张量流集成模型重现了结果,但使用pytorch集成模型却表现出明显的性能下降。 这段代码使用pytorch重新实现了集成动力学模型,并缩小了差距。 转载结果 比较是在两个任务上完成的,而其他任务没有经过测试。 但是在经过测试的两个任务上,与官方的tensorflow代码相比,pytorch实现获得了类似的性能。 依存关系 MuJoCo 1.5和MuJoCo 2.0 用法 python main_mb
  3. 所属分类:其它

    • 发布日期:2021-03-25
    • 文件大小:176128
    • 提供者:weixin_42168830