您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. Upside-Down-Reinforcement-Learning:PyTorch中的颠倒强化学习(⅂ꓤ)实施。 基于JürgenSchmidhuber发表的论文-源码

  2. 颠倒的强化学习 Pytorch中的颠倒强化学习(⅂ꓤ)实施。 基于JürgenSchmidhuber发表的论文: 该存储库包含一个离散动作空间以及一个针对OpenAI Gym CartPole环境(该环境的版本)的连续动作空间实现。 笔记本包括行为功能的培训以及评估部分,您可以在其中测试经过培训的行为功能。 用代理人在期望的时间范围内可以达到的期望的报酬来喂养它。 离散CartPole环境的图: 连续CartPole环境的图: LunarLander环境的图: 去做: 测试论文中提到
  3. 所属分类:其它

    • 发布日期:2021-03-13
    • 文件大小:1048576
    • 提供者:weixin_42098759