搜索资源 - Upside-Down-Reinforcement-Learning:PyTorch中的颠倒强化学习（⅂ꓤ）实施。基于JürgenSchmidhuber发表的论文-源码

搜索资源列表

Upside-Down-Reinforcement-Learning:PyTorch中的颠倒强化学习（⅂ꓤ）实施。基于JürgenSchmidhuber发表的论文-源码
颠倒的强化学习 Pytorch中的颠倒强化学习（⅂ꓤ）实施。基于JürgenSchmidhuber发表的论文：该存储库包含一个离散动作空间以及一个针对OpenAI Gym CartPole环境（该环境的版本）的连续动作空间实现。笔记本包括行为功能的培训以及评估部分，您可以在其中测试经过培训的行为功能。用代理人在期望的时间范围内可以达到的期望的报酬来喂养它。离散CartPole环境的图：连续CartPole环境的图： LunarLander环境的图：去做：测试论文中提到
所属分类：其它
- 发布日期：2021-03-13
- 文件大小：1048576
- 提供者：weixin_42098759