您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. ai-traineree:用于(深度)强化学习的PyTorch代理和工具-源码

  2. 实习生 目的是建立一个深度强化学习方法的动物园,并展示它们在某些环境中的应用。 在文档中阅读更多信息: 。 为什么要另选一个? 主要原因是执行哲学。 我们坚信,代理应该出现在环境中,而不是相反。 大多数流行的实现都将环境实例传递给代理,就像代理是焦点一样。 这可能会简化某些算法的实现,但并不代表世界。 代理想要控制环境,但这并不意味着他们可以/应该。 那,然后使用PyTorch代替Tensorflow或JAX。 快速开始 要开始培训RL代理,您需要三件事:代理,环境和跑步者。 假设您要
  3. 所属分类:其它

    • 发布日期:2021-03-11
    • 文件大小:142336
    • 提供者:weixin_42174098