您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. basic_reinforcement_learning:强化学习(RL)入门系列,其中包含完整的分步教程-源码

  2. 基本强化学习(RL) 该存储库旨在通过介绍如何编写不同的RL技术来提供强化学习(RL)入门系列。 背景审查 RL的快速回顾背景可以。 教程: 教程1: 教程2: 教程3: 教程4: 教程5: 教程6: 教程7: 教程8: (未完成) 教程9: 教程10: (未完成) 教程11: ( WIP ) 教程12: 教程13:(合并) 指南14: 教程15: (惨败) 参考文献: 克里斯·沃特金斯(Chris Watkins),《从延迟奖励中学习》,剑桥,1989年(
  3. 所属分类:其它

    • 发布日期:2021-02-05
    • 文件大小:46137344
    • 提供者:weixin_42166261