您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. 逆强化学习算法的概述By Abbeel

  2. 2004年Abbeel在ICML上发表的逆向强化学习之后,近几年来又出现许多优秀的逆向强化学习算法,这篇文档介绍了逆向强化学习的整体概要和近几年的发展状况。
  3. 所属分类:专业指导

    • 发布日期:2013-07-24
    • 文件大小:7340032
    • 提供者:u011497199
  1. 学徒学习博士论文

  2. 本资料为学徒学习大牛的博士论文,该论文通过提供专家策略,利用逆强化学习的方式,快速学习到媲美专家策略的新策略。
  3. 所属分类:讲义

    • 发布日期:2018-09-08
    • 文件大小:26214400
    • 提供者:luobaqiu7073
  1. 传智播客扫地僧视频讲义源码

  2. 本教程共分为5个部分,第一部分是C语言提高部分,第二部分为C++基础部分,第三部分为C++进阶部分,第四部分为C、C++及数据结构基础部分,第五部分为C_C++与设计模式基础,内容非常详细. 第一部分 C语言提高部分目录 01_初学者的企业用人标准寻找引言 02_socketclient_api模型的抽象_初学者应知的标准_传智扫地僧 03_本套视频总体课程简介 04_就业班课程总体简介_课堂答疑 05_初学者建立信心 06_学员学习标准_排序及问题抛出 07_数组做函数参数退化问题剖析_传智
  3. 所属分类:C/C++

    • 发布日期:2019-04-03
    • 文件大小:116
    • 提供者:uestczyh
  1. Python-逆强化学习算法APPMaxEntGAILVAIL

  2. Inverse RL Algorithms (APP, MaxEnt, GAIL, VAIL)
  3. 所属分类:其它

    • 发布日期:2019-08-11
    • 文件大小:16777216
    • 提供者:weixin_39841856
  1. 高引用逆强化学习算法在对象世界中的比较与实现

  2. 高引用逆强化学习算法在对象世界中的比较与实现
  3. 所属分类:其它

    • 发布日期:2021-03-25
    • 文件大小:465920
    • 提供者:weixin_38536349
  1. irl_sfm:具有IRL的SFM-源码

  2. irl_sfm 具有IRL和CNMP的SFM 要求 ROS动力学 V-Rep 3.5 Python 2.7和3.7(与ROS相关的程序在Python 2.7上运行,但TF / Keras运行的程序需要Python 3.7) 参考 深入的IRL:Markus Wulfmeier,Peter Ondruska和Ingmar Posner。 最大熵深度逆强化学习 CNMP:尤努斯·塞克(M. Yunus Seker),默特·埃姆雷(Mert Imre),贾斯图斯·皮亚特(Justus Piater
  3. 所属分类:其它

    • 发布日期:2021-03-16
    • 文件大小:7340032
    • 提供者:weixin_42099116
  1. NTU-ReinforcementLearning-Notes:国立台湾大学李宏毅老师讲解的深度强化学习学习笔记-源码

  2. 李宏毅深度强化学习笔记 课程主页: 视频: 李宏毅老师讲这门课不是从MDP开始讲起,而是从如何获得最佳奖励出发,直接引出政策梯度(以及PPO),再讲Q-learning(原始Q-learning,DQN,各种DQN的升级),然后是A2C(以及A3C,DDPG),紧接着介绍了一些Reward Shaping的方法(主要是好奇心,课程学习,分层学习) ,,最后介绍模仿学习(逆RL)。比较全面的展现了深度强化学习的核心内容,也比较直观。跟伯克利学派的课类似,与UCL上来就讲MDP,解各种值迭代的思路
  3. 所属分类:其它

    • 发布日期:2021-03-12
    • 文件大小:4194304
    • 提供者:weixin_42127369
  1. 模仿:在pythonTensorflow中实施逆向强化学习(IRL)算法。 深度MaxEnt,MaxEnt,LPIRL-源码

  2. 模仿 在python / Tensorflow中实现选定的逆向强化学习(IRL)算法。 python demo.py 实现的算法 线性逆强化学习(Ng&Russell 2000) 最大熵逆强化学习(Ziebart et al。2008) 最大熵深度逆强化学习(Wulfmeier et al。2015) 已实施MDP和求解器 网格世界2D 网格世界1D 价值迭代 依存关系 python 2.7 cvxopt Tensorflow 0.12.1 matplotlib 线性逆向强化学习
  3. 所属分类:其它

    • 发布日期:2021-02-06
    • 文件大小:2097152
    • 提供者:weixin_42156940