搜索资源 - 逆强化学习 - 点数信息

点数信息

注册会员 | 设为首页 | 加入收藏夹

您好，欢迎光临本网站！[请登录] ！[注册会员]！

热门搜索： 源码 Android 整站插件识别 p2p 游戏算法更多...

在线客服QQ:632832888

当前位置：

搜索资源 - 逆强化学习

下载资源分类

移动开发

开发技术

课程资源

网络技术

操作系统

安全技术

数据库

行业

服务器应用

存储

信息化

考试认证

云计算

大数据

跨平台

音视频

游戏开发

人工智能

区块链

资源分类

搜索资源列表

逆强化学习算法的概述By Abbeel
2004年Abbeel在ICML上发表的逆向强化学习之后，近几年来又出现许多优秀的逆向强化学习算法，这篇文档介绍了逆向强化学习的整体概要和近几年的发展状况。
所属分类：专业指导
- 发布日期：2013-07-24
- 文件大小：7340032
- 提供者：u011497199

学徒学习博士论文
本资料为学徒学习大牛的博士论文，该论文通过提供专家策略，利用逆强化学习的方式，快速学习到媲美专家策略的新策略。
所属分类：讲义
- 发布日期：2018-09-08
- 文件大小：26214400
- 提供者：luobaqiu7073

传智播客扫地僧视频讲义源码
本教程共分为5个部分，第一部分是C语言提高部分，第二部分为C++基础部分，第三部分为C++进阶部分，第四部分为C、C++及数据结构基础部分，第五部分为C_C++与设计模式基础，内容非常详细. 第一部分 C语言提高部分目录 01_初学者的企业用人标准寻找引言 02_socketclient_api模型的抽象_初学者应知的标准_传智扫地僧 03_本套视频总体课程简介 04_就业班课程总体简介_课堂答疑 05_初学者建立信心 06_学员学习标准_排序及问题抛出 07_数组做函数参数退化问题剖析_传智
所属分类：C/C++
- 发布日期：2019-04-03
- 文件大小：116
- 提供者：uestczyh

Python-逆强化学习算法APPMaxEntGAILVAIL
Inverse RL Algorithms (APP, MaxEnt, GAIL, VAIL)
所属分类：其它
- 发布日期：2019-08-11
- 文件大小：16777216
- 提供者：weixin_39841856

高引用逆强化学习算法在对象世界中的比较与实现
高引用逆强化学习算法在对象世界中的比较与实现
所属分类：其它
- 发布日期：2021-03-25
- 文件大小：465920
- 提供者：weixin_38536349

irl_sfm:具有IRL的SFM-源码
irl_sfm 具有IRL和CNMP的SFM 要求 ROS动力学 V-Rep 3.5 Python 2.7和3.7（与ROS相关的程序在Python 2.7上运行，但TF / Keras运行的程序需要Python 3.7）参考深入的IRL：Markus Wulfmeier，Peter Ondruska和Ingmar Posner。最大熵深度逆强化学习 CNMP：尤努斯·塞克（M. Yunus Seker），默特·埃姆雷（Mert Imre），贾斯图斯·皮亚特（Justus Piater
所属分类：其它
- 发布日期：2021-03-16
- 文件大小：7340032
- 提供者：weixin_42099116

NTU-ReinforcementLearning-Notes:国立台湾大学李宏毅老师讲解的深度强化学习学习笔记-源码
李宏毅深度强化学习笔记课程主页：视频：李宏毅老师讲这门课不是从MDP开始讲起，而是从如何获得最佳奖励出发，直接引出政策梯度（以及PPO），再讲Q-learning（原始Q-learning，DQN，各种DQN的升级），然后是A2C（以及A3C，DDPG），紧接着介绍了一些Reward Shaping的方法（主要是好奇心，课程学习，分层学习），，最后介绍模仿学习（逆RL）。比较全面的展现了深度强化学习的核心内容，也比较直观。跟伯克利学派的课类似，与UCL上来就讲MDP，解各种值迭代的思路
所属分类：其它
- 发布日期：2021-03-12
- 文件大小：4194304
- 提供者：weixin_42127369

模仿：在pythonTensorflow中实施逆向强化学习（IRL）算法。深度MaxEnt，MaxEnt，LPIRL-源码
模仿在python / Tensorflow中实现选定的逆向强化学习（IRL）算法。 python demo.py 实现的算法线性逆强化学习（Ng＆Russell 2000）最大熵逆强化学习（Ziebart et al。2008）最大熵深度逆强化学习（Wulfmeier et al。2015）已实施MDP和求解器网格世界2D 网格世界1D 价值迭代依存关系 python 2.7 cvxopt Tensorflow 0.12.1 matplotlib 线性逆向强化学习
所属分类：其它
- 发布日期：2021-02-06
- 文件大小：2097152
- 提供者：weixin_42156940