点数信息
www.dssz.net
注册会员
|
设为首页
|
加入收藏夹
您好,欢迎光临本网站!
[请登录]
!
[注册会员]
!
首页
移动开发
云计算
大数据
数据库
游戏开发
人工智能
网络技术
区块链
操作系统
模糊查询
热门搜索:
源码
Android
整站
插件
识别
p2p
游戏
算法
更多...
在线客服QQ:632832888
当前位置:
资源下载
搜索资源 - 逆强化学习
下载资源分类
移动开发
开发技术
课程资源
网络技术
操作系统
安全技术
数据库
行业
服务器应用
存储
信息化
考试认证
云计算
大数据
跨平台
音视频
游戏开发
人工智能
区块链
在结果中搜索
所属系统
Windows
Linux
FreeBSD
Unix
Dos
PalmOS
WinCE
SymbianOS
MacOS
Android
开发平台
Visual C
Visual.Net
Borland C
CBuilder
Dephi
gcc
VBA
LISP
IDL
VHDL
Matlab
MathCAD
Flash
Xcode
Android STU
LabVIEW
开发语言
C/C++
Pascal
ASM
Java
PHP
Basic/ASP
Perl
Python
VBScript
JavaScript
SQL
FoxBase
SHELL
E语言
OC/Swift
文件类型
源码
程序
CHM
PDF
PPT
WORD
Excel
Access
HTML
Text
资源分类
搜索资源列表
逆强化学习算法的概述By Abbeel
2004年Abbeel在ICML上发表的逆向强化学习之后,近几年来又出现许多优秀的逆向强化学习算法,这篇文档介绍了逆向强化学习的整体概要和近几年的发展状况。
所属分类:
专业指导
发布日期:2013-07-24
文件大小:7340032
提供者:
u011497199
学徒学习博士论文
本资料为学徒学习大牛的博士论文,该论文通过提供专家策略,利用逆强化学习的方式,快速学习到媲美专家策略的新策略。
所属分类:
讲义
发布日期:2018-09-08
文件大小:26214400
提供者:
luobaqiu7073
传智播客扫地僧视频讲义源码
本教程共分为5个部分,第一部分是C语言提高部分,第二部分为C++基础部分,第三部分为C++进阶部分,第四部分为C、C++及数据结构基础部分,第五部分为C_C++与设计模式基础,内容非常详细. 第一部分 C语言提高部分目录 01_初学者的企业用人标准寻找引言 02_socketclient_api模型的抽象_初学者应知的标准_传智扫地僧 03_本套视频总体课程简介 04_就业班课程总体简介_课堂答疑 05_初学者建立信心 06_学员学习标准_排序及问题抛出 07_数组做函数参数退化问题剖析_传智
所属分类:
C/C++
发布日期:2019-04-03
文件大小:116
提供者:
uestczyh
Python-逆强化学习算法APPMaxEntGAILVAIL
Inverse RL Algorithms (APP, MaxEnt, GAIL, VAIL)
所属分类:
其它
发布日期:2019-08-11
文件大小:16777216
提供者:
weixin_39841856
高引用逆强化学习算法在对象世界中的比较与实现
高引用逆强化学习算法在对象世界中的比较与实现
所属分类:
其它
发布日期:2021-03-25
文件大小:465920
提供者:
weixin_38536349
irl_sfm:具有IRL的SFM-源码
irl_sfm 具有IRL和CNMP的SFM 要求 ROS动力学 V-Rep 3.5 Python 2.7和3.7(与ROS相关的程序在Python 2.7上运行,但TF / Keras运行的程序需要Python 3.7) 参考 深入的IRL:Markus Wulfmeier,Peter Ondruska和Ingmar Posner。 最大熵深度逆强化学习 CNMP:尤努斯·塞克(M. Yunus Seker),默特·埃姆雷(Mert Imre),贾斯图斯·皮亚特(Justus Piater
所属分类:
其它
发布日期:2021-03-16
文件大小:7340032
提供者:
weixin_42099116
NTU-ReinforcementLearning-Notes:国立台湾大学李宏毅老师讲解的深度强化学习学习笔记-源码
李宏毅深度强化学习笔记 课程主页: 视频: 李宏毅老师讲这门课不是从MDP开始讲起,而是从如何获得最佳奖励出发,直接引出政策梯度(以及PPO),再讲Q-learning(原始Q-learning,DQN,各种DQN的升级),然后是A2C(以及A3C,DDPG),紧接着介绍了一些Reward Shaping的方法(主要是好奇心,课程学习,分层学习) ,,最后介绍模仿学习(逆RL)。比较全面的展现了深度强化学习的核心内容,也比较直观。跟伯克利学派的课类似,与UCL上来就讲MDP,解各种值迭代的思路
所属分类:
其它
发布日期:2021-03-12
文件大小:4194304
提供者:
weixin_42127369
模仿:在pythonTensorflow中实施逆向强化学习(IRL)算法。 深度MaxEnt,MaxEnt,LPIRL-源码
模仿 在python / Tensorflow中实现选定的逆向强化学习(IRL)算法。 python demo.py 实现的算法 线性逆强化学习(Ng&Russell 2000) 最大熵逆强化学习(Ziebart et al。2008) 最大熵深度逆强化学习(Wulfmeier et al。2015) 已实施MDP和求解器 网格世界2D 网格世界1D 价值迭代 依存关系 python 2.7 cvxopt Tensorflow 0.12.1 matplotlib 线性逆向强化学习
所属分类:
其它
发布日期:2021-02-06
文件大小:2097152
提供者:
weixin_42156940