点数信息
www.dssz.net
注册会员
|
设为首页
|
加入收藏夹
您好,欢迎光临本网站!
[请登录]
!
[注册会员]
!
首页
移动开发
云计算
大数据
数据库
游戏开发
人工智能
网络技术
区块链
操作系统
模糊查询
热门搜索:
源码
Android
整站
插件
识别
p2p
游戏
算法
更多...
在线客服QQ:632832888
当前位置:
资源下载
搜索资源 - kaushik_2018_multi-dex:“基于多目标模型的策略搜索以稀疏奖励实现数据有效学习的源代码”(CoRL2018)-Searchsourcecode
下载资源分类
移动开发
开发技术
课程资源
网络技术
操作系统
安全技术
数据库
行业
服务器应用
存储
信息化
考试认证
云计算
大数据
跨平台
音视频
游戏开发
人工智能
区块链
在结果中搜索
所属系统
Windows
Linux
FreeBSD
Unix
Dos
PalmOS
WinCE
SymbianOS
MacOS
Android
开发平台
Visual C
Visual.Net
Borland C
CBuilder
Dephi
gcc
VBA
LISP
IDL
VHDL
Matlab
MathCAD
Flash
Xcode
Android STU
LabVIEW
开发语言
C/C++
Pascal
ASM
Java
PHP
Basic/ASP
Perl
Python
VBScript
JavaScript
SQL
FoxBase
SHELL
E语言
OC/Swift
文件类型
源码
程序
CHM
PDF
PPT
WORD
Excel
Access
HTML
Text
资源分类
搜索资源列表
kaushik_2018_multi-dex:“基于多目标模型的策略搜索以稀疏奖励实现数据有效学习的源代码”(CoRL 2018)-Search source code
多DEX算法 论文: 抽象的: 机器人技术中用于强化学习的数据效率最高的算法是基于模型的策略搜索算法,该算法在学习机器人的动力学模型与优化策略之间交替进行,以在模型及其不确定性给定的情况下最大化期望的回报。 但是,当前的算法缺乏有效的探索策略来处理稀疏或误导性的奖励方案:如果在初始随机探索期间它们没有遇到任何具有正奖励的状态,则解决该问题的可能性很小。 在这里,我们提出了一种新颖的基于模型的策略搜索算法Multi-DEX,该算法利用学习到的动态模型来有效地探索任务空间,并在几集中以稀疏奖励来解
所属分类:
其它
发布日期:2021-03-24
文件大小:1048576
提供者:
weixin_42134878