点数信息
www.dssz.net
注册会员
|
设为首页
|
加入收藏夹
您好,欢迎光临本网站!
[请登录]
!
[注册会员]
!
首页
移动开发
云计算
大数据
数据库
游戏开发
人工智能
网络技术
区块链
操作系统
模糊查询
热门搜索:
源码
Android
整站
插件
识别
p2p
游戏
算法
更多...
在线客服QQ:632832888
当前位置:
资源下载
搜索资源 - 马尔可夫决策过程-源码
下载资源分类
移动开发
开发技术
课程资源
网络技术
操作系统
安全技术
数据库
行业
服务器应用
存储
信息化
考试认证
云计算
大数据
跨平台
音视频
游戏开发
人工智能
区块链
在结果中搜索
所属系统
Windows
Linux
FreeBSD
Unix
Dos
PalmOS
WinCE
SymbianOS
MacOS
Android
开发平台
Visual C
Visual.Net
Borland C
CBuilder
Dephi
gcc
VBA
LISP
IDL
VHDL
Matlab
MathCAD
Flash
Xcode
Android STU
LabVIEW
开发语言
C/C++
Pascal
ASM
Java
PHP
Basic/ASP
Perl
Python
VBScript
JavaScript
SQL
FoxBase
SHELL
E语言
OC/Swift
文件类型
源码
程序
CHM
PDF
PPT
WORD
Excel
Access
HTML
Text
资源分类
搜索资源列表
MDP(马尔可夫决策过程) MATLAB 源码
这是2002年Kevin Murphy等人写的matlab的mdp源码,可以直接调用其中的所有函数,另外附件中还有其他页面详细介绍mdp和强化学习等知识。
所属分类:
其它
发布日期:2013-04-23
文件大小:7168
提供者:
fumaocai0706
mdp(马尔可夫决策过程)2009年matlab源码,非常详细全面,非常实用
2009年写的matlab mdp源码,里面有全部的英文document介绍说明
所属分类:
其它
发布日期:2013-04-23
文件大小:236544
提供者:
fumaocai0706
mdp(马尔可夫决策过程)2009年matlab源码,非常详细全面,非常实用
2009年写的matlab mdp源码,里面有全部的英文document介绍说明
所属分类:
其它
发布日期:2020-02-19
文件大小:230400
提供者:
chenzihong_gcx
mdp(马尔可夫决策过程)2009年matlab源码,非常详细全面,非常实用
2009年写的matlab mdp源码,里面有全部的英文document介绍说明 2009年写的matlab mdp源码,里面有全部的英文document介绍说明
所属分类:
其它
发布日期:2020-01-18
文件大小:230400
提供者:
qhttl
mdp(马尔可夫决策过程)2009年matlab源码,非常详细全面,非常实用
2009年写的matlab mdp源码,里面有全部的英文document介绍说明 2009年写的matlab mdp源码,里面有全部的英文document介绍说明
所属分类:
其它
发布日期:2020-01-11
文件大小:230400
提供者:
tian_jie
mdp(马尔可夫决策过程)2009年matlab源码,非常详细全面,非常实用
2009年写的matlab mdp源码,里面有全部的英文document介绍说明
所属分类:
其它
发布日期:2020-06-20
文件大小:230400
提供者:
yi122144453
autonomous-self-driving-car:使用Double Deep Q学习和Markov模型的自动驾驶汽车-源码
自动驾驶汽车 artificialintelligence(han2021cs, title={Autonomous Self-driving Car}, author={Nguyen, Han}, year={2021}, associate={Personal Projects} ) 描述 我该怎么做 数据集 实施无人驾驶汽车 马尔可夫决策过程 深度Q学习 成本函数 设计代理 Double Deep Q网络 设计环境 最终实施 结果 我学到的是 该项目的下一步
所属分类:
其它
发布日期:2021-03-26
文件大小:7168
提供者:
weixin_42162978
holbertonschool-machine_learning:机器学习-源码
机器学习 这是霍尔伯顿学校的机器学习(ML)培训计划,分为三个学期。从一些数学开始,然后在实践练习中深入学习各种技巧(监督,无监督,强化)。 课程的一些主题: 头三个学期 数学: 线性代数简介 微积分简介 绘图简介 概论 监督学习: 二进制分类 多类别分类 优化技术 正则化技术 卷积神经网络 深度卷积架构 物体检测 人脸验证 神经风格转移 第二学期 数学: 高级线性代数 进阶机率 无监督学习: 降维 聚类 嵌入 自动编码器 生成对抗网络 超参数优化 隐马尔可夫模型 监督学习: 递归神经网络 变形
所属分类:
其它
发布日期:2021-03-18
文件大小:1048576
提供者:
weixin_42176827
pacman-源码
吃豆人 一组不同的AI算法来玩pacman。 将继续添加不同的游戏玩法。 A *搜索 马尔可夫决策过程 分类器 Q学习 跑步 每种方法的API略有不同-下面是用于运行每种方法的命令集 $ python pacman.py -n 5 -p PartialAgent -l mediumClassic $ python pacman.py -q -n -n 10 -p MDPAgent -l mediumClassic 去做 不同的搜索算法 不同的分类器(RF,SVM,梯度提升等) 模型和模型免费
所属分类:
其它
发布日期:2021-03-16
文件大小:406528
提供者:
weixin_42173218
Udacity-Algorithms:Udacity-Intro_to_Algorithms-源码
Udacity算法 Udacity算法 Udacity 1.介绍算法 2.可计算性,复杂性和算法 3. Python中的数据结构和算法 4.研究生算法导论 其他 1.使用Python的数据结构和算法 1. Udacity-Intro_to_Algorithms Udacity-Intro_to_Algorithms 授课教师:Michael Littman 迈克尔·莱德曼·利特曼(Michael Lederman Littman)(1966年8月30日出生)是计算机科学家。 他主要从事强化
所属分类:
其它
发布日期:2021-03-13
文件大小:6144
提供者:
weixin_42131443
mdp(马尔可夫决策过程)2009年matlab源码,非常详细全面,非常实用
2009年写的matlab mdp源码,里面有全部的英文document介绍说明 2009年写的matlab mdp源码,里面有全部的英文document介绍说明
所属分类:
其它
发布日期:2021-03-06
文件大小:230400
提供者:
gotodiy01
强化:与Sutton&Barto教科书相关的完整章节练习:强化学习-简介-源码
Sutton&Barto撰写的《强化学习:简介》 (第2版)包括本章练习。 该资料库存储了我在理解强化学习过程中对这些练习的尝试。 所有练习均在Rmarkdown中完成,并按章节分开。 章节: 1:简介 第一部分:表格求解方法 2:多臂匪 3:有限马尔可夫决策过程 4:动态编程 5:蒙特卡洛方法 6:时差学习 7:n步自举 8:使用表格方法进行计划和学习 第二部分:近似解法 9:基于策略的预测 10:基于策略的近似控制 11:近似的非策略方法 12:资格跟踪 13:政
所属分类:
其它
发布日期:2021-03-03
文件大小:2048
提供者:
weixin_42161450
stats701-winter2021:强化学习理论-源码
欢迎使用STATS 701 WI 2021 这是关于强化学习理论(RL)的特殊主题课程。 我们将从在线算法的遗憾分析,浓度不等式和随机逼近等工具着重于RL算法的设计和分析。 本课程的“核心”将基于有限状态下的在线RL(通常称为“表格”设置)马尔可夫决策过程(MDP),并将以传统的授课方式进行授课(由于COVID-19而完全遥不可及) )。 本课程的“高级”部分将根据受众的兴趣来选择主题,并且将以更多的讨论为基础。 学生将自愿阅读一篇论文(或一小组相关论文),并在课堂上主持讨论。 高级部分的主题
所属分类:
其它
发布日期:2021-02-26
文件大小:2097152
提供者:
weixin_42144554
强化学习:专注于强化学习的相关概念,用例和学习方法-源码
强化学习(RL) 专注于强化学习的相关概念,用例和学习方法 涵盖了RL中使用的关键术语,基本元素,围绕RL的概念/主题等。 地区 多武装强盗问题(MABP) 有限马尔可夫决策过程(MDP) 动态编程方法 蒙特卡洛方法 时差(TD)学习 n步自举 表格解法和近似解法 用例 临床试验:临床试验期间患者的健康状况以及研究的实际结果极为重要。 在这种情况下,探索等同于确定最佳治疗方法,而剥削则是在试验过程中尽可能有效地治疗患者。 网络路由:路由是为网络中的流量(例如电话网络或计算机网络(互联网)
所属分类:
其它
发布日期:2021-02-23
文件大小:4096
提供者:
weixin_42103587
madigan:强化学习在金融市场交易中的应用-源码
马迪根 与论文相关的代码 目的 该存储库包含用于进行实验的框架,以探索强化学习在金融市场交易中的使用。 以统计套利为重点,最终目标是创建自主系统,以制定交易决策并执行这些决策。 这个过程很像科学探究,假设将以有针对性的方式成功地检验假设。 为此,需要强大的软件来实现,验证和部署想法的过程,而无需必要的硬件来进行实验。 方法 当前的方法包括在马尔可夫决策过程(MDP)框架中形式化交易问题/上下文。 代理人通过定义的动作空间来与环境交互,从而做出决策,以寻求最大程度地提高环境所带来的回报。 代理-&
所属分类:
其它
发布日期:2021-02-22
文件大小:5242880
提供者:
weixin_42116604
David-Silver-Reinforcement-learning:David Silver的“强化学习”课程注释以及各种算法的实现-源码
David-Silver强化学习 这个软件库包含了强化学习笔记由与各种算法的讨论,无论是在Keras的实现(与TensorFlow后端),并沿的框架。 教学大纲: 第一周:强化学习简介[] [ ] 第2周:马尔可夫决策过程[] [ ] 第3周:通过动态编程进行规划[] [ ] 第4周:无模型预测[] [ ] 第5周:无模型控制[] [ ] 第6周:价值函数逼近[] [ ] 第7周:政策梯度方法[] [ ] 第8周:学习与计划整合[] [ ] 第9周:探索与开发[] [ ]
所属分类:
其它
发布日期:2021-02-21
文件大小:19922944
提供者:
weixin_42144201
MarkovDecisionProcesses:运行策略迭代,值迭代和Q学习算法来解决MDP问题-源码
马尔可夫决策过程 概述 该存储库运行3种强化算法:策略迭代,值迭代和Q学习,以解决2个MDP问题:悬崖行走和20X20冻湖网格,并比较它们的性能。 运行步骤 需要Python 3.6 使用pip从Requirements.txt安装需求 使用python 3运行以下命令以创建数据和图形文件: python run_experiment.py-全部 python run_experiment.py --plot 获得的结果 有关获得的结果的更多信息,请参考Analysis.pdf。 悬崖行走
所属分类:
其它
发布日期:2021-02-20
文件大小:3145728
提供者:
weixin_42135753
马尔可夫决策过程-源码
马尔可夫决策过程
所属分类:
其它
发布日期:2021-02-19
文件大小:382976
提供者:
weixin_42103128
POMDP:基于部分可观察的马尔可夫决策过程实现RL算法-源码
POMDP:基于部分可观察的马尔可夫决策过程实现RL算法
所属分类:
其它
发布日期:2021-02-03
文件大小:168960
提供者:
weixin_42131785
POMDPs.jl:Julia中的MDP和POMDP-用于在离散和连续空间上定义,求解和模拟完全可部分观察的马尔可夫决策过程的接口-源码
POMDPs.jl:Julia中的MDP和POMDP-用于在离散和连续空间上定义,求解和模拟完全可部分观察的马尔可夫决策过程的接口
所属分类:
其它
发布日期:2021-02-03
文件大小:377856
提供者:
weixin_42110038
«
1
2
»