搜索资源 - 马尔可夫决策过程-源码 - 点数信息

点数信息

注册会员 | 设为首页 | 加入收藏夹

您好，欢迎光临本网站！[请登录] ！[注册会员]！

热门搜索： 源码 Android 整站插件识别 p2p 游戏算法更多...

在线客服QQ:632832888

当前位置：

搜索资源 - 马尔可夫决策过程-源码

下载资源分类

移动开发

开发技术

课程资源

网络技术

操作系统

安全技术

数据库

行业

服务器应用

存储

信息化

考试认证

云计算

大数据

跨平台

音视频

游戏开发

人工智能

区块链

资源分类

搜索资源列表

MDP（马尔可夫决策过程） MATLAB 源码
这是2002年Kevin Murphy等人写的matlab的mdp源码，可以直接调用其中的所有函数，另外附件中还有其他页面详细介绍mdp和强化学习等知识。
所属分类：其它
- 发布日期：2013-04-23
- 文件大小：7168
- 提供者：fumaocai0706

mdp（马尔可夫决策过程）2009年matlab源码，非常详细全面，非常实用
2009年写的matlab mdp源码，里面有全部的英文document介绍说明
所属分类：其它
- 发布日期：2013-04-23
- 文件大小：236544
- 提供者：fumaocai0706

mdp（马尔可夫决策过程）2009年matlab源码，非常详细全面，非常实用
2009年写的matlab mdp源码，里面有全部的英文document介绍说明
所属分类：其它
- 发布日期：2020-02-19
- 文件大小：230400
- 提供者：chenzihong_gcx

mdp（马尔可夫决策过程）2009年matlab源码，非常详细全面，非常实用
2009年写的matlab mdp源码，里面有全部的英文document介绍说明 2009年写的matlab mdp源码，里面有全部的英文document介绍说明
所属分类：其它
- 发布日期：2020-01-18
- 文件大小：230400
- 提供者：qhttl

mdp（马尔可夫决策过程）2009年matlab源码，非常详细全面，非常实用
2009年写的matlab mdp源码，里面有全部的英文document介绍说明 2009年写的matlab mdp源码，里面有全部的英文document介绍说明
所属分类：其它
- 发布日期：2020-01-11
- 文件大小：230400
- 提供者：tian_jie

mdp（马尔可夫决策过程）2009年matlab源码，非常详细全面，非常实用
2009年写的matlab mdp源码，里面有全部的英文document介绍说明
所属分类：其它
- 发布日期：2020-06-20
- 文件大小：230400
- 提供者：yi122144453

autonomous-self-driving-car:使用Double Deep Q学习和Markov模型的自动驾驶汽车-源码
自动驾驶汽车 artificialintelligence(han2021cs, title={Autonomous Self-driving Car}, author={Nguyen, Han}, year={2021}, associate={Personal Projects} ) 描述我该怎么做数据集实施无人驾驶汽车马尔可夫决策过程深度Q学习成本函数设计代理 Double Deep Q网络设计环境最终实施结果我学到的是该项目的下一步
所属分类：其它
- 发布日期：2021-03-26
- 文件大小：7168
- 提供者：weixin_42162978

holbertonschool-machine_learning:机器学习-源码
机器学习这是霍尔伯顿学校的机器学习（ML）培训计划，分为三个学期。从一些数学开始，然后在实践练习中深入学习各种技巧（监督，无监督，强化）。课程的一些主题：头三个学期数学：线性代数简介微积分简介绘图简介概论监督学习：二进制分类多类别分类优化技术正则化技术卷积神经网络深度卷积架构物体检测人脸验证神经风格转移第二学期数学：高级线性代数进阶机率无监督学习：降维聚类嵌入自动编码器生成对抗网络超参数优化隐马尔可夫模型监督学习：递归神经网络变形
所属分类：其它
- 发布日期：2021-03-18
- 文件大小：1048576
- 提供者：weixin_42176827

pacman-源码
吃豆人一组不同的AI算法来玩pacman。将继续添加不同的游戏玩法。 A *搜索马尔可夫决策过程分类器 Q学习跑步每种方法的API略有不同-下面是用于运行每种方法的命令集 $ python pacman.py -n 5 -p PartialAgent -l mediumClassic $ python pacman.py -q -n -n 10 -p MDPAgent -l mediumClassic 去做不同的搜索算法不同的分类器（RF，SVM，梯度提升等）模型和模型免费
所属分类：其它
- 发布日期：2021-03-16
- 文件大小：406528
- 提供者：weixin_42173218

Udacity-Algorithms:Udacity-Intro_to_Algorithms-源码
Udacity算法 Udacity算法 Udacity 1.介绍算法 2.可计算性，复杂性和算法 3. Python中的数据结构和算法 4.研究生算法导论其他 1.使用Python的数据结构和算法 1. Udacity-Intro_to_Algorithms Udacity-Intro_to_Algorithms 授课教师：Michael Littman 迈克尔·莱德曼·利特曼（Michael Lederman Littman）（1966年8月30日出生）是计算机科学家。他主要从事强化
所属分类：其它
- 发布日期：2021-03-13
- 文件大小：6144
- 提供者：weixin_42131443

mdp（马尔可夫决策过程）2009年matlab源码，非常详细全面，非常实用
2009年写的matlab mdp源码，里面有全部的英文document介绍说明 2009年写的matlab mdp源码，里面有全部的英文document介绍说明
所属分类：其它
- 发布日期：2021-03-06
- 文件大小：230400
- 提供者：gotodiy01

强化：与Sutton＆Barto教科书相关的完整章节练习：强化学习-简介-源码
Sutton＆Barto撰写的《强化学习：简介》（第2版）包括本章练习。该资料库存储了我在理解强化学习过程中对这些练习的尝试。所有练习均在Rmarkdown中完成，并按章节分开。章节： 1：简介第一部分：表格求解方法 2：多臂匪 3：有限马尔可夫决策过程 4：动态编程 5：蒙特卡洛方法 6：时差学习 7：n步自举 8：使用表格方法进行计划和学习第二部分：近似解法 9：基于策略的预测 10：基于策略的近似控制 11：近似的非策略方法 12：资格跟踪 13：政
所属分类：其它
- 发布日期：2021-03-03
- 文件大小：2048
- 提供者：weixin_42161450

stats701-winter2021：强化学习理论-源码
欢迎使用STATS 701 WI 2021 这是关于强化学习理论（RL）的特殊主题课程。我们将从在线算法的遗憾分析，浓度不等式和随机逼近等工具着重于RL算法的设计和分析。本课程的“核心”将基于有限状态下的在线RL（通常称为“表格”设置）马尔可夫决策过程（MDP），并将以传统的授课方式进行授课（由于COVID-19而完全遥不可及））。本课程的“高级”部分将根据受众的兴趣来选择主题，并且将以更多的讨论为基础。学生将自愿阅读一篇论文（或一小组相关论文），并在课堂上主持讨论。高级部分的主题
所属分类：其它
- 发布日期：2021-02-26
- 文件大小：2097152
- 提供者：weixin_42144554

强化学习：专注于强化学习的相关概念，用例和学习方法-源码
强化学习（RL）专注于强化学习的相关概念，用例和学习方法涵盖了RL中使用的关键术语，基本元素，围绕RL的概念/主题等。地区多武装强盗问题（MABP）有限马尔可夫决策过程（MDP）动态编程方法蒙特卡洛方法时差（TD）学习 n步自举表格解法和近似解法用例临床试验：临床试验期间患者的健康状况以及研究的实际结果极为重要。在这种情况下，探索等同于确定最佳治疗方法，而剥削则是在试验过程中尽可能有效地治疗患者。网络路由：路由是为网络中的流量（例如电话网络或计算机网络（互联网）
所属分类：其它
- 发布日期：2021-02-23
- 文件大小：4096
- 提供者：weixin_42103587

madigan：强化学习在金融市场交易中的应用-源码
马迪根与论文相关的代码目的该存储库包含用于进行实验的框架，以探索强化学习在金融市场交易中的使用。以统计套利为重点，最终目标是创建自主系统，以制定交易决策并执行这些决策。这个过程很像科学探究，假设将以有针对性的方式成功地检验假设。为此，需要强大的软件来实现，验证和部署想法的过程，而无需必要的硬件来进行实验。方法当前的方法包括在马尔可夫决策过程（MDP）框架中形式化交易问题/上下文。代理人通过定义的动作空间来与环境交互，从而做出决策，以寻求最大程度地提高环境所带来的回报。代理-&
所属分类：其它
- 发布日期：2021-02-22
- 文件大小：5242880
- 提供者：weixin_42116604

David-Silver-Reinforcement-learning：David Silver的“强化学习”课程注释以及各种算法的实现-源码
David-Silver强化学习这个软件库包含了强化学习笔记由与各种算法的讨论，无论是在Keras的实现（与TensorFlow后端），并沿的框架。教学大纲：第一周：强化学习简介[] [ ] 第2周：马尔可夫决策过程[] [ ] 第3周：通过动态编程进行规划[] [ ] 第4周：无模型预测[] [ ] 第5周：无模型控制[] [ ] 第6周：价值函数逼近[] [ ] 第7周：政策梯度方法[] [ ] 第8周：学习与计划整合[] [ ] 第9周：探索与开发[] [ ]
所属分类：其它
- 发布日期：2021-02-21
- 文件大小：19922944
- 提供者：weixin_42144201

MarkovDecisionProcesses：运行策略迭代，值迭代和Q学习算法来解决MDP问题-源码
马尔可夫决策过程概述该存储库运行3种强化算法：策略迭代，值迭代和Q学习，以解决2个MDP问题：悬崖行走和20X20冻湖网格，并比较它们的性能。运行步骤需要Python 3.6 使用pip从Requirements.txt安装需求使用python 3运行以下命令以创建数据和图形文件： python run_experiment.py-全部 python run_experiment.py --plot 获得的结果有关获得的结果的更多信息，请参考Analysis.pdf。悬崖行走
所属分类：其它
- 发布日期：2021-02-20
- 文件大小：3145728
- 提供者：weixin_42135753

马尔可夫决策过程-源码
马尔可夫决策过程
所属分类：其它
- 发布日期：2021-02-19
- 文件大小：382976
- 提供者：weixin_42103128

POMDP：基于部分可观察的马尔可夫决策过程实现RL算法-源码
POMDP：基于部分可观察的马尔可夫决策过程实现RL算法
所属分类：其它
- 发布日期：2021-02-03
- 文件大小：168960
- 提供者：weixin_42131785

POMDPs.jl：Julia中的MDP和POMDP-用于在离散和连续空间上定义，求解和模拟完全可部分观察的马尔可夫决策过程的接口-源码
POMDPs.jl：Julia中的MDP和POMDP-用于在离散和连续空间上定义，求解和模拟完全可部分观察的马尔可夫决策过程的接口
所属分类：其它
- 发布日期：2021-02-03
- 文件大小：377856
- 提供者：weixin_42110038

« 12 »