您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. MDP(马尔可夫决策过程) MATLAB 源码

  2. 这是2002年Kevin Murphy等人写的matlab的mdp源码,可以直接调用其中的所有函数,另外附件中还有其他页面详细介绍mdp和强化学习等知识。
  3. 所属分类:其它

    • 发布日期:2013-04-23
    • 文件大小:7168
    • 提供者:fumaocai0706
  1. mdp(马尔可夫决策过程)2009年matlab源码,非常详细全面,非常实用

  2. 2009年写的matlab mdp源码,里面有全部的英文document介绍说明
  3. 所属分类:其它

    • 发布日期:2013-04-23
    • 文件大小:236544
    • 提供者:fumaocai0706
  1. mdp(马尔可夫决策过程)2009年matlab源码,非常详细全面,非常实用

  2. 2009年写的matlab mdp源码,里面有全部的英文document介绍说明
  3. 所属分类:其它

    • 发布日期:2020-02-19
    • 文件大小:230400
    • 提供者:chenzihong_gcx
  1. mdp(马尔可夫决策过程)2009年matlab源码,非常详细全面,非常实用

  2. 2009年写的matlab mdp源码,里面有全部的英文document介绍说明 2009年写的matlab mdp源码,里面有全部的英文document介绍说明
  3. 所属分类:其它

    • 发布日期:2020-01-18
    • 文件大小:230400
    • 提供者:qhttl
  1. mdp(马尔可夫决策过程)2009年matlab源码,非常详细全面,非常实用

  2. 2009年写的matlab mdp源码,里面有全部的英文document介绍说明 2009年写的matlab mdp源码,里面有全部的英文document介绍说明
  3. 所属分类:其它

    • 发布日期:2020-01-11
    • 文件大小:230400
    • 提供者:tian_jie
  1. mdp(马尔可夫决策过程)2009年matlab源码,非常详细全面,非常实用

  2. 2009年写的matlab mdp源码,里面有全部的英文document介绍说明
  3. 所属分类:其它

    • 发布日期:2020-06-20
    • 文件大小:230400
    • 提供者:yi122144453
  1. autonomous-self-driving-car:使用Double Deep Q学习和Markov模型的自动驾驶汽车-源码

  2. 自动驾驶汽车 artificialintelligence(han2021cs, title={Autonomous Self-driving Car}, author={Nguyen, Han}, year={2021}, associate={Personal Projects} ) 描述 我该怎么做 数据集 实施无人驾驶汽车 马尔可夫决策过程 深度Q学习 成本函数 设计代理 Double Deep Q网络 设计环境 最终实施 结果 我学到的是 该项目的下一步
  3. 所属分类:其它

    • 发布日期:2021-03-26
    • 文件大小:7168
    • 提供者:weixin_42162978
  1. holbertonschool-machine_learning:机器学习-源码

  2. 机器学习 这是霍尔伯顿学校的机器学习(ML)培训计划,分为三个学期。从一些数学开始,然后在实践练习中深入学习各种技巧(监督,无监督,强化)。 课程的一些主题: 头三个学期 数学: 线性代数简介 微积分简介 绘图简介 概论 监督学习: 二进制分类 多类别分类 优化技术 正则化技术 卷积神经网络 深度卷积架构 物体检测 人脸验证 神经风格转移 第二学期 数学: 高级线性代数 进阶机率 无监督学习: 降维 聚类 嵌入 自动编码器 生成对抗网络 超参数优化 隐马尔可夫模型 监督学习: 递归神经网络 变形
  3. 所属分类:其它

    • 发布日期:2021-03-18
    • 文件大小:1048576
    • 提供者:weixin_42176827
  1. pacman-源码

  2. 吃豆人 一组不同的AI算法来玩pacman。 将继续添加不同的游戏玩法。 A *搜索 马尔可夫决策过程 分类器 Q学习 跑步 每种方法的API略有不同-下面是用于运行每种方法的命令集 $ python pacman.py -n 5 -p PartialAgent -l mediumClassic $ python pacman.py -q -n -n 10 -p MDPAgent -l mediumClassic 去做 不同的搜索算法 不同的分类器(RF,SVM,梯度提升等) 模型和模型免费
  3. 所属分类:其它

    • 发布日期:2021-03-16
    • 文件大小:406528
    • 提供者:weixin_42173218
  1. Udacity-Algorithms:Udacity-Intro_to_Algorithms-源码

  2. Udacity算法 Udacity算法 Udacity 1.介绍算法 2.可计算性,复杂性和算法 3. Python中的数据结构和算法 4.研究生算法导论 其他 1.使用Python的数据结构和算法 1. Udacity-Intro_to_Algorithms Udacity-Intro_to_Algorithms 授课教师:Michael Littman 迈克尔·莱德曼·利特曼(Michael Lederman Littman)(1966年8月30日出生)是计算机科学家。 他主要从事强化
  3. 所属分类:其它

    • 发布日期:2021-03-13
    • 文件大小:6144
    • 提供者:weixin_42131443
  1. mdp(马尔可夫决策过程)2009年matlab源码,非常详细全面,非常实用

  2. 2009年写的matlab mdp源码,里面有全部的英文document介绍说明 2009年写的matlab mdp源码,里面有全部的英文document介绍说明
  3. 所属分类:其它

    • 发布日期:2021-03-06
    • 文件大小:230400
    • 提供者:gotodiy01
  1. 强化:与Sutton&Barto教科书相关的完整章节练习:强化学习-简介-源码

  2. Sutton&Barto撰写的《强化学习:简介》 (第2版)包括本章练习。 该资料库存储了我在理解强化学习过程中对这些练习的尝试。 所有练习均在Rmarkdown中完成,并按章节分开。 章节: 1:简介 第一部分:表格求解方法 2:多臂匪 3:有限马尔可夫决策过程 4:动态编程 5:蒙特卡洛方法 6:时差学习 7:n步自举 8:使用表格方法进行计划和学习 第二部分:近似解法 9:基于策略的预测 10:基于策略的近似控制 11:近似的非策略方法 12:资格跟踪 13:政
  3. 所属分类:其它

    • 发布日期:2021-03-03
    • 文件大小:2048
    • 提供者:weixin_42161450
  1. stats701-winter2021:强化学习理论-源码

  2. 欢迎使用STATS 701 WI 2021 这是关于强化学习理论(RL)的特殊主题课程。 我们将从在线算法的遗憾分析,浓度不等式和随机逼近等工具着重于RL算法的设计和分析。 本课程的“核心”将基于有限状态下的在线RL(通常称为“表格”设置)马尔可夫决策过程(MDP),并将以传统的授课方式进行授课(由于COVID-19而完全遥不可及) )。 本课程的“高级”部分将根据受众的兴趣来选择主题,并且将以更多的讨论为基础。 学生将自愿阅读一篇论文(或一小组相关论文),并在课堂上主持讨论。 高级部分的主题
  3. 所属分类:其它

    • 发布日期:2021-02-26
    • 文件大小:2097152
    • 提供者:weixin_42144554
  1. 强化学习:专注于强化学习的相关概念,用例和学习方法-源码

  2. 强化学习(RL) 专注于强化学习的相关概念,用例和学习方法 涵盖了RL中使用的关键术语,基本元素,围绕RL的概念/主题等。 地区 多武装强盗问题(MABP) 有限马尔可夫决策过程(MDP) 动态编程方法 蒙特卡洛方法 时差(TD)学习 n步自举 表格解法和近似解法 用例 临床试验:临床试验期间患者的健康状况以及研究的实际结果极为重要。 在这种情况下,探索等同于确定最佳治疗方法,而剥削则是在试验过程中尽可能有效地治疗患者。 网络路由:路由是为网络中的流量(例如电话网络或计算机网络(互联网)
  3. 所属分类:其它

    • 发布日期:2021-02-23
    • 文件大小:4096
    • 提供者:weixin_42103587
  1. madigan:强化学习在金融市场交易中的应用-源码

  2. 马迪根 与论文相关的代码 目的 该存储库包含用于进行实验的框架,以探索强化学习在金融市场交易中的使用。 以统计套利为重点,最终目标是创建自主系统,以制定交易决策并执行这些决策。 这个过程很像科学探究,假设将以有针对性的方式成功地检验假设。 为此,需要强大的软件来实现,验证和部署想法的过程,而无需必要的硬件来进行实验。 方法 当前的方法包括在马尔可夫决策过程(MDP)框架中形式化交易问题/上下文。 代理人通过定义的动作空间来与环境交互,从而做出决策,以寻求最大程度地提高环境所带来的回报。 代理-&
  3. 所属分类:其它

    • 发布日期:2021-02-22
    • 文件大小:5242880
    • 提供者:weixin_42116604
  1. David-Silver-Reinforcement-learning:David Silver的“强化学习”课程注释以及各种算法的实现-源码

  2. David-Silver强化学习 这个软件库包含了强化学习笔记由与各种算法的讨论,无论是在Keras的实现(与TensorFlow后端),并沿的框架。 教学大纲: 第一周:强化学习简介[] [ ] 第2周:马尔可夫决策过程[] [ ] 第3周:通过动态编程进行规划[] [ ] 第4周:无模型预测[] [ ] 第5周:无模型控制[] [ ] 第6周:价值函数逼近[] [ ] 第7周:政策梯度方法[] [ ] 第8周:学习与计划整合[] [ ] 第9周:探索与开发[] [ ]
  3. 所属分类:其它

    • 发布日期:2021-02-21
    • 文件大小:19922944
    • 提供者:weixin_42144201
  1. MarkovDecisionProcesses:运行策略迭代,值迭代和Q学习算法来解决MDP问题-源码

  2. 马尔可夫决策过程 概述 该存储库运行3种强化算法:策略迭代,值迭代和Q学习,以解决2个MDP问题:悬崖行走和20X20冻湖网格,并比较它们的性能。 运行步骤 需要Python 3.6 使用pip从Requirements.txt安装需求 使用python 3运行以下命令以创建数据和图形文件: python run_experiment.py-全部 python run_experiment.py --plot 获得的结果 有关获得的结果的更多信息,请参考Analysis.pdf。 悬崖行走
  3. 所属分类:其它

    • 发布日期:2021-02-20
    • 文件大小:3145728
    • 提供者:weixin_42135753
  1. 马尔可夫决策过程-源码

  2. 马尔可夫决策过程
  3. 所属分类:其它

    • 发布日期:2021-02-19
    • 文件大小:382976
    • 提供者:weixin_42103128
  1. POMDP:基于部分可观察的马尔可夫决策过程实现RL算法-源码

  2. POMDP:基于部分可观察的马尔可夫决策过程实现RL算法
  3. 所属分类:其它

    • 发布日期:2021-02-03
    • 文件大小:168960
    • 提供者:weixin_42131785
  1. POMDPs.jl:Julia中的MDP和POMDP-用于在离散和连续空间上定义,求解和模拟完全可部分观察的马尔可夫决策过程的接口-源码

  2. POMDPs.jl:Julia中的MDP和POMDP-用于在离散和连续空间上定义,求解和模拟完全可部分观察的马尔可夫决策过程的接口
  3. 所属分类:其它

    • 发布日期:2021-02-03
    • 文件大小:377856
    • 提供者:weixin_42110038
« 12 »