您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. 强化学习简介

  2. 强化学习简介强化学习简介强化学习简介强化学习简介强化学习简介强化学习简介
  3. 所属分类:机器学习

    • 发布日期:2017-12-03
    • 文件大小:13631488
    • 提供者:fuchungu1365
  1. 深度强化学习论文

  2. 深度强化学习简介,里面有应该看的论文,如果对深度强化学习感兴趣的,可以看看这个。
  3. 所属分类:深度学习

    • 发布日期:2018-01-20
    • 文件大小:668672
    • 提供者:weixin_40587737
  1. 微软亚洲研究院秦涛_强化学习PPT

  2. 近年来,强化学习特别是深度强化学习在棋类、视屏游戏、机器人控制等问题上取得了极大的成功,成为人工智能研究的热点。 微软亚洲研究院的秦涛研究员在报告《强化学习简介》中对强化学习做一个简要介绍。 该报告分为3个部分: 1、强化学习基础,包括: 马氏决策过程 Bellman方程 规划 最优控制 蒙特卡洛采样 TD算法 2、强化学习新算法,包括: 基于值函数的算法 基于策略函数的算法 基于两者的混合算法 3、强化学习所面临的挑战,如鲁棒性、样本效率等
  3. 所属分类:机器学习

    • 发布日期:2018-10-31
    • 文件大小:7340032
    • 提供者:zpf1002
  1. 李宏毅深度强化学习PPT(含机器学习课程对RL的简介)

  2. 李宏毅深度强化学习PPT(含机器学习课程对RL的简介)
  3. 所属分类:深度学习

    • 发布日期:2018-11-01
    • 文件大小:166723584
    • 提供者:qq_20852429
  1. 《强化学习》简介小册

  2. 强化学习方法的发展和应用才在这些领域占据了大量的研究人员。激发这种兴趣的是两个基本的挑战:1) 设计能够在复杂动态环境中在不确定性下运行的自主机器人代理,2) 为非常大规模的动态决策问题找到有用的近似解。
  3. 所属分类:机器学习

    • 发布日期:2020-04-19
    • 文件大小:118784
    • 提供者:syp_net
  1. 深度强化学习课件lecture1

  2. 课件来自于UCberkeley课程官网,内容是深度强化学习课程的第一节课的课件,其中包含了深度学习、强化学习的简介;其他学习方式的介绍;典型的实验;推荐阅读的文章。
  3. 所属分类:深度学习

    • 发布日期:2020-02-13
    • 文件大小:4194304
    • 提供者:agent_snail
  1. 机器学习简介——监督学习、无监督学习

  2. 机器学习入门的可以看一看,作者呕心沥血整理的资源,学习的可以看一看,里面包括机器学习历年来的发展,机器学习的分支,传统机器学习算法和无监督学习,监督学习和强化学习相关定义等等
  3. 所属分类:机器学习

    • 发布日期:2020-06-04
    • 文件大小:1024
    • 提供者:weixin_38613873
  1. 强化学习简介——介绍强化学习的应用及理论.pptx

  2. 强化学习简介——介绍强化学习的应用及理论 包含视频
  3. 所属分类:教育

    • 发布日期:2020-06-03
    • 文件大小:13631488
    • 提供者:weixin_45278613
  1. UCBerkeley 深度强化学习-强化学习简介Lec4

  2. 课程内容 简介 强化学习算法 几种强化学习方法的比较 简介 Part ♡1 MDPS POMDPS(部分可观测) Part ♡2 其中θ是策π略的参数,强化学习为了使得在当前状态st和当前选择的行为at的情况下的条件概率最大,则需要使得策略π最大,那么需要找到使得π最大的θ。 有限时间情况下 无限时间情况下 所以,在无限和有限的情况下的参数优化方式: Part ♡3 强化学习关系期望! 奖励函数r(x)是非平滑的,在策略π下的奖励函数的期望是平滑的!这就是可以进行梯度下降优化的原因
  3. 所属分类:其它

    • 发布日期:2021-01-07
    • 文件大小:850944
    • 提供者:weixin_38632146
  1. 强化学习(五)用时序差分法(TD)求解

  2. 作者:刘建平            编辑:田   旭            前  言 在强化学习(四)用蒙特卡罗法(MC)求解中,我们讲到了使用蒙特卡罗法来求解强化学习问题的方法,虽然蒙特卡罗法很灵活,不需要环境的状态转化概率模型,但是它需要所有的采样序列都是经历完整的状态序列。如果我们没有完整的状态序列,那么就无法使用蒙特卡罗法求解了。本文我们就来讨论可以不使用完整状态序列求解强化学习问题的方法:时序差分(Temporal-Difference, TD)。 时序差分这一篇对应Sutt
  3. 所属分类:其它

    • 发布日期:2021-01-06
    • 文件大小:285696
    • 提供者:weixin_38729221
  1. reinforcement_learning_specialisation_notes:强化学习专家的笔记-源码

  2. 强化学习笔记简介 我的来自Coursera和艾伯塔大学的。 它们都包含漂亮的$ \ LaTeX $公式。 如果在上方看到$\LaTeX$而不是格式精美的文字,则建议使用。 我从课程1的第一周顶部列出的资料中自由地提取了文本和公式。 强化学习基础 基于样本的学习方法 [WIP] [尚未开始]
  3. 所属分类:其它

    • 发布日期:2021-03-19
    • 文件大小:123731968
    • 提供者:weixin_42157567
  1. sutton:萨顿和巴托强化学习-源码

  2. 强化学习:简介 的示例实验(图)和编程练习的Python实现 当我学习本书时,会添加章节。 有用的材料 (Rich Sutton的研究生) (DeepMind研究小组负责人) ((请查看他的个人。大量数学书籍的解决方案。这个人是个怪物) 回购: 另外,还有许多有用的信息,例如“读者在自己进行练习后,使用本书进行自学,可以逐章获取答案。请发送电子邮件至 ,以您回答练习。一个章节,我们将发回包含该章节答案的pdf文件。”
  3. 所属分类:其它

    • 发布日期:2021-03-18
    • 文件大小:1048576
    • 提供者:weixin_42116921
  1. robotics_final:机器人技术最终项目简介。 通过强化学习教机器人打“乒乓球”-源码

  2. robotics_final 机器人技术最终项目简介。 通过强化学习来教机器人打“乒乓球”。 罗斯科尔 roslaunch机器人技术_final turtlebot3_pong.launch rosrun robotics_final ball_move.py rosrun robotics_final play_commands.py ball_move订阅BallCommand线程并等待“发送”命令 ball_move发布到ball_state和ball_result线程,并发布球
  3. 所属分类:其它

    • 发布日期:2021-03-15
    • 文件大小:27648
    • 提供者:weixin_42105816
  1. 强化:与Sutton&Barto教科书相关的完整章节练习:强化学习-简介-源码

  2. Sutton&Barto撰写的《强化学习:简介》 (第2版)包括本章练习。 该资料库存储了我在理解强化学习过程中对这些练习的尝试。 所有练习均在Rmarkdown中完成,并按章节分开。 章节: 1:简介 第一部分:表格求解方法 2:多臂匪 3:有限马尔可夫决策过程 4:动态编程 5:蒙特卡洛方法 6:时差学习 7:n步自举 8:使用表格方法进行计划和学习 第二部分:近似解法 9:基于策略的预测 10:基于策略的近似控制 11:近似的非策略方法 12:资格跟踪 13:政
  3. 所属分类:其它

    • 发布日期:2021-03-03
    • 文件大小:2048
    • 提供者:weixin_42161450
  1. AI_课程:在斯坦福大学,麻省理工学院,加州大学伯克利分校等顶尖大学开设深度学习和强化学习讲座-源码

  2. 人工智能课程 在斯坦福大学,麻省理工学院和加州大学伯克利分校等顶尖大学开设深度学习和强化学习讲座。 内容 DS-GA 1008:深度学习| 2020年Spring MIT 6.S191:深度学习简介| 2020年 CS231n:斯坦福大学用于视觉识别的CNN | 2019年Spring CS224n:具有深度学习功能的NLP,斯坦福大学| 2019年冬季 CS285:加州大学伯克利分校的深度强化学习2020年秋季 CS285:加州大学伯克利分校的深度强化学习2019年秋季 CS294-158
  3. 所属分类:其它

    • 发布日期:2021-02-26
    • 文件大小:3145728
    • 提供者:weixin_42123456
  1. David-Silver-Reinforcement-learning:David Silver的“强化学习”课程注释以及各种算法的实现-源码

  2. David-Silver强化学习 这个软件库包含了强化学习笔记由与各种算法的讨论,无论是在Keras的实现(与TensorFlow后端),并沿的框架。 教学大纲: 第一周:强化学习简介[] [ ] 第2周:马尔可夫决策过程[] [ ] 第3周:通过动态编程进行规划[] [ ] 第4周:无模型预测[] [ ] 第5周:无模型控制[] [ ] 第6周:价值函数逼近[] [ ] 第7周:政策梯度方法[] [ ] 第8周:学习与计划整合[] [ ] 第9周:探索与开发[] [ ]
  3. 所属分类:其它

    • 发布日期:2021-02-21
    • 文件大小:19922944
    • 提供者:weixin_42144201
  1. DeepRL:基于UC Berkeley的CS285的深度强化学习笔记-源码

  2. 深度强化学习 说明:注释内容基于加州大学伯克利分校的CS285。 内容清单 简介与概述 行为监督学习 Tensorflow和神经网络 强化学习导论 政策梯度 演员关键算法 值函数方法 具有Q功能的Deep RL 高级策略梯度 基于模型的计划 基于模型的强化学习 基于模型的政策学习 变异推理和生成模型 控制为推理 逆向强化学习 转移和多任务学习 分布式RL 探索(第1部分) 探索(第2部分) 元学习 信息论,未解决的问题
  3. 所属分类:其它

    • 发布日期:2021-02-17
    • 文件大小:5242880
    • 提供者:weixin_42124743
  1. 强化学习简介:强化学习的Python实现:简介-源码

  2. 强化学习:简介 Sutton&Barto的书《Python复制 如果您对代码有任何疑问或要报告错误,请打开一个问题,而不是直接通过电子邮件发送给我,但是不幸的是,我没有关于本书的练习答案。 内容 第1章 井字游戏 第2章 第3章 第四章 第五章 第六章 第七章 第八章 第九章 第10章 第十一章 第十二章 第十三章 环境 python 3.6 麻木 matplotlib 用法 所有文件都是独立的 python any_file_you_want.py 贡献 如果您想提供一些缺少的示例或修
  3. 所属分类:其它

    • 发布日期:2021-02-14
    • 文件大小:4194304
    • 提供者:weixin_42099633
  1. 强化学习:强化学习:简介-源码

  2. 强化学习:强化学习:简介
  3. 所属分类:其它

    • 发布日期:2021-02-09
    • 文件大小:69206016
    • 提供者:weixin_42139357
  1. Deep_reinforcement_learning_Course:免费课程使用Tensorflow和PyTorch进行深度强化学习的实现-源码

  2. :warning_selector: 新版本的深度强化学习课程将于2020年10月2日开始。 第一章:深度强化学习简介 :scroll: :video_camera: 第2章:使用Taxi-v3进行Q学习 :taxi: :scroll: :video_camera: [文章:Q-Learning,让我们创建一个自主的出租车 :oncoming_taxi: (第2/2部分)] :calendar: 星期五 :calendar: :video_camera: [视频:Q
  3. 所属分类:其它

    • 发布日期:2021-02-05
    • 文件大小:326107136
    • 提供者:weixin_42129797
« 12 3 4 »