搜索资源 - 强化学习简介 - 点数信息

点数信息

注册会员 | 设为首页 | 加入收藏夹

您好，欢迎光临本网站！[请登录] ！[注册会员]！

热门搜索： 源码 Android 整站插件识别 p2p 游戏算法更多...

在线客服QQ:632832888

当前位置：

搜索资源 - 强化学习简介

下载资源分类

移动开发

开发技术

课程资源

网络技术

操作系统

安全技术

数据库

行业

服务器应用

存储

信息化

考试认证

云计算

大数据

跨平台

音视频

游戏开发

人工智能

区块链

资源分类

搜索资源列表

强化学习简介
强化学习简介强化学习简介强化学习简介强化学习简介强化学习简介强化学习简介
所属分类：机器学习
- 发布日期：2017-12-03
- 文件大小：13631488
- 提供者：fuchungu1365

深度强化学习论文
深度强化学习简介，里面有应该看的论文，如果对深度强化学习感兴趣的，可以看看这个。
所属分类：深度学习
- 发布日期：2018-01-20
- 文件大小：668672
- 提供者：weixin_40587737

微软亚洲研究院秦涛_强化学习PPT
近年来，强化学习特别是深度强化学习在棋类、视屏游戏、机器人控制等问题上取得了极大的成功，成为人工智能研究的热点。微软亚洲研究院的秦涛研究员在报告《强化学习简介》中对强化学习做一个简要介绍。该报告分为3个部分： 1、强化学习基础，包括: 马氏决策过程 Bellman方程规划最优控制蒙特卡洛采样 TD算法 2、强化学习新算法，包括: 基于值函数的算法基于策略函数的算法基于两者的混合算法 3、强化学习所面临的挑战，如鲁棒性、样本效率等
所属分类：机器学习
- 发布日期：2018-10-31
- 文件大小：7340032
- 提供者：zpf1002

李宏毅深度强化学习PPT（含机器学习课程对RL的简介）
李宏毅深度强化学习PPT（含机器学习课程对RL的简介）
所属分类：深度学习
- 发布日期：2018-11-01
- 文件大小：166723584
- 提供者：qq_20852429

《强化学习》简介小册
强化学习方法的发展和应用才在这些领域占据了大量的研究人员。激发这种兴趣的是两个基本的挑战:1) 设计能够在复杂动态环境中在不确定性下运行的自主机器人代理，2) 为非常大规模的动态决策问题找到有用的近似解。
所属分类：机器学习
- 发布日期：2020-04-19
- 文件大小：118784
- 提供者：syp_net

深度强化学习课件lecture1
课件来自于UCberkeley课程官网，内容是深度强化学习课程的第一节课的课件，其中包含了深度学习、强化学习的简介；其他学习方式的介绍；典型的实验；推荐阅读的文章。
所属分类：深度学习
- 发布日期：2020-02-13
- 文件大小：4194304
- 提供者：agent_snail

机器学习简介——监督学习、无监督学习
机器学习入门的可以看一看，作者呕心沥血整理的资源，学习的可以看一看，里面包括机器学习历年来的发展，机器学习的分支，传统机器学习算法和无监督学习，监督学习和强化学习相关定义等等
所属分类：机器学习
- 发布日期：2020-06-04
- 文件大小：1024
- 提供者：weixin_38613873

强化学习简介——介绍强化学习的应用及理论.pptx
强化学习简介——介绍强化学习的应用及理论包含视频
所属分类：教育
- 发布日期：2020-06-03
- 文件大小：13631488
- 提供者：weixin_45278613

UCBerkeley 深度强化学习-强化学习简介Lec4
课程内容简介强化学习算法几种强化学习方法的比较简介 Part ♡1 MDPS POMDPS（部分可观测） Part ♡2 其中θ是策π略的参数，强化学习为了使得在当前状态st和当前选择的行为at的情况下的条件概率最大，则需要使得策略π最大，那么需要找到使得π最大的θ。有限时间情况下无限时间情况下所以，在无限和有限的情况下的参数优化方式： Part ♡3 强化学习关系期望！奖励函数r(x)是非平滑的，在策略π下的奖励函数的期望是平滑的！这就是可以进行梯度下降优化的原因
所属分类：其它
- 发布日期：2021-01-07
- 文件大小：850944
- 提供者：weixin_38632146

强化学习（五）用时序差分法（TD）求解
作者：刘建平编辑：田旭前言在强化学习（四）用蒙特卡罗法（MC）求解中，我们讲到了使用蒙特卡罗法来求解强化学习问题的方法，虽然蒙特卡罗法很灵活，不需要环境的状态转化概率模型，但是它需要所有的采样序列都是经历完整的状态序列。如果我们没有完整的状态序列，那么就无法使用蒙特卡罗法求解了。本文我们就来讨论可以不使用完整状态序列求解强化学习问题的方法：时序差分(Temporal-Difference, TD)。时序差分这一篇对应Sutt
所属分类：其它
- 发布日期：2021-01-06
- 文件大小：285696
- 提供者：weixin_38729221

reinforcement_learning_specialisation_notes:强化学习专家的笔记-源码
强化学习笔记简介我的来自Coursera和艾伯塔大学的。它们都包含漂亮的$ \ LaTeX $公式。如果在上方看到$\LaTeX$而不是格式精美的文字，则建议使用。我从课程1的第一周顶部列出的资料中自由地提取了文本和公式。强化学习基础基于样本的学习方法 [WIP] [尚未开始]
所属分类：其它
- 发布日期：2021-03-19
- 文件大小：123731968
- 提供者：weixin_42157567

sutton:萨顿和巴托强化学习-源码
强化学习：简介的示例实验（图）和编程练习的Python实现当我学习本书时，会添加章节。有用的材料（Rich Sutton的研究生）（DeepMind研究小组负责人）（（请查看他的个人。大量数学书籍的解决方案。这个人是个怪物）回购：另外，还有许多有用的信息，例如“读者在自己进行练习后，使用本书进行自学，可以逐章获取答案。请发送电子邮件至，以您回答练习。一个章节，我们将发回包含该章节答案的pdf文件。”
所属分类：其它
- 发布日期：2021-03-18
- 文件大小：1048576
- 提供者：weixin_42116921

robotics_final:机器人技术最终项目简介。通过强化学习教机器人打“乒乓球”-源码
robotics_final 机器人技术最终项目简介。通过强化学习来教机器人打“乒乓球”。罗斯科尔 roslaunch机器人技术_final turtlebot3_pong.launch rosrun robotics_final ball_move.py rosrun robotics_final play_commands.py ball_move订阅BallCommand线程并等待“发送”命令 ball_move发布到ball_state和ball_result线程，并发布球
所属分类：其它
- 发布日期：2021-03-15
- 文件大小：27648
- 提供者：weixin_42105816

强化：与Sutton＆Barto教科书相关的完整章节练习：强化学习-简介-源码
Sutton＆Barto撰写的《强化学习：简介》（第2版）包括本章练习。该资料库存储了我在理解强化学习过程中对这些练习的尝试。所有练习均在Rmarkdown中完成，并按章节分开。章节： 1：简介第一部分：表格求解方法 2：多臂匪 3：有限马尔可夫决策过程 4：动态编程 5：蒙特卡洛方法 6：时差学习 7：n步自举 8：使用表格方法进行计划和学习第二部分：近似解法 9：基于策略的预测 10：基于策略的近似控制 11：近似的非策略方法 12：资格跟踪 13：政
所属分类：其它
- 发布日期：2021-03-03
- 文件大小：2048
- 提供者：weixin_42161450

AI_课程：在斯坦福大学，麻省理工学院，加州大学伯克利分校等顶尖大学开设深度学习和强化学习讲座-源码
人工智能课程在斯坦福大学，麻省理工学院和加州大学伯克利分校等顶尖大学开设深度学习和强化学习讲座。内容 DS-GA 1008：深度学习| 2020年Spring MIT 6.S191：深度学习简介| 2020年 CS231n：斯坦福大学用于视觉识别的CNN | 2019年Spring CS224n：具有深度学习功能的NLP，斯坦福大学| 2019年冬季 CS285：加州大学伯克利分校的深度强化学习2020年秋季 CS285：加州大学伯克利分校的深度强化学习2019年秋季 CS294-158
所属分类：其它
- 发布日期：2021-02-26
- 文件大小：3145728
- 提供者：weixin_42123456

David-Silver-Reinforcement-learning：David Silver的“强化学习”课程注释以及各种算法的实现-源码
David-Silver强化学习这个软件库包含了强化学习笔记由与各种算法的讨论，无论是在Keras的实现（与TensorFlow后端），并沿的框架。教学大纲：第一周：强化学习简介[] [ ] 第2周：马尔可夫决策过程[] [ ] 第3周：通过动态编程进行规划[] [ ] 第4周：无模型预测[] [ ] 第5周：无模型控制[] [ ] 第6周：价值函数逼近[] [ ] 第7周：政策梯度方法[] [ ] 第8周：学习与计划整合[] [ ] 第9周：探索与开发[] [ ]
所属分类：其它
- 发布日期：2021-02-21
- 文件大小：19922944
- 提供者：weixin_42144201

DeepRL：基于UC Berkeley的CS285的深度强化学习笔记-源码
深度强化学习说明：注释内容基于加州大学伯克利分校的CS285。内容清单简介与概述行为监督学习 Tensorflow和神经网络强化学习导论政策梯度演员关键算法值函数方法具有Q功能的Deep RL 高级策略梯度基于模型的计划基于模型的强化学习基于模型的政策学习变异推理和生成模型控制为推理逆向强化学习转移和多任务学习分布式RL 探索（第1部分）探索（第2部分）元学习信息论，未解决的问题
所属分类：其它
- 发布日期：2021-02-17
- 文件大小：5242880
- 提供者：weixin_42124743

强化学习简介：强化学习的Python实现：简介-源码
强化学习：简介 Sutton＆Barto的书《Python复制如果您对代码有任何疑问或要报告错误，请打开一个问题，而不是直接通过电子邮件发送给我，但是不幸的是，我没有关于本书的练习答案。内容第1章井字游戏第2章第3章第四章第五章第六章第七章第八章第九章第10章第十一章第十二章第十三章环境 python 3.6 麻木 matplotlib 用法所有文件都是独立的 python any_file_you_want.py 贡献如果您想提供一些缺少的示例或修
所属分类：其它
- 发布日期：2021-02-14
- 文件大小：4194304
- 提供者：weixin_42099633

强化学习：强化学习：简介-源码
强化学习：强化学习：简介
所属分类：其它
- 发布日期：2021-02-09
- 文件大小：69206016
- 提供者：weixin_42139357

Deep_reinforcement_learning_Course：免费课程使用Tensorflow和PyTorch进行深度强化学习的实现-源码
:warning_selector: 新版本的深度强化学习课程将于2020年10月2日开始。第一章：深度强化学习简介 :scroll: :video_camera: 第2章：使用Taxi-v3进行Q学习 :taxi: :scroll: :video_camera: [文章：Q-Learning，让我们创建一个自主的出租车 :oncoming_taxi: （第2/2部分）] :calendar: 星期五 :calendar: :video_camera: [视频：Q
所属分类：其它
- 发布日期：2021-02-05
- 文件大小：326107136
- 提供者：weixin_42129797

« 12 3 4 »