搜索资源 - 强化学习导论 - 点数信息

点数信息

注册会员 | 设为首页 | 加入收藏夹

您好，欢迎光临本网站！[请登录] ！[注册会员]！

热门搜索： 源码 Android 整站插件识别 p2p 游戏算法更多...

在线客服QQ:632832888

当前位置：

搜索资源 - 强化学习导论

下载资源分类

移动开发

开发技术

课程资源

网络技术

操作系统

安全技术

数据库

行业

服务器应用

存储

信息化

考试认证

云计算

大数据

跨平台

音视频

游戏开发

人工智能

区块链

资源分类

搜索资源列表

强化学习导论（Reinforcement Learning）
Reinforcement Learning：An Introduction 强化学习经典入门教程
所属分类：讲义
- 发布日期：2016-05-26
- 文件大小：5242880
- 提供者：rtygbwwwerr

统计学习导论基于R应用第三章部分答案
本资源是统计学习导论基于R应用第三章部分答案，适用于课程学习以及强化
所属分类：讲义
- 发布日期：2018-10-20
- 文件大小：17408
- 提供者：qq_43475245

Reinforcement Learning An Introduction~Summary of Notation
强化学习导论符号摘要，大写字母表示随机变量，反之小写字母表示随机变量的值和标量函数的值。需要为实值向量的量以粗体和小写字母书写（即使是随机变量）。矩阵是粗体大写字母。
所属分类：深度学习
- 发布日期：2018-11-15
- 文件大小：20480
- 提供者：coolsunxu

Reinforcement Learning_ An Introduction
强化学习导论第二版，网上虽已有，但有80M之多。这个版本仅10M多。
所属分类：机器学习
- 发布日期：2018-11-21
- 文件大小：10485760
- 提供者：cengagewang

多伦多大学“神经网络与机器学习导论”（2018年）
多伦多大学计算机系助理教授 Roger Grosse 开设的《神经网络与机器学习导论》课程涵盖了从机器学习基础知识到深度学习、强化学习等高阶内容，是AI从业者最佳的学习上手材料之一。
所属分类：讲义
- 发布日期：2019-01-21
- 文件大小：89128960
- 提供者：fulighter

《强化学习导论》最新版——————文字版本，
《强化学习导论》最新版——————文字版本，
所属分类：深度学习
- 发布日期：2019-04-24
- 文件大小：37748736
- 提供者：qq_26269815

强化学习导论2018年最新版
强化学习导论2018年最新版
所属分类：机器学习
- 发布日期：2019-03-04
- 文件大小：85983232
- 提供者：weixin_43161624

强化学习qlearning算法训练贪吃蛇
利用qlearing算法训练贪吃蛇，模型在2000次循环内取得很好的效果，属于伯克利人工智能导论课cs188中的作业
所属分类：机器学习
- 发布日期：2020-07-22
- 文件大小：5120
- 提供者：weixin_43509207

机器学习知识图谱中国科学院大学机器学习导论课程总结
内容包括线性模型、SVM、神经网络、聚类方法、降维与度量学习、集成学习、特征选择与稀疏学习、半监督学习、概率图模型、强化学习、深度学习等主要内容的知识点和关联关系，PDF文件
所属分类：机器学习
- 发布日期：2020-09-10
- 文件大小：57671680
- 提供者：whuKK

Udacity-Algorithms:Udacity-Intro_to_Algorithms-源码
Udacity算法 Udacity算法 Udacity 1.介绍算法 2.可计算性，复杂性和算法 3. Python中的数据结构和算法 4.研究生算法导论其他 1.使用Python的数据结构和算法 1. Udacity-Intro_to_Algorithms Udacity-Intro_to_Algorithms 授课教师：Michael Littman 迈克尔·莱德曼·利特曼（Michael Lederman Littman）（1966年8月30日出生）是计算机科学家。他主要从事强化
所属分类：其它
- 发布日期：2021-03-13
- 文件大小：6144
- 提供者：weixin_42131443

DeepRL：基于UC Berkeley的CS285的深度强化学习笔记-源码
深度强化学习说明：注释内容基于加州大学伯克利分校的CS285。内容清单简介与概述行为监督学习 Tensorflow和神经网络强化学习导论政策梯度演员关键算法值函数方法具有Q功能的Deep RL 高级策略梯度基于模型的计划基于模型的强化学习基于模型的政策学习变异推理和生成模型控制为推理逆向强化学习转移和多任务学习分布式RL 探索（第1部分）探索（第2部分）元学习信息论，未解决的问题
所属分类：其它
- 发布日期：2021-02-17
- 文件大小：5242880
- 提供者：weixin_42124743

CS-3600-人工智能简介：人工智能简介2019秋季-源码
CS-3600-人工智慧导论＃链接到描述：专案1：：在这个专案中，Pacman特工必须寻找穿越迷宫世界的路径，以到达特定地点并收集食物有效。我们建立了通用的搜索算法并将其应用于Pacman方案。 Project2： ://bhrolenok.github.io/teaching/cs-3600-spr2019/project2/index.html该项目涵盖MDP和强化学习方法，以解决行动随机性环境中的问题。 Project3： : 此项目涵盖贝叶斯网络中的推理和过滤。
所属分类：其它
- 发布日期：2021-02-16
- 文件大小：6291456
- 提供者：weixin_42099906

2021《机器学习导论》讲义
这是一门专门为STEM学生开发的机器学习入门课程。我们讨论有监督、无监督和强化学习。笔记开始阐述了没有神经网络的机器学习方法，如主成分分析，t-SNE，和线性回归。我们继续介绍基本和高级神经网络结构，如传统神经网络、(变分)自编码器、生成对抗网络、受限玻尔兹曼机器和递归神经网络。
所属分类：机器学习
- 发布日期：2021-02-12
- 文件大小：4194304
- 提供者：syp_net

maintenance_learning_course_materials：讲义，包括解决方案的教程任务以及帕德博恩大学举办的强化学习课程的在线视频-源码
强化学习课程资料讲义，教程任务（包括解决方案）以及帕德博恩大学主办的强化学习课程的在线视频。整个课程材料的源代码是开放的，我们诚挚地邀请所有人使用它进行自学（学生）或设置自己的课程（讲师）。演讲内容强化学习导论马尔可夫决策过程动态编程蒙特卡洛方法时差学习 n步自举使用表格方法进行计划和学习监督学习下的函数逼近函数逼近的策略上预测基于函数的基于值的控制资格跟踪政策梯度法第一部分摘要：有限状态和动作空间中的强化学习第二部分摘要：课程完成和展望全部课程幻灯片练习内
所属分类：其它
- 发布日期：2021-02-03
- 文件大小：68157440
- 提供者：weixin_42102272

机器学习实战笔记4——主成分分析
任务安排 1、机器学习导论 8、稀疏表示 2、KNN及其实现 9、核方法 3、K-means聚类 10、高斯混合模型 4、主成分分析 11、嵌入学习 5、线性判别分析 12、强化学习 6、贝叶斯方法 13、PageRank 7、逻辑回归 14、深度学习主成分分析(PCA) Ⅰ算法背景：维数灾难维数灾难最早是由理查德·贝尔曼(Richard E. Bellman)在考虑优化问题
所属分类：其它
- 发布日期：2021-01-21
- 文件大小：882688
- 提供者：weixin_38636461

An_introduction_to_Reinforcement_Learning.pdf
scott的强化学习导论
所属分类：互联网
- 发布日期：2021-03-31
- 文件大小：5242880
- 提供者：m0_37759287