点数信息
www.dssz.net
注册会员
|
设为首页
|
加入收藏夹
您好,欢迎光临本网站!
[请登录]
!
[注册会员]
!
首页
移动开发
云计算
大数据
数据库
游戏开发
人工智能
网络技术
区块链
操作系统
模糊查询
热门搜索:
源码
Android
整站
插件
识别
p2p
游戏
算法
更多...
在线客服QQ:632832888
当前位置:
资源下载
搜索资源 - 强化学习导论
下载资源分类
移动开发
开发技术
课程资源
网络技术
操作系统
安全技术
数据库
行业
服务器应用
存储
信息化
考试认证
云计算
大数据
跨平台
音视频
游戏开发
人工智能
区块链
在结果中搜索
所属系统
Windows
Linux
FreeBSD
Unix
Dos
PalmOS
WinCE
SymbianOS
MacOS
Android
开发平台
Visual C
Visual.Net
Borland C
CBuilder
Dephi
gcc
VBA
LISP
IDL
VHDL
Matlab
MathCAD
Flash
Xcode
Android STU
LabVIEW
开发语言
C/C++
Pascal
ASM
Java
PHP
Basic/ASP
Perl
Python
VBScript
JavaScript
SQL
FoxBase
SHELL
E语言
OC/Swift
文件类型
源码
程序
CHM
PDF
PPT
WORD
Excel
Access
HTML
Text
资源分类
搜索资源列表
强化学习导论(Reinforcement Learning)
Reinforcement Learning:An Introduction 强化学习经典入门教程
所属分类:
讲义
发布日期:2016-05-26
文件大小:5242880
提供者:
rtygbwwwerr
统计学习导论基于R应用第三章部分答案
本资源是统计学习导论基于R应用第三章部分答案,适用于课程学习以及强化
所属分类:
讲义
发布日期:2018-10-20
文件大小:17408
提供者:
qq_43475245
Reinforcement Learning An Introduction~Summary of Notation
强化学习导论符号摘要,大写字母表示随机变量,反之小写字母表示随机变量的值和标量函数的值。需要为实值向量的量以粗体和小写字母书写(即使是随机变量)。矩阵是粗体大写字母。
所属分类:
深度学习
发布日期:2018-11-15
文件大小:20480
提供者:
coolsunxu
Reinforcement Learning_ An Introduction
强化学习导论第二版,网上虽已有,但有80M之多。这个版本仅10M多。
所属分类:
机器学习
发布日期:2018-11-21
文件大小:10485760
提供者:
cengagewang
多伦多大学“神经网络与机器学习导论”(2018年)
多伦多大学计算机系助理教授 Roger Grosse 开设的《神经网络与机器学习导论》课程涵盖了从机器学习基础知识到深度学习、强化学习等高阶内容,是AI从业者最佳的学习上手材料之一。
所属分类:
讲义
发布日期:2019-01-21
文件大小:89128960
提供者:
fulighter
《强化学习导论》最新版——————文字版本,
《强化学习导论》最新版——————文字版本,
所属分类:
深度学习
发布日期:2019-04-24
文件大小:37748736
提供者:
qq_26269815
强化学习导论2018年最新版
强化学习导论2018年最新版
所属分类:
机器学习
发布日期:2019-03-04
文件大小:85983232
提供者:
weixin_43161624
强化学习qlearning算法训练贪吃蛇
利用qlearing算法训练贪吃蛇,模型在2000次循环内取得很好的效果,属于伯克利人工智能导论课cs188中的作业
所属分类:
机器学习
发布日期:2020-07-22
文件大小:5120
提供者:
weixin_43509207
机器学习知识图谱 中国科学院大学机器学习导论课程总结
内容包括线性模型、SVM、神经网络、聚类方法、降维与度量学习、集成学习、特征选择与稀疏学习、半监督学习、概率图模型、强化学习、深度学习等主要内容的知识点和关联关系,PDF文件
所属分类:
机器学习
发布日期:2020-09-10
文件大小:57671680
提供者:
whuKK
Udacity-Algorithms:Udacity-Intro_to_Algorithms-源码
Udacity算法 Udacity算法 Udacity 1.介绍算法 2.可计算性,复杂性和算法 3. Python中的数据结构和算法 4.研究生算法导论 其他 1.使用Python的数据结构和算法 1. Udacity-Intro_to_Algorithms Udacity-Intro_to_Algorithms 授课教师:Michael Littman 迈克尔·莱德曼·利特曼(Michael Lederman Littman)(1966年8月30日出生)是计算机科学家。 他主要从事强化
所属分类:
其它
发布日期:2021-03-13
文件大小:6144
提供者:
weixin_42131443
DeepRL:基于UC Berkeley的CS285的深度强化学习笔记-源码
深度强化学习 说明:注释内容基于加州大学伯克利分校的CS285。 内容清单 简介与概述 行为监督学习 Tensorflow和神经网络 强化学习导论 政策梯度 演员关键算法 值函数方法 具有Q功能的Deep RL 高级策略梯度 基于模型的计划 基于模型的强化学习 基于模型的政策学习 变异推理和生成模型 控制为推理 逆向强化学习 转移和多任务学习 分布式RL 探索(第1部分) 探索(第2部分) 元学习 信息论,未解决的问题
所属分类:
其它
发布日期:2021-02-17
文件大小:5242880
提供者:
weixin_42124743
CS-3600-人工智能简介:人工智能简介2019秋季-源码
CS-3600-人工智慧导论 #链接到描述: 专案1: : 在这个专案中,Pacman特工必须寻找穿越迷宫世界的路径,以到达特定地点并收集食物有效。 我们建立了通用的搜索算法并将其应用于Pacman方案。 Project2: ://bhrolenok.github.io/teaching/cs-3600-spr2019/project2/index.html该项目涵盖MDP和强化学习方法,以解决行动随机性环境中的问题。 Project3: : 此项目涵盖贝叶斯网络中的推理和过滤。
所属分类:
其它
发布日期:2021-02-16
文件大小:6291456
提供者:
weixin_42099906
2021《机器学习导论》讲义
这是一门专门为STEM学生开发的机器学习入门课程。我们讨论有监督、无监督和强化学习。笔记开始阐述了没有神经网络的机器学习方法,如主成分分析,t-SNE,和线性回归。我们继续介绍基本和高级神经网络结构,如传统神经网络、(变分)自编码器、生成对抗网络、受限玻尔兹曼机器和递归神经网络。
所属分类:
机器学习
发布日期:2021-02-12
文件大小:4194304
提供者:
syp_net
maintenance_learning_course_materials:讲义,包括解决方案的教程任务以及帕德博恩大学举办的强化学习课程的在线视频-源码
强化学习课程资料 讲义,教程任务(包括解决方案)以及帕德博恩大学主办的强化学习课程的在线视频。 整个课程材料的源代码是开放的,我们诚挚地邀请所有人使用它进行自学(学生)或设置自己的课程(讲师)。 演讲内容 强化学习导论 马尔可夫决策过程 动态编程 蒙特卡洛方法 时差学习 n步自举 使用表格方法进行计划和学习 监督学习下的函数逼近 函数逼近的策略上预测 基于函数的基于值的控制 资格跟踪 政策梯度法 第一部分摘要:有限状态和动作空间中的强化学习 第二部分摘要:课程完成和展望 全部课程幻灯片 练习内
所属分类:
其它
发布日期:2021-02-03
文件大小:68157440
提供者:
weixin_42102272
机器学习实战笔记4——主成分分析
任务安排 1、机器学习导论 8、稀疏表示 2、KNN及其实现 9、核方法 3、K-means聚类 10、高斯混合模型 4、主成分分析 11、嵌入学习 5、线性判别分析 12、强化学习 6、贝叶斯方法 13、PageRank 7、逻辑回归 14、深度学习 主成分分析(PCA) Ⅰ算法背景:维数灾难 维数灾难最早是由理查德·贝尔曼(Richard E. Bellman)在考虑优化问题
所属分类:
其它
发布日期:2021-01-21
文件大小:882688
提供者:
weixin_38636461
An_introduction_to_Reinforcement_Learning.pdf
scott的强化学习导论
所属分类:
互联网
发布日期:2021-03-31
文件大小:5242880
提供者:
m0_37759287