您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. 强化学习导论(Reinforcement Learning)

  2. Reinforcement Learning:An Introduction 强化学习经典入门教程
  3. 所属分类:讲义

    • 发布日期:2016-05-26
    • 文件大小:5242880
    • 提供者:rtygbwwwerr
  1. 统计学习导论基于R应用第三章部分答案

  2. 本资源是统计学习导论基于R应用第三章部分答案,适用于课程学习以及强化
  3. 所属分类:讲义

    • 发布日期:2018-10-20
    • 文件大小:17408
    • 提供者:qq_43475245
  1. Reinforcement Learning An Introduction~Summary of Notation

  2. 强化学习导论符号摘要,大写字母表示随机变量,反之小写字母表示随机变量的值和标量函数的值。需要为实值向量的量以粗体和小写字母书写(即使是随机变量)。矩阵是粗体大写字母。
  3. 所属分类:深度学习

    • 发布日期:2018-11-15
    • 文件大小:20480
    • 提供者:coolsunxu
  1. Reinforcement Learning_ An Introduction

  2. 强化学习导论第二版,网上虽已有,但有80M之多。这个版本仅10M多。
  3. 所属分类:机器学习

    • 发布日期:2018-11-21
    • 文件大小:10485760
    • 提供者:cengagewang
  1. 多伦多大学“神经网络与机器学习导论”(2018年)

  2. 多伦多大学计算机系助理教授 Roger Grosse 开设的《神经网络与机器学习导论》课程涵盖了从机器学习基础知识到深度学习、强化学习等高阶内容,是AI从业者最佳的学习上手材料之一。
  3. 所属分类:讲义

    • 发布日期:2019-01-21
    • 文件大小:89128960
    • 提供者:fulighter
  1. 《强化学习导论》最新版——————文字版本,

  2. 《强化学习导论》最新版——————文字版本,
  3. 所属分类:深度学习

    • 发布日期:2019-04-24
    • 文件大小:37748736
    • 提供者:qq_26269815
  1. 强化学习导论2018年最新版

  2. 强化学习导论2018年最新版
  3. 所属分类:机器学习

    • 发布日期:2019-03-04
    • 文件大小:85983232
    • 提供者:weixin_43161624
  1. 强化学习qlearning算法训练贪吃蛇

  2. 利用qlearing算法训练贪吃蛇,模型在2000次循环内取得很好的效果,属于伯克利人工智能导论课cs188中的作业
  3. 所属分类:机器学习

    • 发布日期:2020-07-22
    • 文件大小:5120
    • 提供者:weixin_43509207
  1. 机器学习知识图谱 中国科学院大学机器学习导论课程总结

  2. 内容包括线性模型、SVM、神经网络、聚类方法、降维与度量学习、集成学习、特征选择与稀疏学习、半监督学习、概率图模型、强化学习、深度学习等主要内容的知识点和关联关系,PDF文件
  3. 所属分类:机器学习

    • 发布日期:2020-09-10
    • 文件大小:57671680
    • 提供者:whuKK
  1. Udacity-Algorithms:Udacity-Intro_to_Algorithms-源码

  2. Udacity算法 Udacity算法 Udacity 1.介绍算法 2.可计算性,复杂性和算法 3. Python中的数据结构和算法 4.研究生算法导论 其他 1.使用Python的数据结构和算法 1. Udacity-Intro_to_Algorithms Udacity-Intro_to_Algorithms 授课教师:Michael Littman 迈克尔·莱德曼·利特曼(Michael Lederman Littman)(1966年8月30日出生)是计算机科学家。 他主要从事强化
  3. 所属分类:其它

    • 发布日期:2021-03-13
    • 文件大小:6144
    • 提供者:weixin_42131443
  1. DeepRL:基于UC Berkeley的CS285的深度强化学习笔记-源码

  2. 深度强化学习 说明:注释内容基于加州大学伯克利分校的CS285。 内容清单 简介与概述 行为监督学习 Tensorflow和神经网络 强化学习导论 政策梯度 演员关键算法 值函数方法 具有Q功能的Deep RL 高级策略梯度 基于模型的计划 基于模型的强化学习 基于模型的政策学习 变异推理和生成模型 控制为推理 逆向强化学习 转移和多任务学习 分布式RL 探索(第1部分) 探索(第2部分) 元学习 信息论,未解决的问题
  3. 所属分类:其它

    • 发布日期:2021-02-17
    • 文件大小:5242880
    • 提供者:weixin_42124743
  1. CS-3600-人工智能简介:人工智能简介2019秋季-源码

  2. CS-3600-人工智慧导论 #链接到描述: 专案1: : 在这个专案中,Pacman特工必须寻找穿越迷宫世界的路径,以到达特定地点并收集食物有效。 我们建立了通用的搜索算法并将其应用于Pacman方案。 Project2: ://bhrolenok.github.io/teaching/cs-3600-spr2019/project2/index.html该项目涵盖MDP和强化学习方法,以解决行动随机性环境中的问题。 Project3: : 此项目涵盖贝叶斯网络中的推理和过滤。
  3. 所属分类:其它

    • 发布日期:2021-02-16
    • 文件大小:6291456
    • 提供者:weixin_42099906
  1. 2021《机器学习导论》讲义

  2. 这是一门专门为STEM学生开发的机器学习入门课程。我们讨论有监督、无监督和强化学习。笔记开始阐述了没有神经网络的机器学习方法,如主成分分析,t-SNE,和线性回归。我们继续介绍基本和高级神经网络结构,如传统神经网络、(变分)自编码器、生成对抗网络、受限玻尔兹曼机器和递归神经网络。
  3. 所属分类:机器学习

    • 发布日期:2021-02-12
    • 文件大小:4194304
    • 提供者:syp_net
  1. maintenance_learning_course_materials:讲义,包括解决方案的教程任务以及帕德博恩大学举办的强化学习课程的在线视频-源码

  2. 强化学习课程资料 讲义,教程任务(包括解决方案)以及帕德博恩大学主办的强化学习课程的在线视频。 整个课程材料的源代码是开放的,我们诚挚地邀请所有人使用它进行自学(学生)或设置自己的课程(讲师)。 演讲内容 强化学习导论 马尔可夫决策过程 动态编程 蒙特卡洛方法 时差学习 n步自举 使用表格方法进行计划和学习 监督学习下的函数逼近 函数逼近的策略上预测 基于函数的基于值的控制 资格跟踪 政策梯度法 第一部分摘要:有限状态和动作空间中的强化学习 第二部分摘要:课程完成和展望 全部课程幻灯片 练习内
  3. 所属分类:其它

    • 发布日期:2021-02-03
    • 文件大小:68157440
    • 提供者:weixin_42102272
  1. 机器学习实战笔记4——主成分分析

  2. 任务安排 1、机器学习导论       8、稀疏表示 2、KNN及其实现       9、核方法 3、K-means聚类      10、高斯混合模型 4、主成分分析          11、嵌入学习 5、线性判别分析      12、强化学习 6、贝叶斯方法          13、PageRank 7、逻辑回归              14、深度学习 主成分分析(PCA) Ⅰ算法背景:维数灾难       维数灾难最早是由理查德·贝尔曼(Richard E. Bellman)在考虑优化问题
  3. 所属分类:其它

    • 发布日期:2021-01-21
    • 文件大小:882688
    • 提供者:weixin_38636461
  1. An_introduction_to_Reinforcement_Learning.pdf

  2. scott的强化学习导论
  3. 所属分类:互联网

    • 发布日期:2021-03-31
    • 文件大小:5242880
    • 提供者:m0_37759287