您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. Reinforcement Learning: An Introduction

  2. The authoritative textbook for reinforcement learning by Richard Sutton and Andrew Barto. Contents Preface Series Forward Summary of Notation I. The Problem 1. Introduction 1.1 Reinforcement Learning 1.2 Examples 1.3 Elements of Reinforcement Learni
  3. 所属分类:硬件开发

    • 发布日期:2010-03-15
    • 文件大小:6291456
    • 提供者:gladiolus03
  1. Q学习sarsa学习代码包

  2. 从各种网站在下载到的Q学习算法集成包,有matlab示例,有C示例,有Java示例,有C++示例。总有一个算法是你需要模拟和借鉴的,需要研究强化学习或增强学习算法的人不容错过。。。真心话,要不是我需要下载别的资源需要积分,不会无私奉献。。。我的强化学习就是在这里面修改实现的,需要的顶起来。。
  3. 所属分类:C/C++

    • 发布日期:2013-05-17
    • 文件大小:266240
    • 提供者:sysuywc
  1. Q学习sarsa学习 java

  2. Q学习算法sarsa学习算法的Java示例。
  3. 所属分类:Java

    • 发布日期:2014-12-04
    • 文件大小:4096
    • 提供者:drovi
  1. 强化学习 Dyna-H算法代码

  2. sarsa,q-learning
  3. 所属分类:其它

    • 发布日期:2017-04-03
    • 文件大小:8192
    • 提供者:hona1022
  1. matlab强化学习平衡杆代码

  2. matlab中平衡杆问题的强化学习代码,包含Q学习、Sarsa学习的实现。
  3. 所属分类:机器学习

    • 发布日期:2018-04-24
    • 文件大小:9216
    • 提供者:u011271459
  1. 强化学习matlab山地车问题代码

  2. matlab强化学习中山地车问题的代码实现,包括Q学习、Sarsa学习、Sarsa(lambda)等
  3. 所属分类:机器学习

    • 发布日期:2018-04-24
    • 文件大小:30720
    • 提供者:u011271459
  1. 基于TensorFlow的项目实例

  2. 实例包括: CNN、图像相关:包含图像分类、目标检测、人脸识别、风格迁移,同时包含GAN、cGAN、CycleGAN等和GAN相关的内容 RNN、序列相关:文本生成、序列分类、训练词嵌入、时间序列预测、机器翻译等等。 强化学习:主要复现一些基础的算法,如Q Learning、SARSA、Deep Q Learning等。
  3. 所属分类:深度学习

    • 发布日期:2018-05-29
    • 文件大小:159383552
    • 提供者:flyingzerozero
  1. deep q_learning

  2. # Deep Reinforcement Learning for Keras [![Build Status](https://api.travis-ci.org/matthiasplappert/keras-rl.svg?branch=master)](https://travis-ci.org/matthiasplappert/keras-rl) [![Documentation](https://readthedocs.org/projects/keras-rl/badge/)](ht
  3. 所属分类:深度学习

    • 发布日期:2018-06-19
    • 文件大小:10485760
    • 提供者:weixin_37949195
  1. 19. 强化学习SARSA 算法.zip

  2. 通过与 Q Learning 对比学习 SARSA 算法,采用python语言代码实现
  3. 所属分类:Python

    • 发布日期:2019-05-08
    • 文件大小:3072
    • 提供者:weixin_43471818
  1. 用强化学习玩飞翔小鸟-播放Flappy Bird的AI程序.zip

  2. 该AI程序实现了多个AI代理来播放Flappy Bird。该计划应用强化学习技术,包括SARSA,Q学习和函数逼近。经过10,000次迭代的训练后,特工经常获得1400+的高分,最高游戏得分2069 该项目需要以下框架: Pygame:https://www.pygame.org PyGame学习环境:https://github.com/ntasfi/PyGame-Learning-Environment OpenAI体育馆:https ://gym.openai.com Gy-pl
  3. 所属分类:其它

    • 发布日期:2020-03-27
    • 文件大小:23552
    • 提供者:weixin_38747087
  1. Matlab强化学习_网格迷宫问题_SarsaLambda算法

  2. MATLAB强化学习代码包,用于解决多步决策模型(网格迷宫问题)的Sarsa-λ算法 "I thought what I'd do was I'd pretend I was one of those deaf-mutes, or should I?"
  3. 所属分类:机器学习

    • 发布日期:2020-01-19
    • 文件大小:2048
    • 提供者:weixin_43723517
  1. Matlab强化学习_网格迷宫问题_Sarsa算法

  2. MATLAB强化学习代码包,用于解决多步决策模型(网格迷宫问题)的Sarsa算法。 编程与算法的详细说明可参看我的专栏:https://blog.csdn.net/weixin_43723517/category_9676083.html "I thought what I'd do was I'd pretend I was one of those deaf-mutes, or should I?"
  3. 所属分类:机器学习

    • 发布日期:2020-01-19
    • 文件大小:2048
    • 提供者:weixin_43723517
  1. dueldqn.pdf

  2. 关于duelingdqn的原始论文,适合初学者对深度强化学习duelingdqn的认识和了解Dueling Network Architectures for Deep Reinforcement Learning et al.(2016). The results of Schaul et al.(2016) are the 2.1. Deep Q-networks current published state-of-the-art The value functions as descri
  3. 所属分类:讲义

    • 发布日期:2019-09-02
    • 文件大小:688128
    • 提供者:m0_37384317
  1. matlab开发-SARSAReinforcementLearning

  2. matlab开发-SARSAReinforcementLearning。利用sarsa解迷宫,强化学习
  3. 所属分类:其它

    • 发布日期:2019-08-24
    • 文件大小:120832
    • 提供者:weixin_38743968
  1. 强化学习笔记(4)无模型控制Model-Free Control(On-policy learning, off-policy learning, GLIE, Sarsa, Q-learning)

  2. 文章目录Introduction概念On-Policy learningOff-Policy learningMonte-Carlo Control问题1:使用行为价值函数代替状态价值函数贪婪策略基于行为价值函数的更新:问题2:使用贪婪算法的局限性例解决方案:ϵ−greedy\epsilon-greedyϵ−greedyGLIE定理:GLIE Monte-Carlo Control定理TD ControlSarsa​算法描述定理缺点:Sarsa(λ)Sarsa(\lambda)Sarsa(λ)n
  3. 所属分类:其它

    • 发布日期:2021-01-07
    • 文件大小:519168
    • 提供者:weixin_38503233
  1. Reinforcement_Learning-源码

  2. 补强_学习 该存储库包含我在各种深度强化学习算法的实现方面的工作。 这些包括我的项目和Ioannis Karamouzas博士在CS8810深度强化学习课程中的作业。 Pytorch在Open-AI中在lunarlander-env上实现进化策略算法。 在Open-AI中的frogger-env上实现Deep Q Network(DQN)算法。 代理试图通过单向交通穿越高速公路。 代理的操作集由上下移动的2个操作组成。 Open-AI中关于frogger2-env的Double DQN算法
  3. 所属分类:其它

    • 发布日期:2021-03-17
    • 文件大小:1024
    • 提供者:weixin_42151305
  1. 基于具有转换奖励的Sarsa的束缚大WaSP的腹部挥动控制

  2. 基于具有转换奖励的Sarsa的束缚大WaSP的腹部挥动控制
  3. 所属分类:其它

    • 发布日期:2021-03-08
    • 文件大小:917504
    • 提供者:weixin_38746738
  1. 基于Sarsa(λ)的实时交通灯协调控制模型

  2. 由于道路上数量众多的车辆的交通需求,经常会出现交通问题。 最大化交通流量和最小化平均等待时间是智能交通控制的目标。 每个路口都希望获得更大的交通流量。 在此过程中,路口形成协调政策以及对相邻路口的约束,以最大化其自身利益。 良好的交通信号定时策略有助于解决该问题。 但是,由于有太多因素会影响交通控制模型,因此很难找到最佳解决方案。 交通信号灯控制器无法从过去的经验中学习,导致他们无法适应交通流量的动态变化。 考虑到实际交通环境的动态特性,可以采用基于强化学习算法的交通控制方法来获得最优的调度策略
  3. 所属分类:其它

    • 发布日期:2021-02-26
    • 文件大小:1019904
    • 提供者:weixin_38735790
  1. 强化学习:SARSA,SARSA-Lambda的实现以及函数逼近来解决一系列开放式AI Gym环境-源码

  2. 项目概况: 该项目使用强化学习来解决出租车和山地车Open AI体育馆的问题。 对于出租车,可以在( )上详细探讨目标。 对于山地车,可以在( )上详细探讨目标。 为了解决出租车问题,我实现了SARSA和SARSA Lambda算法。 对于山地车问题,我将SARSA Lambda与函数逼近合并(使用傅立叶基础函数)。 运行说明: python3 taxi_sarsa.py 将执行SARSA学习算法,并将q值和策略保存到.npy文件。 。 注意:先前的学习序列中的存储库中已经包含一组
  3. 所属分类:其它

    • 发布日期:2021-02-15
    • 文件大小:100352
    • 提供者:weixin_42119358
  1. 基于值函数迁移的启发式Sarsa算法

  2. 针对 Sarsa 算法存在的收敛速度较慢的问题,提出一种改进的基于值函数迁移的启发式 Sarsa 算法(VFT-HSA)。该算法将Sarsa算法与值函数迁移方法相结合,引入自模拟度量方法,在相同的状态空间和动作空间下,对新任务与历史任务之间的不同状态进行相似性度量,对满足条件的历史状态进行值函数迁移,提高算法的收敛速度。此外,该算法结合启发式探索方法,引入贝叶斯推理,结合变分推理衡量信息增益,并运用获取的信息增益构建内在奖赏函数作为探索因子,进而加快算法的收敛速度。将所提算法用于经典的Grid
  3. 所属分类:其它

    • 发布日期:2021-01-14
    • 文件大小:1048576
    • 提供者:weixin_38611459
« 12 »