搜索资源 - 多智能体强化学习 - 点数信息

点数信息

注册会员 | 设为首页 | 加入收藏夹

您好，欢迎光临本网站！[请登录] ！[注册会员]！

热门搜索： 源码 Android 整站插件识别 p2p 游戏算法更多...

在线客服QQ:632832888

当前位置：

搜索资源 - 多智能体强化学习

下载资源分类

移动开发

开发技术

课程资源

网络技术

操作系统

安全技术

数据库

行业

服务器应用

存储

信息化

考试认证

云计算

大数据

跨平台

音视频

游戏开发

人工智能

区块链

资源分类

搜索资源列表

基于多智能体的交通控制与交通诱导协同理论和方法研究
交通管理在城市交通问题治理中十分重要,其目的是提供一个畅通、有序的交通环境。建立智能交通管理系统,广泛应用科学技术手段,全面提高管理水平和管理效益,是解决当前道路交通拥堵、事故频繁发生和环境污染严重的有效途径。在交通管理实施中涉及到很多管理策略的制定,包括交通诱导和控制策略的制定。由于交通系统本身的复杂性,在交通管理中涉及的决策数据的信息量巨大,完全依靠人工来完成城市交通控制和诱导策略的制定存在很大困难,难以实现。基于多智能体的智能决策支持技术的出现,可以满足交通管理中的决策需求。本文深入剖析
所属分类：专业指导
- 发布日期：2013-07-14
- 文件大小：8388608
- 提供者：shi198369

多智能体系统强化学习
内容主要讲的是强化学习在多智能体系统中的应用及方法，比较简单的方法。
所属分类：讲义
- 发布日期：2014-06-26
- 文件大小：303104
- 提供者：qq_15379731

一种新的多智能体强化学习算法及其在多机器人协作任务中的应用
在多机器人系统中,评价一个机器人行为的好坏常常依赖于其它机器人的行为,此时必须采用组合动作以实现多机器人的协作,但采用组合动作的强化学习算法由于学习空间异常庞大而收敛得极慢.本文提出的新方法通过预测各机器人执行动作的概率来降低学习空间的维数,并应用于多机器人协作任务之中.实验结果表明,基于预测的加速强化学习算法可以比原始算法更快地获得多机器人的协作策略.
所属分类：机器学习
- 发布日期：2017-12-25
- 文件大小：183296
- 提供者：daluoling

多智能体系统中的分布式强化学习研究现状
多智能体系统中的分布式强化学习研究现状，分析比较优劣，探讨未来发展。
所属分类：机器学习
- 发布日期：2017-12-25
- 文件大小：478208
- 提供者：daluoling

分布式强化学习系统的体系结构研究
强化学习是一种重要的机器学习方法，随着计算机网络和分布式处理技术的飞速发展，多智能体系统中的分布式强化学习方法正受到越来越多的关注。论文将目前已有的各种分布式强化学习方法总结为中央强化学习、独立强化学习、群体强化学习、社会强化学习四类，然后探讨了这四类分布式强化学习方法的体系结构框架，并给出了这四类分布式强化学习方法的形式化定义。
所属分类：机器学习
- 发布日期：2017-12-25
- 文件大小：354304
- 提供者：daluoling

最新中文深度强化学习综述文章，利于入门学习者理解（兼论计算机围棋的发展）
这是几篇最新中文深度强化学习综述。综述了深度强化学习的发展历程, 兼论计算机围棋的历史, 阐述了3类主要的深度强化学习方法，包括基于值函数的深度强化学习、基于策略梯度的深度强化学习和基于搜索与监督的深度强化学习；其次对深度强化学习领域的一些前沿研究方向进行了综述，包括分层深度强化学习、多任务迁移深度强化学习、多智能体深度强化学习、基于记忆与推理的深度强化学习等．最后总结了深度强化学习在若干领域的成功应用和未来发展趋势。本文是中文深度强化学习综述，更利于入门学习者理解。
所属分类：深度学习
- 发布日期：2018-01-01
- 文件大小：3145728
- 提供者：zhuf14

AAAI2018 multi-agent RL
AAAI 2018年论文关于多智能体强化学习方面的研究论文合辑
所属分类：机器学习
- 发布日期：2018-08-02
- 文件大小：6291456
- 提供者：m0_37343099

强化学习阿里
第一章基于强化学习的实时搜索排序策略调控第二章延迟奖赏在搜索排序场景中的作用分析第三章基于多智能体强化学习的多场景联合优化第四章强化学习在淘宝锦囊推荐系统中的应用第五章基于强化学习的引擎性能优化第六章基于强化学习分层流量调控第七章风险商品流量调控第八章虚拟淘宝第九章组合优化视角下基于强化学习的精准定向广告 OCPC 业务优化第十章策略优化方法在搜索广告排序和竞价机制中的应用第十一章 TaskBot－阿里小蜜的任务型问答技术第十二章 DRL导购－阿里小蜜
所属分类：机器学习
- 发布日期：2018-08-07
- 文件大小：17825792
- 提供者：zzqstronger

强化学习在阿里的技术演进与业务创新
第一章基于强化学习的实时搜索排序策略调控第二章延迟奖赏在搜索排序场景中的作用分析第三章基于多智能体强化学习的多场景联合优化第四章强化学习在淘宝锦囊推荐系统中的应用第五章基于强化学习的引擎性能优化第六章基于强化学习分层流量调控第七章风险商品流量调控第八章虚拟淘宝第九章组合优化视角下基于强化学习的精准定向广告 OCPC 业务优化第十章策略优化方法在搜索广告排序和竞价机制中的应用第十一章 TaskBot－阿里小蜜的任务型问答技术第十二章 DRL导购－阿里小蜜
所属分类：互联网
- 发布日期：2018-02-06
- 文件大小：19922944
- 提供者：chowmin3410

采用多智能体强化学习的交通信号优化控制.pdf
在城市交通环境，交通流的正确预测是比较困难，因为多个十字路口，这使得预设的交通控制模型之间的相互作用和纠缠在一起，不能在所有的交通情况下始终保持高性能的预测。考虑到的强化学习的所具有的自主学习能力，本文提出了基于多智能体强化学习的交通信号控制方法。没有预设的控制模型，多协作代理可以学习相应的实时交通状况下的最优控制策略。通过实验结果证明了这种方法的可行性和有效性。
所属分类：其它
- 发布日期：2019-09-12
- 文件大小：242688
- 提供者：weixin_38743737

多智能体强化学习综述_杜威.pdf
多智能体系统是一种分布式计算技术，可用于解决各种领域的问题，包括机器人系统、分布式决策、交通控制和商业管理等。这是被高引用的综述论文，入门可以看看。
所属分类：机器学习
- 发布日期：2020-02-09
- 文件大小：437248
- 提供者：thu_peter

多智能体模型与实验.pdf
多智能体模型与实验pdf,提供“多智能体模型与实验”免费资料下载，主要包括合作式机器人的控制、主要的机器人控制、计算机模型与技术、多智能体强化学习中的技术、进化的多智能体强化学习等内容，可供学习使用。
所属分类：其它
- 发布日期：2019-10-12
- 文件大小：5242880
- 提供者：weixin_38744375

多智能体深度强化学习的若干关键科学问题
强化学习作为一种用于解决无模型序列决策问题的方法已经有数十年的历史, 但强化学习方法在处理高维变量问题时常常会面临巨大挑战。
所属分类：机器学习
- 发布日期：2020-05-25
- 文件大小：892928
- 提供者：syp_net

多智能体-DM-ICML-ACAI.pdf
强化学习与多智能体入门读物，这篇文章对多智能体强化学习（MARL）的背景，目的，代表性的算法进行了调研，在这样一个环境中，每个智能体拥有独立的 Q network，独自采集数据并进行训练，都有对环境的全局观察，动作空间包含以下四个维度：上移、下移、保持不动以及击球（或称为开始游戏）。作者为了全面的观察将 DQN 应用到多智能体环境下的各方面表现，通过设计回报函数的方式设计了完全协作环境、完全竞争环境以及非完全协作/竞争环境。具体回报函数设计如下：完全协作环境：一方失球，则两方均获得 -1
所属分类：机器学习
- 发布日期：2020-08-08
- 文件大小：17825792
- 提供者：u014093545

学会协作：通过多智能体强化学习进行多场景排名
学会协作：通过多智能体强化学习进行多场景排名
所属分类：其它
- 发布日期：2021-03-09
- 文件大小：1048576
- 提供者：weixin_38648396

KDMA:基于知识蒸馏的人类启发式多智能体导航-源码
基于知识蒸馏的人类启发式多智能体导航这是代码库，用于支持论文《使用知识蒸馏的人类启发式多代理导航》。摘要-尽管在多智能体导航领域取得了重大进步，但智能体仍然缺乏人类在多智能体环境中展现出的先进性和智能性。在本文中，我们提出了一个框架，用于在完全分散的多代理环境中学习类似于人的通用碰撞避免策略，以进行代理与代理的交互。我们的方法使用知识强化和强化学习，基于通过行为克隆从人类轨迹演示中提取的专家策略来塑造奖励功能。我们证明，使用我们的方法训练的特工可以在避免碰撞和演示所没有提供的目标导
所属分类：其它
- 发布日期：2021-03-08
- 文件大小：9437184
- 提供者：weixin_42125770

基于半马尔可夫对策的多机器人分层强化学习
在多智能体分层强化学习研究成果的基础上，考虑多机器人系统经常面临的通信困难问题(如水下环境)，提出一种基于半马尔可夫对策的多机器人分层强化学习方法，通过引入对策论方法解决通信困难情况下多机器人学习问题。仿真实验结果表明了该方法的有效性。
所属分类：其它
- 发布日期：2021-02-21
- 文件大小：548864
- 提供者：weixin_38539705

PokerRL：扑克中多智能体深度强化学习的框架-源码
扑克RL 扑克游戏中的多智能体深度强化学习框架。背景解决不完善的信息游戏的研究主要围绕直到最近才遍历整个游戏树的方法（例如，请参见，，）。神经虚拟自我播放（NFSP），后悔策略梯度（RPG），深反事实后悔最小化（Deep CFR）和单深CFR 等新算法最近将深（强化）使用常规方法（例如CFR和虚拟游戏）进行学习，以仅在访问游戏状态的一小部分时即可了解近似的纳什均衡。 PokerRL框架 PokerRL算法的组成部分您的算法由相互交互的工作人员（绿色）组成。训练运
所属分类：其它
- 发布日期：2021-02-04
- 文件大小：332800
- 提供者：weixin_42110469

awesome-game-ai：多智能体强化学习的Awesome Game AI资料-源码
awesome-game-ai：多智能体强化学习的Awesome Game AI资料
所属分类：其它
- 发布日期：2021-02-01
- 文件大小：6144
- 提供者：weixin_42116604

异构多智能体系统的输出同步：一个基于数据的强化学习方法
通过强化学习研究了异构多智能体系统的输出同步问题。根据多智能体系统的拓扑结构，定义一个具有邻居控制输入的性能指标和价值函数。为克服已有控制方法需要系统模型的弊端，提出一个基于系统数据的强化学习算法，使输出同步控制器也可以被应用于模型未知的情况。此外，通过调节价值函数中的权重矩阵，可以减少每个智能体的控制成本。最后，通过一个仿真示例验证了该方法的有效性和定义的价值函数的优越性。
所属分类：其它
- 发布日期：2021-01-20
- 文件大小：1048576
- 提供者：weixin_38661852

« 12 3 »