搜索资源 - kaushik_2018_multi-dex:“基于多目标模型的策略搜索以稀疏奖励实现数据有效学习的源代码”（CoRL2018）-Searchsourcecode

搜索资源列表

kaushik_2018_multi-dex:“基于多目标模型的策略搜索以稀疏奖励实现数据有效学习的源代码”（CoRL 2018）-Search source code
多DEX算法论文：抽象的：机器人技术中用于强化学习的数据效率最高的算法是基于模型的策略搜索算法，该算法在学习机器人的动力学模型与优化策略之间交替进行，以在模型及其不确定性给定的情况下最大化期望的回报。但是，当前的算法缺乏有效的探索策略来处理稀疏或误导性的奖励方案：如果在初始随机探索期间它们没有遇到任何具有正奖励的状态，则解决该问题的可能性很小。在这里，我们提出了一种新颖的基于模型的策略搜索算法Multi-DEX，该算法利用学习到的动态模型来有效地探索任务空间，并在几集中以稀疏奖励来解
所属分类：其它
- 发布日期：2021-03-24
- 文件大小：1048576
- 提供者：weixin_42134878