您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. MineRL-源码

  2. 抽象的 我们将使用流行的沙盒视频游戏Minecraft及其相关的Malmo平台来训练代理,以成功打击被称为“暴民”的游戏内实体。 我们希望,像我们在模拟环境中用于训练代理的方法那样,可以外推到现实世界中的应用程序,例如机器人技术。 我们将使用一种流行的强化学习技术,称为Deep Q Learning,它使用了几种不同的特征表示,并比较了性能差异。 简介与背景 Minecraft是一款流行的沙盒视频游戏,其中包含许多被称为“暴民”的敌对非玩家实体; 这些实体旨在攻击和*玩家角色。 我们的特工将必
  3. 所属分类:其它

    • 发布日期:2021-03-14
    • 文件大小:1048576
    • 提供者:weixin_42102220
  1. minecraft-bc-2020:MineRL2020竞争行为克隆解决方案-源码

  2. 使用行为克隆玩Minecraft,2020年版 该存储库仅包含NoActionWasted团队对的最终排名,模仿学习,排名第四。 团队成员: , 和 。 核心成分: 写在PyTorch中。 在比赛中,动作被混淆成连续的向量。 我们在人类数据集上使用了k均值聚类来创建具有代表性的动作,效果非常好(感谢)。 连续的动作矢量被映射到最接近的质心,并且所有学习都是在这些离散的动作上完成的。 行为克隆(即训练网络以预测人类采取的行动)。 网络模型:具有LSTM层的小型ResNet(有关类似架
  3. 所属分类:其它

    • 发布日期:2021-03-06
    • 文件大小:33792
    • 提供者:weixin_42116058
  1. MineRL-Project-源码

  2. MineRL项目-Minecraft中的深度强化学习 我们测试了DQN和PPO算法。 该代理的目标是在视频游戏环境中导航。 给定摄像机数据作为输入,座席必须走到指定位置。 动作很简单:向前,向后,向左,向右,平移等。 QLearning 针对MineRLNavigateDense-v0环境的深度Q学习。 用法 要测试预训练的网络:运行test.py 训练新网络:运行train.py 依存关系 经过以下培训和测试: Python 3.6 PyTorch 1.0 NumPy 1.15.3 gy
  3. 所属分类:其它

    • 发布日期:2021-03-05
    • 文件大小:3145728
    • 提供者:weixin_42105570