您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. MineRL-源码

  2. 抽象的 我们将使用流行的沙盒视频游戏Minecraft及其相关的Malmo平台来训练代理,以成功打击被称为“暴民”的游戏内实体。 我们希望,像我们在模拟环境中用于训练代理的方法那样,可以外推到现实世界中的应用程序,例如机器人技术。 我们将使用一种流行的强化学习技术,称为Deep Q Learning,它使用了几种不同的特征表示,并比较了性能差异。 简介与背景 Minecraft是一款流行的沙盒视频游戏,其中包含许多被称为“暴民”的敌对非玩家实体; 这些实体旨在攻击和杀死玩家角色。 我们的特工将必
  3. 所属分类:其它

    • 发布日期:2021-03-14
    • 文件大小:1048576
    • 提供者:weixin_42102220
  1. MineRL-Project-源码

  2. MineRL项目-Minecraft中的深度强化学习 我们测试了DQN和PPO算法。 该代理的目标是在视频游戏环境中导航。 给定摄像机数据作为输入,座席必须走到指定位置。 动作很简单:向前,向后,向左,向右,平移等。 QLearning 针对MineRLNavigateDense-v0环境的深度Q学习。 用法 要测试预训练的网络:运行test.py 训练新网络:运行train.py 依存关系 经过以下培训和测试: Python 3.6 PyTorch 1.0 NumPy 1.15.3 gy
  3. 所属分类:其它

    • 发布日期:2021-03-05
    • 文件大小:3145728
    • 提供者:weixin_42105570