抽象的
我们将使用流行的沙盒视频游戏Minecraft及其相关的Malmo平台来训练代理,以成功打击被称为“暴民”的游戏内实体。 我们希望,像我们在模拟环境中用于训练代理的方法那样,可以外推到现实世界中的应用程序,例如机器人技术。 我们将使用一种流行的强化学习技术,称为Deep Q Learning,它使用了几种不同的特征表示,并比较了性能差异。
简介与背景
Minecraft是一款流行的沙盒视频游戏,其中包含许多被称为“暴民”的敌对非玩家实体; 这些实体旨在攻击和杀死玩家角色。 我们的特工将必