您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. banana-agent:使用Deep Q-Learning收集尽可能多的香蕉的代理商-源码

  2. 代理使用Deep Q-Learning遍历整个香蕉世界,以使得分最大化。 该项目包括可用于训练和测试代理的脚本。 环境 代理被放置在随机放置黄色和蓝色香蕉的方形世界中。 提供+1的奖励以收集黄色香蕉,提供-1的奖励以收集蓝色香蕉。 该代理的目标是收集尽可能多的黄色香蕉,同时避免使用蓝色香蕉。 状态空间具有37个维度,并包含主体的速度以及围绕主体向前方向的物体的基于光线的感知。 提供了四个离散操作,分别对应于: 0向前移动。 1向后移动。 2向左转。 3向右转。 该任务是情节性的,当
  3. 所属分类:其它

    • 发布日期:2021-03-16
    • 文件大小:20971520
    • 提供者:weixin_42132354