您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. Mastering the game of Go without human knowledge

  2. 本文为英文版完整论文。论文摘要翻译:长期以来,人工智能算法的目标就是让机器能够学习,在具有挑战性的专业领域,从婴儿般的状态(没有经验、知识基础)发展到超人类的级别。近期,AlphaGo成为了首个打败人类围棋世界冠军的程序。AlphaGo中的树形检索(tree search)可以利用深度神经网络评估棋局并进行落子,甚至能通过自我对弈实现强化学习(reinforcement learning)。本文(nature24270)介绍一种纯粹基于强化学习的算法,无需人类数据、指导或者超出游戏规则的专业知
  3. 所属分类:机器学习

    • 发布日期:2017-10-19
    • 文件大小:2097152
    • 提供者:pierian_d
  1. 不使用人类知识掌握围棋

  2. DeepMind在Nature上发表了名为Mastering the game of Go without human knowledge(不使用人类知识掌握围棋)的论文,在论文中,Deepmind展示了他们强大的新版本围棋程序“AlphaGo Zero”—— 仅经过三天训练,就能以100:0击败此前击败李世石的AlphaGo Lee,经过21天训练,就能达到击败柯洁的AlphaGo Master的水平。
  3. 所属分类:深度学习

    • 发布日期:2017-10-21
    • 文件大小:2097152
    • 提供者:hgh513
  1. 如何理解AlphaGo Zero背后涉及到的技术

  2. 详细讲解AlphaGo Zero背后涉及到的知识点,以及论文流程讲解分析。
  3. 所属分类:机器学习

  1. Python-AlphaGoZero揭秘SuperGo代码解析

  2. AlphaGo Zero揭秘(SuperGo代码解析)
  3. 所属分类:其它

    • 发布日期:2019-08-11
    • 文件大小:26624
    • 提供者:weixin_39841848
  1. Python-AlphaGoZero工作原理解析的示例代码

  2. AlphaGo Zero工作原理解析的示例代码
  3. 所属分类:其它

    • 发布日期:2019-08-11
    • 文件大小:8388608
    • 提供者:weixin_39840387
  1. Python-Nochi一个简约类似于AlphaGoZero的引擎

  2. Nochi:一个简约类似于AlphaGoZero的引擎
  3. 所属分类:其它

    • 发布日期:2019-08-11
    • 文件大小:15360
    • 提供者:weixin_39841848
  1. Python-一个参考AlphaGoZero论文实现的围棋引擎

  2. 一个参考AlphaGo Zero论文实现的围棋引擎
  3. 所属分类:其它

    • 发布日期:2019-08-11
    • 文件大小:54525952
    • 提供者:weixin_39841856
  1. Python-Minigo基于AlphaGoZero核心算法TensorFlow极简围棋引擎

  2. Minigo: 基于AlphaGo Zero核心算法(TensorFlow)极简围棋引擎
  3. 所属分类:其它

    • 发布日期:2019-08-11
    • 文件大小:99328
    • 提供者:weixin_39841848
  1. Python-通过AlphaGoZero方法反转强化学习

  2. 通过AlphaGo Zero方法反转强化学习
  3. 所属分类:其它

    • 发布日期:2019-08-12
    • 文件大小:1021952
    • 提供者:weixin_39840924
  1. ELF-master.zip

  2. 受 DeepMind 的启发,今年早些时候,我们研究开发出了可扩展的、轻量级框架 ELF,期望达到 AlphaGoZero 最近的水平。目标是创建一个开源实现的系统,该系统可以自学围棋并能够打败职业棋手。最后,通过发布我们的代码和模型,来激励更多的人去思考这项技术新的应用和研究方向。 ELF OpenGo 已经成功打败了其他开源机器人和人类棋手。我们对 LeelaZero(基于Deepmind最新论文的围棋人工智能)进行了一系列的比赛(198 胜 2 负),2018 年 4 月 25 日),我
  3. 所属分类:深度学习

    • 发布日期:2020-05-05
    • 文件大小:408576
    • 提供者:m0_45004979
  1. AlphaSnake-Zero:基于AlphaGo Zero的算法的增强型学习AI,可以玩同步策略游戏《战栗》-源码

  2. 介绍 有关算法的详细说明,请检查。 抽象的 最近,有关强化学习的研究很多。 Q学习或DQN试图解决单人与环境的问题,而AlphaGo等其他方法则尝试双人游戏。在这个项目中,我们尝试找到一种算法来生成在多主体同步策略游戏中表现良好的主体。尽管此项目特定于称为Battlesnake的游戏,但我们使用的方法和算法不限于此。数学适用于具有有限状态和动作空间的任何同步游戏。 要求: 的Python 3.7.6 NumPy 1.18.1 TensorFlow 2.1.0 指示: 转到“代码”文件夹并运行
  3. 所属分类:其它

    • 发布日期:2021-03-18
    • 文件大小:1048576
    • 提供者:weixin_42123191
  1. 深度强化学习进展: 从AlphaGo到AlphaGo Zero

  2. 2016年初, AlphaGo战胜李世石成为人工智能的里程碑事件. 其核心技术深度强化学习受到人们的广泛关.注和研究, 取得了丰硕的理论和应用成果. 并进一步研发出算法形式更为简洁的AlphaGo Zero, 其采用完全不基于.人类经验的自学习算法, 完胜AlphaGo, 再一次刷新人们对深度强化学习的认知. 深度强化学习结合了深度学习和.强化学习的优势, 可以在复杂高维的状态动作空间中进行端到端的感知决策. 本文主要介绍了从AlphaGo到Alpha-.Go Zero的深度强化学习的研究进展.
  3. 所属分类:其它

    • 发布日期:2021-03-09
    • 文件大小:1048576
    • 提供者:weixin_38537968
  1. 2021-KAIST-Include-AlphaZero:2021년KAIST Include리스터디-AlphaGo와AlphaGo Zero를인공지능-源码

  2. 2021-KAIST-Include-AlphaZero 2021-KAIST-Include-AlphaZero是使用课程制作“ Go”游戏的AI的材料(讲义,示例和作业)存储库,我将在2021年Spring在KAIST教授俱乐部“ Include”。该存储库中的示例和分配使用和 。 书 Max Pumperla和Kevin Ferguson撰写的《深度学习与围棋》(曼宁,2019年) 韩语:딥러닝과(딥러닝과,2020) 内容 第一周(3/20) 走向深度学习:机器学习简介 什么是机器
  3. 所属分类:其它

    • 发布日期:2021-02-25
    • 文件大小:5120
    • 提供者:weixin_42099116
  1. leela-zero:无引擎提供的Go引擎,以AlphaGo Zero论文为模型-源码

  2. 什么 没有人提供知识的Go程序。 使用MCTS(但没有蒙特卡罗播报)和深度残差卷积神经网络堆栈。 这是Alpha Go Zero论文“”中描述的系统的忠实重新实现。 出于所有目的和目的,它是一个开源的AlphaGo Zero。 等一下 如果您想知道问题所在:您仍然需要网络权重。 此存储库中没有网络权重。 如果您设法获得AlphaGo零权重,那么只要您还获得了一些张量处理单元,该程序的强度就会差不多。 缺少那些TPU,我建议使用顶级的GPU-它并不完全相同,但是结果仍然是引擎要比顶级人类强大得多
  3. 所属分类:其它

    • 发布日期:2021-02-24
    • 文件大小:1048576
    • 提供者:weixin_42171208
  1. ScalphaGoZero:使用Deeplearning4J(DL4J)在Scala中对DeepMind的AlphaGoZero进行独立实现-源码

  2. ScalphaGoZero ScalphaGoZero是Scala中DeepMind的AlphaGo Zero的独立实现,它使用运行神经网络。 您可以使用内置的模型运行实验,也可以导入预构建的 。 ScalphaGoZero主要是一项工程工作,旨在证明机器学习中复杂而成功的系统不再与Python绑定。 通过使用功能强大的工具(例如用于高级数学的ND4J,用于神经网络的DL4J)以及JVM的成熟基础架构,Scala等语言可以为数据科学家提供可行的替代方案。 该项目是的AlphaGo零模块的S
  3. 所属分类:其它

    • 发布日期:2021-02-05
    • 文件大小:40894464
    • 提供者:weixin_42138788