您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. ml-agents-master

  2. Ml-agents 是 Unity 机器学习 Agent,它可以让研究人员和开发者用 Unity 编辑器创建游戏和仿真实验。这些编辑器能够通过简单易用的 Python API 使用强化学习或者其他机器学习模型来训练智能 Agent,github上下载不了的话可以下载这个
  3. 所属分类:C++

    • 发布日期:2019-06-26
    • 文件大小:61865984
    • 提供者:hello__pig
  1. dotnet-Unity机器学习代理

  2. 允许研究人员和开发人员使用Unity Editor来创建游戏和模拟,Unity Editor可以作为可以通过简单易用的Python API使用强化学习,神经演化或其他机器学习方法来训练智能代理的环境。
  3. 所属分类:其它

    • 发布日期:2019-08-15
    • 文件大小:84934656
    • 提供者:weixin_39840387
  1. Reinforcement learning framework and toolkits (Gym and Unity)

  2. Reinforcement learning framework and toolkits (Gym and Unity),强化学习框架和工具包,by Amanad 。
  3. 所属分类:深度学习

    • 发布日期:2020-01-05
    • 文件大小:785408
    • 提供者:tox33
  1. Python-UnityObstacleTowerChallenge强化学习竞赛优胜方案

  2. Unity Obstacle Tower Challenge强化学习竞赛优胜方案
  3. 所属分类:其它

    • 发布日期:2019-08-10
    • 文件大小:56320
    • 提供者:weixin_39841365
  1. Deep_reinforcement_learning_Unity_Tennis:这款笔记本采用深度强化学习来解决Unity网球环境-源码

  2. Deep_reinforcement_learning_Unity_Tennis 这款笔记本采用深度强化学习来解决Unity网球环境
  3. 所属分类:其它

    • 发布日期:2021-03-14
    • 文件大小:130048
    • 提供者:weixin_42137022
  1. Udacity-Deep-Reinforcement-Learning-p3-collaboration-and-competition-源码

  2. Udacity深度强化学习p3合作与竞争 该项目的目标是训练网球环境。 该环境基于Unity ML代理。 问题描述 在这种环境下,两名特工控制球拍在球网上弹跳球。 如果探员将球击中网,则得到+0.1的奖励。 如果探员让一个球击中地面或将球击出界外,则其获得的奖励为-0.01。 因此,每个特工的目标是保持比赛中的球权。 观察空间由8个变量组成,分别对应于球和球拍的位置和速度。 每个代理都会收到自己的本地观察结果。 有两个连续的动作可用,分别对应于朝向(或远离)网络的运动和跳跃。 该任务是情节性
  3. 所属分类:其它

    • 发布日期:2021-03-06
    • 文件大小:1048576
    • 提供者:weixin_42130786
  1. 网球俱乐部-源码

  2. DRL-网球统一 项目详情 这是Udacity深度强化学习纳米学位的最终项目。 在这种环境下,两名特工控制球拍在球网上弹跳球。 如果探员将球击中网,则得到+0.1的奖励。 如果探员让一个球击中地面或将球击出界外,则其获得的奖励为-0.01。 因此,每个特工的目标是保持比赛中的球权。 观察空间由8个变量组成,分别对应于球和球拍的位置和速度。 每个代理都会收到自己的本地观察结果。 有两个连续的动作可用,分别对应于朝向(或远离)网络的运动和跳跃。 该任务是情节性的,并且为了解决环境,您的特工必须获
  3. 所属分类:其它

    • 发布日期:2021-03-02
    • 文件大小:160768
    • 提供者:weixin_42131276
  1. DRL:“深度强化学习”代码的存储库-源码

  2. 博士升 介绍 该存储库是Deep Reinforcement Learning的代码我通过游戏验证了我的代码。 这些游戏是用pygame 。 我制作了游戏或修改了游戏以申请DRL。 另外,由Unity ML-agents构成的环境位于 我实现的每种算法的性能如下(已通过Breakout验证)。 我按照以下步骤设置DRL代码。 这是我实现descr iption of DQN codes的。 DRL算法的描述 环境 软件 Windows7(64位) Python 3.6.5 Python4.
  3. 所属分类:其它

    • 发布日期:2021-02-23
    • 文件大小:5242880
    • 提供者:weixin_42165490
  1. udacity-reacher:Udacity深度强化学习纳米学位课程的连续控制项目,学生在其中训练Unity Reacher手臂-源码

  2. 持续控制项目 在Udacity深度强化学习纳米学位计划中,持续控制是学生自己建立的第二个主要项目。 该项目将使用任何基于策略的技术来构建和训练代理,以控制Unity ML代理环境中的Reacher两关节机器人手臂。 目的是以这样一种方式移动手臂,使其终点始终位于环境移动目标的附近。 目标是在平行于基台的平面中以圆形图案随机移动的球体。 它可以顺时针或逆时针移动,并改变其速度。 有时它基本上是静止的。 这不是一个偶然的任务,因此我们将轨迹长度任意限制为一定数量的时间步长,并将其称为情节。 主体
  3. 所属分类:其它

    • 发布日期:2021-02-16
    • 文件大小:988160
    • 提供者:weixin_42118701
  1. p2_continuous-control:Udacity深度强化学习NanoDegree-项目2-机械手臂控制-源码

  2. 项目2:连续控制 介绍 对于此项目,您将使用环境。 ![训练有素的经纪人] [image1] 在这种环境下,双臂可以移动到目标位置。 对于代理人的手在目标位置中的每一步,将提供+0.1的奖励。 因此,座席的目标是在尽可能多的时间步中保持其在目标位置的位置。 观察空间由33个变量组成,分别对应于手臂的位置,旋转,速度和角速度。 每个动作是一个带有四个数字的向量,对应于适用于两个关节的扭矩。 动作向量中的每个条目都应为-1和1之间的数字。 分布式培训 对于此项目,我们将为您提供两个单独的Uni
  3. 所属分类:其它

    • 发布日期:2021-02-15
    • 文件大小:1048576
    • 提供者:weixin_42135773
  1. DRLND-project-3:Udacity的深度强化学习纳米学位项目3的实施-源码

  2. DRLND-项目3 该存储库包含项目3的实现。 项目详情 该项目实施了多代理深度确定性策略梯度(MADDPG),用于解决在虚拟世界中打网球主要是合作游戏的Unity环境。 最终执行记录: 在这种环境下,两名特工控制球拍在球网上弹跳球。 如果探员将球击中网,则得到+0.1的奖励。 如果探员让一个球击中地面或越界将球击中,则其收益为-0.01。 因此,每个特工的目标是保持比赛中的球权。 观察空间由8个变量组成,分别对应于球和球拍的位置和速度。 每个代理都会收到自己的本地观察结果。 有两个连续
  3. 所属分类:其它

    • 发布日期:2021-02-15
    • 文件大小:934912
    • 提供者:weixin_42120283
  1. DRLND-project-2:Udacity的深度强化学习纳米学位项目2的实施-源码

  2. DRLND-project-2 该存储库包含项目2的实现。 项目详情 到达者 该项目实现了PPO,用于解决Unity环境中的连续控制问题-使机械臂跟随旋转的航点-在具有20个代理的变体版本上。 最终执行记录: 当手臂末端位于目标球体内/目标航路点的固定范围内时,每个代理随时间累积的奖励。 代理的目标是遵循路标。 对于每个代理,状态空间具有33个维度,而动作空间具有4个连续维度。 该任务是情节性的,当特工在100个连续情节中获得+30的平均分数时,该任务被认为已解决。 履带式 该项目的可
  3. 所属分类:其它

    • 发布日期:2021-02-15
    • 文件大小:15728640
    • 提供者:weixin_42120563
  1. drl-dodgeball:一个简单的躲避球环境和DDQN代理,提供课程学习和优先级的经验重播-源码

  2. DRL躲避球 DRL(深度强化学习)已导致创建具有令人着迷的复杂和智能行为的代理,特别是在和等计算机游戏领域。 一个令人兴奋的研究领域是开发最终部署到物理机器人中的数字代理,OpenAI的演示了一项任务,该任务需要高保真训练环境。 在这个项目中,我们设计了具有高维感官数据源的物理逼真的模拟,并在其中使用完善的深层Q网络训练了代理。 档案 火车 用于培训的主文件,目前正在使用精制DQN培训代理商 命令:“ py train.py” train_DQN.py 使用精致的DQN在Unity环境下培
  3. 所属分类:其它

    • 发布日期:2021-02-14
    • 文件大小:36700160
    • 提供者:weixin_42121058
  1. ds_drl_tennis_player:我的项目(协作和竞争)的存储库,其中包含深度强化学习-源码

  2. 通过深度强化学习打网球 该项目包含一个基于深度强化学习的代理,该代理可以从零(无标签数据)中学习打网球。 \ o / 它使用来设计,训练和评估深度强化学习算法的实现。 该项目使用的环境是的Udacity版本的 。 这个Unity环境有两个版本: 该项目是我的。 环境细节 在这种环境下,两名特工控制球拍在球网上弹跳球。 奖励 如果探员将球击中网,则将获得+0.1的奖励。 如果探员让一个球击中地面或将球击出界外,则其收益为-0.01 。 因此,每个特工的目标是保持比赛中的球权。 状态和动作
  3. 所属分类:其它

    • 发布日期:2021-02-12
    • 文件大小:54525952
    • 提供者:weixin_42097369
  1. Q-GridWorld:使用表格Q学习算法的演示项目-源码

  2. Q-GridWorld演示 一个简单的Unity项目,以表格形式展示了Q学习算法。 要获得浏览器内WebGL版本,请点击的链接。 总览 在最简单的情况下,我们有一个5x5的网格世界,其中有一个特工(蓝色方块),一个目标(绿色方块)和障碍物(红色方块)。 对于演示的每次运行,都会随机选择代理商,目标和障碍物的位置(但在同一演示运行中保持一致)。 在这种网格世界环境中,代理的目标是学习一种策略,以有效地从其起始位置导航到目标位置,同时避免障碍。 它通过学习针对处于每种状态的最佳行动来实现这一目标(通
  3. 所属分类:其它

    • 发布日期:2021-02-06
    • 文件大小:833536
    • 提供者:weixin_42098251
  1. AirSim:来自Microsoft AI&Research的基于Unreal Engine Unity的自动驾驶汽车开源模拟器-源码

  2. 欢迎来到AirSim AirSim是一款基于 (我们现在还有一个实验性的版本)的无人机,汽车等模拟器。 它是开源,跨平台的,并通过流行的飞行控制器(例如PX4和ArduPilot)支持在环软件仿真,并通过PX4进行硬件在环仿真,以进行物理和视觉逼真的仿真。 它是作为Unreal插件开发的,可以直接放入任何Unreal环境中。 同样,我们有一个Unity插件的实验版本。 我们的目标是将AirSim开发为AI研究的平台,以对自动驾驶汽车的深度学习,计算机视觉和强化学习算法进行实验。 为此,Air
  3. 所属分类:其它

    • 发布日期:2021-02-06
    • 文件大小:226492416
    • 提供者:weixin_42177768
  1. 机器学习:我在PyTorch,Keras,Tensorflow,scikit学习和Python中进行机器学习的项目-源码

  2. 机器学习 我的项目,Kaggle竞赛和一些流行的机器学习算法的实现。 我还列出了我在ML / DL / AI领域策划的研究论文清单。 指数: 内容: 专案 以下是我在机器学习领域完成的项目: 名称 描述 实现不同的强化学习算法,例如DQN,Double-DQN,Dualling-DQN,蒙特卡洛,时间差等。 能够在基于Unity ML-Agents的Banana Collector环境中获得最大回报的Deep-Q Learning代理 深度确定性策略梯度学习代理,能够在基于Unity ML
  3. 所属分类:其它

    • 发布日期:2021-02-05
    • 文件大小:22020096
    • 提供者:weixin_42099633
  1. ml-agents:Unity机器学习代理工具包-源码

  2. Unity ML-Agents工具包 ()() Unity Machine Learning Agents工具包(ML-Agents)是一个开放源代码项目,使游戏和模拟能够用作训练智能代理的环境。 我们提供最新算法的实现(基于PyTorch),使游戏开发人员和业余爱好者可以轻松地训练2D,3D和VR / AR游戏的智能代理。 研究人员还可以使用提供的易于使用的Python API通过强化学习,模仿学习,神经进化或任何其他方法来训练Agent。 这些训练有素的代理可以用于多种目的,包括控制NP
  3. 所属分类:其它

    • 发布日期:2021-02-04
    • 文件大小:154140672
    • 提供者:weixin_42113754
  1. udacity-drlnd-project-3-Collaboration-and-Competition:深度强化学习纳米学位项目3-源码

  2. 项目3:合作与竞争 该存储库包含项目3的实现。 项目详情 待定 入门 Python环境 如果您在自己的环境中运行该项目,则需要安装一些软件包。 的Python == 3.6 pytorch == 0.4 mlagents == 0.4(Unity ML代理) 或者,您可以在jupyter笔记本上运行该项目。 依存关系 要设置您的python环境(使用conda)以在项目中运行代码,请遵循以下说明。 使用Python 3.6创建并激活新环境 conda create --name pro
  3. 所属分类:其它

    • 发布日期:2021-03-31
    • 文件大小:6144
    • 提供者:weixin_42131618
  1. MEMRL:博士论文工作-强化学习任务决策中的学习和记忆计算模型-源码

  2. 记忆辅助强化学习 由安尼克·卡森(Annik Carson) 基本的 -与Kyle Nealy Fall2020编写项目,以在Unity / OpenMaze环境中运行实验。 去做: 为环境编写测试(确保它们的行为均相同) 网格世界环境符合Openai标准 表征学习作为主体对象的功能 MF和EC动作选择之间的仲裁,作为代理对象的功能 保存实验结果/记录参数 档案结构 basic │ README.md │ └───Agents | | Define class which
  3. 所属分类:其它

    • 发布日期:2021-03-22
    • 文件大小:115343360
    • 提供者:weixin_42169245
« 12 »