搜索资源 - unity强化学习 - 点数信息

点数信息

注册会员 | 设为首页 | 加入收藏夹

您好，欢迎光临本网站！[请登录] ！[注册会员]！

热门搜索： 源码 Android 整站插件识别 p2p 游戏算法更多...

在线客服QQ:632832888

当前位置：

搜索资源 - unity强化学习

下载资源分类

移动开发

开发技术

课程资源

网络技术

操作系统

安全技术

数据库

行业

服务器应用

存储

信息化

考试认证

云计算

大数据

跨平台

音视频

游戏开发

人工智能

区块链

资源分类

搜索资源列表

ml-agents-master
Ml-agents 是 Unity 机器学习 Agent，它可以让研究人员和开发者用 Unity 编辑器创建游戏和仿真实验。这些编辑器能够通过简单易用的 Python API 使用强化学习或者其他机器学习模型来训练智能 Agent,github上下载不了的话可以下载这个
所属分类：C++
- 发布日期：2019-06-26
- 文件大小：61865984
- 提供者：hello__pig

dotnet-Unity机器学习代理
允许研究人员和开发人员使用Unity Editor来创建游戏和模拟，Unity Editor可以作为可以通过简单易用的Python API使用强化学习，神经演化或其他机器学习方法来训练智能代理的环境。
所属分类：其它
- 发布日期：2019-08-15
- 文件大小：84934656
- 提供者：weixin_39840387

Reinforcement learning framework and toolkits (Gym and Unity)
Reinforcement learning framework and toolkits (Gym and Unity),强化学习框架和工具包,by Amanad 。
所属分类：深度学习
- 发布日期：2020-01-05
- 文件大小：785408
- 提供者：tox33

Python-UnityObstacleTowerChallenge强化学习竞赛优胜方案
Unity Obstacle Tower Challenge强化学习竞赛优胜方案
所属分类：其它
- 发布日期：2019-08-10
- 文件大小：56320
- 提供者：weixin_39841365

Deep_reinforcement_learning_Unity_Tennis:这款笔记本采用深度强化学习来解决Unity网球环境-源码
Deep_reinforcement_learning_Unity_Tennis 这款笔记本采用深度强化学习来解决Unity网球环境
所属分类：其它
- 发布日期：2021-03-14
- 文件大小：130048
- 提供者：weixin_42137022

Udacity-Deep-Reinforcement-Learning-p3-collaboration-and-competition-源码
Udacity深度强化学习p3合作与竞争该项目的目标是训练网球环境。该环境基于Unity ML代理。问题描述在这种环境下，两名特工控制球拍在球网上弹跳球。如果探员将球击中网，则得到+0.1的奖励。如果探员让一个球击中地面或将球击出界外，则其获得的奖励为-0.01。因此，每个特工的目标是保持比赛中的球权。观察空间由8个变量组成，分别对应于球和球拍的位置和速度。每个代理都会收到自己的本地观察结果。有两个连续的动作可用，分别对应于朝向（或远离）网络的运动和跳跃。该任务是情节性
所属分类：其它
- 发布日期：2021-03-06
- 文件大小：1048576
- 提供者：weixin_42130786

网球俱乐部-源码
DRL-网球统一项目详情这是Udacity深度强化学习纳米学位的最终项目。在这种环境下，两名特工控制球拍在球网上弹跳球。如果探员将球击中网，则得到+0.1的奖励。如果探员让一个球击中地面或将球击出界外，则其获得的奖励为-0.01。因此，每个特工的目标是保持比赛中的球权。观察空间由8个变量组成，分别对应于球和球拍的位置和速度。每个代理都会收到自己的本地观察结果。有两个连续的动作可用，分别对应于朝向（或远离）网络的运动和跳跃。该任务是情节性的，并且为了解决环境，您的特工必须获
所属分类：其它
- 发布日期：2021-03-02
- 文件大小：160768
- 提供者：weixin_42131276

DRL：“深度强化学习”代码的存储库-源码
博士升介绍该存储库是Deep Reinforcement Learning的代码我通过游戏验证了我的代码。这些游戏是用pygame 。我制作了游戏或修改了游戏以申请DRL。另外，由Unity ML-agents构成的环境位于我实现的每种算法的性能如下（已通过Breakout验证）。我按照以下步骤设置DRL代码。这是我实现descr iption of DQN codes的。 DRL算法的描述环境软件 Windows7（64位） Python 3.6.5 Python4.
所属分类：其它
- 发布日期：2021-02-23
- 文件大小：5242880
- 提供者：weixin_42165490

udacity-reacher：Udacity深度强化学习纳米学位课程的连续控制项目，学生在其中训练Unity Reacher手臂-源码
持续控制项目在Udacity深度强化学习纳米学位计划中，持续控制是学生自己建立的第二个主要项目。该项目将使用任何基于策略的技术来构建和训练代理，以控制Unity ML代理环境中的Reacher两关节机器人手臂。目的是以这样一种方式移动手臂，使其终点始终位于环境移动目标的附近。目标是在平行于基台的平面中以圆形图案随机移动的球体。它可以顺时针或逆时针移动，并改变其速度。有时它基本上是静止的。这不是一个偶然的任务，因此我们将轨迹长度任意限制为一定数量的时间步长，并将其称为情节。主体
所属分类：其它
- 发布日期：2021-02-16
- 文件大小：988160
- 提供者：weixin_42118701

p2_continuous-control：Udacity深度强化学习NanoDegree-项目2-机械手臂控制-源码
项目2：连续控制介绍对于此项目，您将使用环境。！[训练有素的经纪人] [image1] 在这种环境下，双臂可以移动到目标位置。对于代理人的手在目标位置中的每一步，将提供+0.1的奖励。因此，座席的目标是在尽可能多的时间步中保持其在目标位置的位置。观察空间由33个变量组成，分别对应于手臂的位置，旋转，速度和角速度。每个动作是一个带有四个数字的向量，对应于适用于两个关节的扭矩。动作向量中的每个条目都应为-1和1之间的数字。分布式培训对于此项目，我们将为您提供两个单独的Uni
所属分类：其它
- 发布日期：2021-02-15
- 文件大小：1048576
- 提供者：weixin_42135773

DRLND-project-3：Udacity的深度强化学习纳米学位项目3的实施-源码
DRLND-项目3 该存储库包含项目3的实现。项目详情该项目实施了多代理深度确定性策略梯度（MADDPG），用于解决在虚拟世界中打网球主要是合作游戏的Unity环境。最终执行记录：在这种环境下，两名特工控制球拍在球网上弹跳球。如果探员将球击中网，则得到+0.1的奖励。如果探员让一个球击中地面或越界将球击中，则其收益为-0.01。因此，每个特工的目标是保持比赛中的球权。观察空间由8个变量组成，分别对应于球和球拍的位置和速度。每个代理都会收到自己的本地观察结果。有两个连续
所属分类：其它
- 发布日期：2021-02-15
- 文件大小：934912
- 提供者：weixin_42120283

DRLND-project-2：Udacity的深度强化学习纳米学位项目2的实施-源码
DRLND-project-2 该存储库包含项目2的实现。项目详情到达者该项目实现了PPO，用于解决Unity环境中的连续控制问题-使机械臂跟随旋转的航点-在具有20个代理的变体版本上。最终执行记录：当手臂末端位于目标球体内/目标航路点的固定范围内时，每个代理随时间累积的奖励。代理的目标是遵循路标。对于每个代理，状态空间具有33个维度，而动作空间具有4个连续维度。该任务是情节性的，当特工在100个连续情节中获得+30的平均分数时，该任务被认为已解决。履带式该项目的可
所属分类：其它
- 发布日期：2021-02-15
- 文件大小：15728640
- 提供者：weixin_42120563

drl-dodgeball：一个简单的躲避球环境和DDQN代理，提供课程学习和优先级的经验重播-源码
DRL躲避球 DRL（深度强化学习）已导致创建具有令人着迷的复杂和智能行为的代理，特别是在和等计算机游戏领域。一个令人兴奋的研究领域是开发最终部署到物理机器人中的数字代理，OpenAI的演示了一项任务，该任务需要高保真训练环境。在这个项目中，我们设计了具有高维感官数据源的物理逼真的模拟，并在其中使用完善的深层Q网络训练了代理。档案火车用于培训的主文件，目前正在使用精制DQN培训代理商命令：“ py train.py” train_DQN.py 使用精致的DQN在Unity环境下培
所属分类：其它
- 发布日期：2021-02-14
- 文件大小：36700160
- 提供者：weixin_42121058

ds_drl_tennis_player：我的项目（协作和竞争）的存储库，其中包含深度强化学习-源码
通过深度强化学习打网球该项目包含一个基于深度强化学习的代理，该代理可以从零（无标签数据）中学习打网球。 \ o / 它使用来设计，训练和评估深度强化学习算法的实现。该项目使用的环境是的Udacity版本的。这个Unity环境有两个版本：该项目是我的。环境细节在这种环境下，两名特工控制球拍在球网上弹跳球。奖励如果探员将球击中网，则将获得+0.1的奖励。如果探员让一个球击中地面或将球击出界外，则其收益为-0.01 。因此，每个特工的目标是保持比赛中的球权。状态和动作
所属分类：其它
- 发布日期：2021-02-12
- 文件大小：54525952
- 提供者：weixin_42097369

Q-GridWorld：使用表格Q学习算法的演示项目-源码
Q-GridWorld演示一个简单的Unity项目，以表格形式展示了Q学习算法。要获得浏览器内WebGL版本，请点击的链接。总览在最简单的情况下，我们有一个5x5的网格世界，其中有一个特工（蓝色方块），一个目标（绿色方块）和障碍物（红色方块）。对于演示的每次运行，都会随机选择代理商，目标和障碍物的位置（但在同一演示运行中保持一致）。在这种网格世界环境中，代理的目标是学习一种策略，以有效地从其起始位置导航到目标位置，同时避免障碍。它通过学习针对处于每种状态的最佳行动来实现这一目标（通
所属分类：其它
- 发布日期：2021-02-06
- 文件大小：833536
- 提供者：weixin_42098251

AirSim：来自Microsoft AI＆Research的基于Unreal Engine Unity的自动驾驶汽车开源模拟器-源码
欢迎来到AirSim AirSim是一款基于（我们现在还有一个实验性的版本）的无人机，汽车等模拟器。它是开源，跨平台的，并通过流行的飞行控制器（例如PX4和ArduPilot）支持在环软件仿真，并通过PX4进行硬件在环仿真，以进行物理和视觉逼真的仿真。它是作为Unreal插件开发的，可以直接放入任何Unreal环境中。同样，我们有一个Unity插件的实验版本。我们的目标是将AirSim开发为AI研究的平台，以对自动驾驶汽车的深度学习，计算机视觉和强化学习算法进行实验。为此，Air
所属分类：其它
- 发布日期：2021-02-06
- 文件大小：226492416
- 提供者：weixin_42177768

机器学习：我在PyTorch，Keras，Tensorflow，scikit学习和Python中进行机器学习的项目-源码
机器学习我的项目，Kaggle竞赛和一些流行的机器学习算法的实现。我还列出了我在ML / DL / AI领域策划的研究论文清单。指数：内容：专案以下是我在机器学习领域完成的项目：名称描述实现不同的强化学习算法，例如DQN，Double-DQN，Dualling-DQN，蒙特卡洛，时间差等。能够在基于Unity ML-Agents的Banana Collector环境中获得最大回报的Deep-Q Learning代理深度确定性策略梯度学习代理，能够在基于Unity ML
所属分类：其它
- 发布日期：2021-02-05
- 文件大小：22020096
- 提供者：weixin_42099633

ml-agents：Unity机器学习代理工具包-源码
Unity ML-Agents工具包（）（） Unity Machine Learning Agents工具包（ML-Agents）是一个开放源代码项目，使游戏和模拟能够用作训练智能代理的环境。我们提供最新算法的实现（基于PyTorch），使游戏开发人员和业余爱好者可以轻松地训练2D，3D和VR / AR游戏的智能代理。研究人员还可以使用提供的易于使用的Python API通过强化学习，模仿学习，神经进化或任何其他方法来训练Agent。这些训练有素的代理可以用于多种目的，包括控制NP
所属分类：其它
- 发布日期：2021-02-04
- 文件大小：154140672
- 提供者：weixin_42113754

udacity-drlnd-project-3-Collaboration-and-Competition:深度强化学习纳米学位项目3-源码
项目3：合作与竞争该存储库包含项目3的实现。项目详情待定入门 Python环境如果您在自己的环境中运行该项目，则需要安装一些软件包。的Python == 3.6 pytorch == 0.4 mlagents == 0.4（Unity ML代理）或者，您可以在jupyter笔记本上运行该项目。依存关系要设置您的python环境（使用conda）以在项目中运行代码，请遵循以下说明。使用Python 3.6创建并激活新环境 conda create --name pro
所属分类：其它
- 发布日期：2021-03-31
- 文件大小：6144
- 提供者：weixin_42131618

MEMRL:博士论文工作-强化学习任务决策中的学习和记忆计算模型-源码
记忆辅助强化学习由安尼克·卡森（Annik Carson）基本的 -与Kyle Nealy Fall2020编写项目，以在Unity / OpenMaze环境中运行实验。去做：为环境编写测试（确保它们的行为均相同）网格世界环境符合Openai标准表征学习作为主体对象的功能 MF和EC动作选择之间的仲裁，作为代理对象的功能保存实验结果/记录参数档案结构 basic │ README.md │ └───Agents | | Define class which
所属分类：其它
- 发布日期：2021-03-22
- 文件大小：115343360
- 提供者：weixin_42169245

« 12 »