点数信息
www.dssz.net
注册会员
|
设为首页
|
加入收藏夹
您好,欢迎光临本网站!
[请登录]
!
[注册会员]
!
首页
移动开发
云计算
大数据
数据库
游戏开发
人工智能
网络技术
区块链
操作系统
模糊查询
热门搜索:
源码
Android
整站
插件
识别
p2p
游戏
算法
更多...
在线客服QQ:632832888
当前位置:
资源下载
搜索资源 - 逆向深度q学习-源码
下载资源分类
移动开发
开发技术
课程资源
网络技术
操作系统
安全技术
数据库
行业
服务器应用
存储
信息化
考试认证
云计算
大数据
跨平台
音视频
游戏开发
人工智能
区块链
在结果中搜索
所属系统
Windows
Linux
FreeBSD
Unix
Dos
PalmOS
WinCE
SymbianOS
MacOS
Android
开发平台
Visual C
Visual.Net
Borland C
CBuilder
Dephi
gcc
VBA
LISP
IDL
VHDL
Matlab
MathCAD
Flash
Xcode
Android STU
LabVIEW
开发语言
C/C++
Pascal
ASM
Java
PHP
Basic/ASP
Perl
Python
VBScript
JavaScript
SQL
FoxBase
SHELL
E语言
OC/Swift
文件类型
源码
程序
CHM
PDF
PPT
WORD
Excel
Access
HTML
Text
资源分类
搜索资源列表
DeepRL:基于UC Berkeley的CS285的深度强化学习笔记-源码
深度强化学习 说明:注释内容基于加州大学伯克利分校的CS285。 内容清单 简介与概述 行为监督学习 Tensorflow和神经网络 强化学习导论 政策梯度 演员关键算法 值函数方法 具有Q功能的Deep RL 高级策略梯度 基于模型的计划 基于模型的强化学习 基于模型的政策学习 变异推理和生成模型 控制为推理 逆向强化学习 转移和多任务学习 分布式RL 探索(第1部分) 探索(第2部分) 元学习 信息论,未解决的问题
所属分类:
其它
发布日期:2021-02-17
文件大小:5242880
提供者:
weixin_42124743
逆向深度q学习-源码
创建三个玩Reversi游戏的AI代理(也称为商标Othello)。 由python撰写 game_play.py 该文件将播放两个AI代理。 从命令行,使用以下命令调用此函数: python gameplay.py [-t ] [-v] [-r] player1 player2 其中player1.py和player2.py是包含nextMove和nextMoveR的python文件。 标志-v代表详细输出(每转之后显示板,已经实现),标志-r代表“反转”(使用nextMoveR而不是n
所属分类:
其它
发布日期:2021-02-13
文件大小:8192
提供者:
weixin_42099530