您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. DRL-2018:结合策略梯度方法(香草PG,Actor-Critic,PPO)和进化策略的实验-源码

  2. DRL-2018 该存储库的功能是2018年夏季深度强化学习研究项目的工作(由Keith Ross教授建议,由纽约大学上海分校院长本科研究基金资助)。 在此项目中,我们尝试将“策略梯度”方法(香草策略梯度(aka REINFORCE),Actor-Critic和PPO)与“进化策略”相结合,以设计出一种提高样本效率的混合算法。 在MuJoCo基准上评估了所提出算法的性能。 参考: 加强:罗纳德·J·威廉姆斯。 用于连接符增强学习的简单统计梯度跟踪算法。 机器学习,8(3-4):229–25
  3. 所属分类:其它

    • 发布日期:2021-03-22
    • 文件大小:15360
    • 提供者:weixin_42109598
  1. iarg:图像分析阅读小组-源码

  2. 麦格理大学计算机系IARG 我们在星期一下午3.00-4.30pm在教育部的研讨室开会:研究园大道4号221室。 欢迎所有人加入我们。 会议 日期 主持人 话题 11/11 小姐 16/09 我的 用于恶意软件自动表示和分析的机器学习(博士学位论文) 5/8 机管局 22/7 SS 8/7 小姐 11/6 WK 机器视觉的生物识别和医学成像概述() 27/5 在 13/5 SS 29/4 名爵 25/3 机管局 11/3 XD 25/2 SS 11/2 我的 2
  3. 所属分类:其它

    • 发布日期:2021-02-20
    • 文件大小:49283072
    • 提供者:weixin_42151036
  1. 实用大师:COMP2200COMP6200 S2-2020实用笔记本麦格理大学-源码

  2. COMP2200 / COMP6200实践S2-2020 此存储库包含适用于S2-2020 Macquarie University的COMP2200 / COMP6200的实用笔记本 此存储库将包含2020年COMP2200 / COMP6200 Session S2的实用笔记本。初始存储库在第一周有一个笔记本。 每个星期,您将添加一个新的笔记本,并在完成为您设置的问题时提交更改。 在学期末,您将拥有此资料库作为您工作的记录。 然后,这可以构成您正在进行的工作组合的一部分。 您可以更新此
  3. 所属分类:其它

    • 发布日期:2021-02-12
    • 文件大小:16384
    • 提供者:weixin_42099858