您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. 强化学习笔记(3) Monte-Carlo和TD

  2. 3_Monte-Carlo_RL 文章目录1.1. 前言1.1.1. 算法特性1.1.2. 目标1.2. 两种Monte-Carlo 估计价值函数1.2.1. First Visit1.2.2. Every Visit1.2.3. 小tips: Incremental Mean1.3. Monte Carlo Control (Approximate optimal policies)1.3.1. Over all idea2. Temporal-difference reinforcement
  3. 所属分类:其它

    • 发布日期:2021-01-06
    • 文件大小:634880
    • 提供者:weixin_38520046