您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. 基于在线选择性核的时间差异学习

  2. 在本文中,提出了一种在线的基于核的选择性时差(OSKTD)学习算法,以解决大规模和/或连续的强化学习问题。 OSKTD包括两个在线过程:在线稀疏化和针对基于内核的选择性值函数的参数更新。 提出了一种基于选择性集成学习的稀疏化方法(即基于核距离的在线稀疏化方法),该方法与其他稀疏化方法相比,计算复杂度较低。 使用所提出的稀疏化方法,通过检查是否需要将样本添加到稀疏化字典中来在线构建样本稀疏字典。 另外,基于局部有效性,提出了一种基于选择性核的价值函数,从样本字典中选择最佳样本作为基于选择性核的价值
  3. 所属分类:其它

    • 发布日期:2021-03-10
    • 文件大小:501760
    • 提供者:weixin_38641339