您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. pisac:PI-SAC代理的Tensorflow源代码,来自“ Predictive Information Accelerates Learning in RL”(NeurIPS 2020)-tensorflow source code

  2. PI-SAC:预测性信息可加速RL中的学习 , ,,,, , NeurIPS 2020年 该存储库托管PI-SAC的开源实现,PI-SAC中的引入的强化学习代理。 PI-SAC将“软参与者关键代理”与另一个目标结合在一起,该目标可学习预测信息的压缩表示形式。 PI-SAC代理可以极大地提高样本效率,并能在基于视觉的连续控制环境(观测值是像素)的中完成的任务上,突破具有挑战性的基准。 如果您发现这对您的研究有用,请使用以下内容作为参考: article{lee2020predictive
  3. 所属分类:其它

    • 发布日期:2021-03-24
    • 文件大小:51200
    • 提供者:weixin_42161497