您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. rl-laplacian:在强化学习中学习拉普拉斯表示-源码

  2. 在强化学习中学习拉普拉斯表示 该代码库实现了的表示学习方法 。 该实施包括(i)表示学习和(ii)使用所学习的重新设置进行奖励整形。 该代码库是重新实现的,不是本文中用于生成实验结果的代码库。 实验代码仅包括网格世界环境,而不包括Mujoco控件环境。 请参考run_full_experiments.sh来运行表示学习,奖励整形和可视化表示。 plot_curves.py用于绘制不同形状的奖励之间的学习曲线比较。 该代码适用于Python> = 3.6和PyTorch> =
  3. 所属分类:其它

    • 发布日期:2021-02-15
    • 文件大小:241664
    • 提供者:weixin_42140716