用于有效强化学习(SEER)的存储嵌入
官方代码库,用于来。 Rainbow代码库最初是从Kaixhin的分叉的,而CURL代码库最初是从分叉的。
BibTex
彩虹+ SEER
指示
请参阅Kaixhin的。 其他超参数是steps_until_freeze。 在脚本文件夹中可以找到使用大型重放缓冲区(run_lb_alien.sh)和小型重放缓冲区(run_sb_alien.sh)的示例脚本。
卷发+ SEER
指示
请参阅说明。 其他超参数是steps_until_freeze和num_c