说明:PAL是一种灵活高效的强化学习框架.具有可重复性的特点。我们给出的算法能够稳定地再现许多有影响的强化学习算法的结果。大规模的。支持数千CPU和多GPU的高性能并行训练的能力.可重复使用。存储库中提供的算法可以通过定义前向网络直接适应新任务,并自动建立训练机制。可扩展的。通过继承框架中的抽象类,快速构建新的算法。PARL is a flexible and high-efficient reinforcement learning framework.
<SparkQiang> 在 上传 | 大小:27262976