EasyRL
概述
近年来,我们目睹了强化学习(RL)的许多令人瞩目的进步,包括AlphaGo,OpenAI Five等。对于实际应用,我们已经成功地将RL应用到了许多电子商务场景中,例如基于会话的学习进行排名,与有监督的学习范式相比,RL的交互性提高了其应用的门槛,因为从业者必须
实现复杂的学习算法,而不是简单地从TensorFlow(TF)/ PyTorch中选择一种损失,模型和优化器
当考虑分布式设置时,处理数据(状态,动作,奖励等)和模型参数的通信
此仓库以独立和分布式模式提供了许多广泛