马迪根
与论文相关的代码
目的
该存储库包含用于进行实验的框架,以探索强化学习在金融市场交易中的使用。 以统计套利为重点,最终目标是创建自主系统,以制定交易决策并执行这些决策。 这个过程很像科学探究,假设将以有针对性的方式成功地检验假设。 为此,需要强大的软件来实现,验证和部署想法的过程,而无需必要的硬件来进行实验。
方法
当前的方法包括在马尔可夫决策过程(MDP)框架中形式化交易问题/上下文。 代理人通过定义的动作空间来与环境交互,从而做出决策,以寻求最大程度地提高环境所带来的回报。 代理-&