您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. 利用强化学习进行股票操作实战(三)

  2. 与上一篇文章相同之处 对于交易策略,与上一篇文章相同,当发出买入指令时,一次性全部买入;当发出卖出指令时,一次性全部卖出。还没有添加加减仓操作。 模型仍然用的是DQN模型。 新增内容 在之前的基础上加入了交易手续费、印花税等。 在强化学习这个领域中,reward函数是一个需要精心设计的函数。目前暂时没有好的reward设计思路,但还是修改了之前的reward函数。(其实之前的reward的设计也是错的) 首先将第二天的股票价格的涨跌幅当做reward。 reward =(self.trend[s
  3. 所属分类:其它

    • 发布日期:2021-01-07
    • 文件大小:285696
    • 提供者:weixin_38565818