您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. reinforcement-learning-tutorials:强化学习的基本算法-源码

  2. 写在前面 本项目用于学习RL基础算法,尽量做到: 注释详细 结构清晰 代码结构清晰,主要分为以下几个脚本: env.py用于重建强化学习环境,也可以重新归一化环境,例如给动作加噪声 model.py强化学习算法的基本模型,局部神经网络,演员,评论家等 memory.py保存重放缓冲区,用于off-policy agent.py RL核心算法,某种dqn等,主要包含update和select_action两个方法, main.py运行主函数 params.py保存各种参数 plot.py利用
  3. 所属分类:其它

    • 发布日期:2021-03-12
    • 文件大小:2097152
    • 提供者:weixin_42114580