您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. Quadratic_MLPs_in_RL:具有Quadratic-MLP(Q-MLP)作为参与者策略网络的TD3和SAC算法-源码

  2. 强化学习中的二次MLP 我们随附的论文“用于无模型强化学习的二次方参与者网络”的源代码和数据。 具有Quadratic-MLP(Q-MLP)作为参与者策略网络的TD3和SAC算法。 如果您使用我们的代码或数据,请引用本文。 要求 TD3和SAC在连续控制任务中进行了测试。 使用Pytorch 1.7.1 + cu110和Python 3.8.7训练Neural Netorks。 用法 要使用Q-MLP actor策略运行实验,请分别在SAC和TD3文件夹中运行以下Shell脚本。 ./run
  3. 所属分类:其它

    • 发布日期:2021-03-06
    • 文件大小:5242880
    • 提供者:weixin_42121412