:提出一种基于深度强化学习的电网切机控制策略,所
提控制策略依据电网运行环境信息,通过数据分析得到切机
控制策略。首先介绍强化学习框架,阐述学习算法原理,并
详细介绍Q-Learning 方法。然后介绍深度学习基本概念和
深度卷积网络原理,提出利用深度卷积网络提取电网运行特
征,构建切机策略的思路。再结合深度学习和强化学习,构
建深度强化学习框架,其中深度学习采用深度卷积神经网络
模型用于提取特征,强化学习采用双重Q-Learning 和竞争
Q-Learning 模型计算Q 值,通过比较Q 值