基于协同奖励函数多目标强化学习的智能频率控制策略研究
文档名:基于协同奖励函数多目标强化学习的智能频率控制策略研究
摘要:在含大规模风电并网系统的智能频率控制策略中,仅考虑CPS控制准则易造成频率短期集中越限,严重影响智能自动发电控制(AGC)策略的控制效果.提出一种基于协同奖励函数的多目标强化学习(TOPQ-MORL)智能频率控制策略,该策略构建了计及多维度频率控制性能评价标准的协同奖励函数,实现了多维度频率控制性能标准在时间尺度上的配合评价.采用TOPQ学习策略对智能体动作空间进行全局寻优,有效解决了传统贪婪策略下的Q函数线性加权多目标强化学习算法运算效率不佳的问题.标准两区域互联电网AGC控制模型仿真研究结果表明:所提智能AGC控制策略能有效改善频率控制性能,显著提高系统在全时间尺度上的频率质量.
作者:韩保军 高强 代飞 杨宵 吕颖 许忠义 付希越 Author:HANBaojun GAOQiang DAIfei YANGXiao LüYing XUZhongyi FUXiyue
作者单位:国网河南省电力公司,河南郑州450052中国电力科学研究院有限公司,北京100192国网浙江省电力有限公司松阳县供电公司,浙江松阳323400武汉大学电气与自动化学院,湖北武汉430072
刊名:电力科学与技术学报 ISTICPKU
Journal:JournalofElectricPowerScienceandTechnology
年,卷(期):2023, 38(2)
分类号:TM933
关键词:风电并网智能频率控制策略多维度频率控制性能标准TOPQ-MORL算法协同奖励函数
机标分类号:TM73TM614TM
在线出版日期:2023年7月6日
基金项目:国家重点研发计划基于协同奖励函数多目标强化学习的智能频率控制策略研究[
期刊论文]电力科学与技术学报--2023, 38(2)韩保军高强代飞杨宵吕颖许忠义付希越在含大规模风电并网系统的智能频率控制策略中,仅考虑CPS控制准则易造成频率短期集中越限,严重影响智能自动发电控制(AGC)策略的控制效果.提出一种基于协同奖励函数的多目标强化学习(TOPQ-MORL)智能频率控制策略,该策略...参考文献和引证文献
参考文献
引证文献
本文读者也读过
相似文献
相关博文
基于协同奖励函数多目标强化学习的智能频率控制策略研究Intelligent frequency control strategy based on multi-objective reinforcement learning of cooperative reward function
基于协同奖励函数多目标强化学习的智能频率控制策略研究.pdf
页:
[1]