基于深度学习的智能电网短期日负荷曲线预测系统设计与实现
摘要:短期电力负荷精准预测对发电容量与输电方式的合理调度、确保电力系统安全、稳定运行起着至关重要的作用。本文针对负荷数据基数大、难提取、负荷预测影响因素多等问题,运用Mysql数据库和Python爬虫技术构建了短期负荷曲线预测基础数据平台,提高了数据的存取效率;针对电力负荷的随机波动性,运用 Pandas、关联分析算法完成了缺失值处理和影响因素与用电负荷的相关性分析;为提高预测精度,探索使用了融合卷积神经网络、长短期记忆网格和注意力机制的多元混合神经网络模型。同时,基于Flask、VUE框架和Echarts可视化组件搭建了图形可视化界面,便于用户观测负荷数据与预测结果。
本文引用地址:http://www.amcfsurvey.com/article/202302/443744.htm0 引言
随着我国经济社会的高速发展,各行业对电力的依赖增强,对供电可靠性及电能质量的要求日益提高。短期电力负荷精准预测是建设智能配电网和提高分布式电源消纳能力的一个关键指标,对确保电力系统稳定调度、保证其经济、安全、可靠的运行起着至关重要的作用[1]。
短期电力负荷预测通常是指在考虑一些重要的系统运行特性、增容决策和自然条件的情况下,利用现有的历史数据及相关的外围数据建立预测模型,对未来较短时间(几小时、几天到几周)内的电力需求量(功率)、未来用电量( 能量) 以及负荷曲线的预测[2]。由于电力系统负荷本身具有的不可控性,再加上各种经济、环境等不确定性因素的影响,进行精准的短期电力负荷预测是比较困难的。短期日负荷曲线预测是短期电力负荷预测中的一类,由于日负荷曲线包含了一天很多时点的信息,需要对一天中各个时点的负荷进行预测,故预测难度相对较大。精准的短期日负荷曲线预测可有效辅助调度中心安排日调度计划,包括确定机组启停、水库调度和设备检修等[3]。
本文介绍的“基于深度学习的智能电网短期日负荷曲线预测系统设计与实现”,以用电基数大,总体规律相对稳定的公共变压器为研究对象;采用Python 爬虫技术+Mysql 数据库构建短期负荷曲线预测基础数据平台,实现历史负荷数据一键入库、影响因素数据爬虫解析入库功能,有效提高负荷预测数据的存取效率;应用NumPy、Pandas、关联分析算法进行缺失数据处理与影响因素分析,深入研究天气、工作日类型等影响因素与用电负荷的相关性;针对现有浅层神经网络电力负荷预测方法难于对负荷数据特征进行充分提取,限制了短期负荷预测精度的问题,使用了融合CNN+LSTM+Attention 的多元混合神经网络模型,提高了预测精度;为了让用户更加直观便捷地观察负荷数据和预测结果,搭建了基于Flask+VUE 框架、Echarts 可视化组件的图形可视化界面,提供了便捷的人机交互方式。系统架构如图1 所示:
图1 系统架构图
1 短期日负荷曲线预测基础数据平台
负荷预测的前提是基础数据,在建立预测模型前,首先需要完成变压器历史时点负荷、负荷预测影响因素等原始数据采集,并进行必要的数据预处理与分析,为构建最终用于建模的输入数据做好数据准备。由于历史时点负荷数据体量大,难提取、影响因素多等问题,本系统构建了短期负荷曲线预测基础数据平台,实现数据的系统化管理,为预测模型提供较好的数据支持。
1.1 数据采集
公共变压器短期日负荷曲线预测需要的数据主要有历史时点负荷、天气、工作日类型、节假日、社会大事件等负荷预测影响因素数据。其中历史时点负荷数据源自某省电网调度中心,获取到的往往是大容量的文本文件,存在数据体量大、难提取、不易管理等问题,本系统根据采集到的历史负荷数据结构与类型,选用MySQL 数据库,应用Python 编程语言,实现了历史负荷数据一键解析入库,提高了数据的存取效率。负荷预测影响因素,诸如天气、工作日类型、节假日等数据考虑其实效性,应用Python 爬虫Beautiful Soup 库从国家气象局、TkinkAPI 等公用网络接口自动提取,并解析入库。
1.2 数据库结构设计
根据短期日负荷曲线预测业务逻辑需求和采集到的原始数据结构及各种数据类型之间的关系,搭建了MySQL 数据库平台。其中表1~3 为部分数据表的字段定义和说明。
2 数据处理与分析
2.1 数据预处理
解析入库的短期日负荷曲线预测基础数据并不能直接用于模型预测,需要进行必要的数据清洗与缺失值处理。例如采集到的时点负荷数据由于采集器发生故障或进行检修时设备暂停会导致部分数据缺失,可以应用Pandas 通过类似区域变压器或历史近似日时点负荷数据进行近邻插补;再比如节假日的负荷会比工作日负荷低很多,且可获取到的负荷数据较少,受到各种随机因素的影响较大,为了数据的一致性,我们在数据预处理阶段通常会将节假日的数据设置为缺失值,然后在将节假日转换成月份、星期后,基于K 邻近算法完成缺失值插补,具体代码如图2 所示。
图2 基于K近邻算法的缺失值插补示例代码
2.2 关联分析
短期日负荷曲线预测的影响因素种类较多,如天气、工作日类型、社会大事件等都会对预测结果产生影响。若采用单一的或者影响作用较小的因素作为输入特征,则不利于预测模型挖掘出负荷数据和影响因素之间的关联性,进而影响负荷预测的精度;若把所有影响因素全部作为输入特征,反而会影响预测模型的泛华能力[4],因此对影响因素进行相关性分析十分必要。
本文应用APRIORI,SPUFP( 一种改进的关联规则增量更新算法) 等关联算法,通过计算两两指标的相关系数,分析得知工作日类型、节假日影响因素与短期负荷存在较强的相关性;区域最高气温、最低气温和平均气温都与短期负荷呈现显著的负相关,相关系数绝对值均在0.4 以上。在天气类影响因素中,相对湿度与短期负荷呈现极弱的负相关,对负荷预测影响较小。基于以上分析,根据影响程度确定工作日类型、最高气温、最低气温、平均气温作为建模的初始特征集。
3 短期日负荷曲线预测
智能电网短期日负荷曲线预测系统最核心的问题是利用现有历史数据及相关外围数据建立预测模型。通过文献调研发现,目前已有的负荷预测模型大多是浅层神经网络预测模型,而基于浅层神经网络的电力负荷预测方法难以对原始负荷数据特征进行充分提取,限制了短期负荷预测精度的提高[5]。近年来,随着深度学习的兴起,国内外研究人员开始尝试将卷积神经网络(CNN)、长短期记忆网络(LSTM) 等深度学习方法应用于短期日负荷曲线预测。为了提高预测精度,本系统借鉴文献[6]融合使用了CNN 卷积神经网络、LSTM 长短期记忆网格和Attention 注意力机制进行模型训练与预测(即综合考虑时序与非线性特点,利用CNN 对数据进行分类与特征处理,利用LSTM对特征更为明显的数据进行记忆,在LSTM 层中引入注意力机制,通过对LSTM 输出向量设置大小不同的权重,提高数据识别能力,最后经过Softmax 分类分析,输出预测结果),通过将预测结果和真实数据进行绘图比较,预测曲线与真实曲线相当接近,模型预测效果较好。整体预测过程如图3 所示。
4 预测结果呈现
为了让用户更加直观的观测负荷数据与预测结果,本系统基于BS 架构,应用Flask+VUE 框架、Echarts组件构建了数据交互与可视化展示平台,该平台可实现用户信息可视化管理、历史负荷数据可视化呈现、短期日负荷曲线预测结果展示等功能。本文选择某公共变压器2019-05-01—2020 年-09-01 的数据作为训练集,使用2020 年10 月数据作为测试数据,负荷曲线预测效果图如图4 所示。
图4 负荷曲线预测效果图
5 结束语
智能电网短期日负荷曲线精准预测对地区电网科学调度与合理规划具有十分重要的应用价值。本文研究的“基于深度学习的智能电网短期日负荷曲线预测系统”, 通过构建短期负荷曲线预测基础数据平台,实现了数据的高效能管理;应用CNN+LSTM+Attention 的多元混合神经网络模型,提高了负荷曲线的预测精度;基于Flask+VUE+Echarts构建的数据交互与可视化展示界面,提供了便捷的人机交互方式,实现了预测结果及影响因素的精准展示。
参考文献:
[1] 迟作为,辛鹏,李振新.基于数据挖掘技术的地区电网负荷特性分析与预测[J].吉林电力,2021,49(3):25-28.
[2] 游皓麟. Python预测之美:数据分析与算法实战[M].北京:电子工业出版社,2020.
[3] 邵雪羚.地区电网短期负荷预测云平台设计与实现[D].成都:电子科技大学.
[4] 魏腾飞.基于机器学习的微电网短期负荷预测策略研究[D].无锡:江南大学.
[5] 张倩.基于深度学习的电力系统短期负荷预测[D].绵阳:西南科技大学,2022.
[6] 郭成,王宵,王波,等.基于多层融合神经网络模型的短期电力负荷预测方法[J].计算机与现代化,2021(10):94-106.
(本文来源于《电子产品世界》杂志2023年2月期)
评论