技术领域
本发明涉及电力系统负荷预测技术领域,具体涉及一种基于相空间重构和数据驱动的电力负荷预测方法。
背景技术
准确的负荷预测可以保持电网运行的安全稳定性,减少不必要的旋转储备容量,合理安排机组检修计划,有效地降低发电成本,提高经济效益和社会效益。电力负荷大小受多种因素影响:天气、温度、节假日、地区GDP等。然而,通常情况下难以获得所有影响因素的准确数据。因此,若能在缺乏多因素数据情况下实施较为准确的电力负荷预测方法,则可以省去收集和处理多种数据的繁琐过程,简化电力负荷预测步骤。
本申请发明人在实施本发明的过程中,发现现有技术的方法,至少存在如下技术问题:
目前,国内外对考虑多因素数据条件下的负荷预测研究较多,但一般情况下难以获得准确的多因素数据,且处理多因素数据需要耗费大量时间,因此基于单一负荷历史数据下的研究尤为重要。在现有基于相空间重构的负荷预测研究中,一般采用BP神经网络或BP神经网络的变式进行预测,其预测精度较低。
发明内容
本发明提出一种基于相空间重构和数据驱动的电力负荷预测方法,用于解决或者至少部分解决现有技术的方法存在的预测精度较低的技术问题。
为了解决上述技术问题,本发明提供了一种基于相空间重构和数据驱动的电力负荷预测方法,包括:
S1:计算历史负荷数据的延迟时间和嵌入维数,将历史负荷数据划分为训练集和测试集,依据延迟时间和嵌入维数分别对训练集和测试集进行相空间重构,并进行最大最小归一化处理;
S2:将进行最大最小归一化处理后的训练集和测试集输入至少两种类型的数据驱动模型,其中,每种类型的数据驱动模型包含一个或者多个,数据驱动模型用以自主学习输入数据集的数据特征并输出预测结果,对比所有数据驱动模型的预测精度,并采用预设评价指标从中筛选出不同类型数据驱动模型对应的最优模型;
S3:采用灰色关联度法建立相空间重构条件下不同类型数据驱动模型对应的最优模型的组合模型,利用建立的组合模型对电力负荷进行预测。
在一种实施方式中,步骤S1包括:
S1.1:采用自相关法计算历史负荷数据的延迟时间,混沌时间序列为x
根据上述自相关函数得到关于延迟时间τ的图像,当自相关函数的值下降到初值的1-1/e倍时,对应的τ为重构相空间的延迟时间;
S1.2:采用伪近邻法计算历史负荷数据的嵌入维数,对混沌时间序列数据,从嵌入维数m=2开始,计算伪最近邻点的比值S
若S
S1.3:依据延迟时间和嵌入维数分别对训练集和测试集进行相空间重构,具体为:混沌时间序列为x
x
其中,τ为延迟时间,m为嵌入维数;
根据相空间重构法,将混沌时间序列x
其中,每一列表示一个向量或相点;
S1.4:利用最大最小归一化算法对负荷数据进行归一化处理:
其中,x
在一种实施方式中,步骤S2中的不同类型的数据模型包括三种,分别为基准模型、神经网络模型以及统计学习模型,其中,数据驱动模型自主学习数据特征的方式为:基准模型将t-1时刻的负荷值作为t时刻的负荷预测值,不经过训练,直接输出,神经网络模型依据测试集数据不断反馈和调整网络权值,利用梯度下降算法寻求网络的最优权值,最后输出测试集的预测结果;统计学习模型根据各自的目标函数求得残差,同样利用梯度下降算法不断优化超参数,最后输出测试集的预测结果。
在一种实施方式中,采用的数据驱动模型包括12个,其中,1个基准模型、5个神经网络模型和6个统计学习模型,
基准模型使可持久化算法:Persistence算法,Persistence算法将t-1时刻的负荷值作为t时刻的负荷预测值;
神经网络模型包括BP神经网络、Elman神经网络、小波神经网络、极限学习机和长短期记忆网络;
统计学习模型包括线性回归、Lasso回归、Ridge回归、ElasticNet回归、支持向量回归和极端梯度提升。
在一种实施方式中,将均方根误差的变异系数和对称平均绝对百分比误差两个评价指标作为预设评价指标,根据预设评价指标得出极限学习机和长短期记忆网络为神经网络模型中的最优模型,极端梯度提升为统计学习模型中的最优模型。
在一种实施方式中,均方根误差的变异系数CVRMSE和对称平均绝对百分比误差SMAPE公式如下:
其中,y
在一种实施方式中,步骤S3包括:
S3.1:获得某一长度为N的时间序列在M种预测模型下的预测值x
其中,l
采用灰色关联度法求解权值,等价于求解
其中,e
S3.2:利用建立的组合模型对电力负荷进行日负荷预测和周负荷预测。
本申请实施例中的上述一个或多个技术方案,至少具有如下一种或多种技术效果:
本发明提供的方法,首先计算历史负荷数据的延迟时间和嵌入维数,划分数据集为训练集和测试集,并依据延迟时间和嵌入维数分别对训练集和测试集进行相空间重构,然后进行归一化处理;并在相同数据集下对比所有数据驱动模型的预测精度,得到不同类型数据驱动模型对应的最优模型,最后,利用灰色关联度法对不同类型数据驱动模型对应的最优模型进行不等权组合,构建组合模型,则可以利用建立的组合模型对电力负荷进行预测。由于采用相空间重构技术处理历史负荷数据,可以省去收集和处理多因素数据的繁琐步骤;通过应用多种数据驱动模型来进行负荷预测,相比于传统数据驱动模型,具有更强的非线性能力来进行预测;采用灰色关联度法进行组合集成了深度学习和统计学习,从而获得了比单个学习器更好的效果,故而提升了电力负荷预测的精度。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明具体实施例中负荷预测基本流程图;
图2为本发明具体实施例中对月历史数据采用自相关法求延迟时间结果图;
图3为本发明具体实施例中对年历史数据采用自相关法求延迟时间结果图;
图4为本发明具体实施例中对月历史数据采用伪近邻法求嵌入维数结果图;
图5为本发明具体实施例中对年历史数据采用伪近邻法求嵌入维数结果图;
图6为本发明具体实施例中所选用数据驱动模型概览图;
图7为本发明具体实施例中不同预测时间长度下CVRMSE对比图;
图8为本发明具体实施例中不同预测时间长度下SMAPE对比图;
图9为本发明具体实施例中组合模型日负荷预测结果图;
图10为本发明具体实施例中组合模型周负荷预测结果图。
具体实施方式
本申请发明人通过大量的研究与实践发现,在现有基于相空间重构的负荷预测研究中,一般采用BP神经网络或BP神经网络的变式进行预测,其预测精度较低,对于近年来预测精度高且热门的深度学习和机器学习算法,鲜有将其与相空间重构进行结合。因此,基于相空间重构和数据驱动算法的电力负荷预测在简化负荷预测步骤及提高负荷预测精度方面具有重要的现实意义。
基于此,本发明提供了一种基于相空间重构和数据驱动的电力负荷预测方法,用于改善现有技术的方法存在的预测精度较低的技术问题。
本发明的主要发明构思如下:
提出一种基于相空间重构和组合数据驱动模型的电力负荷预测方法。首先计算历史负荷数据的延迟时间和嵌入维数,划分数据集为训练集和测试集,依据延迟时间和嵌入维数分别对训练集和测试集进行相空间重构,并进行归一化处理。其次,在相同数据集下对比不同数据驱动模型的预测精度,得到不同类型数据驱动模型对应的最优模型,最后,利用灰色关联度法对不同类型数据驱动模型对应的最优模型进行不等权组合,构建组合模型,则可以利用建立的组合模型对电力负荷进行预测。
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例一
请参见图1~图10,本发明实施例提供了一种基于相空间重构和数据驱动的电力负荷预测方法,包括:
S1:计算历史负荷数据的延迟时间和嵌入维数,将历史负荷数据划分为训练集和测试集,依据延迟时间和嵌入维数分别对训练集和测试集进行相空间重构,并进行最大最小归一化处理;
S2:将进行最大最小归一化处理后的训练集和测试集输入至少两种类型的数据驱动模型,其中,每种类型的数据驱动模型包含一个或者多个,数据驱动模型用以自主学习输入数据集的数据特征并输出预测结果,对比所有数据驱动模型的预测精度,并采用预设评价指标从中筛选出不同类型数据驱动模型对应的最优模型;
S3:采用灰色关联度法建立相空间重构条件下不同类型数据驱动模型对应的最优模型的组合模型,利用建立的组合模型对电力负荷进行预测。
具体来说,数据驱动模型的类型可以根据实际情况选取,例如2种、3种、5种等。每一种类型的数据驱动模型可以包含一个或者多个。
在一种实施方式中,步骤S1包括:
S1.1:采用自相关法计算历史负荷数据的延迟时间,混沌时间序列为x
根据上述自相关函数得到关于延迟时间τ的图像,当自相关函数的值下降到初值的1-1/e倍时,对应的τ为重构相空间的延迟时间;
S1.2:采用伪近邻法计算历史负荷数据的嵌入维数,对混沌时间序列数据,从嵌入维数m=2开始,计算伪最近邻点的比值S
若S
S1.3:依据延迟时间和嵌入维数分别对训练集和测试集进行相空间重构,具体为:混沌时间序列为x
x
其中,τ为延迟时间,m为嵌入维数;
根据相空间重构法,将混沌时间序列x
其中,每一列表示一个向量或相点;
S1.4:利用最大最小归一化算法对负荷数据进行归一化处理:
其中,x
具体来说,步骤S1.1中,对于一个时间序列,自相关法是根据自相关函数做出函数值关于延迟时间τ的图像,当自相关函数的值下降到初始值的1-1/e倍时,所对应的时间就是重构相空间的延迟时间τ,通过步骤S1.1中的自相关函数可以得到自相关函数关于延迟时间τ的图像,当自相关函数的值下降到初值的1-1/e倍时,对应的τ即为重构相空间的延迟时间。
图2和图3分别为月历史数据和年历史数据采用自相关法求延迟时间的结果图,由图2和图3可知,当自相关函数的值下降到初值的1-1/e倍时,即自相关函数值为0.6321时,对应月历史数据和年历史数据的延迟时间均为4。
步骤S1.2中,使用伪近邻法计算嵌入维数。对于空间中的相点X(t)=(x
具体实施过程中,对混沌时间序列数据,从嵌入维数m=2开始,计算伪最近邻点的比值S
图4和图5分别为月历史数据和年历史数据采用伪近邻法求嵌入维数结果图,由图4和图5可知,对于月历史数据,当嵌入维数增加到4时,伪近邻率下降至0%,对于年历史数据,当嵌入维数增加至5时,伪近邻率下降至0%。因此,取月历史负荷数据的嵌入维数为4,取年历史负荷数据的嵌入维数为5。
步骤S1.3中,给出了将混沌时间序列进行相空间重构的方法,即转换到延时为τ,维数为m的新数据空间。相空间重构的过程可以采用Matlab实现。
在一种实施方式中,步骤S2中的不同类型的数据模型包括三种,分别为基准模型、神经网络模型以及统计学习模型,其中,数据驱动模型自主学习数据特征的方式为:基准模型将t-1时刻的负荷值作为t时刻的负荷预测值,不经过训练,直接输出,神经网络模型依据测试集数据不断反馈和调整网络权值,利用梯度下降算法寻求网络的最优权值,最后输出测试集的预测结果;统计学习模型根据各自的目标函数求得残差,同样利用梯度下降算法不断优化超参数,最后输出测试集的预测结果。
在一种实施方式中,采用的数据驱动模型包括12个,其中,1个基准模型、5个神经网络模型和6个统计学习模型,
基准模型使可持久化算法:Persistence算法,Persistence算法将时刻的负荷值作为时刻的负荷预测值;
神经网络模型包括BP神经网络、Elman神经网络、小波神经网络、极限学习机和长短期记忆网络;
统计学习模型包括线性回归、Lasso回归、Ridge回归、ElasticNet回归、支持向量回归和极端梯度提升。
具体来说,12种数据驱动模型包括1种基准模型、5种神经网络模型和6种统计学习模型。基准模型、LSTM及统计学习模型使用Python语言实现,除LSTM外的神经网络模型使用Matlab实现。
具体实施过程中,采用均方根误差的变异系数和对称平均绝对百分比误差两个评价指标作为预设评价指标,则可得到极限学习机和长短期记忆网络为神经网络模型中的最优模型,极端梯度提升为统计学习模型中的最优模型。分别对上述三种模型进行日、周、半月、月负荷预测,均能保持较高的预测精度。图6为所选用数据驱动模型概览图。
基准模型使用Persistence算法。Persistence算法将t-1时刻的负荷值作为t时刻的负荷预测值。
5种神经网络模型包括BP神经网络、Elman神经网络、小波神经网络、极限学习机和长短期记忆网络。
(1)BP神经网络。BP神经网络(Back Propagation Neural Network,BPNN)是一种按误差反向传播训练的多层前馈网络,它的基本思想是梯度下降法,利用梯度搜索技术,使网络的实际输出值和期望输出值的误差均方差为最小,包括输入层、隐藏层和输出层。对于回归问题来说,输出层神经元个数一般为1。超参数设置为:最大训练次数net.trainparam.epochs=500,训练要求精度net.trainparam.goal=0.01,学习速率net.trainParam.lr=0.01。
(2)Elman神经网络。Elman神经网络(Elman Neural Network,ENN)在BP神经网络的基础上增加了承接层(Context Layer),承接层从隐含层接收反馈信号,用来记忆隐含层神经元前一时刻的输出值,承接层神经元的输出经延迟与存储,再输入到隐含层。这样就使其对历史数据具有敏感性,增加了网络自身处理动态信息的能力。超参数设置为:最大训练次数net.trainparam.epochs=500,训练要求精度net.trainparam.goal=0.01,学习速率net.trainParam.lr=0.01。
(3)小波神经网络。小波神经网络(Wavelet Neural Network,WNN)是一种以BP神经网络拓扑结构为基础,将小波基函数作为隐含层神经元激活函数的神经网络。超参数设置为:迭代次数maxgen=50,学习速率net.trainParam.lr=0.01。小波基函数为
其中,x为隐含层神经元的输入值。
(4)极限学习机。极限学习机(Extreme Learning Machine,ELM)为求解单隐层神经网络算法。当激活函数无限可微时,单隐含层前馈神经网络的参数并不需要全部进行调整,输入层到隐含层之间的权值和偏置在训练前可以随机选择。隐含层和输出层之间的连接权值β为
β=H
其中,H
(5)长短期记忆网络。长短期记忆网络(Long ShortTerm Memory,LSTM)是一种特殊的循环神经网络。LSTM网络的基本组成单元主要包括遗忘门、输入门、输出门和记忆单元。超参数设置为:LSTM单元的数量units=1,用平均绝对误差作损失函数,即loss='mae',采用随机梯度下降法优化,即optimizer='sgd',训练代数epochs=50,每隔一个样本打印一次当前的损失函数,即batch_size=1,每一次迭代输出一行记录,即verbose=2。
6种统计学习模型为线性回归、Lasso回归、Ridge回归、Elastic Net回归、支持向量回归和极端梯度提升。
(1)线性回归。线性回归(Linear Regression,LR)假设目标值与特征之间线性相关,即对于每个样本点均满足多元一次方程
y
其中,i表示第i个样本点,θ
误差近似服从正态分布:
其中,σ为误差ε
对数似然函数为
其中,m为样本数。
当样本确定后,式中唯一的变量为θ
(2)Lasso回归。在目标函数中加入对系数向量θ大小的约束可以防止过拟合。加入L1-norm正则项为Lasso回归,Lasso回归的目标函数为
其中,λ为约束项的系数,n为系数向量θ的长度。设置λ=0.5。
(3)Ridge回归。加入L2-norm正则项为Ridge回归,Ridge回归的目标函数为
设置λ=0.5。
(4)Elastic Net回归。同时加入L1-norm正则项和L2-norm正则项,即为ElasticNet回归,Elastic Net回归的目标函数为
其中,ρ为L1-norm正则项的权重,1-ρ为L2-norm正则项的权重。设置λ=ρ=0.5。
(5)支持向量回归。支持向量回归(Support Vector Regression,SVR)是支持向量机(Support Vector Machines,SVM)的回归推广形式。SVR通过构造一个超平面来解决回归预测问题。当所有样本点与该超平面的距离最小时,即为最优超平面。超平面的公式和距离可以分别表示为
f(x)=w
d=y
SVR模型可写为
其中,w为权重向量,b为偏移量,y
(6)极端梯度提升。使用分类回归树(CART)作为XGBoost(eXtreme GradientBoosting,XGBoost)的基学习器。假设样本集合为D={(x
其中,
构造带正则项的损失函数为
损失函数式中第一项
Ω(f
正则项中T表示每棵树的叶子节点数量,w为每棵树叶子节点的分数向量,γ和λ分别为叶子节点数量约束系数和叶子节点分数向量约束系数。
超参数设置为:采用均方误差作为损失函数,即objective='reg:squarederror',树的数目n_estimators=1000。
对比结果可得,在神经网络模型中,ELM和LSTM在测试集上表现最优;在统计学习模型中,XGBoost精度最高。
在一种实施方式中,将均方根误差的变异系数和对称平均绝对百分比误差两个评价指标作为预设评价指标,根据预设评价指标得出极限学习机和长短期记忆网络为神经网络模型中的最优模型,极端梯度提升为统计学习模型中的最优模型。
在一种实施方式中,均方根误差的变异系数CVRMSE和对称平均绝对百分比误差SMAPE公式如下:
其中,y
图7和图8分别为不同预测时间长度下CVRMSE和SMAPE的对比图。
在一种实施方式中,步骤S3包括:
S3.1:获得某一长度为N的时间序列在M种预测模型下的预测值x
其中,l
采用灰色关联度法求解权值,等价于求解
其中,e
S3.2:利用建立的组合模型对电力负荷进行日负荷预测和周负荷预测。
求解结果为:在日负荷预测中,极限学习机、极端梯度提升和长短期记忆网络的权值分别为0.171、0.544和0.284;在周负荷预测中,极限学习机、极端梯度提升和长短期记忆网络的权值分别为0.641、0.275和0.110。对组合模型分别进行日负荷预测和周负荷预测。图9和图10分别为组合模型日负荷预测结果图和周负荷预测结果图。
与现有的方法相比,本发明具有以下积极效果和优点:
(1)采用相空间重构技术处理历史负荷数据,可减少收集和处理多因素数据的繁琐步骤;
(2)通过应用多种数据驱动模型来进行负荷预测,其中包括深度学习和统计学习模型,相比于传统数据驱动模型,具有更强的非线性能力来进行预测;
(3)采用灰色关联度法进行组合集成了深度学习和统计学习,从而获得了比单个学习器更好的效果。
应当理解的是,本说明书未详细阐述的部分均属于现有技术。
应当理解的是,上述针对较佳实施例的描述较为详细,并不能因此而认为是对本发明专利保护范围的限制,本领域的普通技术人员在本发明的启示下,在不脱离本发明权利要求所保护的范围情况下,还可以做出替换或变形,均落入本发明的保护范围之内,本发明的请求保护范围应以所附权利要求为准。
机译: 一种对包括亮度分量和两个色度分量的输入视频进行编码的方法,所述方法包括基于重构函数来重构所述输入视频
机译: 一种基于数据驱动的基于意图的联网方法,该方法使用轻量级分布式SDN控制器来提供智能的消费者体验
机译: 数据驱动处理器,数据驱动类型信息处理设备以及在该数据驱动类型信息处理设备中,一种用于验证多个数据驱动处理器的路径连通性的方法