法律状态公告日
法律状态信息
法律状态
2019-01-25
授权
授权
2016-03-09
实质审查的生效 IPC(主分类):G06F17/50 申请日:20150930
实质审查的生效
2016-02-10
公开
公开
技术领域
本发明风电场风速预测领域,特别是在风电场分布较为密集的地区对某一风电场的风速进行预测,用于解决风速预测过程中忽略风场位置而造成的预测精度不足的难题。
背景技术
风力发电因为具有环保、可再生等诸多优点,近年来迅速发展,已经成为全世界公认的理想能源。然而当风电穿透功率达到一定值后,风电的随机性、波动性和不稳定性就会对电力系统的运行产生很大的影响。相关学者对该方面进行了许多的相关研究,得出了一些就有实际意义的结论。而要减少该影响就主要的就是要对风速或风电功率做出比较准确的预测。
风机发电功率最主要的决定因素是风速,所以对于风速的有效预测可以作为预测风电功率的关键部分。目前,国内外关于风速预测的方法一般能够分为两类:一类是利用历史数据建模的统计方法,另一类是利用数值天气预报及地形学的物理方法。前者包括时间序列发、卡尔曼滤波法、神经网络法等。物理方法一般包括利用数值天气预报的预测模型、空间相关法等。但是风作为一种自然现象有自己的特点,现存的方法不能很好的对风速进行预测。针对风速的预测,不仅仅要考虑单一风速序列,需要风电场的历史风速序列和实时数据,还必须考虑地理位置,粗糙度,风向,气压,温度以及空间位置等物理因素。
因此一个好的风速预测模型,不仅要考虑风速间的时间相关性,还要考虑周围风电场的风速的空间相关性,这样才能提高预测精度,完善预测模型。
在文献Short-termwindpredictionusinganunscentedKalmanfilterbasedstate-spacesupportvectorregressionapproach中,作者给出了一种基于非线性状态空间模型无极卡尔曼滤波的风速预测方法,为了建立状态空间模型的状态方程,文中采用了支持向量机回归的方法,这种方法可以对风速进行实时的预测,而且可以减小风速随机性的影响,但是,这种方法只考虑了单一的风速时间序列,对于其周围的风场风速没有研究,不是一种完整的预测方法。
在文献Applicationofartificialneuralnetworksforthewindspeedpredictionofstationusingreferencestationsdata中,作者提出了利用神经网络模型对风速进行预测,该方法利用了周围风场的风速数据作为输入数据的选取,考虑了空间相关性,但是对于如相关性的强弱如何去分辨文中没有提及,且不是一种实时的预测方法。
在文献Ahybridstatisticalmethodtopredictwindspeedandwindpower中,作者提出了一种混合预测模型,为了减小风速波动性对预测结果的影响,作者提出对原始数据进行小波分解,对子序列进行时间序列预测,最后再对每个子序列的预测结果进行合并。该方法依然没有考虑其空间相关性。
在文献Windpowerpredictionbasedonnumericalandstatisticalmodel中,该方法依据数值天气预报和卡尔曼滤波预测模型对风速进行了预测,作者考虑了气象参数对风速的影响,且利用卡尔曼滤波模型对风速进行实时的预测,然而由于此状态空间模型是线性的,所以不能很好的刻画风速的实际情况。
在风速预测过程中,风速之间的时间和空间相关性是并存的,并且随着距离的不同而不一样,上述文献中除了文献Applicationofartificialneuralnetworksforthewindspeedpredictionofstationusingreferencestationsdata考虑了周围风场之间风速的相关性,其余的都未考虑风速之间的空间相关性,对预测精度必然存在较大的影响,所以预测模型可以进一步完善。
发明内容
本发明的目的在于针对目前大部分风速预测模型不考虑其空间相关性的不足,提出一种风速混合预测模型,该模型首先基于copula函数来比较其各风场之间空间相关性的强弱,接着利用支持向量机来建立非线性状态空间模型,最后利用优化的无迹卡尔曼滤波对风速进行预测。该模型实现了对风速的实时预测,且考虑了风速的时间相关性和空间相关性。在介绍本发明前,先给出2个定义。
利用copula函数计算两个风场之间的空间相关性通用的指标为kendall秩相关系数和Spearman秩相关系数。下边我们给出这两个秩相关系数的定义和计算方法。
定义1(Kendall秩相关系数)令(x1,y1)和(x2,y2)为独立同分布的随机变量,定义
τ≡P[(x1-x2)(y1-y2)>0]-P[(x1-x2)(y1-y2)<0]
=2P[(x1-x2)(y1-y2)>0]-1
为kendall秩相关系数,记为τ。
若随机变量X,Y的边缘分布分别为F(x),G(y),相应的copula函数为C(u,v),其中u=F(x),v=G(y),u,v∈[0,1],则kendall秩相关系数τ可有相应的copula函数C(u,v)给出
定义2(Spearman秩相关系数)令(x1,y1),(x2,y2)和(x3,y3)为独立同分布的随机变量,定义
ρ≡3{P[(x1-x2)(y1-y3)>0]-P[(x1-x2)(y1-y3)<0]}
为Spearman秩相关系数,记为ρ。
若随机变量X,Y的边缘分布分别为F(x),G(y),相应的copula函数为C(u,v),其中u=F(x),v=G(y),u,v∈[0,1],则kendall秩相关系数τ可有相应的copula函数C(u,v)给出
注:计算这两个秩相关系数时,本发明采用的copula函数为正态分布函数和T分布函数。本发明所使用的数据集来自公开数据集美国威斯康星州(Wisconsinstate,WI)22个风电场的风速数据(2006年1月1日至2009年12月31日,每隔1小时记录一次)。
在运用秩相关系数选择输入数据时的步骤如下:
1:从数据集中选择2009年12月24日到2009年12月30日共7天的数据。
2:检测数据的有效性,对缺失数据进行填充,本发明利用其周围1天的平均值代替缺失数据。
3:对检测好的数据进行正态性检验,接着求其经验分布函数,对其原始数据进行核分布估计,之后就可以对copula函数进行参数估计。
4:根据计算出的Normcopula和tcopula函数来计算其对应的kendall秩相关系数和Spearman秩相关系数。
5:依据计算出的kendall秩相关系数和Spearman秩相关系数的大小选取合适的输入数据。
依据上述方法我们计算的秩相关系数表见表1。
表1
通过选择比较我们筛选出3号、4号、5号、6号、7号、11号、14号和19号风机作为数据输入的风机。
支持向量机是一种机器学习技术,而支持向量回归是专门利用非线性核函数和支持向量来建立的预测回归模型。在支持向量回归中,最核心的步骤是找到一个函数f∈F(F是一函数集),让对应的期望风险函数达到最小值,即:R[f]=∫l(y-f(x))dP(x,y)。其中l(·)表示损失函数,代表y和f(x)之间的偏差,常用形式为l(·)=|y-f(x)|p,其中p是某个正整数。
SVR的基本思想如下:
对于给定的训练样本{(x1,y1),(x2,y2),…,(xN,yN)}其中设回归函数为
上述回归问题依据拉格朗日定理和KKT条件可以求得:
其中为核函数。xr,xs为辨识向量。
本方法依据选择出的8个风机的2009年12月24日00时到2009年12月24日08时的数据和对于9号风机的风速数据进行训练,得到的α1:8,见表2.
表2
本方法对无迹卡尔曼滤波的优化过程如下步骤:
1:指定一个尺度参数κ的可行集,最小值为0,最大值依据文献进行选择。
2:选择一个初始的κ0,本方法取
3:令带入无迹卡尔曼滤波的步骤中计算预测结果。
4:如果
则取κj+1=κj+,否则κj+1=κj。
5:循环3-4步,直到预测误差达到设定的阈值停止。
本发明最后利用灰色关联系数再对输入数据进行进一步的优化,优化方法如下:
1:针对选择好的8个风场,分别选择2006年—2009年每年12月24日到12月30日数据,每个风场选出4组数据,每组168个数据。
2:将每个风场的组数据与9号风场2009年12月24日到2009年12月30日数据进行灰色关联度计算。
3:依据灰色关联系数的大小,选择对应输入数据。
本发明选择的是绝对关联度,该关联度的计算方式如下:
1:将原始序列X0={x0(k),k=1,2,…,n}和Xi={xi(k),k=1,2,…,n}进行初值化处理:
2计算x0与xi的绝对关联度为:
其中,
计算结果见表3。
表3
相对于现有技术,本发明具备以下的优点:
(1)本发明可以有效的提高预测精度相比较一般的传统预测方法。
(2)本发明不仅实现了风速的实时预测,而且考虑了风场之间的空间相关性。
(3)本发明不仅考虑了同一年风场数据的空间相关性,且考虑了每年各风速之间的时间相关性。对于数据缺失的处理以及利用关联度判断不同年份同时间段数据的相似性计算,比较了同时间段数据之间的相似性,提高了预测精度。
(4)本发明在预测过程中不仅考虑了数据之间的相关性,而且建立的是非线性模型,较好的减小了由于风速随机性、波动性造成的预测精度不足的问题。
(5)充分考虑了风场之间的空间相关性,更加符合实际情况。
(6)通过一个非线性的预测方法去对风速进行预测,利用无迹卡尔曼滤波去对风速进行预测,可以保证其预测的实时性,且更加符合风速的实际规律,结果更为精确。
(7)对选定风场的四年风速数据和目标风场风速数据进行灰色绝对值关联度计算,能够减少风速突变性对预测结果的影响,即采用与预测时段相似性更强的数据去进行预测,预测精度更高。
(8)对数据进行预处理可以避免在后续的步骤中由于数据方面造成的预测影响。
附图说明
图1是本发明的总流程图;
图2是无迹卡尔曼滤波的尺度参数优化步骤图;
图3是利用灰色关联系数选择最优输入数据流程图;
图4是各个风电场的位置分布图;
图5是3个风电场的风速曲线变化图;
图6是肯德尔秩相关系数与选定风场到目标风场距离的拟合图;
图7是斯皮尔秩相关系数的拟合图;
图8是没有经过灰色关联度选择,用同一年数据进行预测的风速结果图;
图9是图8预测残差的直方图;
图10是混合算法的预测结果图;
图11是利用AR-KALMAN滤波预测结果图;
图12是小波神经网络法预测结果图;
图13是混合算法预测结果残差图;
图14是AR-KALMAN滤波预测结果残差图;
图15是小波神经网络法预测结果残差图;
具体实施方式
为使本发明的目标、技术方案和优点能够更加清楚明确的表示,结合上述附图对本发明的详细实施步骤做进一步描述。
参考图1,本发明的具体步骤如下:
步骤1.选择原始数据,从公开数据集中选取各风场数据,数据采集2006~2009这4年每年12月24日开始,12月30日结束。
步骤2.对所有采集到的数据进行缺失检查,对缺失数据多的风场直接删除,剩下的利用均值法进行填充,即:假设ai为缺失数据,则填充到该位置的数据为
若ai前后12个数据也有缺失时向前向后退递推,直至得到前后12个数据;若ai为第一个数据,此时同理,ai为最后一个数据时,若ai为数据集中前12和后12的数据时,为了计算方便,我们依然选择和首尾的填充方法一致。结果可以表明,对预测误差的影响不是太大。
步骤3.根据上边的填充方案得到除1号,8号,12号,13号,15号风场外其他风场的完整数据集。
步骤4.选择输入数据,具体如下:依据copula函数计算目标风场9号和其他16个风场第四年数据的秩相关系数,依据秩相关系数的大小选择输入风场。经过比较选定8组风场。
步骤5.选择选定风场2006~2009数据,数据采集从每年的12月24日到12月30日,共32组数据,每组168个数据。目标风场采集数据为2009年12月24日到2009年12月30日,共168个数据。
步骤6.计算每个风场每年的数据与目标风场第四年数据的灰色关联度。
步骤7.依据灰色关联度的大小关系选择最终的输入数据。
步骤8.对选取的输入数据进行建模分析,依据SVR建立非线性状态空间模型。
步骤9.依据建立好的状态空间模型进行无迹卡尔曼滤波预测。
步骤10.根据误差最小原则对无迹卡尔曼滤波中的尺度参数进行优化
步骤11.得到最优的预测结果。
本发明的效果可以通过以下仿真进行进一步说明:
1.仿真条件
本发明通过对同一数据集进行不同方法的实验仿真,来说明算法的有效性。仿真实验室在一台4G内存,赛扬双核2.6Hz,32位win7操作系统,使用MATLAB2012b进行的。
2.仿真内容
仿真1,选取公开数据集美国威斯康星州的22个风电场的数据集进行实验。该数据集采集时间为每隔1小时一次,时间从2006年1月1日到2009年12月31日。数据有4个属性,分别为T,dir,spd和airmp。基于本文的方法,本发明在仿真时选取的属性只有风速。数据集D1为22个风电场的经度和维度。
图4为依据各个风电场的经度和维度画出的3维位置分布图。该图是以地球的球心为球坐标原点,地球半径为球半径,依据经维度的画出的位置分布图,图中可以清晰的看出各个风电场和目标风场的距离分布。图5是3个风电场同一时间段风速的变化曲线图,其中星线为一号风场,点线为2号风场,虚线为3号风场,数据个数为92个。可以看出各风场同一时间段的风速具有很强的相似性。
仿真2,数据集D2为填充好的完整数据集,包括17个风场2006~2009每年12月24日到12月30日的数据。数据集D3是从D2中提取的每个风电场2009年12月24日到2009年12月30日的风速数据。图6是肯德尔秩相关系数与选定风场到目标风场距离的拟合图,直线代表为拟合曲线,散点为真实值。图7为斯皮尔秩相关系数的拟合图。
仿真3,采用数据集D3来检测本发明的算法,图8是没有经过灰色关联度选择,直接用同一年数据进行预测的风速结果图,图9是预测残差的直方图。预测步数为24步,即目标风场2009年12月31日的风速,点线为真实风速,星线为预测值。
仿真4,为了更好地改进预测精度,我们需要对数据进行相似性选择,即利用灰色关联度来选择每个风场4年中数据与目标风场第4年风场同一时间段关联性最强的那年数据作为输入数据,经过该方法选择的数据集我们称为数据集D3′。图10是D3′作为输入数据时,该混合算法的预测结果图,图11和图12分别为利用AR-KALMAN滤波和小波神经网络法对同一数据进行预测的结果图,图13、图14和图15是上述三种方法的预测残差的直方图。
符号说明
SVR:支持向量机回归
T:温度
dir:风向
spd:风速
airmp:气压
D1:仿真数据集1
D2:仿真数据集2
D3:仿真数据集3。
机译: 在高风速条件下运行风电场的方法,涉及通过发电技术来运行风电场
机译: 风速预测装置,风速预测系统,风速预测方法和程序
机译: 风速预测装置,风速预测系统,风速预测方法和程序