首页> 中国专利> 基于变分模态分解和相关向量机的风功率区间短期预测方法

基于变分模态分解和相关向量机的风功率区间短期预测方法

摘要

本发明公开了一种基于变分模态分解与相关向量机的风功率区间短期预测方法,该方法包含,首先对风功率序列进行变分模态分解,获得多个具有不同中心频率的分量;然后对各分量采用相关向量机算法分别建立区间预测模型;最后将各分量的预测结果进行叠加得到一定置信水平下总体的区间预测结果。采用本发明方法,模型的预测精度和区间覆盖率得到提高,区间宽度明显变窄,从而风功率区间的短期预测效果得到了显著改善。

著录项

  • 公开/公告号CN105391083A

    专利类型发明专利

  • 公开/公告日2016-03-09

    原文格式PDF

  • 申请/专利权人 河海大学;

    申请/专利号CN201510744636.1

  • 申请日2015-11-05

  • 分类号H02J3/38(20060101);G06Q10/04(20120101);G06Q50/06(20120101);

  • 代理机构南京苏高专利商标事务所(普通合伙);

  • 代理人柏尚春

  • 地址 210098 江苏省南京市江宁开发区佛城西路8号

  • 入库时间 2023-12-18 14:50:10

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2018-05-25

    授权

    授权

  • 2016-04-06

    实质审查的生效 IPC(主分类):H02J3/38 申请日:20151105

    实质审查的生效

  • 2016-03-09

    公开

    公开

说明书

技术领域

本发明属于新能源发电和智能电网的技术领域,涉及一种基于变分模态分解和相关 向量机的风功率区间短期预测方法。

背景技术

在化石能源紧缺和环境问题严峻的今天,开发利用清洁无污染的可再生能源已成共 识。其中风力发电因其清洁无污染、储量丰富、可循环利用受到越来越多的重视与关注。 由于自然风存在一定的随机性与波动性,当风电大规模接入电网时,电网的供需平衡与 安全稳定运行在风机发生较大的功率波动时会造成巨大影响。因此准确的风功率预测是 合理制定发电计划与安排系统备用的前提,是提高风电在电网的比重的关键。

与传统确定性点预测的方法相比较,目前区间预测仍处于起步阶段。现有的区间预 测方法大概可以归为一下几类:①基于Bootstrap重抽样法、②分位点法、③区间构造 法、④概率预测法。其中采用Bootstrap重抽样法构造样本,需要大量处理数据,耗时 较长;分位点法通过估计累计概率函数的分位数提供预测对象的概率信息,虽无需事先 确定分布假设,但需要预先确定回归模型和分位点,模型计算量大;区间构造法通常先 以某种点预测方法为基础,再通过误差分析等方法构造比例系数从而获得短期负荷的区 间,但是其最优系数的获取不易;概率预测法多基于贝叶斯理论,其结果具有概率意义, 可得出预测量的期望值及其分布特性,因而可以直接得出任意置信水平下的区间预测结 果,但是有时也存在预测区间过大的问题。

考虑实际风功率的随机性与波动性,直接对原始风功率序列进行预测的误差较大。 目前流行的改进方法是通过对原始数据的分解,降低数据复杂度,其中比较典型的方法 有小波分析、经验模态分解(EmpiricalModeDecomposition,EMD)、局域均值分解(LocalMean Decomposition,LMD)等。相比EMD和LMD,变分模态分解(VariationalModeDecomposition, VMD)是一种新的信号分解估计方法,具有更好的噪声鲁棒性以及较准确的模态分离效 果。

在点预测方法中,常采用以人工神经网络(ArtificialNeuralNetworks,ANN)为代 表的智能算法和以支持向量机(SupportVectorMachines,SVM)为代表的机器学习方法进 行风功率的预测。但是ANN方法在训练中容易导致学习不足或过拟合的问题;SVM等 机器学习算法虽有效避免了陷入局部最小的风险,能实现较为精确的预测,但是仍存在 以下不足:①核函数必须满足Mercer条件,可选核函数较少;②只能实现点预测,无 法描述数据的不确定信息;③参数较多,且支持向量随着训练样本的增加而线性增长, 计算量较大。

为了克服上述缺点,MichaelE.Tipping提出了一种基于贝叶斯理论、边缘似然理论 的概率学习方法-相关向量机(RelevanceVectorMachines,RVM)。RVM不仅很好的保留 了SVM出色的预测能力,具有模型高度稀疏、待优化核参数少、核函数选择灵活、模 型泛化能力强的优点,还改善了ANN、SVM的不足之处,能直接实现区间的预测。目 前该方法已应用于负荷预测、故障分类、模式识别等领域,但运用于风功率区间预测的 几乎没有。

因此,亟待解决上述问题。

发明内容

发明目的:本发明提供一种具有较高的预测精度与较窄的区间宽度,区间预测效果 较为理想的基于变分模态分解和相关向量机的风功率区间短期预测方法。

技术方案:本发明公开了一种基于变分模态分解和相关向量机的风功率区间短期预 测方法,其特征在于,包括以下步骤:

步骤1:采用变分模态分解算法对原始的风功率序列进行分解,获得多个具有不同 中心的分量;

步骤2:按照以风功率待预测时刻前5个点的数据作为训练样本输入的原则对各分 量数据进行处理,构造出训练样本与预测样本并归一化;

步骤3:对相关向量机预测模型的参数采用网格搜索进行优化,得到最优化的核函 数宽度和混合核系数权重,设定相关向量机预测模型的迭代初值;

步骤4:求解核函数,得到各分量的预测值和方差。

步骤5:将各分量的预测值进行叠加,得到一定置信度下的风功率的预测区间。

所述步骤1具体包括变分问题构造和变分问题求解两个子步骤:

其中变分问题构造的具体方法为:

步骤1.11:对于输入信号f,通过希伯特变换,得到每个模态函数uk(t)的解析信号, 并最终获得其单边频谱其中,t表示第t时刻,k表示第k个模态,j 表示虚数单位,δ(t)表示第k个模态在第t时刻的中心频率;

步骤1.12:将每个模态的频谱以各模态解析信号的混合-预估中心频率为基准调 制到相应基频带其中ωk表示第k个模态的角频率;

步骤1.13:将计算以上解调信号梯度的平方L2范数,估计出各模态信号带宽,受约 束的变分问题构造如下:

min{uk},{ωk}{Σk||t[(δ(t)+jπt)*uk(t)]e-kt||2}s.t.Σkuk=f

其中,{uk}={u1,...,uK};{ωk}={ω1,...,ωK},表示对t求偏导数,f表示输入信号;

其中变分问题求解的具体步骤为:

步骤1.21:引入二次惩罚因子α和拉格朗日乘法算子λ(t),将约束性变分问题变为 非约束性变分问题;

其中α保证信号的重构精度;λ(t)保持约束条件严格性;扩展的拉格朗日表达式为:

L({uk},{ωk},λ)=αΣk||t[(δ(t)+jπt)*uk(t)]e-kt||2+||f(t)-Σkuk(t)||22+<λ(t),f(t)-Σkuk(t)>

步骤1.22:初始化参数和n;

其中,{uk}={u1,...,uK}表示k个模态函数;表示这k个模态函数的初值; {ωk}={ω1,...,ωK}表示k个中心频率;表示这k个中心频率的初值;是拉格朗日乘法 算子的初值;n为迭代的次数。

步骤1.23:采用了交替乘子方向法解决以上变分问题,通过交替更新ukn+1,ωkn+1以 及λn+1寻求扩展拉格朗日表达式的‘鞍点’;

其中,uk和ωk分别由公式u^kn+1(ω)=f^(ω)-Σiu^i(ω)+λ^(ω)21+2α(ω-ωk)2ωkn+1=0ω|u^k(ω)|2dω0|u^k(ω)|2dω进行更 新;λ采用λ^n+1(ω)λ^n(ω)+τ[f^(ω)-Σku^kn+1(ω)]实现更新。

步骤1.24:对于给定判别精度e>0,若则停止迭代,获得一 个分量U1

步骤1.25:,重复步骤1.23和1.24,求解其他分量U2、U3……Un

其中,所述以风功率待预测时刻前5个点的数据作为训练样本输入的原则对各分量 数据进行处理,构造出训练样本与预测样本并归一化;其具体包括:

训练样本的输入向量为xn=[L(i-1),L(i-2),L(i-3),L(i-4),L(i-5)], i>5,n=1,…,M,输出向量为yn=L(i)。

其中,xn表示第n个输入向量;yn表示第n个输入向量对应的输出;L(i)表示待 预测风功率在第i时刻的数据;L(i-1)表示待预测风功率前1时刻的数据;L(i-2)表 示待预测风功率前2时刻的数据;L(i-3)表示待预测风功率前3时刻的数据;L(i-4) 表示待预测风功率前4时刻的数据;L(i-5)表示待预测风功率前5时刻的数据。

其中,所述步骤3的具体方法为:

步骤3.1:设定RVM模型的核宽o和核函数系数k,并将其进行网格化,设定最大 迭代次数;

步骤3.2:输入归一化后的训练样本,以训练误差(训练输出与实际值的平均相对 误差)最小为目标,在迭代次数范围内在寻找使训练误差最小时的最优核宽o和核函数 系数k;

所述训练误差具体为:

etrain=1N(ytrain_fore-ytrain_trueytrain_true)

其中,etrain表示训练误差;N表示训练样本的个数;ytrain_fore表示模型训练输出; ytrain_true表示训练样本的实际值。

优选的,所述步骤4的具体方法包括:

步骤4.1:计算相关向量机模型的核函数、训练样本后验分布的方差和后验分布权 重;

步骤4.2:利用最大边缘估计法计算超参数的先验分布最大化值;

步骤4.3:检验当前迭代获得的超参数是否满足迭代要求,若满足则此超参数为相 关向量机预测模型参数;否则更新超参数,直到满足迭代要求或达到最大迭代次数,结 束。

所述核函数计算公式具体为:

模型的核函数采用的是局部和-高斯核和全局核-多项式核的组合, K(x,xi)=kG(x,xi)+(1-k)P(x,xi),G(x,xi)=exp(-||x-xi||2/o2),P(x,xi)=[(x·xi)+1]2

其中,K(x,xi)表示模型总体的核函数;G(x,xi)表示高斯核;P(x,xi)表示多 项式核;x表示相关向量;xi表示归一化后的输入参量;o表示高斯核的核宽;k表示 混合核的核函数权重系数;

所述训练样本后验分布的方差和均值计算公式具体为:

Σ=(σ-2ΦTΦ+A)-1,U=σ-2ΣΦTT

其中,Σ表示后验分布的方差;U表示后验分布的均值;A=diag(α01,…,αN)为超参 数对角元素;σ-2为迭代初值;Φ为基函数向量;T为训练样本的目标。

所述风功率的预测值和方差的计算公式具体为:

其中,y*表示风功率预测期望值;表示风功率预测值的方差。

所述风功率的预测区间计算公式具体为:

[Lb,Ub]=[y*-zα/2σ*,y*+zα/2σ*]

其中,Lb和Ub分别表示预测值的下界和上界;zα/2为正态分布的双侧α分位点。

有益效果:与已有技术相比,本发明的有益效果为:

1、本发明引入变分模态分解降低数据的复杂度,该分解方法效果优异,结果准确, 有效提高了预测精度;

2、本发明采用相关向量机方法进行预测,具有模型高度稀疏、待优化参数少、核 函数选择灵活、泛化能力强、预测精度高等优点。

3、本发明实现了结果的概率区间预测,不仅能提供风功率的预测值,还能提供一 定置信度下的区间预测结果,可包含更多的信息。

4、本发明使用局部核-高斯核和全局核-多项式核的组合构成相关向量机的核函数, 进一步改善区间预测的效果。

附图说明

图1为本发明的风功率区间短期预测流程框图;

图2为本发明变分模态分解的效果示意图;

图3为本发明RVM模型在90%置信水平的区间预测结果;

图4为本发明VMD-RVM模型在90%置信水平的区间预测结果;

图5为本发明VMD-RVM模型在70%置信水平的区间预测结果。

具体实施方式

下面结合附图对本发明的技术方案作进一步说明。需要说明的是,此处的说明仅仅 以风功率为例,该发明还可适用于负荷、光伏出力等其他范围与领域。

考虑风功率的随机波动性,本发明提出了一种基于变分模态分解和相关向量机的风 功率区间短期预测方法。一方面引入变分模态分解对风功率序列进行分解,获得多个具 有不同中心频率的分量,降低了数据的复杂度;另一方面对各分量采用相关向量机算法 分别建立区间预测模型,并采用局部核-高斯核和全局核-多项式核的组合构成相关向量 机的核函数,进一步改善区间预测的效果。最后将各分量的预测结果进行叠加得到一定 置信水平下的区间预测结果。该方法具有预测精度和区间覆盖率高、区间宽度窄的优点, 可较好的运用于工程实际问题。

首先为避免突变数据或坏数据对预测结果的影响,对风功率序列数据进行预处理, 本发明中使用的是数据纵向对比法,其计算公式如下:

其中,L(t)为第t时刻的风功率数据;α(t),β(t)为预先设定的两个阈值。

对已预处理过的风功率序列{L(t)}={L(1),…,L(n)}进行变分模态分解。假设每个模态是 具有中心频率的有限带宽,变分问题描述为寻求k个模态函数uk(t),使得每个模态的估 计带宽之和最小,约束条件为各模态之和等于输入信号f,具体步骤如下:

①通过希伯特变换,得到每个模态函数uk(t)的解析信号,并最终获得其单边频谱:

[δ(t)+jπt]*uk(t)---(2)

其中,t表示第t时刻,k表示第k个模态,j表示虚数单位,δ(t)表示第k个模态 在第t时刻的中心频率;

②将每个模态的频谱以各模态解析信号的混合-预估中心频率为基准调制到相 应基频带:

[(δ(t)+jπt)*uk(t)]e-kt---(3)

其中ωk表示第k个模态的角频率;

③计算以上信号梯度的平方L2范数,估计出各模态信号带宽,受约束的变分问题表 示如下:

{min{uk},{ωk}{Σk||t[(δ(t)+jπt)*uk(t)]e-kt||2}s.t.Σkuk=f---(4)

其中,{uk}={u1,...,uK},{ωk}={ω1,...,ωK},表示对t求偏导数,f表示输入信号;

④引入二次惩罚因子α和拉格朗日乘法算子λ(t),将约束性变分问题变为非约束性 变分问题。其中α可保证信号的重构精度,λ(t)使得约束条件保持严格性,扩展的拉格 朗日表达式如下:

L({uk},{ωk},λ)=αΣk||t[(δ(t)+jπt)*uk(t)]e-kt||2+||f(t)-Σkuk(t)||22+<λ(t),f(t)-Σkuk(t)>---(5)

⑤VMD中采用了交替乘子方向法解决以上变分问题,通过交替更新ukn+1,ωkn+1以及 λn+1寻求扩展拉格朗日表达式的‘鞍点’。对ukn+1利用傅里叶等距变换转变到频域:

u^kn+1=argminu^k,ukX{α||jω[(1+sgn(ω+ωk))·u^k(ω+ωk)]||22+||f^(ω)-Σiu^i(ω)+λ^(ω)2||22}---(6)

⑥将第一项的ω用ω-ωk代替,并转换为非负频率区间积分的形式:

u^kn+1=argminu^k,ukX{04α(ω-ωk)2|u^k(ω)|2+2|f^(ω)-Σiu^i(ω)+λ^(ω)2|2dω}---(7)

⑦此时,二次优化问题的解与中心频率的更新公式分别为:

u^kn+1(ω)=f^(ω)-Σiu^i(ω)+λ^(ω)21+2α(ω-ωk)2,ωkn+1=0ω|u^k(ω)|2dω0|u^k(ω)|2dω---(8)

⑧其中,相当于当前剩余量的维纳滤波;ωkn+1为当前模态函数 功率谱的重心;对进行傅里叶逆变换,其实部则为{uk(t)}。

根据事先给定的模态数获得相应的多个具有不同中心频率的分量 {u(t)}={u1(t),…,ud(n)}。其中,n表示风功率序列的长度;d表示分量u(t)的个数。变分模 态分解的效果如图2所示。

按照以风功率待预测时刻前5个点的数据作为训练样本输入的原则对各分量数据进 行处理,构造出训练样本与预测样本并归一化。

表1样本输入特征量

由此可将输入向量表示为:x(n)=[L(i-1),L(i-2),L(i-3),L(i-4),L(i-5)],i>5,n=1,…,M; 输出向量为y(n)=L(i);归一化公式为:

x~(n)=(x(n)-xmin)/(xmax-xmin)---(9)

采用RVM对VMD分解得到的分量分别建立预测模型。

对于给定的训练样本输入集和对应的输出集相关向量机回归模型可定 义为:

ti=Σi=1NwiK(x,xi)+w0+ϵ---(10)

其中ε为服从N(0,σ2)分布的各独立样本误差,wi为权系数,K(x,xi)为核函数,N 为样本数量。

对于相互独立的输出集,整个样本的似然函数为:

p(t|w,σ2)=Πi=1NN(ti|y(xi;w),σ2)=(2πσ2)-N/2exp(-||t-Φ(x)w||2/2σ2---(11)

其中:t=(t1,t2,…,tN),w=[w0,w1,…,wN]T

根据概率预测公式,所求的条件概率为:

P(t*|t)=∫p(t*|w,σ2)p(w,σ2|t)dwdσ2(12)

若直接使用最大似然的方法来求解w和σ2,结果通常会导致严重的过适应,为避免 这种现象,对w加上先决条件。根据贝叶斯理论,w为分布为零的标准正态分布,同时 引入超参数α=[α012,…,αN]T,可得

因此,概率预测式改为:

p(t*|t)=∫p(t*|w,σ2)p(w,α,σ2|t)dwdαdσ2(13)

对每个权值限定先决条件的方法,是相关向量机的一个重要特征。α为权值w对应 的超参数,符合伽马分布。经过足够的更新次数后,大部分αi会趋近无限大,其对应的 权值趋于0,而其他的αi会稳定地趋近有限值。而与之对应的xi称之为相关向量,实现 相关向量机稀疏特性。

在定义了先验概率分布及似然分布以后,根据贝叶斯原理,就可以求得所有未知参 数的后验概率分布为:

p(w|t,α,σ2)=(2π)-(N+1)/2|Ψ|-1/2·exp{-12(w-μ)TΨT(w-μ)}---(14)

其中,后验协方差矩阵和均值分别为:Ψ=(σ-2ΦTΦ+A)-1,μ=σ-2ΨΦTt,

A=diag(α01,…,αN)为超参数对角元素。

为了确定模型权值,首先需要得到超参数的最佳值,可以通过迭代算法求得,即

αinew=1-αiΨi,iμi2,(σ2)new=||t-Φμ||2N-Σi=0N(1-αiΨi,i)---(15)

其中,μi为第i个后验平均权,Ψi,i为后验协方差矩阵中的第i个对角元素,N为样 本数据个数。

若给定新的输入值x*,则相应的输出概率分布服从高斯分布,其相应的预测均值和 方差分别为

y*=μTφ(x*)(16)

在置信度1-α下,预测结果的置信区间可表示为:

[Lb,Ub]=[y*-zα/2σ*,y*+zα/2σ*](18)

为评价区间预测效果的好坏,采用以下三个指标对其进行评判。

1)平均相对误差(MeanAbsolutePercentageError,MAPE)

MAPE=1NΣi=1N|yi*-yiyi|×100%---(19)

式中:为第i个预测样本的预测期望值;yi为第i个预测样本的实际值。MAPE用于 评价预测期望值与实际值之间的偏差,其值越小越好。

2)区间覆盖率(ForecastingIntervalCoveragePercentage,FICP)

FICP(1-α)=1Nξ(1-α)×100%---(20)

式中,FICP(1-α)为区间覆盖率;N为预测样本的个数;ξ(1-α)为置信度1-α下实际值落在 预测置信区间内的个数。FICP用于评价构建区间的可信程度,其绝对值越大,可信度 越高。

3)区间平均宽度(ForecastingIntervalAverageWidth,FIAW)

FIAW(1-α)=1NΣi=1NU(xi)-L(xi)yi---(21)

式中,FIAW(1-α)为置信度1-α下的区间平均宽度;U(xi)为第i个预测样本的上界;L(xi) 为第i个预测样本的下界;yi为第i个样本的真实值;上式中采用的是相对宽度。FIAW 用于评价预测结果描述不确定信息的能力,其值越小,效果越好。

为分析本发明的区间预测效果,分别采用90%和70%两个置信度对风功率进行区间 预测,其区间预测效果分别如图4、图5所示。部分预测结果及指标析结果如表2所示

表2VMD-RVM模型的区间预测结果

从图表中可以看出:①该方法的短期内风功率预测期望值能够有效跟随实际值,其 上下浮动趋势与实际负荷变化情况基本一致;②由图4、图5中实际风功率在区间内的 分布情况来看,实际风功率大部分都落在置信度为90%和70%的预测区间之内,但实际 值落在70%置信度预测区间之外的个数明显多于90%的,符合实际情况,体现了该方法 区间预测结果的有效性;③90%置信水平的预测区间宽度明显大于70%的,随着置信度 的降低,区间预测的区间宽度降低,区间覆盖率也随之降低。

为进一步评价VMD算法对改善区间预测效果的作用,将其与标准RVM模型、 EEMD-RVM的预测结果进行对比。评价结果如表3所示。

表3各预测模型的指标评价结果

由表3中各种模型指标结果可以得出以下结论:①总体上看,该方法的预测误差最 小,区间宽度最窄,区间覆盖率与运行时间也处于中上水平,模型的区间预测效果较为 理想;②与未采用VMD分解的标准RVM模型相比,该方法的预测误差与区间宽度都 得到了明显改善。区间覆盖率也满足指标要求。运行时间虽有所延长,但仍在工程实际 要求的范围内;③与同为分解算法的EEMD相比,该方法的预测精度和区间覆盖率较 高,区间宽度较窄,运行时间明显缩短。综上所述,本发明可实现风功率的区间短期预 测,可用于实际工程应用。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号