法律状态公告日
法律状态信息
法律状态
2014-11-19
授权
授权
2014-03-19
实质审查的生效 IPC(主分类):G01N30/00 申请日:20131118
实质审查的生效
2014-02-19
公开
公开
技术领域
本发明涉及电力系统安全技术领域,尤其涉及对变压器油中的气体浓度进行 预测的变压器油色谱数据预测方法。
背景技术
实际运行中,变压器绝缘油和有机绝缘材料在电场及磁场的作用下,会逐渐 老化和分解,产生少量低分子烃类及二氧化碳、一氧化碳等气体,并大量溶解在 变压器油中。当存在潜伏性过热故障或放电性故障时,这些气体的产生速度和溶 解在油中的数量也会增加,即故障气体的组成和含量与故障类型的严重程度有密 切关系。为此,检测变压器中的绝缘油的色谱情况是见识变压器安全运行的重要 手段之一。
电力变压器是电力系统的重要设备之一,其正常运行对电网的安全稳定运行 起着非常重要关键的作用。变压器油中溶解气体的含量是监督变压器运行状态的 重要手段,因此,建立科学、准确度高和可操作性强的预测模型是变压器在线监 测和故障诊断的重要手段,具有重要的技术和经济价值。
目前,常用的预测方法有BP神经网络,支持向量机等。预测模型可以由不 同的方法建立,如神经网络,时间序列等方法。由于预测方法的原理和建模机制 不同,这些方法的预测效果不完全相同。神经网络方法中BP神经网络的局部拟 合能力较强,机器学习算法中支持向量机的整体逼近能力较强。在预测变压器油 中溶解气体时,各种方法对各个时间段的预测精度也各不相同,因此,仅仅采用 某一种方法进行预测,在某种程度上会降低预测精度。
发明内容
本发明针对以上问题,提供一种利用D-S证据理论对多种方法的综合能力, 改善了变压器油色谱数据预测模型的精度和泛化能力的基于D-S证据理论的变 压器油色谱数据预测方法。
本发明的技术方案:包括以下步骤:
步骤1):采集变压器油色谱数据中的多种气体浓度历史数据;
步骤2):以所述多种气体在某一时刻的浓度作为输入,以所述多种气体中的待 预测气体在下一时刻的浓度作为输出,利用所采集的多种气体浓度历史数据作为 训练样本集通过多种智能预测算法进行训练,并计算训练误差;
所述步骤2)按如下过程进行:
2.1),采集N种气体的浓度历史数据,将某一时刻的N种气体的浓度数 据作为输入量,下一时刻的N种气体中的第n种气体浓度作为输出量,则训练 样本集Dn可表示为:
2.2),将训练样本集Dn输入到各个智能预测算法中进行训练,得到各个智 能预测算法对应的预测模型,以及训练误差,每个训练误差记作:
式中,为预测值,yi为真实值;
步骤3):利用D-S证据理论对步骤2)中所述的多个预测模型得到的预测结果 进行权重提取和融合,得到待预测气体预测模型权重,最终得到预测值;
所述步骤3)按如下过程进行:
3.1),首先提取融合样本的权重,
权重wi可以表示为下面关于ei的函数
其中,ε的引入避免了相对误差为0,进而可得到组合预测结果Y:
3.2),设y1、y2和y3分别代表三种气体预测模型的预测值,w1、w2和w3分 别为相应的权重,在识别框架Θ={y1,y2,y3}上建立基本信任分配函数m,其对 应的信度值为
m(yi)=wi (i=1,2,3)
3.3),设mj(yi)(i=1,2,3;j=a,b,c)为a,b,c日的溶解气体预测值所对应的基 本信度值,Belj为信度值对应的信度函数;
首先将a日和b日的信度函数通过D-S证据理论进行融合,融合过程如下:
m(y1)=ma(y1)mb(y1)/(1-K)
m(y2)=ma(y2)mb(y2)/(1-K)
m(y3)=ma(y3)mb(y3)/(1-K)
其中K表示证据冲突程度指数:
K=ma(y1)mb(y2)+ma(y1)mb(y3)+ma(y2)mb(y1)+ma(y2)mb(y3)
+ma(y3)mb(y1)+ma(y3)mb(y2)
然后将a日和b日合成后的信度函数再与c日的信度值进行二重融合,将结 果记为同时用m4(y1)、m4(y2)和m4(y3)作为对应的基本信度 值;
3.4),设三种预测模型对d日的预测结果分别为和则d日预测 数据融合的最终结果表示为
步骤4):结束。
所述多种智能预测算法包括BP神经网络、支持向量机和相关向量机。
所述多种气体包括:H2、CO、C2H2、C2H4、C2H6、CH4和/或CO2。
本发明利用D-S证据理论对多种方法获得的预测结果融合能力来对变压器 油中的气体浓度进行预测,改善了变压器油色谱数据预测模型的精度和泛化能 力。相比现有技术,本发明具有更高的预测精度。
附图说明
图1是本发明的原理框图,
图2是本发明的流程图,
图3是本发明中信息的不确定性用证据理论表示图,
图4是本发明中证据E1的基本信任分配图,
图5是证据E2的基本信任分配图,
图6是D-S证据理论中合成法则的表现形式图,
图7是BP神经网络结构示意图。
具体实施方式
下面结合附图对本发明的技术方案进行详细说明:
Dempster在20世纪70年代首先提出来证据理论的概念,Shafer在Dempster 的基础上提出了新的理论,因此通常把证据理论也简称D-S证据理论。证据理 论主要采用信任函数来处理不确定性因素的,而不是采用确定的概率值。它已经 在人工智能、检测诊断等方面得到了广泛的应用。
一、证据理论的基本概念
(一)识别框架
定义1:现在有一个需要判断的问题,用集合Θ来表示所有可能的答案,而 且集合中的元素是两两相斥的;集合Θ中的某一个元素对应问题的一个答案,则 称此集合Θ为识别框架,可以表示为
Θ={θ1,θ2,L,θj,L,θN}
式中,N是识别框架中元素的总个数,θj为其中的任一个元素, j=1,2,Λ,N。
幂集记作2Θ,是所有子集在识别框架Θ中的集合,可表示为:
式中,表示空集;{θi∪θj}也可记为{θi,θj},i,j∈[1,n],且i≠j,依此 类推。
(二)基本信任分配函数
定义2:设Θ为识别框架,基本信任分配函数m是从集合2Θ到[0,1]的映射, A是识别框架Θ里的任一个子集,记作且满足
式中,m(A)称为事件A的基本信任分配函数。
对A的信度大小是通过基本信任分配函数来反映的。表示空集不 产生信度;表示所有命题的信度和等于1。
(三)信任函数
证据建立时通过基本信任分配函数来对信任程度进行初始分配。若 则意味这B在逻辑上包含于A,所以B所有命题的信度和是A的总 信任。
定义3子集A是识别框架Θ中的任一集合,表示为同时满足
则Bel(A)称为A的信任函数,Bel是一个从集合2Θ到[0,1]的映射。
(四)众信任度函数
定义4设函数Q:2Θ→[0,1]由下式定义,即有
则Q称为众信度函数。Q(A)称为A的众信度。
定义5设Bel是Θ上的信度函数,Q是它的众信度函数,那么,对有
(五)似然函数
由于Bel(A)不能对怀疑A的程度进行反映,所以描述命题A的信任情况仅 仅使用信任函数是不够的。因此,为了对A的信任进行全面描述,需要引入一个 度量命题A程度的函数,即似然函数。
定义6子集A是识别框架Θ中的任一集合,表示为同时满足
函数Pl(A)表示不怀疑A的程度,称为似然函数,Pl是集合2Θ到[0,1]的映 射。对A的怀疑程度用函数表示。
似然函数与信任函数之间有一定的关系:
Pl(A)≥Bel(A)
证明:
A是真的程度用Bel(A)表示,A是非假的程度用Pl(A)表示,可得 Pl(A)≥Bel(A),则对A的上限和下限分别用Pl(A)和Bel(A)表示,记为 [Bel(A),Pl(A)],这是命题A的不确定区间,如图3所示。
(六)两个证据的合成规则
假设E1和E2是识别框架Θ下的两个证据,Ai和Bj分别为焦元,m1和m2分 别为对应的基本信任分配函数,分别用图4和图5来表示。图6是图4和图5 综合后得到的。
竖条和横条分别表示m1和m2在相应焦元上的基本信任分配值。交集是一个矩阵, 其值为m1(Ai)m2(Bj),Bel1、Bel2通过共同作用将m1(Ai)m2(Bj)分配到Ai∩Bj上。由 于分配到空集上的分配值为0,所以这部分的基本信任分配值被丢弃,造成总信任值小于1, 因此需要乘上一个系数来保证信度值总和为1.
定义7假定E1和E2两个证据属于识别框架Θ,Ai和Bj是相应的焦元,m1和 m2是相应的基本信任分配函数,设则D-S合成规则 为
当时,m1与m2所对应的两个证据发生了冲突。K值与证据之间 的冲突成正比关系,能够正确反映出冲突的程度,K值越大,冲突越大;反之亦 然。
(七)多个证据的合成规则
定义8设同一个识别框架Θ上,n个基本信任分配函数分别为m1,m2,L,mn, Ai(i=1,2,L,N)为相应的焦元,则D-S合成法则为
其中,
二、BP神经网络算法
BP神经网络是一种多层前馈神经网络,网络的核心算法是BP学习算法。 BP学习算法自从20世纪80年代提出来以后,得到了广泛的使用。常用的BP 网络都是由输入层、隐含层和输出层三层组成,如图7所示。
具体步骤如下:
设置网络各权值和阀值的初始值:wji(0),θj(0)为小的随机变量。
输入训练样本:输入向量为Xk,k=1,2,Λ,P;期望输出为dk, k=1,2,Λ,P。
计算网络隐含层的输出:
计算网络的训练误差
δkj=okj(1-okj)(tkj-okj),(输出层)
对权值和阀值进行修正:
wji(t+1)=wji(t)+ηδjoki+α[wji(t)-wji(t-1)]
θj(t+1)=θj(t)+ηδj+α[θj(t)-θj(t-1)]
当k从1至P后,判断指标是否满足精度要求:
E≤ε;ε:精度
结束。
(三)支持向量机方法
20世纪90年代,Vapnik提出了一种基于统计学习理论(Statistical Learning Theory,SLT)的机器学习算法——支持向量机。该算法实现风险最小化是通过 寻找结构风险的最小化,同时学习的效果也比较好。SVM可以有效的避免过学 习、维数灾、局部极小等问题。
SVM应用主要在模式识别,函数回归和概率密度估计方面。SVM与神经网 络相比,具有很强的预测能力和较快的收敛速度,同时能够得到全局最优,因而 在风速及风功率预测中的得到了广泛应用。
预测中常见的回归问题是给定样本{(xi,yi)}(i=1,2,3,Λ,m),其中xi为输入 向量,而yi为相应目标输出数据。常见的非线性回归思路是直接寻找yi和xi之 间的非线性函数,难度很大,而SVM的计算是在高维空间里完成的[59,60]:
式中,w为权值向量,而b为偏差,是两个待预测的参数,非线性函数φ(x) 是把输入向量映射到高维空间,它的选取一般是在几个模板之间进行选择试算得 到。
SVM引入损失函数,不仅使得估计具有鲁棒性,而且使它是稀疏的。损失 函数有很多种,这里主要采用ε-不敏感损失函数。因为该损失函数得到的展开 式所需要的支持向量机数目最少,所以稀疏性更好。
ε-不敏感损失函数定义为
根据结构风险最小化原则,回归问题转化为:
引入松弛因子ξi≥0和则上式变为:
优化目标转变为:
其中,C>0,C表示对超出样本的惩罚程度,是一种惩罚函数。通过拉格 朗日乘子把优化问题中的约束条件去掉
式中,是拉格朗日因子。L(w,b,ξ,ξ*)分别对w,b,ξ,ξ*求偏 导并令其为零:
把式(4.19)代入式(4.18)把原问题转化成对偶问题:
解上述问题后,得到最优解后,通过最优解计算w和 b:
从而得到回归函数:
如果问题是非线性的,那么可以通过非线性变换转化成线性问题。通过内积 计算就可以实现对偶问题的寻优,所以在高维空间中不需要知道非线性的具体形 式,这也是支持向量机的一个优点,即使用核函数K(xi,xj)实现非线性函数拟合, 且计算复杂度没有增加。则最优化问题为:
相应的回归函数为:
(三)相关向量机
Michael E.Tipping在支持向量机预测函数基础上,以基于概率学习的贝叶斯 学习理论提出了更实用的算法模型:相关向量机。与支持向量机相比,具备支持 向量机所没有的优点:(1)相关向量的数目远远小于支持向量,具有高稀疏性; (2)仅有核参数的设置,可节约训练时间;(3)核函数无需满足Mercer条件, 增加的核函数选择的灵活性。
对于给定的训练样本输入集和对应的输出集相关向量机回归 模型可定义为:
其中ε为服从N(0,σ2)分布的各独立样本误差,ωi为权系数,K(x,xi)为核函 数,N为样本数量。
对于相互独立的输出集整个样本的似然函数为:
其中:t=(t1,t2,ΛtN)T,w=[ω0,ω1,ω2,Λ,ωN]T,
由概率预测公式,所求的条件概率为:
P(t*|t)=∫p(t*|w,σ2)p(w,σ2|t)dwdσ2
为了避免直接使用最大似然方法求解w和σ2而带来的过适应现象,根据贝 叶斯理论,引入先决条件:w的分布为零均值的标准正态分布。同时引入超参数 α=[α0,α1,α2,Λ,αN]T,可得:
因此,条件概率预测公式可改写为:
P(t*|t)=∫p(t*|w,σ2)p(w,α,σ2|t)dwdαdσ2
其中αi为权值ωi对应的超参数。对每个权值限定先决条件的方法,是相关 向量机的一个重要特征,由于自动相关决定先验理论,在经过足够多的更新后, 大部分超参数会趋向于无穷大,而与其对应的权值为0,这就保证了相关向量机 的高稀疏性。
对于改写后的概率预测式,根据贝叶斯理论对其进行整理,可得权值的后验 分布概率密度为:
p(w|t,α,σ2)=(2π)-(N+1)/2|Ψ|-1/2
·exp{-[(w-μ)TΨ-1(w-μ)]/2}
其中Ψ=(σ-2ΦTΦ+A)-1,μ=σ-2ΨΦTt,A=diag(α0,α1,Λ,αN)。
最后使用最大似然方法可得到估计超参数α和方差σ2。
若给定输入值x*,则相应的输出概率分布服从高斯分布,其相应的预测值 为:
y*=Φ(x*)μ
由于单个预测模型往往很难达到理想的精度,预测结果还具有不确定性和片 面性,因此,如何融合单一方法的优点来进行预测成为今年来的一个研究热点。
考虑到各种不同方法的预测不确定性对结果的影响,提出一种基于D-S证 据理论的变压器油中溶解气体预测模型,首先分别采用BP神经网络、支持向量 机和相关向量机对溶解气体含量进行预测,而后通过对预测误差进行分析,借助 D-S证据理论对三种模型进行融合,选择待测日前几日的溶解气体数据作为融合 样本,计算出相应的基本信任分配函数,同时将函数进行融合,融合结果作为预 测模型的权重,最终得到溶解气体的预测结果。
本发明方法的流程如图1-2所示,包括以下步骤:
步骤1):采集变压器油色谱数据中的多种气体浓度历史数据;
步骤2):以所述多种气体在某一时刻的浓度作为输入,以所述多种气体中的待 预测气体在下一时刻的浓度作为输出,利用所采集的多种气体浓度历史数据作为 训练样本集通过多种(至少三种)智能预测算法进行训练,并计算训练误差;
所述步骤2)按如下过程进行:
2.1),采集N种气体的浓度历史数据,将某一时刻的N种气体的浓度数 据作为输入量,下一时刻的N种气体中的第n种气体浓度作为输出量,则训练 样本集Dn可表示为:
2.2),将训练样本集Dn输入到各个智能预测算法中进行训练,得到各个智 能预测算法对应的预测模型(在智能算法中训练完成之后,即可得到所谓的预测 模型,“训练”为智能算法建模的常规过程),以及训练误差,每个训练误差记作:
式中,为预测值,yi为真实值;
步骤3):利用D-S证据理论对步骤2)中所述的多个预测模型得到的预测结果 进行权重提取和融合,得到待预测气体预测模型权重,最终得到预测值;
所述步骤3)按如下过程进行:
3.1),首先提取融合样本的权重,
权重wi可以表示为下面关于ei的函数
其中,ε的引入是为了避免了相对误差为0,进而可得到组合预测结果Y:
3.2),设y1、y2和y3分别代表三种气体预测模型的预测值,w1、w2和w3分 别为相应的权重,在识别框架Θ={y1,y2,y3}上建立基本信任分配函数m,其对 应的信度值为
m(yi)=wi (i=1,2,3)
3.3),设mj(yi)(i=1,2,3;j=a,b,c)为a,b,c日的溶解气体预测值所对应的基 本信度值,Belj为信度值对应的信度函数;
首先将a日和b日的信度函数通过D-S证据理论进行融合,融合过程如下:
m(y1)=ma(y1)mb(y1)/(1-K)
m(y2)=ma(y2)mb(y2)/(1-K)
m(y3)=ma(y3)mb(y3)/(1-K)
其中K表示证据冲突程度指数:
K=ma(y1)mb(y2)+ma(y1)mb(y3)+ma(y2)mb(y1)+ma(y2)mb(y3)
+ma(y3)mb(y1)+ma(y3)mb(y2)
然后将a日和b日合成后的信度函数再与c日的信度值进行二重融合,将结 果记为同时用m4(y1)、m4(y2)和m4(y3)作为对应的基本信度 值;
3.4),设三种预测模型对d日的预测结果分别为和则d日预测 数据融合的最终结果表示为
步骤4):结束。
所述多种智能预测算法包括BP神经网络、支持向量机和相关向量机。
所述多种气体包括:H2、CO、C2H2、C2H4、C2H6、CH4和/或CO2。
在实际运行中,变压器绝缘油和有机绝缘材料在电场及磁场(即电和热)的作 用下,会逐渐老化和分解,产生少量低分子烃类及二氧化碳、一氧化碳等气体, 并大量溶解在油中。当存在潜伏性过热故障或放电性故障时,这些气体的产生速 度和溶解在油中的数量也会增加,即故障气体的组成和含量与故障类型的严重程 度有密切关系,因此可以通过变压器油色谱分析对变压器的故障进行分析和预 测。
机译: 基于多维时间序列框架卷积LSTM的变压器DGA数据预测方法
机译: 一种基于逐步抛光获得的数据的电子设备剩余资源的预测方法
机译: 记录了一种基于数据库的数据关联方法和一种基于数据库的数据关联系统以及基于数据库的数据关联方法,并且计算机可读记录介质包括计算机可读记录介质。