首页> 中国专利> 一种基于D-S证据理论的变压器油色谱数据预测方法

一种基于D-S证据理论的变压器油色谱数据预测方法

页面导航

摘要
著录项
法律信息
说明书
相似文献

摘要

一种基于D-S证据理论的变压器油色谱数据预测方法。包括以下步骤：步骤1）：采集变压器油色谱数据中的多种气体浓度历史数据；步骤2）：以多种气体在某一时刻的浓度作为输入，以多种气体中的待预测气体在下一时刻的浓度作为输出，利用所采集的多种气体浓度历史数据作为训练样本集通过多种智能预测算法进行训练，并计算训练误差；步骤3）：利用D-S证据理论对步骤2）中所述的多个预测模型得到的预测结果进行权重提取和融合，得到待预测气体预测模型权重，最终得到预测值；步骤4）：结束。本发明利用D-S证据理论对多种方法获得的预测结果融合能力来对气体浓度进行预测，改善了变压器油色谱数据预测模型的精度和泛化能力，具有更高的预测精度。

著录项

公开/公告号CN103592374A

专利类型发明专利
公开/公告日2014-02-19

原文格式PDF
申请/专利权人国家电网公司;江苏省电力公司;江苏省电力公司扬州供电公司;
展开▼

申请/专利号CN201310576421.4
发明设计人邹展;陈付;潘晴宇;仇激文;陈英传;王群;范正勇;
展开▼

申请日2013-11-18
分类号G01N30/00(20060101);
代理机构32224 南京纵横知识产权代理有限公司;
代理人周全
地址 100031 北京市西城区西长安街86号
入库时间 2024-02-19 22:05:54

法律信息

法律状态公告日

法律状态信息

法律状态
2014-11-19

授权

授权
2014-03-19

实质审查的生效 IPC(主分类):G01N30/00 申请日:20131118

实质审查的生效
2014-02-19

公开

公开

说明书

技术领域

本发明涉及电力系统安全技术领域，尤其涉及对变压器油中的气体浓度进行预测的变压器油色谱数据预测方法。

背景技术

实际运行中，变压器绝缘油和有机绝缘材料在电场及磁场的作用下，会逐渐老化和分解，产生少量低分子烃类及二氧化碳、一氧化碳等气体，并大量溶解在变压器油中。当存在潜伏性过热故障或放电性故障时，这些气体的产生速度和溶解在油中的数量也会增加，即故障气体的组成和含量与故障类型的严重程度有密切关系。为此，检测变压器中的绝缘油的色谱情况是见识变压器安全运行的重要手段之一。

电力变压器是电力系统的重要设备之一，其正常运行对电网的安全稳定运行起着非常重要关键的作用。变压器油中溶解气体的含量是监督变压器运行状态的重要手段，因此，建立科学、准确度高和可操作性强的预测模型是变压器在线监测和故障诊断的重要手段，具有重要的技术和经济价值。

目前，常用的预测方法有BP神经网络，支持向量机等。预测模型可以由不同的方法建立，如神经网络，时间序列等方法。由于预测方法的原理和建模机制不同，这些方法的预测效果不完全相同。神经网络方法中BP神经网络的局部拟合能力较强，机器学习算法中支持向量机的整体逼近能力较强。在预测变压器油中溶解气体时，各种方法对各个时间段的预测精度也各不相同，因此，仅仅采用某一种方法进行预测，在某种程度上会降低预测精度。

发明内容

本发明针对以上问题，提供一种利用D-S证据理论对多种方法的综合能力，改善了变压器油色谱数据预测模型的精度和泛化能力的基于D-S证据理论的变压器油色谱数据预测方法。

本发明的技术方案：包括以下步骤：

步骤1）：采集变压器油色谱数据中的多种气体浓度历史数据；

步骤2）：以所述多种气体在某一时刻的浓度作为输入，以所述多种气体中的待预测气体在下一时刻的浓度作为输出，利用所采集的多种气体浓度历史数据作为训练样本集通过多种智能预测算法进行训练，并计算训练误差；

所述步骤2）按如下过程进行：

2.1），采集N种气体的浓度历史数据，将某一时刻的N种气体的浓度数据作为输入量，下一时刻的N种气体中的第n种气体浓度作为输出量，则训练样本集D_n可表示为： $D_{n} = {(x_{t}, y_{t + 1}^{n}), t = 1,2, L, T},$ n=1,2,L,N，x_t为 t时刻输入向量，其组成为：其中为t时刻第n种气体的浓度，为t+1时刻第n种气体的输出量，T为训练样本集中的样本总数；

2.2),将训练样本集D_n输入到各个智能预测算法中进行训练，得到各个智能预测算法对应的预测模型，以及训练误差，每个训练误差记作：

$e_{i} = \frac{{\hat{y}}_{i} - y_{i}}{y_{i}} (i = 1,2,3)$

式中，为预测值，y_i为真实值；

步骤3）：利用D-S证据理论对步骤2）中所述的多个预测模型得到的预测结果进行权重提取和融合，得到待预测气体预测模型权重，最终得到预测值；

所述步骤3）按如下过程进行：

3.1），首先提取融合样本的权重，

权重w_i可以表示为下面关于e_i的函数

$w_{i} = \frac{1 / (| e_{i} | + ϵ)}{Σ_{i = 1}^{3} 1 / (| e_{i} | + ϵ)} (i = 1,2,3)$

其中，ε的引入避免了相对误差为0，进而可得到组合预测结果Y：

$Y = Σ_{i = 1}^{3} w_{i} y_{i}$ 其中 $Σ_{i = 1}^{3} w_{i} = 1$

3.2），设y₁、y₂和y₃分别代表三种气体预测模型的预测值，w₁、w₂和w₃分别为相应的权重，在识别框架Θ={y₁,y₂,y₃}上建立基本信任分配函数m，其对应的信度值为

m(y_i)=w_i (i=1,2,3)

3.3），设m_j(y_i)(i=1,2,3;j=a,b,c)为a,b,c日的溶解气体预测值所对应的基本信度值，Bel_j为信度值对应的信度函数；

首先将a日和b日的信度函数通过D-S证据理论进行融合，融合过程如下：

m(y₁)=m_a(y₁)m_b(y₁)/(1-K)

m(y₂)=m_a(y₂)m_b(y₂)/(1-K)

m(y₃)=m_a(y₃)m_b(y₃)/(1-K)

其中K表示证据冲突程度指数：

K=m_a(y₁)m_b(y₂)+m_a(y₁)m_b(y₃)+m_a(y₂)m_b(y₁)+m_a(y₂)m_b(y₃)

+m_a(y₃)m_b(y₁)+m_a(y₃)m_b(y₂)

然后将a日和b日合成后的信度函数再与c日的信度值进行二重融合，将结果记为同时用m₄(y₁)、m₄(y₂)和m₄(y₃)作为对应的基本信度值；

3.4），设三种预测模型对d日的预测结果分别为和则d日预测数据融合的最终结果表示为

$y_{4} = m_{4} (y_{1}) \times y_{1}^{4} + m_{4} (y_{2}) \times y_{2}^{4} + m_{4} (y_{3}) \times y_{3}^{4};$

步骤4）：结束。

所述多种智能预测算法包括BP神经网络、支持向量机和相关向量机。

所述多种气体包括：H₂、CO、C₂H₂、C₂H₄、C₂H₆、CH₄和/或CO₂。

本发明利用D-S证据理论对多种方法获得的预测结果融合能力来对变压器油中的气体浓度进行预测，改善了变压器油色谱数据预测模型的精度和泛化能力。相比现有技术，本发明具有更高的预测精度。

附图说明

图1是本发明的原理框图，

图2是本发明的流程图，

图3是本发明中信息的不确定性用证据理论表示图，

图4是本发明中证据E₁的基本信任分配图，

图5是证据E₂的基本信任分配图，

图6是D-S证据理论中合成法则的表现形式图，

图7是BP神经网络结构示意图。

具体实施方式

下面结合附图对本发明的技术方案进行详细说明：

Dempster在20世纪70年代首先提出来证据理论的概念，Shafer在Dempster 的基础上提出了新的理论，因此通常把证据理论也简称D-S证据理论。证据理论主要采用信任函数来处理不确定性因素的，而不是采用确定的概率值。它已经在人工智能、检测诊断等方面得到了广泛的应用。

一、证据理论的基本概念

（一）识别框架

定义1：现在有一个需要判断的问题，用集合Θ来表示所有可能的答案，而且集合中的元素是两两相斥的；集合Θ中的某一个元素对应问题的一个答案，则称此集合Θ为识别框架，可以表示为

Θ={θ₁,θ₂,L,θ_j,L,θ_N}

式中，N是识别框架中元素的总个数，θ_j为其中的任一个元素， j=1,2,Λ,N。

幂集记作2^Θ，是所有子集在识别框架Θ中的集合，可表示为：

式中，表示空集；{θ_i∪θ_j}也可记为{θ_i,θ_j}，i,j∈[1,n]，且i≠j，依此类推。

（二）基本信任分配函数

定义2：设Θ为识别框架，基本信任分配函数m是从集合2^Θ到[0,1]的映射， A是识别框架Θ里的任一个子集，记作且满足

式中，m(A)称为事件A的基本信任分配函数。

对A的信度大小是通过基本信任分配函数来反映的。表示空集不产生信度；表示所有命题的信度和等于1。

（三）信任函数

证据建立时通过基本信任分配函数来对信任程度进行初始分配。若则意味这B在逻辑上包含于A，所以B所有命题的信度和是A的总信任。

定义3子集A是识别框架Θ中的任一集合，表示为同时满足

$Bel (A) = \underset{B \subseteq A}{Σ} m (B)$

则Bel(A)称为A的信任函数，Bel是一个从集合2^Θ到[0,1]的映射。

（四）众信任度函数

定义4设函数Q：2^Θ→[0,1]由下式定义，即有

$Q (A) = \underset{A ⋐ B}{Σ} m (B)$

则Q称为众信度函数。Q(A)称为A的众信度。

定义5设Bel是Θ上的信度函数，Q是它的众信度函数，那么，对有

$Bel = \underset{B ⋐ A}{Σ} {(- 1)}^{| B |} Q (B)$

$Q (A) = \underset{B ⋐ A}{Σ} {(- 1)}^{| B |} Bel (\overline{B})$

（五）似然函数

由于Bel(A)不能对怀疑A的程度进行反映，所以描述命题A的信任情况仅仅使用信任函数是不够的。因此，为了对A的信任进行全面描述，需要引入一个度量命题A程度的函数，即似然函数。

定义6子集A是识别框架Θ中的任一集合，表示为同时满足

$Pl (A) = 1 - Bel (\overline{A})$

函数Pl(A)表示不怀疑A的程度，称为似然函数，Pl是集合2^Θ到[0,1]的映射。对A的怀疑程度用函数表示。

似然函数与信任函数之间有一定的关系：

Pl(A)≥Bel(A)

证明：

$(\begin{matrix} Pl (A) - Bel (A) = 1 - Bel (\overline{A}) - Bel (A) \\ = 1 - [\underset{C \subseteq \overline{A}}{Σ} m (C) + \underset{B \subseteq A}{Σ} m (B)] \geq 1 - \underset{E \subseteq Θ}{Σ} m (E) = 1 - 1 = 0 \end{matrix})$

A是真的程度用Bel(A)表示，A是非假的程度用Pl(A)表示，可得 Pl(A)≥Bel(A)，则对A的上限和下限分别用Pl(A)和Bel(A)表示，记为 [Bel(A),Pl(A)]，这是命题A的不确定区间，如图3所示。

（六）两个证据的合成规则

假设E₁和E₂是识别框架Θ下的两个证据，A_i和B_j分别为焦元，m₁和m₂分别为对应的基本信任分配函数，分别用图4和图5来表示。图6是图4和图5 综合后得到的。

竖条和横条分别表示m₁和m₂在相应焦元上的基本信任分配值。交集是一个矩阵，其值为m₁(A_i)m₂(B_j)，Bel₁、Bel₂通过共同作用将m₁(A_i)m₂(B_j)分配到A_i∩B_j上。由于分配到空集上的分配值为0，所以这部分的基本信任分配值被丢弃，造成总信任值小于1，因此需要乘上一个系数来保证信度值总和为1.

定义7假定E₁和E₂两个证据属于识别框架Θ，A_i和B_j是相应的焦元，m₁和 m₂是相应的基本信任分配函数，设则D-S合成规则为

当时，m₁与m₂所对应的两个证据发生了冲突。K值与证据之间的冲突成正比关系，能够正确反映出冲突的程度，K值越大，冲突越大；反之亦然。

（七）多个证据的合成规则

定义8设同一个识别框架Θ上，n个基本信任分配函数分别为m₁,m₂,L,m_n， A_i(i=1,2,L,N)为相应的焦元，则D-S合成法则为

其中， $K = \underset{\cap A_{i} = A}{Σ} \underset{1 \leq i \leq N}{Π} m_{i} (A_{i})$

二、BP神经网络算法

BP神经网络是一种多层前馈神经网络，网络的核心算法是BP学习算法。 BP学习算法自从20世纪80年代提出来以后，得到了广泛的使用。常用的BP 网络都是由输入层、隐含层和输出层三层组成，如图7所示。

具体步骤如下：

设置网络各权值和阀值的初始值：w_ji(0)，θ_j(0)为小的随机变量。

输入训练样本：输入向量为X_k，k=1,2,Λ,P；期望输出为d_k， k=1,2,Λ,P。

计算网络隐含层的输出：

$o_{kj} = f_{j} (\underset{i}{Σ} w_{ji} o_{ki} + θ_{j})$

计算网络的训练误差

δ_kj=o_kj(1-o_kj)(t_kj-o_kj)，（输出层）

$δ_{kj} = o_{kj} (1 - o_{kj}) \underset{m}{Σ} δ_{km} w_{mj},$ （隐含层）

对权值和阀值进行修正：

w_ji(t+1)=w_ji(t)+ηδ_jo_ki+α[w_ji(t)-w_ji(t-1)]

θ_j(t+1)=θ_j(t)+ηδ_j+α[θ_j(t)-θ_j(t-1)]

当k从1至P后，判断指标是否满足精度要求：

E≤ε；ε：精度

结束。

（三）支持向量机方法

20世纪90年代，Vapnik提出了一种基于统计学习理论（Statistical Learning Theory，SLT）的机器学习算法——支持向量机。该算法实现风险最小化是通过寻找结构风险的最小化，同时学习的效果也比较好。SVM可以有效的避免过学习、维数灾、局部极小等问题。

SVM应用主要在模式识别，函数回归和概率密度估计方面。SVM与神经网络相比，具有很强的预测能力和较快的收敛速度，同时能够得到全局最优，因而在风速及风功率预测中的得到了广泛应用。

预测中常见的回归问题是给定样本{(x_i,y_i)}(i=1,2,3,Λ,m)，其中x_i为输入向量，而y_i为相应目标输出数据。常见的非线性回归思路是直接寻找y_i和x_i之间的非线性函数，难度很大，而SVM的计算是在高维空间里完成的^[59,60]：

式中，w为权值向量，而b为偏差，是两个待预测的参数，非线性函数φ(x) 是把输入向量映射到高维空间，它的选取一般是在几个模板之间进行选择试算得到。

SVM引入损失函数，不仅使得估计具有鲁棒性，而且使它是稀疏的。损失函数有很多种，这里主要采用ε-不敏感损失函数。因为该损失函数得到的展开式所需要的支持向量机数目最少，所以稀疏性更好。

ε-不敏感损失函数定义为

根据结构风险最小化原则，回归问题转化为：

$\min \frac{1}{2} {| | w | |}^{2}$

$s . t (\begin{matrix} y_{i} - w \cdot x_{i} - b \leq ϵ \\ w \cdot x_{i} + b - y_{i} \leq ϵ \end{matrix}) i = 1,2, L, n$

引入松弛因子ξ_i≥0和则上式变为：

$(\begin{matrix} y_{i} - w \cdot x_{i} - b \leq ϵ + ξ_{i} \\ w \cdot x_{i} + b - y_{i} \leq ϵ + {ξ_{i}}^{*} \end{matrix}) i = 1,2, L, n$

优化目标转变为：

$\min \frac{1}{2} {| | w | |}^{2} + C Σ_{i = 1}^{n} ξ_{i} + {ξ_{i}}^{*}$

其中，C>0，C表示对超出样本的惩罚程度，是一种惩罚函数。通过拉格朗日乘子把优化问题中的约束条件去掉

$(\begin{matrix} L (w, b, ξ, ξ^{*}) = \frac{1}{2} {| | w | |}^{2} + C Σ_{i = 1}^{n} (ξ_{i} + {ξ_{i}}^{*}) - \underset{i = 1}{Σ} α_{i} \cdot (ϵ + ξ_{i} - y_{i} + w \cdot x_{i} + b) \\ - \underset{i = 1}{Σ} α_{i}^{*} \cdot (ϵ + {ξ_{i}}^{*} + y_{i} - w \cdot x_{i} - b) - Σ_{i = 1}^{n} (η_{i} ξ_{i} + {η_{i}}^{*} {ξ_{i}}^{*}) \end{matrix})$

式中，是拉格朗日因子。L(w,b,ξ,ξ^*)分别对w，b，ξ，ξ^*求偏导并令其为零：

$(\begin{matrix} \frac{\partial L}{\partial w} = w - Σ_{i = 1}^{n} (a_{i} - a_{i}^{*}) \cdot x_{i} = 0 \\ \frac{\partial L}{\partial b} = Σ_{i = 1}^{n} (a_{i} - a_{i}^{*}) = 0 \\ \frac{\partial L}{{\partial ξ}_{i}} = C - α_{i} - η_{i} = 0 \\ \frac{\partial L}{{\partial ξ}_{i}^{*}} C - α_{i}^{*} - η_{i}^{*} = 0 \end{matrix})$

把式（4.19）代入式（4.18）把原问题转化成对偶问题：

$(\begin{matrix} \max & Σ_{i = 1}^{n} y_{i} (α_{i} - α_{i}^{*}) - ϵ Σ_{i = 1}^{n} (α_{i} + α_{i}^{*}) - \frac{1}{2} Σ_{i, j = 1}^{n} (α_{i} - α_{i}^{*}) (α_{j} - α_{j}^{*}) (x_{i} \cdot x_{j}) \\ s . t & (\begin{matrix} Σ_{i = 1}^{n} (α_{i} - α_{i}^{*}) = 0 & 0 \leq α_{i}, α_{i}^{*} \leq C, i = 1,2, L, n \end{matrix}) \end{matrix})$

解上述问题后，得到最优解后，通过最优解计算w和 b：

$(\begin{matrix} w = Σ_{i = 1}^{n} (α_{i}^{*} - α_{i}) x_{i} \\ b = y_{j} - Σ_{j = 1}^{n} (α_{j}^{*} - α_{j}) (x_{j} \cdot x_{i}) + ϵ \end{matrix})$

从而得到回归函数：

$f (x) = Σ_{i = 1}^{n} (α_{i} - α_{i}^{*}) (x_{i} \cdot x) + b$

如果问题是非线性的，那么可以通过非线性变换转化成线性问题。通过内积计算就可以实现对偶问题的寻优，所以在高维空间中不需要知道非线性的具体形式，这也是支持向量机的一个优点，即使用核函数K(x_i,x_j)实现非线性函数拟合，且计算复杂度没有增加。则最优化问题为：

$\max Σ_{i = 1}^{n} y_{i} (α_{i} - α_{i}^{*}) - ϵ Σ_{i = 1}^{n} (α_{i} + α_{i}^{*}) - \frac{1}{2} Σ_{i, j = 1}^{n} (α_{i} - α_{i}^{*}) (α_{j} - α_{j}^{*}) K (x_{i}, x_{j}) - - - (4.23)$

相应的回归函数为：

$f (x) = Σ_{i = 1}^{n} (α_{i} - α_{i}^{*}) K (x_{i}, x) + b$

（三）相关向量机

Michael E.Tipping在支持向量机预测函数基础上，以基于概率学习的贝叶斯学习理论提出了更实用的算法模型：相关向量机。与支持向量机相比，具备支持向量机所没有的优点：（1）相关向量的数目远远小于支持向量，具有高稀疏性；（2）仅有核参数的设置，可节约训练时间；（3）核函数无需满足Mercer条件，增加的核函数选择的灵活性。

对于给定的训练样本输入集和对应的输出集相关向量机回归模型可定义为：

$t_{i} = Σ_{i = 1}^{N} ω_{i} K (x, x_{i}) + ω_{0} + ϵ$

其中ε为服从N(0,σ²)分布的各独立样本误差，ω_i为权系数，K(x,x_i)为核函数，N为样本数量。

对于相互独立的输出集整个样本的似然函数为：

$(\begin{matrix} p (t | w, σ^{2}) = Π_{i = 1}^{N} N (t_{i} | y (x_{i}; w), σ^{2}) \\ = {(2 π σ^{2})}^{- N / 2} \exp (- | | t - Φ (x) w | | / {2 σ}^{2}) \end{matrix})$

其中：t=(t₁,t₂,Λt_N)^T，w=[ω₀,ω₁,ω₂,Λ,ω_N]^T，

由概率预测公式，所求的条件概率为：

P(t_*|t)=∫p(t_*|w,σ²)p(w,σ²|t)dwdσ²

为了避免直接使用最大似然方法求解w和σ²而带来的过适应现象，根据贝叶斯理论，引入先决条件：w的分布为零均值的标准正态分布。同时引入超参数 α=[α₀,α₁,α₂,Λ,α_N]^T，可得：

$p (w | α) = Π_{i = 0}^{N} N (ω_{i} | 0, α_{i}^{- 1})$

因此，条件概率预测公式可改写为：

P(t_*|t)=∫p(t_*|w,σ²)p(w,α,σ²|t)dwdαdσ²

其中α_i为权值ω_i对应的超参数。对每个权值限定先决条件的方法，是相关向量机的一个重要特征，由于自动相关决定先验理论，在经过足够多的更新后，大部分超参数会趋向于无穷大，而与其对应的权值为0，这就保证了相关向量机的高稀疏性。

对于改写后的概率预测式，根据贝叶斯理论对其进行整理，可得权值的后验分布概率密度为：

p(w|t,α,σ²)=(2π)^-(N+1)/2|Ψ|^-1/2

·exp{-[(w-μ)^TΨ^-1(w-μ)]/2}

其中Ψ=(σ^-2Φ^TΦ+A)^-1，μ=σ^-2ΨΦ^Tt，A=diag(α₀,α₁,Λ,α_N)。

最后使用最大似然方法可得到估计超参数α和方差σ²。

若给定输入值x^*，则相应的输出概率分布服从高斯分布，其相应的预测值为：

y^*=Φ(x^*)μ

由于单个预测模型往往很难达到理想的精度，预测结果还具有不确定性和片面性，因此，如何融合单一方法的优点来进行预测成为今年来的一个研究热点。

考虑到各种不同方法的预测不确定性对结果的影响，提出一种基于D-S证据理论的变压器油中溶解气体预测模型，首先分别采用BP神经网络、支持向量机和相关向量机对溶解气体含量进行预测，而后通过对预测误差进行分析，借助 D-S证据理论对三种模型进行融合，选择待测日前几日的溶解气体数据作为融合样本，计算出相应的基本信任分配函数，同时将函数进行融合，融合结果作为预测模型的权重，最终得到溶解气体的预测结果。

本发明方法的流程如图1-2所示，包括以下步骤：