法律状态公告日
法律状态信息
法律状态
2012-01-25
未缴年费专利权终止 IPC(主分类):G05B13/04 授权公告日:20100707 终止日期:20101122 申请日:20071122
专利权的终止
2010-07-07
授权
授权
2008-06-25
实质审查的生效
实质审查的生效
2008-04-30
公开
公开
技术领域
本发明属于故障检测与诊断技术领域,提出了一种基于核主元分析贡献图的非线性过程 故障辨识方法。
背景技术
近十年里,多变量统计方法在包括故障检测和故障诊断的过程监控中已经得到了迅速的 发展。如主元分析(PCA),偏最小二乘(PLS),独立元分析(ICA)和支持向量基(SVM) 等已经在工业过程中得到了广泛的应用。但是这些方法主要解决线性变化问题,基于这些方 法的过程监控一般假定过程为线性的,而实际的工业过程都存在不同程度的非线性变化。对 于非线性变化较强的过程,应用这些方法进行在线监控将产生较高的误报率。为了解决观测 数据的非线性问题,人们就提出了一系列的非线性方法。如一种基于主曲线和神经网络的非 线性PCA、一种基于自联想的五层神经网络的非线性PCA以及基于输入训练神经网络的非线 性PCA方法等。但是大部分现有的非线性PCA方法都是基于神经网络,必须离线训练,要 计算主元的话也必须解决非线性最优化问题。
最近,由Schlkopf等人首次在《Neural Computation》提出一种新的PCA的非线性扩展, 即核主元分析(KPCA)。核主元分析是首次通过非线性函数把输入空间映射成特征空间,接 着在特征空间中提取主元。它通过引入一个核函数避免执行非线性映射和在特征空间中计算 内积。同其他非线性方法相比,它主要的优点是不涉及非线性最优化问题,本质上仅需要线 性代数,使用起来同PCA一样简单。但是在KPCA的训练过程中核矩阵的大小是样本数量的 平方,当样本数变大,特征值和特征向量的计算就变的很费时间。而且对于现有的KPCA,故 障变量的分离和故障的识别仍然是个问题。在PCA方法中,故障变量和监控量之间存在一定 的线性关系,可以比较容易的计算变量贡献用于绘制贡献图。如Qin在《JOURNAL OF CHEMOMETRICS》中所提出的在输入空间基于重构的贡献图方法。而对于KPCA,由于输 入空间到特征空间的非线性映射函数未知,因此类似PCA中的贡献图无法直接用于KPCA的 故障变量辨识。
发明内容
针对上述现有技术存在的不足,本发明提供了一种基于改进的核主元分析的非线性过程 故障辨识方法。它在原始KPCA的基础上进行了以下两方面的改进:
1)提出了特征空间基的概念,通过提取基来减少了数据映射到特征空间后的线性冗余, 以及在训练样本数量很大的时候减少KPCA的计算量;
2)提出了基于重构的故障辨识策略,首次通过基于重构的贡献图来辨识过程中各变量失 控对故障产生所承担的责任。
本发明的故障诊断方法包括如下步骤:
步骤一、采集数据
采集过程相关变量的数据,并对其进行中心化和归一化,即规范化处理。
步骤二、提取特征空间的基
根据特征因子依次判断规范化后的数据与基中数据的线性关系,并去除线性关系较强的 数据,其余数据加入基中,最后得到基Ω。为了获得一个能够代表特征空间所有信息的特征 空间的基,本发明采用基于几何学思想的方法。假定
其中
当差值ηi等于0时,则
通过对方程(2)的最小化求解得到
学习的开始,基中只有一个数据点,即
根据方程(1)和(2)定义特征因子
其中
本发明引入核技巧k(x,y)=(Φ(x),Φ(y)),从而特征空间的特征提取转化为在输入空间进 行计算,方程(4)和方程(5)分别转化为
因此,通过方程(6)和(7),即可在输入空间确定最终的基。学习的开始基中只有一个数 据即
步骤三、提取非线性主元
KPCA把标准PCA扩展到了非线性数据分布。KPCA的基本思想是通过非线性映射把输 入空间的观测数据x映射到特征空间F,接着在特征空间F执行线性PCA。在执行PCA之前, 将Ω中的观测数据xk∈Rm,k=1,2,…,N,映射到一个高维特征空间F
xk→Φ(xk) (8)
假定
对协方差进行特征分解
λv=CFv (10)
其中特征值λ≥0,v∈F≠{0}是λ对应的特征向量。这里,CFv能够表示如下:
其中<x,y>表示x和y之间的内积。因此λv=CFv等价于
λ<Φ(xk),v>=<Φ(xk),CFv>,k=1,2,…,N (12)
且存在系数αi(i=1,2,…,N)使得
结合方程(12)和(13),得到
其中所有k=1,2,…,N。通常,尽管映射函数Φ(·)存在,但计算上并不容易处理。然而,它不 需要明确被计算,仅仅需要知道特征空间中两个向量的内积。通过引入核函数 k(x,y)=<Φ(x),Φ(y)>避免了执行非线性映射以及在特征空间计算两者的内积。
现在,定义一个N×N维的核矩阵K
[K]ij=Kij=(Φ(xi),Φ(xj))=k(xi,xj) i=1,2,…,N,j=1,2,…,N (15) 那么方程(14)的左边能够表示为
由于k=1,2,…,N,方程(16)转化为λKα。方程(14)的右边能够表示为
由于k=1,2,…,N,方程(17)转化为(1/N)K2α。结合方程(16)和(17),得到
λNKα=K2α (18)
其中系数α=[α1,…,αN]T。方程(18)的求解转化为下式特征向量的求解
Nλα=Kα (19)
在应用KPCA之前,应先执行高维空间中的中心化。核矩阵K中心化如下
其中
因此方程(19)转化为
现在,在特征空间执行PCA等价于求解方程(21)。求解后得到特征值λ1≥λ2≥…≥λN对应 的特征向量α1,α2,…αN。通过仅保留前p个特征向量来降低问题的维数。按特征空间F中相 应向量归一化的要求对α1,α2,…αp进行归一化,即,
<vk,vk>=1,k=1,2,…,p (22)
利用
式中αik,αjk——分别表示第k个特征向量αk的第i行和第j行的值。 通过把Φ(x)投影到特征空间F中的特征向量vk上,其中k=1,2,…,p,任意数据x的非线性 主元t计算如下
式中k-k=1,2,…,p;
x-要进行非线性主元提取的数据;
xi-训练数据中的第i个数据,i=1,2,…,N;
是中心化核向量的第i个值,
其中
步骤四、故障检测
利用Hotelling的T2统计和平方预测误差(SPE)统计进行故障检测,通过控制图即可判 断出是否发生故障,当T2统计和SPE统计超出各自的控制限时,认为有故障发生,反之,整 个过程正常。
Hotelling的T2统计量和平方预测误差(SPE)统计量的计算如下
T2=tTΛ-1t=[t1,t2,…,tp]Λ-1[t1,t2…,tp]T (25)
其中tk(k=1,2,…,p)由方程(24)决定,Λ-1是训练数据前p个最大正特征值的对角阵的逆。
T2的100α%控制限是利用F分布获得的
其中F(p,n-1,α)是自由度为p和n-p的F分布的上限100α%的临界点。
SPE的100(1-α)%控制限是
其中
且cα是上限100(1-α)%相应的正常偏差。m表示特征空间有效的维数。
步骤五、故障辨识
本发明在特征空间提出了一种KPCA技术的故障识别方法,即贡献图方法。一旦检测到 故障发生,采用贡献图进行故障辨识,对过程的每个变量计算其贡献图和控制限,通过贡献 图和控制限的关系即可判断出各变量失控对故障的发生所承担的责任。
按照每个已知故障的方向重构故障。首次提出基于重构的非线性贡献图。当Ξi被假定为 输入空间的故障方向,Φ(Ξi)是特征空间的故障方向,他们并不一定是真实的故障,可能是 也可能不是,因而,按照Φ(Ξi)方向定义重构的测量向量如下
其中均值和修正系数fi为
其中
式中
因此
且重构的残差向量变为
故障重构的残差向量根据故障自由残差测量可以表示为
其中是假定的实际故障,即
和
因此SPE指标就被引入了控制限δ2,得到
从方程(31)中,残余子空间的大量修正是因而,通过SPE的重构定义贡献图为
方程(42)取代了方程(36),得到
令
其中
考虑到自由故障测量变量服从正态分布且基于重构的分布在二次型中定义,则基于重构 的SPE贡献图的控制限定义如下
其中
式中S是x的协方差矩阵。
利用矩阵轨迹特性,可以把方程(48)和(49)重新排列为
方程(50)和(51)括号里的项都是标量且能够根据迹的运算求出。由以上得出
因此,δi2表示为:
通过各变量的贡献图SPE_t和对应的控制限δi2,就可判断出各变量对故障所承担的责任。当
具体操作步骤如下:
一、离线训练
(1)采集数据,并进行规范化处理;
(2)对规范化后的数据进行特征提取,得到基Ω;
(3)根据方程(15)对基Ω中的数据计算核矩阵K;
(4)根据方程(20)在特征空间执行中心化,得到中心化核矩阵
(5)根据方程(21)求解特征向量,并根据方程(23)对前p个最大正特征值所对应的特征 向量进行归一化;
二、在线监测
(6)获得新数据,并对它进行规范化得到xt∈Rm,由[kt]i=[kt(xt,xi)]计算核向量kt∈R1×N,
其中xi是被规范化的标准操作数据。xi∈Rm,i=1,2,…,N;
(7)计算中心化核向量如下:
其中K由离线建模的第(3)步确定,1t=(1/I)[1,…,1]∈R1×N;
(8)计算非线性主元
(9)计算新数据的检测统计量
(10)确定统计量的控制限;
(11)计算SPE贡献图;
(12)确定SPE贡献图的控制限。
以美国ROCKWELL公司的可编程控制器(PLC)实现基础控制,监控程序用RSView32 提供的VBA应用软件编制。RSLinx与监控程序之间通过DDE方式进行双向通讯。把故障辩 识结果输出到计算机的系统管理画面,同时把故障辩识得到的变量保存到实时数据库中,为 操作者或相关技术工人进行监督操作提供参考指导作用。
本发明——基于改进的核主元分析的非线性过程故障辩识方法的优越性表现为:
1)提出一种新的特征空间基的提取方法;
2)基于重构的故障辩识方法克服了输入空间和特征空间不能自由转换所带来的故障辩识的 困难。
附图说明
图1田纳西-伊斯曼过程示意图;
图中:1,2,3,4,5,6,7,8,9,10,11,12,13分别表示为:流1,流2,流3,流4,流5,流6,流 7,流8,流9,流10,流11,流12,流13;FC:流量控制;FI:流量指示器;PI:压力指 示器;PHL:压力控制;SC:同步回旋加速器;TC:温度控制;TI:温度指示器;LI:液位 指示器;LC:液位控制。XC:成分控制;XA,XB,XD,XE分别是成分A分析,成分B 分析,成分D分析,成分E分析。
图2田纳西-伊斯曼过程中故障10基于原始KPCA的监测结果;
图3田纳西-伊斯曼过程中故障10基于改进的KPCA的监测结果;
图4田纳西-伊斯曼过程中故障10基于735次采样的改进的KPCA的贡献图;
图5田纳西-伊斯曼过程中故障10基于785次采样的改进的KPCA的贡献图;
图6本发明方法实现的流程图。
具体实例
田纳西-伊斯曼过程
本发明方法应用到了田纳西-伊斯曼过程仿真数据中,并同原始KPCA的检测结果进行 对比。田纳西-伊斯曼过程是一个复杂非线性的过程,它是由Eastman化学品公司所创建, 其目的是为评价过程控制和监测方法提供一个真实的工业过程。控制结构如图1所示。过程 包括五个主要单元:反应器,冷凝器,压缩机,分离器,汽提塔;而且,它包含了八种成分: A,B,C,D,E,F,G和H。四种反应物A,C,D以及E和惰性成分B一起被加进反应器里, 形成产品G和H,还有副产品F。田纳西-伊斯曼过程包括22个连续过程测量,12个控制变 量,和19个成分测量。如表1所示。除了反应器的搅拌器的搅动速度(因为没有对它进行控 制),共52个观测变量用于本研究的监测。过程包括21个预设定的故障,如表2所示。本实 例针对故障10进行分析说明。在故障10的情况中,流4的C进料温度是随机变化的。当故 障发生时,汽提塔的温度也发生变化,因而导致了汽提塔压力的变化。为了弥补汽提塔温度 和压力的变化,汽提塔蒸汽阀通过一个控制回路来控制,从而汽提塔蒸汽流率也改变了。
表1.田纳西-伊斯曼过程中的监测变量
表2.田纳西-伊斯曼过程的过程故障描述
步骤一、采集数据
对于训练数据和实时工况数据采用了三分钟的采样间隔采集数据。故障10的训练数据由 480个观测数构成,实时工况数据由960个观测数构成。开始时都是没有故障的,训练数据 中,故障都是在第20次采样时引入,实时工况数据中,故障都是在第160次采样引入的。训 练数据和实时工况数据中的数据都包含了52个观测变量。随机选取了故障10的训练数据和 实时工况数据中控制变量的5组数据分别如表3和表4所示。采集数据后再对其进行规范化 处理。
表3.故障10训练数据中控制变量的五组数据
表4.故障10实时工况数据中控制变量的五组数据
步骤二、提取特征空间的基
对规范化后的训练数据进行特征空间基的提取,本例核函数采用3次多项式核函数 k(x,y)=(x·y+1)3,γ0=0.05。学习的开始基中只有一个数据点Φ1={x1},引入数据x2,根据 方程(6)和(7)计算S2,当
步骤三、提取非线性主元
选取径向基核函数
参数都确定之后,就可以对规范化后的新数据进行非线性主元提取,根据公式 [kt]i=[kt(xt,xi]计算新数据的核向量,其中xt是规范化后的新数据,xi是训练数据, i=1,2,…,316。然后根据方程(55)对其进行了中心化处理,得到中心化核向量最后根 据方程(56)计算得到新数据的非线性主元。
步骤四、故障检测
首先通过SPE统计量对田纳西-伊斯曼过程进行检测,根据方程(58)计算SPE统计, 接着根据方程(28)确定它的控制限,得到改进的KPCA对田纳西-伊斯曼的监测结果如图3 所示,从图中看出SPE统计量在大约170s检测到故障。本发明还利用原始KPCA对故障进 行检测,原始KPCA也是在大约170s检测到故障,延时时间是10s。如图2所示。由此可以 得出,改进的KPCA能达到原始KPCA同样的效果,但改进的KPCA检测结果基于了更少的 样本,减少了计算量。
步骤五、故障辨识
由步骤四的结果得知检测到故障发生,因此采用SPE贡献图确定哪些变量引起了故障的 发生。针对每个变量分别计算它们的贡献图和控制限,本发明随机选取了第735次采样的数 据对各变量进行计算,首先,对第一个变量A进料(流1)进行计算,看看它对故障所承担的责 任,假定故障方向Ξ1=(1,0,0,…,0)T∈R52,根据方程(43)和(54)分别计算得到A进料(流 1)的SPE_t和控制限δ12;接着对第二个变量D进料(流2)进行计算,看看它对故障所承担的责 任,假定故障方向Ξ2=(0,1,0,…,0)T∈R52,根据方程(43)和(54)分别计算得到D进料(流 2)的SPE_t和控制限δ22;按此方法依次对田纳西-伊斯曼的52个变量进行计算,得到贡献图 如图4所示。当各变量的SPE_t>δ2时,那么此变量要对故障的发生承担一定的责任,根据 SPE_t-δ2的大小判断责任的轻重。从图中可以看出第1-6,8-13,15-17,19,21,22,24,28,30, 32,46-48,52个变量失控。接着又随机选取了第785次采样的数据对个变量进行计算,用上面 同样的方法,得到结果如图5所示。从图中知道第1-17,19,21,22,24-26,28,30-33,38,43, 45-48,52个变量失控。因此,通过此方法就可以很明显的从图中看出各变量对故障的发生所 要承担的责任,就不用盲目的对整个过程的所有变量进行检查。
通过上面的实例,表明了本发明——基于改进的核主元分析的非线性过程故障辨识方法的 有效性以及同原始KPCA相比的优越性。它不仅实现了故障的检测,还辨识出各变量失控对 故障所承担的责任,减少了设备维修的盲目性。
机译: 基于图的服务故障分析
机译: 用于检测电缆中软故障的方法,该方法基于反射图的积分
机译: 基于故障运行场的总厚度图