首页> 中国专利> 基于vine copula相关性描述的多模态过程故障检测方法及系统

基于vine copula相关性描述的多模态过程故障检测方法及系统

摘要

本发明揭示了一种基于vine copula相关性描述的多模态过程故障检测方法及系统,检测方法包括:根据专家知识或是采用聚类方法,得到不同模态下正常数据的训练样本集;利用C-vine copula进行相关性建模,获得各模态的联合概率密度函数;采用马尔科夫蒙特卡洛方法对不同模态的联合概率密度函数进行抽样,计算各样本的联合概率密度函数值;根据控制限确定离散化步长l,并利用密度分位数法构建过程的静态密度分位数表;通过查表的方式估计t时刻监控数据在模态k下的广义局部概率指标;采用贝叶斯推理计算广义BIP指标,通过判断该指标是否超限,以此完成实时过程监控。

著录项

  • 公开/公告号CN104914775A

    专利类型发明专利

  • 公开/公告日2015-09-16

    原文格式PDF

  • 申请/专利权人 华东理工大学;

    申请/专利号CN201510323082.8

  • 申请日2015-06-12

  • 分类号G05B19/048(20060101);

  • 代理机构31213 上海新天专利代理有限公司;

  • 代理人王敏杰

  • 地址 200237 上海市徐汇区梅陇路130号

  • 入库时间 2023-12-18 10:50:22

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2019-05-31

    未缴年费专利权终止 IPC(主分类):G05B19/048 授权公告日:20170531 终止日期:20180612 申请日:20150612

    专利权的终止

  • 2017-05-31

    授权

    授权

  • 2015-10-14

    实质审查的生效 IPC(主分类):G05B19/048 申请日:20150612

    实质审查的生效

  • 2015-09-16

    公开

    公开

说明书

技术领域

本发明属于故障检测技术领域,涉及一种故障检测方法,尤其涉及一种基于vine copula相关性描述的多模态过程故障检测方法;同时,本发明还涉及一种基于vine copula相关性描述的多模态过程故障检测系统。

背景技术

随着社会的快速发展,人们对化工产品的需求无论是从质还是量上都有很大提高,这促使化工生产过程朝着大型化、综合化和复杂化的方向发展。然而,在化工行业快速增长、多元化发展的同时,化工生产却面临着安全基础薄弱的挑战。化工生产通常具有高温高压、有毒有害以及易燃易爆的特点。当生产过程受到强干扰或者误操作等因素影响,有可能导致化工事故,造成重大经济损失、人员伤亡、环境污染。为此,对大型化工过程,尤其是多模态化工过程的实时监控就显得非常必要了。

目前来看,大多数的多元统计过程监控方法主要利用降维、去耦合思想(如PCA,PLS,ICA等)实现对过程变量的实时监控。但是当过程体现为高度非线性性与非高斯性时,往往会出现信息的显著缺失并直接影响到最终的监控效果。因此,本发明从直接刻画高维数据复杂相关性的角度出发,引入copula理论实现对高维数据的相关性建模。更为精确的统计模型能够保证复杂化工过程监控效果的显著提升。

传统的copula在刻画高维数据相关性时存在参数优化过程复杂性问题。有鉴于此,如今迫切需要设计一种新的故障检测方式,以便克服现有方式的上述缺陷。

发明内容

本发明所要解决的技术问题是:提供一种基于vine copula相关性描述的多模态过程故障检测方法,可克服传统降维思想引起的信息损失问题,并实现了对存在非线性、非高斯的多模态复杂化工过程的实时监控。

此外,本发明还提供一种基于vine copula相关性描述的多模态过程故障检测系统,可克服传统降维思想引起的信息损失问题,并实现了对存在非线性、非高斯的多模态复杂化工过程的实时监控。

为解决上述技术问题,本发明采用如下技术方案:

一种基于vine copula相关性描述的多模态过程故障检测方法,所述方法包括如下步骤:

步骤S1、根据专家知识或是采用聚类方法,得到不同模态下正常数据的训练样本集;

步骤S2、利用C-vine copula进行相关性建模,获得各模态的联合概率密度函数;

步骤S3、采用马尔科夫蒙特卡洛方法对不同模态的联合概率密度函数进行抽样,计算各样本的联合概率密度函数值;

步骤S4、根据控制限确定离散化步长l,并利用密度分位数法构建过程的静态密度分位数表;

步骤S5、通过查表的方式估计t时刻监控数据在模态k下的广义局部概率指标 PL(k)(Xtmonitor);

步骤S6、采用贝叶斯推理计算广义BIP指标,通过判断该指标是否超限,以此完成实时过程监控。

作为本发明的一种优选方案,所述步骤S2通过以下四个子步骤获得各模态的联合概率密度函数:

步骤2.1、构建copula对的解析模型,见式(1):

f(x)=Πt=1nft(xt)×Πi=1n-1Πj=1n-ici,i+j|1:i-1(F(xi|x1,...,xi-1),F(xi+j|x1,...,xi-1);θi,i+j|1:i-1)---(1)

其中

n为随机向量x的维数,

f(x)为随机向量x的联合概率密度函数,

ft(xt)为随机变量xt的概率密度函数,

F(xi|x1,…,xi-1)为随机变量xi的累积条件分布函数,

ci,i+j|1:i-1为二元copula的密度函数,

θi,i+j|1:i-1为二元copula密度函数中的待优化参数;

步骤2.2、利用式(2)选择合适结构的C-vine copula模型:

i^=argmaxiΣj=1n|τi,j|(i=1,2,...,n)---(2)

其中

τi,j为随机变量xi与xj的Kendall秩相关系数;

步骤2.3、采用迭代策略计算式(1)中的累积条件分布函数,见式(3):

F(xi|xj,x~)=F(xj|x~)Cxi,xj|x~(F(xi|x~),F(xj|x~);θxi,xj|x~)---(3)

其中

表示随机向量x中不包括xi与xj的所有元素集合,

为二元copula的分布函数; 

步骤2.4、采用基于最大伪似然的Akaike准则优化式(1)中不同二元copula的结构与参数:

(θ^i,i+j|1:i-1,γ^i.i+j|1:i-1)=argmaxθi,i+j|1:i-1γi,i+j|1:i-1{Σk=1Mlog[c(Fk(xi|x1,...,xi-1),Fk(xi+j|x1,...,xi-1);θi,i+j|1:i-1,γi,i+j|1:i-1)]-λ}---(4)

其中,

θi,i+j|1:i-1为二元copula的参数,

γi,i+j|1:i-1为二元copula的结构(copula族),

λ为二元copula中待估参数的个数,

Fk(xi|x1,…,xi-1)为累积条件分布函数F(xi|x1,…,xi-1)的第k个观测值;

由于各二元copula参数θi,i+j|1:i-1存在不同的取值范围,因此采用L-BFGS-B算法求解以式(4)为目标函数,以θi,i+j|1:i-1实际取值范围为约束的优化问题,具体为1至2维优化问题。

作为本发明的一种优选方案,所述步骤S4具体包括:对于某设定好的控制限CL,离散化步长l应满足:

l11-CL---(5)

利用步骤S3中获得的样本概率密度函数值并结合离散化步长l,计算不同离散化区间端点δj/l(置信水平)处的分位数值qδj/l,从而构建出多模态过程的静态密度分位数表。

作为本发明的一种优选方案,所述步骤S5中构建的广义局部概率指标满足:

PL(k)(Xtmonitor)=Pr(f(k)(X)f(k)(Xtmonitor))---(6)

为估计式(6)中的结合步骤(4)中的静态密度分位数表,若满足:

f(k)(Xtmonitor)[qδj/l,qδ(j+1)/l]---(7)

则有:

PL(k)(Xtmonitor)[1-δ(j+1)/l,1-δj/l]---(8)

作为本发明的一种优选方案,所述步骤S6中广义BIP指标的构建公式为:

BIP=Σk=1KP(Ck|Xtmonitor)PL(k)(Xtmonitor)---(9)

其中,为通过贝叶斯推理得到的当前样本数据属于f(k)(x)的后验概率。

一种基于vine copula相关性描述的多模态过程故障检测方法,所述方法包括如下步骤:

步骤S1、获取不同模态下正常数据的训练样本集;

步骤S2、进行相关性建模,获得各模态的联合概率密度函数;

步骤S3、对不同模态的联合概率密度函数进行抽样,计算各样本的联合概率密度函数值;

步骤S4、根据控制限确定离散化步长l,并利用密度分位数法构建过程的静态密度分位数表;

步骤S5、通过查表的方式估计t时刻监控数据在模态k下的广义局部概率指标 PL(k)(Xtmonitor);

步骤S6、采用贝叶斯推理计算广义BIP指标,通过判断该指标是否超限,以此完成实时过程监控。

一种基于vine copula相关性描述的多模态过程故障检测系统,所述系统包括:

训练样本集获取模块,用以获取不同模态下正常数据的训练样本集;

联合概率密度函数获取模块,用以进行相关性建模,获得各模态的联合概率密度函数;

联合概率密度函数值计算模块,用以对不同模态的联合概率密度函数进行抽样,计算各样本的联合概率密度函数值;

静态密度分位数表构建模块,用以根据控制限确定离散化步长l,并利用密度分位数法构建过程的静态密度分位数表;

概率指标估算模块,用以通过查表的方式估算t时刻监控数据在模态k下的广义局部概率指标

实时过程监控模块,采用贝叶斯推理计算广义BIP指标,通过判断该指标是否超限,以此完成实时过程监控。

本发明的有益效果在于:本发明提出的基于vine copula相关性描述的多模态过程故障检测方法及系统,可克服传统降维思想引起的信息损失问题,并实现了对存在非线性、非高斯的多模态复杂化工过程的实时监控。

本发明从一个全新的视角——直接刻画高维数据的复杂相关性,实现了对高度非线性性、非高斯性过程的故障检测。在保证实时检测的前提下,该方法较之于传统的故障检测方法(如GMM)具有更低的误报率与漏报率。

本发明引入了vine copula实现复杂化工过程的故障检测。Vine copula作为近些年兴起的一类copula,广泛应用于金融、经济、环境科学等领域。由于vine copula能够将高维数据的相关性问题转化为稀疏矩阵内有限个二元copula的优化问题,显著降低了模型中参数求解的复杂度;同时,基于其高度灵活的结构特点,vine copula能够准确刻画体现为高度非线性性与非高斯性的复杂化工过程,该方法尤其对于含尾偏特性数据具有显著优势。另外,构建的广义局部概率指标能够有效度量样本数据到不同非高斯模态的距离,同时,采用查表的方式实现对广义BIP监控指标的快速计算,该发明不仅能够保证离线建模具有较低的计算复杂度,同时也能够实现对多模态化工过程的实时在线监控。

附图说明

图1为根据本发明的静态密度分位数表(l=20)示意图。

图2为在本发明下TE过程模态一与模态三的离线建模时间示意图。

图3为本发明故障检测方法的流程图。

具体实施方式

下面结合附图详细说明本发明的优选实施例。

实施例一

请参阅图3,本发明揭示了一种基于vine copula相关性建模与贝叶斯推断的多模态化工过程故障检测方法,具体步骤如下:

【步骤S1】根据专家知识或是采用聚类方法,得到不同模态下正常数据的训练样本集。

【步骤S2】利用C-vine copula进行相关性建模,获得各模态的联合概率密度函数。

对于n维随机向量x=[x1,x2,…,xn]T,其C-vine模型(x的联合概率密度函数)为:

f(x)=Πt=1nft(xt)×Πi=1n-1Πj=1n-ici,i+j|1:i-1(F(xi|x1,...,xi-1),F(xi+j|x1,...,xi-1);θi,i+j|1:i-1)---(1)

其中n为随机向量x的维数,ft(xt)为随机变量xt的概率密度函数,F(xi|x1,…,xi-1)为随机变量xi的累积条件分布函数,ci,i+j|1:i-1为二元copula的密度函数,θi,i+j|1:i-1为二元copula密度函数中的待优化参数。

为了获得(1)式中最合适的C-vine结构,根据不同变量的Kendall秩相关系数的影响程度确定C-vine copula树中的变量根节点,即优化如下目标函数实现:

i^=argmaxiΣj=1n|τi,j|(i=1,2,...,n)---(2)

其中,τi,j为随机变量xi与xj的Kendall秩相关系数。

设定各随机变量xi(i=1,2,…,n)边缘累积分布函数的初始值Fi(xi),根据式(3)并采用迭代策略计算式(1)中涉及到的所有累积条件分布函数值。

F(xi|xj,x~)=F(xj|x~)Cxi,xj|x~(F(xi|x~),F(xj|x~);θxi,xj|x~)---(3)

其中,表示随机向量x中不包括xi与xj的所有元素集合,为二元copula的分布函数。

利用(3)式中的条件分布函数值与边缘累积分布函数初始值分别对C-vine copula模型中的n(n-1)/2个二元copula的结构域参数进行优化,优化准则为极大伪似然的Akaike准则:

(θ^i,i+j|1:i-1,γ^i.i+j|1:i-1)=argmaxθi,i+j|1:i-1γi,i+j|1:i-1{Σk=1Mlog[c(Fk(xi|x1,...,xi-1),Fk(xi+j|x1,...,xi-1);θi,i+j|1:i-1,γi,i+j|1:i-1)]-λ}---(4)

其中,M为训练样本数,θi,i+j|1:i-1为二元copula的参数,γi,i+j|1:i-1为二元copula的结构(copula族),λ为二元copula中待估参数的个数,Fk(xi|x1,…,xi-1)为累积条件分布函数F(xi|x1,…,xi-1)的第k个观测值。由于各二元copula参数θi,i+j|1:i-1存在不同的取值范围,因此采用L-BFGS-B算法求解以式(4)为目标函数,以θi,i+j|1:i-1实际取值范围为约束的优化问题(一般为1至2维优化问题)。

【步骤S3】采用马尔科夫蒙特卡洛方法对不同模态的联合概率密度函数进行抽样,计算各样本的联合概率密度函数值。

采用逐分量的Metropolis-Hasting(M-H)算法构造马氏链,进而获得不同模态分布的样本数据,具体分为四步:

(1)指定初始值以保证构造的马氏链具有较高的收敛速度。

(2)定义关于的提议分布,选择高斯分布:

f(xt*)=12πσt*exp(-(xt*-μt*)22σt*2)---(5)

其中和分别表示提议分布的期望和标准差。满足:其中表示第(h-1)th次迭代的马氏链的状态值。的设定应保证马氏链状态值的接受率在50%到85%之间。

(3)计算转移概率r,满足:

r=f(x1h,x2h,...,xt*,xt+1h-1,...,xnh-1)f(x1h,x2h,...,xth-1,xt+1h-1,...,xnh-1)Jh(xth-1|xt*)Jh(xt*|xth-1)---(6)

其中为条件提议分布,为的条件分布,这里满足:

Jh(xt*|xth-1)=Jh(xth-1|xt*)---(7)

(4)以概率r接受否则重复h=1,2,…,N次(N为马氏链长度)。

值得注意的是,若训练样本数据足够充分以至于能够反应相应模态的分布,则不需要引入马尔科夫蒙特卡洛采样,而直接计算训练样本数据的联合概率密度值。

【步骤S4】根据控制限确定离散化步长l,并利用密度分位数法构建过程的静态密度分位数表。

对于某设定好的控制限CL,离散化步长l应满足:

l11-CL---(8)

利用样本概率密度函数值并结合离散化步长l,计算不同离散化区间端点δj/l(置信水平)处的分位数值qδj/l,从而构建出多模态过程的静态密度分位数表。当l=20时对应的静态密度分位数表见图1。

【步骤S5】通过查表的方式估计t时刻监控数据在模态k下的广义局部概率指标 PL(k)(Xtmonitor).

广义局部概率指标表示样本数据到不同非高斯模态的距离度量,满足:

PL(k)(Xtmonitor)=Pr(f(k)(X)f(k)(Xtmonitor))---(9)

为估计式(9)中的结合图1中的静态密度分位数表,若满足:

f(k)(Xtmonitor)[qδj/l,qδ(j+1)/l]---(10)

则有:

PL(k)(Xtmonitor)[1-δ(j+1)/l,1-δj/l]---(11)

【步骤S6】采用贝叶斯推理计算广义BIP指标,通过判断该指标是否超限,以此完成实时过程监控。

根据式(1)中的C-vine模型,可得到第k个模态Ck的联合概率密度函数f(k)(x)。根据贝叶斯公式,当前样本数据属于的后验概率为:

P(Ck|Xtmonitor)=P(Ck)f(k)(Xtmonitor)Σi=1KP(Ci)f(i)(Xtmonitor),(k=1,2,...,K)---(12)

其中K为模态数,P(Ck)为当前样本数据属于f(k)(x)的先验概率。

根据式(11)、式(12),引入广义BIP监控指标实现多模态的故障检测:

BIP=Σk=1KP(Ck|Xtmonitor)PL(k)(Xtmonitor)---(13)

根据给定的控制限CL,若监测样本数据满足BIP>CL,则说明监测过程出现故障;反之,说明监测过程正常。

实施例二

通过以下实施例的说明将有助于理解本发明,但并不限制本发明的内容。请参阅图2,本实施例实现了对TE过程在模态一与模态三情况下的多模态故障检测,两类模态的生产负荷等相关参数如表1所示。本实施例研究的TE过程为闭环控制下的稳态过程,过程数据采自于22个常见的过程变量,采样时间设置为0.05h。从模态一与模态三中分为获得1000组训练样本数据。测试样本数据的前200组数据来自于模态三,后200组数据来自于模态1,其中第101时刻至第200时刻发生故障13(漂移),第301时刻至第400时刻发生故障6(阶跃)。

表1:TE过程模态一与模态三的参数设置

(1)根据先验信息,明确2000组训练样本数据所属的模态类(模态一或模态三)。

(2)根据不同模态下的样本数据建立相应的联合概率密度函数模型,模态一与模态三中22维过程变量间的二元copula优化结果如表2与表3所示。表2与表3中的0元素表示独立二元copula,高亮的非0元素表示不同类型的二元copula。

表2:TE过程模态一中22维过程变量间的二元copula优化结果

表3:TE过程模态三中22维过程变量间的二元copula优化结果

(3)计算2000组训练样本对应的联合概率密度函数值。设置控制限CL=95%,离散化步长l=20,构建静态密度分位数表。

(4)通过查表的方式估计t时刻监控数据在模态k下的广义局部概率指标计算广义BIP指标。

结果表明,采用vine copula的故障检测方法能实现TE多模态过程的及时准确地监控。值得注意的是,由于TE过程中高维数据体现出的非高斯性较弱,对于更为复杂的的化工过程(高度非线性性与非高斯性),本方法在监控效果上具有更为显著的优势。

实施例三

一种基于vine copula相关性描述的多模态过程故障检测方法,所述方法包括如下步骤:

步骤S1、获取不同模态下正常数据的训练样本集;

步骤S2、进行相关性建模,获得各模态的联合概率密度函数;

步骤S3、对不同模态的联合概率密度函数进行抽样,计算各样本的联合概率密度函数值;

步骤S4、根据控制限确定离散化步长l,并利用密度分位数法构建过程的静态密度分位数表;

步骤S5、通过查表的方式估计t时刻监控数据在模态k下的广义局部概率指标 PL(k)(Xtmonitor);

步骤S6、采用贝叶斯推理计算广义BIP指标,通过判断该指标是否超限,以此完成实时过程监控。

本发明还揭示一种基于vine copula相关性描述的多模态过程故障检测系统,所述系统包括:训练样本集获取模块、联合概率密度函数获取模块、联合概率密度函数值计算模块、 静态密度分位数表构建模块、概率指标估算模块、实时过程监控模块。

训练样本集获取模块用以获取不同模态下正常数据的训练样本集;

联合概率密度函数获取模块用以进行相关性建模,获得各模态的联合概率密度函数;

联合概率密度函数值计算模块用以对不同模态的联合概率密度函数进行抽样,计算各样本的联合概率密度函数值;

静态密度分位数表构建模块用以根据控制限确定离散化步长l,并利用密度分位数法构建过程的静态密度分位数表;

概率指标估算模块用以通过查表的方式估算t时刻监控数据在模态k下的广义局部概率指标

实时过程监控模块采用贝叶斯推理计算广义BIP指标,通过判断该指标是否超限,以此完成实时过程监控。

各个模块的具体实现方式可参阅实施例一中各个步骤对应的实现过程。

综上所述,本发明提出的基于vine copula相关性描述的多模态过程故障检测方法,可克服传统降维思想引起的信息损失问题,并实现了对存在非线性、非高斯的多模态复杂化工过程的实时监控。

本发明从一个全新的视角——直接刻画高维数据的复杂相关性,实现了对高度非线性性、非高斯性过程的故障检测。在保证实时检测的前提下,该方法较之于传统的故障检测方法(如GMM)具有更低的误报率与漏报率。

本发明引入了vine copula实现复杂化工过程的故障检测。Vine copula作为近些年兴起的一类copula,广泛应用于金融、经济、环境科学等领域。由于vine copula能够将高维数据的相关性问题转化为稀疏矩阵内有限个二元copula的优化问题,显著降低了模型中参数求解的复杂度;同时,基于其高度灵活的结构特点,vine copula能够准确刻画体现为高度非线性性与非高斯性的复杂化工过程,该方法尤其对于含尾偏特性数据具有显著优势。另外,构建的广义局部概率指标能够有效度量样本数据到不同非高斯模态的距离,同时,采用查表的方式实现对广义BIP监控指标的快速计算,该发明不仅能够保证离线建模具有较低的计算复杂度,同时也能够实现对多模态化工过程的实时在线监控。

这里本发明的描述和应用是说明性的,并非想将本发明的范围限制在上述实施例中。这 里所披露的实施例的变形和改变是可能的,对于那些本领域的普通技术人员来说实施例的替换和等效的各种部件是公知的。本领域技术人员应该清楚的是,在不脱离本发明的精神或本质特征的情况下,本发明可以以其它形式、结构、布置、比例,以及用其它组件、材料和部件来实现。在不脱离本发明范围和精神的情况下,可以对这里所披露的实施例进行其它变形和改变。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号