技术领域
本发明属于工业过程控制领域,利用基于矩阵Rényi的α-熵函数估计传感器采集变量之间的互信息值,弥补了流程工业中难以实时计算概率密度函数的不足。基于互信息矩阵投影的多变量过程监控方法不仅可以刻画过程数据中隐含的非线性特征,而且能够解析故障发生的根变量,同时不受工业过程中样本标签不足、数据不均衡等因素的影响,对于解决实际工业过程监控问题具有重要的现实意义。
背景技术
数据驱动技术是计量学中用于识别异常过程的有效工具,多变量统计过程监控是过程控制领域过去几十年研究中最活跃的领域之一,并在化工过程、微电子制造和制药工艺等工业领域中取得了巨大成功。
考虑到工业过程的动态特性,在线监测数据不仅包含了生产运行过程的累积关联性,而且更能反映系统当前状态的最新变化,基于滑动窗的方法通过添加时滞变量构建时间拓扑矩阵,捕获连续过程的(局部)相关性特征。为了进一步提高基于滑动窗方法的性能,如何利用过程变量的高阶统计量变得至关重要。基于主元分析的故障检测方法均采用协方差矩阵的转换元提取量测(检测)数据中的线性相关性,如何利用工业过程数据中隐含的非线性特性成为故障检测中的关键问题。
近年来,信息论由于其数理统计方面的优势,已成功应用于各种机器学习,计算机视觉和信号处理任务中,在过程监控的应用中也引发了新的研究兴趣。尽管已有一些研究将信息论应用于故障检测,但多数是利用互信息计算选取变量之间的主要驱动量,基于变量选择进行监测数据降维。关于如何将信息论技术应用于流程工业过程控制,仍然是一个有待解决的技术问题。特别地,连续过程的实时概率密度估计是数据驱动领域一个难点,对于可能同时包含离散变量和连续变量的复杂流程工业,有待进一步研究基于信息论的故障检测的技术,以提高诊断系统的实时性和精确性。本发明正是针对上述问题提出的更适用于流程工业过程的过程监控技术
发明内容
本发明的目的在于克服现有流程工业中基于信息论的故障诊断技术的不足,提出了一种基于互信息矩阵投影的多变量过程监控技术:构造互信息矩阵并对其投影进行统计分析以监控工业过程的动态和非平稳性(可能是非线性的);基于矩阵Rényi的α-熵函数的互信息估计在(正则化的)对称正定矩阵的特征谱上计算,弥补了流程工业中难以实时计算概率密度函数的不足。
为了达到上述目的,本发明的技术方案为:
一种基于互信息矩阵投影的多变量过程监控方法,包括离线建模环节和在线监控环节,
所述的离线建模环节包括:
1.1)数据预处理:对于在工业过程中已经采集到的原始流程数据构建训练集
其中,w为时间窗口的长度;x
1.2)构建工业监测时刻i的变量互信息矩阵
1.3)对样本在互信息矩阵
1.4)根据检测指标的均值Θ
1.5)基于工业过程中的置信度η对相似性指标D
所述在线监控环节包括:
2.1)数据预处理:对于工业运行过程中的在线监测样本的原始数据构建测试集
2.2)构建监测时刻i的变量互信息矩阵
2.3)对测试集样本在互信息矩阵
2.4)对测试集的检测指标
2.5)根据监控阈值进行故障辨识,如果
进一步的,所述的步骤1.2)具体为:
1.2.1)定义核函数κ:
1.2.2)基于矩阵Rényi的α-熵函数构建时刻i的变量互信息矩阵
其中,I(x
1.2.3)对互信息矩阵
进一步的,所述的步骤1.3)中训练集的转换元矩阵
转换元矩阵T
其中,t
训练集所构建的检测指标集
进一步的,所述的步骤1.4)中训练集的相似性指标
其中,||·||
进一步的,所述的步骤2.2)中,
基于矩阵Rényi的α-熵函数构建时刻i的测试集变量互信息矩阵
对互信息矩阵
进一步的,所述的步骤2.3)为,
提取测试集的转换元矩阵
计算测试集转换元矩阵
其中μ
所述的步骤2.4)中,测试集的相似性指标
其中,
附图说明
图1为本发明基于滑动窗所构建的时间拓扑结构;
图2为互信息与相关性的对比;
图3为正常及故障状态下Gram矩阵及其特征谱的表示;
图4为正常及故障状态下的互信息矩阵对比;
图5TE过程中及故障状态下的互信息矩阵可视化;
图6TE过程中不同故障状态下互信息矩阵的均值变化;
图7TE过程中不同窗口长度下故障5及19的检测性能变化。
具体实施方式
本发明所提出的方法适用于复杂的流程工业过程,解决的问题主要是流程工业多变量过程中变量相关性的实时概率估计及故障检测的准确性与可解释性。
为了达到上述目的,本发明的技术方案为:
鉴于流程工业过程运行中,传感器采集数据为时间序列,即离散的时间过程
其中x
其中,I(x
对于工业过程中的采样变量
根据定义的核函数κ可求出任意两个随机变量的Gram矩阵K=κ(x
其中,A是Gram矩阵K的归一化正定矩阵,即A=K/tr(K),而λ
对于工业过程中的任意两个传感器变量所组合的变量对
其中,A
本技术中使用高斯核函数
现有过程监控技术表明,可以从样本协方差矩阵的特征向量所形成的正交空间中提取统计特征,从而构成对原始数据空间特性的理解。类比协方差矩阵,互信息矩阵M同样是变量之间相关性的度量。在过程监控中,互信息矩阵M包含了k时刻的时间拓扑矩阵中任意两个变量之间的非线性相关性,在正常状态下,互信息矩阵M的统计量应当保持不变或稳定。但是某一传感器发生故障,至少会影响互信息矩阵中一个或多个互信息值,从而造成所提取的各阶统计量的改变。因此,可对互信息矩阵进行特征谱分解M=PΛP
由于投影空间统计特征向量彼此正交,则消除了变量间的关联性,简化了原始过程特性分析的复杂程度。为了刻画工业过程原始数据空间的特性,从多变量分析角度提取转换元矩阵的统计特征一阶统计量μ
进而构建检测指标
多变量过程监控中,根据相似性度量进行故障检测。本技术中k时刻的相似性指标
不同于协方差矩阵仅能够捕获任意两个变量之间的线性相关性,互信息矩阵M同时包含了任意两个变量之间的非线性相关性,而变量之间的非线性和非单调性关系在多变量工业过程中是普遍存在的。此外,互信息I根据实值概率密度函数进行估计,对数据特征(如连续,离散或混合)没有要求,同时,互信息矩阵M的计算对变量的联合分布或变量之间的关系不作任何先验假设,这使该技术在工业过程控制应用中具有很大潜力。
本发明所提出的技术包含离线建模和在线监控两部分,其流程图如图2所示。其中方法的离线部分步骤为:
步骤一:数据预处理
1)对于在工业过程中已经采集到的原始流程数据构建训练集
其中,
2)构建训练集监测时刻i的时间拓扑矩阵
步骤二:互信息矩阵投影
1)定义核函数κ:
其中,
2)基于矩阵Rényi的α-熵函数构建时刻i的变量互信息矩阵
3)对训练集的互信息矩阵
4)对训练集样本在互信息矩阵
步骤三:计算转换元矩阵的各阶统计量μ
进而构建训练集的检测指标
步骤四:计算训练集的相似性指标
方法的在线部分是指对测试样本是否为故障样本的检测与辨识,步骤为:
步骤一:数据预处理
1)对于工业过程的在线测试样本
构建时刻i的时间拓扑矩阵
步骤二:互信息矩阵投影
1)基于矩阵Rényi的α-熵函数构建时刻i的互信息矩阵
2)对互信息矩阵
3)对测试集样本在互信息矩阵的投影空间进行投影以提取转换元矩阵
步骤三:计算测试集转换元矩阵的各阶统计量μ
其中μ
步骤四:计算训练集的相似性指标
实验验证与分析:
1.互信息与相关性的比较
不同于协方差矩阵仅能够捕获任意两个变量之间的线性相关性,互信息矩阵M同时包含了任意两个变量之间的非线性相关性,而传感器变量之间的非线性和非单调性关系在多变量工业过程中是普遍存在的。
不同数据分布下,两个变量的相关性值(棕色数值)与互信息值(红色数值)的对比如图2所示,由图可见,上面一行两变量之间呈线性关系,相关性与互信息均不为0;下面一行两变量之间呈非线性关系,对于相关性为0的数据分布,其互信息值不为0,且大于相关性的值。这正是工业过程中非线性特性所期望的。
2.基于互信息矩阵投影的故障检测可行性验证
考虑一个由下式生成的多变量非线性过程:
其中
对于传感器故障x
3.性能验证—TE过程实验验证
本发明所提出的方法在化工过程的基准测试集TE(Tennessee Eastman)过程数据上进行了验证。实验数据参见网站:http://web.mit.edu/braatzgroup/links.html。
首先,正常状态,故障1(阶跃故障)和故障14(粘滞故障)的互信息矩阵如图5所示,右侧为对角线上向量的箱线图。显然,正常状态下不同时刻的互信息矩阵几乎不变;但是故障的发生将导致在互信息矩阵出现不同的联合或边缘分布。通过比较正常状态、故障状态的对角线上的箱线图,即熵的变化,可以发现不同类型的故障产生的变化不同,故障14比故障1的箱线图中有更多的离群值(“+”符号绘制)。
其次,监测变量和其余变量之间的互信息平均值见图6,如图6(a)所示,箱线图的晶体变宽,75分位数变大,这表明故障1可能是一个阶跃变化。实际上,故障1确实引起了流4的阶跃变化,反应物A,B和C的进料变化对过程监控造成了总体影响。相比之下,故障14是由反应堆冷却阀的粘滞变化引起,相关变量为变量9、21和32。根据图6(b),确实存在三个离群值(“+”符号绘制)分别对应于第9、21和32维变量。换句话说,变量9、21和32的变化恰好是导致互信息矩阵发生变化的驱动力。从这个意义上讲,本技术对故障诱因的辨识有一定的指导意义,是可解释的。
在不失一般性的前提下,选择滑动窗长度100,不同方法的平均故障检测率和故障误警率见表1和表2。从表1可以看出,本技术(简记PMIM)的故障检测率整体较为满意,可以检测大多数故障,并且在不同类型的故障中保持稳定。此外,由于互信息矩阵包含了时间拓扑矩阵中任意两个变量之间的非线性相关性,这是优于协方差矩阵的,从检测率上看,本技术的性能也在多数情况下优于基于协方差矩阵的转换元方法(RTCSA,RDTCSA)。尽管本技术的检测率在阶跃故障5和未知故障19上相对较低,但随着滑动窗尺寸的增大,这两种故障中的检测性能会得到显着提高,如图7所示。从表2可以看出,本技术及参考方法的故障误警率均接近于显著性水平,甚至相对于基于协方差矩阵的转换元方法(RTCSA,RDTCSA),本技术的误警率更低,证明互信息在捕获变量相关性方面的优越性。
表1 TE过程中不同方法的故障检测率汇总
表2 TE过程中不同方法的故障误检率汇总
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。
机译: 用于成像医疗设备系统即X射线系统的定投影矩阵确定方法涉及基于提供的投影矩阵和坐标系的位置确定定投影矩阵
机译: 解耦矩阵级联的多变量过程控制-对角矩阵控制器
机译: 基于视频图像的投影矩阵的确定方法,无需优化程序即可确定投影矩阵