首页> 中国专利> 基于层次密度峰值聚类和最相似模态的故障监测方法

基于层次密度峰值聚类和最相似模态的故障监测方法

摘要

本发明涉及一种基于层次密度峰值聚类和最相似模态的故障监测方法,对工业过程历史正常数据进行模态划分,获取层次模态信息;利用层次模态信息对工业过程历史正常数据建立故障监测模型;将待监测的工业过程数据,得到最相似模态,输入到所述故障监测模型,进行故障监测。本发明利用已有的工业数据资源,考虑了复杂工业过程的多模态性和多模态动态性和不确定性,克服现有多模态故障监测方法依赖先验的模态信息,采用固定的模态划分及模型等局限,这对于及时发现工业过程的异常工况、保证生产安全、提高产品质量具有重要意义。

著录项

  • 公开/公告号CN109933040A

    专利类型发明专利

  • 公开/公告日2019-06-25

    原文格式PDF

  • 申请/专利权人 中国科学院沈阳自动化研究所;

    申请/专利号CN201711365157.4

  • 申请日2017-12-18

  • 分类号G05B23/02(20060101);

  • 代理机构21002 沈阳科苑专利商标代理有限公司;

  • 代理人李巨智

  • 地址 110016 辽宁省沈阳市东陵区南塔街114号

  • 入库时间 2024-02-19 11:18:46

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2020-08-07

    授权

    授权

  • 2019-07-19

    实质审查的生效 IPC(主分类):G05B23/02 申请日:20171218

    实质审查的生效

  • 2019-06-25

    公开

    公开

说明书

技术领域

本发明涉及故障监测与诊断技术领域,具体地说是一种基于层次密度峰值聚类和最相似模态的故障监测方法。

背景技术

故障监测的目的是及时发现工业过程的异常工况、保证生产安全、提高产品质量。工业过程的操作条件通常因原材料,制造参数,产品规格等因素的改变而改变,从而产生多种操作模态。不同的模态具有相似的,各自特定的特性及持续时间。一个模态被定义为具有相似统计特性和一定持续时间的过程。此外,两个相邻的模态间还可能存在逐渐改变的过渡过程。因此,研究有效可行的多模态过程故障监测方法具有重要意义。

多元统计故障监测方法如主成分分析,偏最小二乘引起了广泛关注。然而,工业过程具有动态,非线性和多模态特性,因此传统的多元统计故障监测方法无法直接用于监测实际工业过程。因此,应该研究更好的多模态过程故障监测方法。目前,在现有的多模态过程故障监测算法中,针对不同模态建立局部模型的多模型方法未考虑模态间的全局相关性,影响故障监测的准确性;很多方法根据模态先验知识进行模态划分或采用固定的模态划分及模型,未考虑多模态动态性和不确定性,采用这些方法对实际工业过程进行故障监测时适应性低。

密度峰值聚类是一种用于识别任意形状类簇的基于密度的聚类算法。在故障监测中,基于层次密度峰值聚类的模态划分方法可以获取复杂工业过程的层次模态信息,不需要模态先验知识。因而,采用层次模态信息建立故障监测模型是很有意义的。

发明内容

针对现有技术的不足,本发明提供一种基于层次密度峰值聚类和最相似模态的故障监测方法,考虑了复杂工业过程的多模态性和多模态动态性和不确定性,克服现有多模态故障监测方法依赖先验模态信息的问题。

本发明为实现上述目的所采用的技术方案是:

一种基于层次密度峰值聚类和最相似模态的故障监测方法,包括以下步骤:

步骤1:对工业过程历史正常数据进行模态划分,获取层次模态信息;

步骤2:利用层次模态信息对工业过程历史正常数据建立故障监测模型;

步骤3:将待监测的工业过程数据,得到最相似模态,输入到所述故障监测模型,进行故障监测。

所述模态划分包括以下过程:

步骤1:搜集工业过程历史正常数据并对其进行标准化处理;

步骤2:对标准化处理后数据进行层次密度峰值聚类,得到初始层次模态信息;

步骤3:根据模态连续特性调整初始层次模态信息,得到层次模态信息。

所述层次密度峰值聚类包括以下过程:

步骤1:计算标准化处理后数据X={x1,x2,…,xN}各数据点之间的测地距离dgeo(xi,xj);

步骤2:选取不同的百分比参数P,得到截止距离计算公共近邻个数CNN(xi,xj),获取混合测地距离dhybgeo(xi,xj);

步骤3:计算标准化处理后数据各数据点之间的局部密度和最小距离

步骤4:人工观察选取不同的截止距离对应的局部密度和最小距离均比一般数据点的局部密度和最小距离大且具有离群特性的数据点为类簇中心,将剩余非中心点划入比其局部密度高的数据点中距离最近数据点的类簇中,得到层次密度峰值聚类结果。

所述计算公共近邻个数CNN(xi,xj),是通过以下公式得到:

所述截止距离,是通过以下公式得到:

其中,为截止距离,D是标准化处理后数据各数据点之间的测地距离的集合,N为数据点的个数,的下标,P为百分比参数,取值范围为0.1-5;

所述混合测地距离dhybgeo(xi,xj),是通过以下公式得到:

所述局部密度是通过以下公式得到:

所述最小距离是通过以下公式得到:

其中,dgeo(xi,xj)为各数据点之间的测地距离;

所述根据模态连续特性调整初始层次模态信息,是采用最小模态长度tmin,取值范围为3-10个采样间隔,调整初始层次模态信息,通过将小于tmin的模态数据点调整到最近的模态实现。

所述建立故障监测模型包括以下过程:利用层次模态信息,基于独立元分析建立故障监测模型,得到故障监测置信限。

所述基于独立元分析建立故障监测模型包括以下过程:

1)计算协方差矩阵C(X);

2)利用SVD分解C(X)=UΛUT,计算协方差矩阵C(X)的特征值对角矩阵Λ和特征向量矩阵U;

3)计算白化矩阵Q=Λ-1/2UT

4)得到白化变换矩阵Z=QX;

5)计算正交矩阵B;

6)计算预测的独立元矩阵S=BTZ;

7)计算低维解混矩阵W=BTQ;

8)计算故障监测I2=sTs统计量和统计量,其中x表示X={x1,x2,…,xN}的一个数据点。

所述计算正交矩阵B包括以下过程:

步骤1:选择估计独立元的个数d(一般保留累计贡献率为0.85-0.95的独立元),设置迭代次数i←1;

步骤2:以单位模向量给随机向量bi赋初值;

步骤3:令bi←E{zg(biTz)}-E{g′(biTz)}bi,其中g和g′分别为G=tanh()的一阶导数和二阶导数;

步骤4:通过正交化来去除相关性,

步骤5:归一化,

步骤6:假如bi没有收敛,返回步骤3;

步骤7:如果bi收敛,输出向量bi

步骤8:若i≤m,则设定i←i+1且返回步骤2。

所述得到故障监测置信限包括以下过程:

1)计算全局故障监测置信限其中α表示置信水平,取值为α=1%,d为选择估计独立元的个数,N为数据点的个数,Fd,N-d,α为置信水平为α的自由度为d和N-d的F分布临界值;

2)计算局部故障监测置信限其中mi为层次模态信息,gmi=Smi/2μmi,μmi和Smi为层次模态信息为mi的SPE统计量的均值和方差。

所述将待监测的工业过程数据,得到最相似模态,输入到所述故障监测模型,进行故障监测包括以下过程:

1)得到待监测的标准化后工业过程数据xnew的最相似模态;

2)得到xnew的统计量

3)如果xnew在最相似模态的I2或SPE统计量大于对应的故障监测置信限,则判定工业过程发生故障,否则为无故障。

所述得到待监测的标准化后工业过程数据的最相似模态,是通过以下公式得到:

其中,为待监测的工业过程数据在层次模态信息中各个模态的局部密度,为待监测的工业过程数据点与层次模态信息为mi的类簇中心的距离。

本发明具有以下有益效果及优点:

本发明通过将层次密度峰值聚类,独立元分析和最相似模态结合,先利用基于层次密度峰值聚类的模态划分方法获取多模态工业过程的层次模态信息,再利用层次模态信息建立故障监测模型,最后利用最相似模态进行故障监测,考虑了多模态动态性和不确定性,克服现有故障监测方法依赖先验的模态信息,采用固定的模态划分及模型等局限,这对于及时发现工业过程的异常工况、保证生产安全、提高产品质量具有重要意义。

附图说明

图1是本发明的方法流程图。

图2是本发明的层次密度峰值聚类人工观察步骤示意图。

具体实施方式

下面结合附图及实施例对本发明做进一步的详细说明。

如图1所示为本发明的方法流程图。

基于层次密度峰值聚类和最相似模态的故障监测方法,搜集工业过程数据,在得到层次模态信息后,利用独立元分析与最相似模态进行故障监测。

本发明的具体步骤如下:

步骤1:搜集青霉素发酵过程历史正常数据,包括通风率,搅拌器功率,底物加料速度,反应产生的热量,培养基体积,二氧化碳浓度,PH值,温度,溶氧饱和度,并对其进行标准化处理,处理后的数据各变量均值为0,方差为1;

步骤2:计算标准化处理后数据X={x1,x2,…,xN}各数据点之间的测地距离dgeo(xi,xj),测地距离能比欧氏距离更能反映数据的真实结构;

步骤3:选取不同的百分比参数P(取值范围为0.1-5),得到截止距离D是标准化处理后数据各数据点之间的测地距离的集合,N为数据点的个数,的下标,计算公共近邻个数CNN(xi,xj)和混合测地距离dhybgeo(xi,xj),公共近邻反映数据点间的局部距离特性,能更好地区分相同类簇与不同类簇的数据点,公式如下:

步骤4:计算各数据点之间的局部密度和最小距离不同的截止距离计算得到的局部密度和最小距离也不同,公式如下:

步骤5:人工观察选取不同的截止距离对应的类簇中心,对于一个数据点,与其距离小于截止距离的数据点越多,局部密度越大,因此类簇中心点的局部密度为最大值或局部最大值,此外,类簇中心点与比其局部密度大的数据点的最小距离为最大值或局部最大值,如图2所示为本发明的层次密度峰值聚类人工观察步骤示意图,横轴为局部密度,纵轴为最小距离,“*”标记的两个数据点的局部密度和最小距离均比其余数据点大且具有离群特性,通过人工观察被选取为类簇中心,将剩余非中心点划入比其局部密度高的数据点中距离最近数据点的类簇中。其它截止距离对应的密度峰值聚类结果也可按此过程获取,最终得到层次密度峰值聚类结果,即青霉素发酵过程通过层次密度峰值聚类可划分为2-6个模态(P=[0.1,0.2,0.25,0.3,1.0])。

步骤6:根据模态连续特性最小模态长度tmin=3调整初始层次模态信息,将小于tmin的模态数据点调整到最近的模态,得到层次模态信息,对实际多模态工业过程,模态先验知识是不完备的且具有不确定性,层次模态信息可以从多模态工业过程数据中提取更多可用于过程建模的信息,并改善故障监测方法对多模态不确定性的适应性;

步骤7:计算协方差矩阵C(X),利用SVD分解C(X)=UΛUT计算协方差矩阵C(X)的特征值对角矩阵Λ和特征向量矩阵U;

步骤8:计算白化矩阵Q=Λ-1/2UT,得到白化变换矩阵Z=QX;

步骤9:计算正交矩阵B,过程如下:

1)选择估计独立元的个数d(一般保留累计贡献率为0.85-0.95的独立元),设置迭代次数i←1;

2)以单位模向量给随机向量bi赋初值;

3)令bi←E{zg(biTz)}-E{g′(biTz)}bi,其中g和g′分别为G=tanh()的一阶导数和二阶导数;

4)通过正交化来去除相关性,

5)归一化,

6)假如bi没有收敛,返回步骤(3);

7)如果bi收敛,输出向量bi

8)若i≤m,则设定i←i+1且返回步骤(2)。

步骤10:计算预测的独立元矩阵S=BTZ和低维解混矩阵W=BTQ,故障监测I2=sTs统计量和统计量,其中x表示X={x1,x2,…,xN}的一个数据点;

步骤11:置信水平α=1%,计算全局故障监测置信限计算局部故障监测置信限其中mi为层次模态信息,gmi=Smi/2μmi,μmi和Smi为层次模态信息为mi的SPE统计量的均值和方差,不同的层次模态对应相同的全局故障监测置信限和不同的局部故障监测置信限,考虑了多模态工业过程的全局相似性和局部非相似性;

步骤11:得到待监测的标准化后工业过程数据xnew的最相似模态,公式如下:

其中,为待监测的工业过程数据在层次模态信息中各个模态的局部密度和与其类簇中心的距离,基于静态模态信息的故障监测可能会影响性能,动态确定待监测的工业过程数据的最相似模态能改善故障监测方法对多模态动态性的适应性;

步骤12:得到xnew的统计量

步骤13:如果xnew在最相似模态的I2或SPE统计量大于对应的故障监测置信限,则判定工业过程发生故障,否则为无故障。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号