首页> 中国专利> 一种基于特征证据离散化的旋转机械故障特征约简方法

一种基于特征证据离散化的旋转机械故障特征约简方法

摘要

本发明提出一种基于特征证据离散化的旋转机械故障特征约简方法,首先利用K均值将原始测量数据聚为T个数据簇,再使用随机模糊变量模型对每个数据簇建模,匹配得到每个测量值的证据,根据决策规则决定测量值转换后的离散值并得到决策表,此时故障特征为条件属性,样本的故障模式为决策属性;计算压缩二进制矩阵获取核属性,分别计算剩余条件属性与核属性集合并集的似真信度,将具有最小似真信度并集对应的条件属性添加至核属性集合中,直至最小似真信度为1时停止,同时得到最终的约简结果。本发明做离散化处理时,考虑到数据簇之间的边界模糊性,相比单一使用K均值,离散处理更加精准,同时压缩二进制矩阵减少了计算量和存储空间。

著录项

  • 公开/公告号CN107490964A

    专利类型发明专利

  • 公开/公告日2017-12-19

    原文格式PDF

  • 申请/专利权人 杭州电子科技大学;

    申请/专利号CN201710706270.8

  • 发明设计人 张明;徐晓滨;黄大荣;韩德强;

    申请日2017-08-17

  • 分类号G05B13/04(20060101);G01M99/00(20110101);G01M13/02(20060101);

  • 代理机构33272 杭州奥创知识产权代理有限公司;

  • 代理人王佳健

  • 地址 310018 浙江省杭州市下沙高教园区2号大街

  • 入库时间 2023-06-19 04:05:17

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2020-06-02

    授权

    授权

  • 2018-01-12

    实质审查的生效 IPC(主分类):G05B13/04 申请日:20170817

    实质审查的生效

  • 2017-12-19

    公开

    公开

说明书

技术领域

本发明涉及一种基于特征证据离散化的旋转机械故障特征约简方法,并应用于旋转机械设备故障诊断,属于旋转机械设备故障监控与诊断技术领域。

背景技术

故障诊断是提高系统可靠性和降低事故风险的重要方法,然而基于单传感器的监控诊断技术已无法获得足够可靠的信息用于结构日益复杂的大型设备的诊断需求。随着传感器技术的发展以及计算机的存储和计算能力的提升,大量的监测数据可以通过安装在设备上的多传感器系统获取,但若将所有的监测数据用于故障诊断,则会造成计算量过大,严重影响诊断的实时性。

由于故障的发生具有不确定性,同时故障发生的成因较为复杂,通常同一故障可以表现出多种特征,同一故障特征可能是由不同故障引起;并且这些故障特征具有不精确、无规律、冗余性等特点。为了进一步提高故障诊断的效率,有必要对监测数据进行约简处理,而粗糙集正是一种处理不精确、不确定以及不完备数据的有效数学工具,它在尽量不影响故障特征(条件属性)的分类诊断能力的情况下,删除不相关或不重要的故障特征。

发明内容

本发明的目的是提出一种基于特征证据离散化的旋转机械故障特征约简方法,并应用于旋转机械设备故障诊断,克服了多传感器监测技术中故障特征选取问题。由于通过传感器采集到的数据都是连续型实值,而粗糙集只能处理离散化的数据,因此首先利用K均值和随机模糊变量对采集的数据进行离散化处理获得决策表便于粗糙集处理,再使用压缩二进制矩阵求得核属性(故障特征)集,通过粗糙集的上近似概念分别计算出剩余属性与核属性集的并集的似真信度,将具有最小似真信度并集对应的属性添加至核属性集合中,继续按照上述步骤向核属性集中添加剩余属性,直至满足最终条件,并获得约简结果。

本发明提出的基于特征证据离散化的旋转机械故障特征约简方法,包括以下各步骤:

(1)首先设定旋转机械设备的故障集合为Θ={F1,…,Fi,…,FN},Fi代表故障集合Θ中的第i个故障,i=1,2,…,N,N为故障个数;x={x1,…,xj,…,xm}为测得的故障特征向量,xj代表第j个特征参数fj的测量值,j=1,2,...,m。

(2)在每种故障模式下分别测得n个特征向量x,总共sum=N*n个特征向量样本组成历史样本集合U={x1,...,xr,...,xsum},其中xr={xr,1,…,xr,j,…,xr,m},>j对应的各离散值随机模糊变量模型其中随机模糊变量模型由外部隶属度函数uout(x)和内部隶属度函数uin(x)组成,获取中的每个随机模糊变量模型的步骤如下:

(2-1)利用K均值算法将这sum个向量样本中故障特征fj的测量值按照从小到大的顺序划分为T个数据簇{X1,j,...Xt,j,...,XT,j},每个数据簇代表对应的离散值,其中st代表第t个数据簇中特征fj的测量值个数,注意所有数据簇中测量值的个数不一定相等。

(2-2)由数据簇Xt,j获得对应的频率直方图,然后对其进行插值拟合得到特征fj的正态分布概率密度函数

(2-3)首先计算出随机模糊变量模型的外部隶属度函数uout(x),确定概率密度函数的峰值点xp,即正态分布的均值,其隶属度为uout(x)=1;对应fj在该数据簇的变化范围是[xL,xR]=[xp-3σ,xp+3σ],σ为标准差。在区间[xL,xp]和>p,xR]上分别均匀插入M个点这些点可以产生M+2个嵌套子区间其中利用在这些区间进行积分运算,可以得到外部隶属度函数 uout(x),其中

(2-4)由于在测量特征fj时,传感器会存在系统误差,可以用内部隶属度函数uin(x)来表示系统误差,该误差取决于传感器供应商提供的测量精度>

(2-5)最终的随机模糊变量模型At,j是将uout(x)和uin(x)的α水平截集结合而得到的,uout(x)和uin(x)的α水平截集分别为那么At,j可由一组α水平截集来表示,这里可以用式(3)形式的矩阵表示:

其中αM+1=1<αM<…<α0=0。一般在实际应用中设定随机模糊变量的行数为100。

(3)将样本中特征fj的测量值xr,j中各个随机模糊变量模型匹配,获得xr,j与各离散值对应的信度,组成一条证据,具体的匹配方法如下:

(3-1)xr,j为单次测量值,因此其随机模糊变量模型为矩形隶属度函数:

(3-2)令xb=xr,j(1-ε%)和xc=xr,j(1+ε%)为μr,j(x)取值为1的左右分界点,那么μr,j(x)与At,j的匹配程度ρr,j(t)可以分为以下3种情况求取:

a)当时,此时μr,j(x)与At,j的内部隶属度函数uin(x)完全或部分重合,则ρr,j(t)=1;

b)当时,μr,j(x)位于At,j的左侧,则

这里k=0,1,2,...,M,通过对两个相邻截集之间的外部隶属度函数进行线性化,利用线性化函数的斜率公式获取匹配度,由于xc比xb更靠近At,j的uin(x),所以这里计算关于xc的斜率作为匹配度。

c)当时,μr,j(x)位于At,j的右侧,则

该式与式(5)是对偶关系,不再解释。

(4)依照以上过程,可以计算出μr,j(x)与每种离散值的随机模糊变量模型的匹配度ρr,j(t),t=1,2,...,T,一般这些匹配度取值之和不会为1,需要对它们进行归一化处理:

那么对于测量值xr,j,其对应各离散值的证据为:

mr,j={mr,j(1),…,mr,j(t),…,mr,j(T)}(8)

根据最大信度决策规则来决定测量值的离散值,即测量值xr,j对应的离散值由最大信度mr,j(t)=max(mr,j)决定,可以判断其离散值为t。

(5)经过离散化处理后的所有的样本可以构成便于粗糙集处理的决策表形式,此时故障特征为条件属性,故障模式为决策属性,如表1所示

表1经离散化处理后的决策表

决策表中离散值tr,j∈V,D代表样本的决策属性。

(6)令C={f1,f2,...,fm},根据离散化后的决策表可以构造条件属性集合C和决策属性D的等价关系

已知等价关系可以推导出等价类[x]C={y∈U|(x,y)∈RC}和>D={y∈U|(x,y)∈RD},最后由故障特征集合C和故障模式D对样本集合U的划分分别为:

更直观地可以表示为U/RC={B1,...,Bβ,...,BJ},U/RD={Y1,...,Yi,...,YN};Bβ和Yi分别是样本集U的子集,且Bβ中样本的条件属性都相等,Yi中样本决策属性都相同。

其中U2=U-U1。rj代表样本xp和>q在特征fj的差别:

其中,delrep代表删除集合中条件属性相同的样本。由此可以构建压缩二进制矩阵CBM=[objectpair,totaloneij,msij],其中>p,xq),表示对应的二进制编码。在矩阵CBM中totaloneab=1所在行中,二进制mspq中1的位置所代表的条件属性,即为核属性。

(7)若以决策属性划分样本集合U,即U/RD={Y1,...,Yi,...,YN};否则,在决策表上增加一列属性δC={D(y):y∈[x]C},并以该属性代替决策属性来划分样本集合U,即U/δC={Y1,...,Yi,...,YN}。将所有核属性添加至约简集Red中,剩余属性C'=C-Red,分别计算剩余属性fw∈C'与约简集Red的并集B=Red∪fw以及B的似真信度,将具有最小似真信度并集对应的属性添加至Red集合中,重复上述步骤直至Red集合的信度为1,并获得最终的约简结果,具体步骤如下:>w∈C',首先计算其与约简集Red的并集B,以及B对样本集合的划分U/B={[x]B,x∈U},B=Red∪fw以及条件属性集合B在集合Yi的上近似由上近似可以得到该故障特征集的似真信度:

其中|.|代表集合中元素个数。

b)将具有最小值的γw对应的属性fw添加至约简集Red中,即Red=Red∪fw,同时令C'=C'-fw;若最小值为1,停止运算,得到最终的约简集Red;否则跳至步骤a继续运算。

本发明提出的基于特征证据离散化的旋转机械故障特征约简方法,首先根据故障特征测量值的数据分布,利用K均值算法将这些连续型实值聚为T个数据簇,每个数据簇代表一个离散值,同时考虑到数据簇之间的边界模糊性,引入随机模糊变量模型对数据簇进行建模,通过匹配得到每个测量值对应各离散值的信度,由最大信度决策规则决定测量值对应转换后的离散值,这种离散方法比单纯利用K均值进行离散更加精准。将所有样本离散处理后得到便于粗糙集处理的决策表,通过构建压缩二进制矩阵可以方便直观地获取核属性,计算剩余条件属性与核属性集合并集的似真信度,将具有最小似真信度的并集所对应的属性添加至核属性集合中,直至核属性集合的信度大小为1时停止,同时得到最终的约简结果。根据本发明方法编制的程序(编译环境LabVIEW,C++等)可以在监控计算机上运行,可以快速获取故障特征的约简结果。

附图说明

图1是本发明方法的流程框图;

图2是电机转子数据采集系统图;

图3是本发明方法的实施例中某一特征对应的离散值“1”、“2”、“3”的随机模糊变量模型以及匹配方法。

具体实施方式

本发明提出的一种基于特征证据离散化的旋转机械故障特征约简方法,其流程框图如图1所示,包括以下各步骤:

(1)首先设定旋转机械设备的故障集合为Θ={F1,…,Fi,…,FN},Fi代表故障集合Θ中的第i个故障,i=1,2,…,N,N为故障个数;x={x1,…,xj,…,xm}为测得的故障特征向量,xj代表第j个特征参数fj的测量值,j=1,2,...,m。

(2)在每种故障模式下分别测得n个特征向量x,总共sum=N*n个特征向量样本组成历史样本集合U={x1,...,xr,...,xsum},其中xr={xr,1,…,xr,j,…,xr,m},>j对应的各离散值随机模糊变量模型其中随机模糊变量模型由外部隶属度函数uout(x)和内部隶属度函数uin(x)组成,获取中的每个随机模糊变量模型的步骤如下:

(2-1)利用K均值算法将这sum个向量样本中故障特征fj的测量值按照从小到大的顺序划分为T个数据簇{X1,j,...Xt,j,...,XT,j},每个数据簇代表对应的离散值,其中st代表第t个数据簇中特征fj的测量值个数,注意所有数据簇中测量值的个数不一定相等。

(2-2)由数据簇Xt,j获得对应的频率直方图,然后对其进行插值拟合得到特征fj的正态分布概率密度函数

(2-3)首先计算出随机模糊变量模型的外部隶属度函数uout(x),确定概率密度函数的峰值点xp,即正态分布的均值,其隶属度为uout(x)=1;对应fj在该数据簇的变化范围是[xL,xR]=[xp-3σ,xp+3σ],σ为标准差。在区间[xL,xp]和[xp,xR]上分别均匀插入M个点这些点可以产生M+2个嵌套子区间其中利用在这些区间进行积分运算,可以得到外部隶属度函数 uout(x),其中

(2-4)由于在测量特征fj时,传感器会存在系统误差,可以用内部隶属度函数uin(x)来表示系统误差,该误差取决于传感器供应商提供的测量精度>

(2-5)最终的随机模糊变量模型At,j是将uout(x)和uin(x)的α水平截集结合而得到的,uout(x)和uin(x)的α水平截集分别为那么At,j可由一组α水平截集来表示,这里可以用式(3)形式的矩阵表示:

其中αM+1=1<αM<…<α0=0。一般在实际应用中设定随机模糊变量的行数为100。

(3)将样本中特征fj的测量值xr,j中各个随机模糊变量模型匹配,获得xr,j与各离散值对应的信度,组成一条证据,具体的匹配方法如下:

(3-1)xr,j为单次测量值,因此其随机模糊变量模型为矩形隶属度函数:

(3-2)令xb=xr,j(1-ε%)和xc=xr,j(1+ε%)为μr,j(x)取值为1的左右分界点,那么μr,j(x)与At,j的匹配程度ρr,j(t)可以分为以下3种情况求取:

a)当时,此时μr,j(x)与At,j的内部隶属度函数uin(x)完全或部分重合,则ρr,j(t)=1。

b)当时,μr,j(x)位于At,j的左侧,则

这里k=0,1,2,...,M,通过对两个相邻截集之间的外部隶属度函数进行线性化,利用线性化函数的斜率公式获取匹配度,由于xc比xb更靠近At,j的uin(x),所以这里计算关于xc的斜率作为匹配度。

c)当时,μr,j(x)位于At,j的右侧,则

该式与式(5)是对偶关系,不再解释。

(4)依照以上过程,可以计算出μr,j(x)与每种离散值的随机模糊变量模型的匹配度ρr,j(t),t=1,2,...,T,一般这些匹配度取值之和不会为1,需要对它们进行归一化处理:

那么对于测量值xr,j,其对应各离散值的证据为

mr,j={mr,j(1),…,mr,j(t),…,mr,j(T)}(8)

根据最大信度决策规则来决定测量值的离散值,即测量值xr,j对应的离散值由最大信度mr,j(t)=max(mr,j)决定,可以判断其离散值为t。

为了加深对离散化过程的理解,假定在6种故障模式下分别测得100个样本的特征向量(f1,f2,...,f15),根据特征值的分布设定离散值V={1,2,3},分别代表数值大小的“低”,“中”,“高”;可以使用K均值算法将f1(这里以f1为里说明)的600>

特征f1的某一测量值为0.1743,通过步骤(3)的匹配方法获取该测量值的证据为(0.6213,0.2341,0.1446),可以判断该测量值对应的离散值为1。

(5)经过离散化处理后的所有的样本可以构成便于粗糙集处理的决策表形式,此时故障特征为条件属性,故障模式为决策属性,如表1所示

表1经离散化处理后的决策表

Uf1fjfmDx1t1,1t1,jt1,mF1xrtr,1tr,jtr,mFixsumtsum,1tsum,jtsum,mFN

决策表中离散值tr,j∈V,D代表样本的决策属性。

(6)令C={f1,f2,...,fm},根据离散化后的决策表可以构造条件属性集合C和决策属性D的等价关系

已知等价关系可以推导出等价类[x]C={y∈U|(x,y)∈RC}和>D={y∈U|(x,y)∈RD},最后由故障特征集合C和故障模式D对样本集合U的划分分别为:

更直观地可以表示为U/RC={B1,...,Bβ,...,BJ},U/RD={Y1,...,Yi,...,YN};Bβ和Yi分别是样本集U的子集,且Bβ中样本的条件属性都相等,Yi中样本决策属性都相同。

其中U2=U-U1。rj代表样本xp和>q在特征fj的差别:

其中,delrep代表删除集合中条件属性相同的样本。由此可以构建压缩二进制矩阵CBM=[objectpair,totaloneij,msij],其中>p,xq),表示对应的二进制编码。在矩阵CBM中totaloneab=1所在行中,二进制mspq中1的位置所代表的条件属性,即为核属性。

为了深入理解求核属性的过程,以经过离散化处理后的5个样本(故障特征有4个)进行说明,如下表所示

表2 5个样本组成的决策表

按照步骤(6)可以计算出:U1={x3,x4,x5},U2={x1,x2},由此构造的压缩二进制矩阵如表所示

表3压缩二进制差别矩阵

objectpairtotalonems(x3,x4)21010(x3,x5)21001(x3,x1)10100(x4,x1)31110(x5,x1)31101

通过该矩阵可以迅速直地获得核属性f2

(7)若以决策属性划分样本集合U,即U/RD={Y1,...,Yi,...,YN};否则,在决策表上增加一列属性δC={D(y):y∈[x]C},并以该属性代替决策属性来划分样本集合U,即U/δC={Y1,...,Yi,...,YN}。将所有核属性添加至约简集Red中,剩余属性C'=C-Red,分别计算剩余属性fw∈C'与约简集Red的并集B=Red∪fw以及B的似真信度,将具有最小似真信度并集对应的属性添加至Red集合中,重复上述步骤直至Red集合的信度为1,并获得最终的约简结果,具体步骤如下:>w∈C',首先计算其与约简集Red的并集B,以及B对样本集合的划分U/B={[x]B,x∈U},B=Red∪fw以及条件属性集合B在集合Yi的上近似由上近似可以得到该故障特征集的似真信度:

其中|.|代表集合中元素个数;

b)将具有最小值的γw对应的属性fw添加至约简集Red中,即Red=Red∪fw,同时令C'=C'-fw;若最小值为1,停止运算,得到最终的约简集Red;否则跳至步骤a继续运算。

以下结合附图,详细介绍本发明方法的实施例:

本发明方法的流程框图如图1所示,核心部分是:从转子试验平台上获取数据,根据数据分布,利用K均值算法将故障特征的测量值聚成T个数据簇,同时为每个数据簇构造随机模糊变量模型,并利用原测量值与随机模糊变量模型匹配,根据决策规则得到测量值对应的离散值,完成数据的离散化处理并得到决策表;针对决策表,利用压缩二进制矩阵求得核属性,分别计算剩余属性的似真信度,将具有最小似真信度的故障特征添加至核属性集合中,直至最终集合的信度大小为1,即可获得约简结果。

以下结合电机转子中实际测得的数据,详细介绍本发明方法的各个步骤,并通过实际结果验证融合诊断结果优于单个故障特征参数所提供的诊断结果。

1、电机转子故障诊断系统设置实例

实验设备如图2中的ZHS-2型多功能柔性转子试验台,将加速度传感器安置在转子支撑座的水平和垂直方向采集转子振动信号,经HG-8902采集箱将信号传输至计算机,然后利用Labview环境下的HG-8902数据分析软件得到转子振动加速度频谱作为故障特征信号。

2、电机转子故障设置及故障特征参数的选取

分别在试验台上设置了故障“正常”(F1),“转子不平衡”(四种不同程度>2,F3,F4,F5),“转子不对中”(F6),则故障集合为Θ={F1,F2,F3,F4,F5,F6}。与设备正常运行时的频谱相比,引发异常振动的故障源都会产生一定频率成分的振动加速度的幅值增加,可能是单一频率,也可能是一组频率或者某个频带。该实验环境中,设置转子转速为1500r/m,基频1X为25Hz,n倍频nX,n=1,2,3,…,>2。当故障出现时,不同的故障所表现出的频率及其幅值的增加情况也不同。故障的振动能量大都集中在1X~3X上,但是对单一某个频率振动加速度幅值的分析很难判定是哪个故障发生,而且一般采用多个传感器对设备进行监测,在ZHS-2型多功能柔性转子试验台上选用5个不同位置上传感器进行实时监测。所以这里将每个传感器上的振动加速度1X~3X的幅值(单位mm)作为故障特征参数,即>1,f2,...,f15

3、利用K均值和随机模糊变量模型对故障特征的进行离散化处理。

在每种故障模式下分别测得100个故障特征向量,总共600个特征向量样本,根据特征测量值的分布,针对每个故障特征fj设定3个离散值V={1,2,3},分别代表数值大小的“低”,“中”,“高”;按照步骤(2)可获得“低”,“中”,“高”对应的三种随机变量模型,其中ε=1%;利用步骤(3)和(4)完成特征测量值的匹配以及证据的获取,同时根据决策规则,确定每个特征测量值所对应的离散值,完成数据的离散化的处理并获取决策表。

4、求取决策表的核属性

根据步骤(6)可以求得压缩二进制矩阵,这里因为篇幅有限,只列出totalone 为1的行,如下表所示:

objectpairtotalonems(x392,x454)1000000000000010(x392,x480)1100000000000000

由压缩二进制矩阵可以快速得到该决策表的核属性f1,f14

5、计算约简结果

根据步骤(7),由于以决策属性来划分样本集合U;Red={f1,f14},剩余属性C'={f2,f3,f4,f5,f6,f7,f8,f9,f10,f11,f12,f13,f15},分别计算剩余属性与Red的似真信度因此应该将具有最小似真信度的f6添加至Red中,此时Red={f1,f6,f14},C'={f2,f3,f4,f5,f7,f8,f9,f10,f11,f12,f13,f15},继续按照上述算法步骤进行迭代运算直至最小似真信度值为1时,停止运算,最终计算得到的属性约简集为Red={f1,f2,f6,f13,f14},本发明方法将原有的15个故障特征约简至5个。

为了进一步说明本发明的有效性,本发明将以下方法进行对比,方法一:胡彧的《一种基于区分矩阵的属性约简算法》,方法二:叶东毅的《属性约简算法的一个改进》,方法三:蒙祖强的《一种新的启发式知识约简算法》,方法四:杨萍的《一种基于二进制区分矩阵的属性约简算法》。同时为了说明约简后的故障特征用于故障诊断的效果,在6种故障模式下再分别测的110个样本,总共660 个样本作为测试样本,并运用《Data Fusion Algorithmof Fault Diagnosis Considering Sensor Measurement Uncertainty》的方法来检验约简后的故障特征的确诊率。

表4几种方法的对比结果

从上表的分类准确率来看,利用约简后的属性进行故障诊断的准确率与将全部属性用于故障诊断的准确率并没有相差太多,说明了这15个故障特征中存在一些不太重要的属性,因此针对测得的故障特征进行约简是有效果的。虽然方法一算法效率较高,但并不一定能找到决策信息系统的较优约简结果,本发明所得的约简结果与方法二和方法三一致,但在程序运行时间上略有提升,主要是在计算压缩二进制差别矩阵的过程中,去除了重复对象,减少了计算量,同时压缩了差别矩阵占用的存储空间,方法四利用了传统的二进制差别矩阵,当论域中案例规模和属性数量较大时,运行效果比较差,同时其计算的约简结果也不理想。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号