首页> 中国专利> 基于数据驱动增量融合的螺旋式故障诊断模型

基于数据驱动增量融合的螺旋式故障诊断模型

摘要

本发明公开了一种基于数据驱动增量融合的螺旋式故障诊断模型,包括下述步骤:采集数据点并划分为正常样本和故障样本;随机抽样得到不同倾斜率的非平衡样本并划分为四组;采用基于划分近邻的重采样方法得到相对平衡的样本;将其输入DAE提取故障特征,存在新增数据时增量合并特征模式,然后输入SVM进行故障诊断;选取既具备信息量又富有代表性的实例,并对有效特征和实例进行动态综合评价;将有效实例集与新增数据合并,重新进行增量学习过程。该模型在充分考虑样本噪声和分布特征的情况下得到利于准确识别故障类型的平衡数据,通过选取特征和实例进行动态评价及增量合并将有效信息保留并传递下去,从而实现了设备故障快速高效的增量学习和分类诊断。

著录项

  • 公开/公告号CN107784325A

    专利类型发明专利

  • 公开/公告日2018-03-09

    原文格式PDF

  • 申请/专利权人 河北工业大学;

    申请/专利号CN201710983351.2

  • 发明设计人 刘晶;安雅程;季海鹏;刘彦凯;

    申请日2017-10-20

  • 分类号G06K9/62(20060101);G06N3/08(20060101);

  • 代理机构11265 北京挺立专利事务所(普通合伙);

  • 代理人刘阳

  • 地址 300401 天津市北辰区西平道5340号

  • 入库时间 2023-06-19 04:42:50

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2020-06-23

    授权

    授权

  • 2018-04-03

    实质审查的生效 IPC(主分类):G06K9/62 申请日:20171020

    实质审查的生效

  • 2018-03-09

    公开

    公开

说明书

技术领域

本发明涉及轴承设备故障诊断技术领域,尤其涉及一种基于数据驱动增量融合的螺旋式故障诊断模型。

背景技术

智能设备多应用于工业、航空、国防等重要领域,其故障后果相对严重。近年来,智能制造作为工业4.0的核心内容逐渐发展成为一个重要研究领域。同时,随着工业物联网的发展,大型设备在生产过程中不断涌现出海量运行数据,通过运行数据快速高效地分析提取故障信息,并对故障类型进行有效诊断和预测,成为智能制造领域的研究热点。

随着信息技术与智能技术的深度融合,设备生产过程中的运行数据获取变得更为容易,使得基于数据驱动的机器学习方法广泛应用于故障诊断领域,其中包括神经网络、支持向量机、贝叶斯和决策树等,都取得了较好的研究成果。文章[袁圃等.改进的基于遗传优化BP神经网络的电网故障诊断[J].电力系统及其自动化学报,2017,29(1):118-122.]提出一种改进的基于遗传优化BP神经网络对电网进行故障诊断;文章[李赢等.基于模糊聚类和完全二叉树支持向量机的变压器故障诊断[J].电工技术学报,201631(4):64-70.]提出基于模糊聚类和完全二叉树支持向量机的故障诊断模型在电力变压器故障诊断中获得较高诊断准确率;文章[肖红军等.面向污水处理的动态变分贝叶斯混合因子故障诊断[J].控制理论与应用,201633(11):1519-1526.]结合动态数据特性的基础上提出了一种基于变分贝叶斯混合因子的动态故障诊断方法对污水生化处理过程中的传感器故障进行诊断;文章[王江宇等.基于PCA-DT的多联机制冷剂充注量故障诊断[J].华中科技大学学报(自然科学版),201644(7):1-4.]基于主成分分析-决策树(PCA-DT)算法用于多联机的制冷剂充注量故障检测与诊断。但是,面对海量的新增状态数据,传统的机器学习方法需要将新增数据与原有数据合并重新训练整个模型,增加了计算复杂度和存储空间。更重要的是设备的状态和属性会随时间变化而发生改变,新增数据的潜在信息对设备当前状态和未来运行趋势有更重要的价值。因此,如何有效利用实时呈指数型增长的新增数据修正已有模型,成为当前急需解决的问题。增量学习即在保存大部分已经学习到知识的同时,不断地从新数据中学习新的知识。目前,已有多种增量学习模型,文章[唐明珠等.基于ICSVM的风电机组齿轮箱故障诊断[J].计算机工程与应用,2016,52(14):232-236.]是基于增量代价敏感支持向量机的风电机组齿轮箱故障诊断方法,建立以误分类代价最小化为目标的代价敏感支持向量机故障诊断模型;文章[尹刚等.自适应集成极限学习机在故障诊断中的应用[J].振动、测试与诊断,2013,33(5):897-901.]提出自适应集成极限学习机进行故障诊断,在线调整集成输出中子网络的投票权值以及网络输入权值和节点偏置;文章[胡银辉等.大规模InfiniBand网络自学习的故障诊断方法[J].计算机应用,2015,35(11):3092-3096.]在引入了特征选取策略和增量学习策略的基础上,提出了一种面向大规模IB网络增量学习的故障诊断方法IL_Bayes,在天河2真实的网络环境下进行诊断。这些增量学习模型在已有文献中都起到了减轻计算量、提高准确率、有效节约时间成本的作用。但在故障诊断领域,增量生成的数据流具有海量、非平稳、高噪声等特点,故障增量之间具有强关联性,且与原有数据具有强因果性,如不加以处理将会严重影响诊断效果。以上这些因素阻碍了传统增量学习方法在故障诊断领域的进一步应用。

发明内容

本发明的目的在于提供一种基于数据驱动增量融合的螺旋式故障诊断模型,以增量数据作为主线推进,针对每个螺旋周期中增量收集的数据块均采用非平衡数据处理、特征提取及分类、有效实例选择、特征和实例动态评价四个过程依次进行处理,并将当前选取的已评价特征和实例传递至下一螺旋周期中进行融合,以保留先前学习过的有效信息,从而形成螺旋式结构的故障诊断模型。该模型与传统增量学习方法相比,通过加入所提基于划分近邻的重采样技术使得故障数据达到相对平衡,将既具备信息量又富有代表性的实例选择传递以最大限度保留全部有效信息,并采用动态遗忘权重对提取的特征和选择的实例进行综合评价,形成了以增量信息动态连接的全新的螺旋式故障诊断模型,有效解决了设备故障数据海量、非平衡、高噪声、不平稳、强因果关联等特性带来的问题,实现了故障数据的非平衡增量学习以及有效特征和实例的动态评价与传递,达到了准确高效识别设备运行数据中增量故障信息的效果。

本发明所采取的技术方案为:

一种基于数据驱动增量融合的螺旋式故障诊断模型,包括下述步骤:

步骤一:对深沟球轴承使用电火花加工技术分别在轴承上对内圈、外圈和滚动体布置了3个故障等级的单点故障,选择电机驱动端振动传感器采集正常状态(N)、内圈故障(IRF)、外圈故障(ORF)和滚动体故障(BF)4种状态下的振动信号,得到多个数据点,使用小波包分解提取振动信号特征,将其按数据所属类别划分为正常样本和故障样本;

步骤二:对步骤一中正常样本和故障样本随机抽取不同倾斜率的五个样本,且每个样本中正常样本的数据点多于故障样本中的数据点,所述的五个样本为四个非平衡训练样本和一个测试样本;

步骤三:将步骤二中所述的每个训练样本等量划分为四组,其中一组作为训练模型,先加入模型中进行训练,得到新的模型后,再将第二组加入,得到新的模型后,再加入第三组,得到新的模型后,加入第四组,以验证模型的增量学习能力;

步骤四:将步骤二中的非平衡样本采用基于划分近邻的重采样方法分别划分为噪声点、边界点和安全点并进行多数类欠采样和少数类过采样,合并得到相对平衡的数据样本;

步骤五:将步骤四中所得的平衡数据样本作为去噪自动编码器的输入数据进行故障特征提取,当存在新增数据时通过模式相似度计算,利用模式增量与合并方法进行特征模式的增量与合并,然后输入SVM分类器中进行轴承故障模式分类诊断,并使用BP算法微调整个分类模型网络中的相关参数,最终得到螺旋式故障诊断模型。

步骤六:当有新增数据增量加入模型时,利用有效实例选择方法,从步骤一的数据样本中将既具备信息量又富有代表性的实例选取出来,构成有效实例集;

步骤七:对步骤五中提取的有效特征和步骤六中选择的有效实例进行动态综合评价,分别给予其能够代表重要性随时间变化的动态遗忘权重,得到动态加权有效特征和动态加权有效实例集;

步骤八:将步骤七中动态加权有效实例集与新增数据样本合并,重新进行增量学习过程,从而实现轴承非平衡故障数据的增量学习和可靠分类诊断。

基于上述步骤,该模型有效实现了设备故障数据的非平衡处理,即利用提出的基于划分近邻的重采样方法分别依据反向K近邻和K近邻对多数类样本和少数类样本进行合理划分,并采取不同欠采样和过采样操作以获得平衡数据,充分考虑了噪声数据和样本分布特征的情况。同时也实现了设备故障特征的增量提取和可靠分类,即通过DAE模型提取新增特征模式,基于相似度与原有模式选择增量合并输入分类器中并调整模型参数。然后提出选择最有价值的有效实例合并至下一新增数据块中,根据动态遗忘权重综合评价选取的特征和实例,既能够将先前学习的有效信息保存下来,又使新增数据中包含的信息得到应有的重视。

作为优选的,步骤四中基于划分近邻的重采样方法包括下述步骤:

(一)基于反向K近邻的多数类欠采样方法

对于非平衡数据中的多数类样本,通过计算非平衡数据中每个多数类样本的反向K近邻,将其划分为噪声点、边界点和安全点三类,分别采取不同的操作策略进行多数类欠采样。具体划分规则如下:

(1)噪声点:即某多数类样本点的反向K近邻均为少数类样本,则表示该点处于少数类样本包围之中,属于噪声数据;

(2)边界点:即某多数类样本点的反向K近邻中既有多数类样本又存在少数类样本,且无论归属哪一类的样本点数据个数较多,都表明该点处于划分数据类别的决策边界附近;

(3)安全点:即某多数类样本的反向K近邻均为多数类样本,则表示该点处于多数类样本内部且远离决策边界,对分类影响较小;

针对不同数据点的相应采样策略如下:

(1)对于噪声点,为避免其对后续分类效果产生消极影响,采取删除策略;

(2)对于边界点,在欠采样数目允许的情况下,保留所有边界点以辅助决策。当欠采样数目小于边界点数目时,优先选择反向K近邻中多数类个数多于少数类的数据点进行保留,因为其中包含了更多的安全信息,能够有效防止潜在噪声数据的影响;

(3)对于安全点,进行欠采样操作,保留相对靠近决策边界的数据点,即按照安全点与少数类样本中心的距离从大到小排列,优先删除距离较远的安全点。

(二)基于K近邻的少数类过采样方法:

对于非平衡数据中的少数类样本,通过计算其K近邻划分为噪声点、边界点和安全点三类,并进一步将边界点细分为危险点和半安全点,分别采取不同的操作策略进行合成少数类过采样。具体划分规则如下:

(1)噪声点:即某少数类样本点的K近邻均为多数类样本,则表示该点处于多数类样本包围之中,属于噪声数据;

(2)危险点:即某少数类样本点的K近邻中既有多数类样本又存在少数类样本,且多数类样本个数大于少数类样本,则表明该点处于划分数据类别的决策边界附近且更靠近多数类;

(3)半安全点:即某少数类样本点的K近邻中既有多数类样本又存在少数类样本,且少数类样本个数大于等于多数类样本,则表明该点处于划分数据类别的决策边界附近且更靠近少数类;

(4)安全点:即某少数类样本的K近邻均为少数类样本,则表示该点处于少数类样本内部且远离决策边界,对分类影响较小。

针对不同数据点采用不同策略进行合成少数类过采样,SMOTE通过在样本与其近邻的连线上随机线性插值选择一点作为新样本的方式来增加样本数量。对每个少数类样本x,搜索其k个最近邻,设采样倍率为n,则在其k个最近邻样本中随机选择n个样本,记为y1,y2,…,yn,在少数类样本x与yi(i=1,2,...,n)之间按下式随机线性插值,构造新的少数类样本ri

ri=x+rand(0,1)*(yi-x)>

其中rand(0,1)表示(0,1)区间内的一个随机数。则根据不同类型数据点的相应采样策略如下:

(1)对于噪声点,为避免其对后续分类效果产生消极影响,采取删除策略;

(2)对于危险点,为防止少数类附近的多数类样本在SMOTE过采样过程中影响生成的新样本,减少多数类对分类决策的消极影响,采取先删除其中的多数类样本,再进行合成少数类过采样的操作;

(3)对于半安全点,由于其处于决策边界附近,且越靠近多数类则说明其越具有重要作用,因此选择多数类附近的样本利用SMOTE过采样,直至达到规定数目;

(4)对于安全点,直接采用SMOTE进行过采样。

作为优选的,所述的基于划分近邻的重采样方法中对每一种划分类型的采样数量进行规定,应使多数类欠采样减少的数量Nd等于少数类过采样增多的数量Ni,即

其中,Nmaj为多数类样本的数量,Nmin为少数类样本的数量。

对于多数类样本欠采样的每一类数据点,首先对其中的Nn_maj个噪声点进行删除,则欠采样数目Nunder应为Nd-Nn_maj。当安全点个数Ns_maj≥Nunder时,从多数类样本安全点中删除距离少数类中心最远的Nunder个数据点;当安全点个数Ns_maj<Nunder时,在删除全部安全点后选择反向K近邻中少数类个数大于多数类的数据点,优先删除其中距离少数类中心最近的数据点,直至总删除数目达到Nunder

对于少数类样本过采样的每一类数据点,首先对其中的噪声点进行删除,则总合成新样本数目Nover应为少数类中噪声个数Nn_min+Ni。对相对远离决策边界的安全点适当少量合成,而对决策边界附近的危险点和半安全点适当增加合成个数。各个划分类别中新合成的样本数据由每类数据点K近邻中平均多数类占比确定,首先分别计算危险点、半安全点的K近邻中多数类平均占比Rdan、Rhalf

其中,Ndan_maj、Nhalf_maj、分别为每个危险点、半安全点K近邻中多数类的个数,K为规定的K近邻个数,Ndan、Nhalf分别为少数类中危险点、半安全点的个数。对于安全点,设定Rsafe为一个相对小值

其中,Nsafe为少数类中安全点的个数,且随其个数增多Rsafe逐渐减小。则考虑样本分布按比例构造少数类样本各个类型需要合成的新样本数量Nover_dan、Nover_half、Nover_safe

作为优选的,所述的去噪自动编码器故障特征提取包括下述步骤:

对样本x按照qD分布加入随机噪声,使其变成含噪样本

式中,qD为二项随机隐藏噪声。然后通过优化以下目标函数JDAE完成DAE的训练。

式中,L(x,z)为输入样本x与输出y之间的重构误差,fθ()为输入层到隐藏层的编码函数,θ为编码网络的参数集合,gθ′()为隐藏层到输出层的解码函数,θ′为解码网络的参数集合。

作为优选的,所述的模式相似度计算包括下述步骤:

采用能够有效区别几何距离难以分辨的对象的KL散度计算模式相似度Sim(P,Q)

式中Dkl(P||Q)为P和Q两个不同故障特征模式的KL散度

其中,P(i)和Q(i)代表特征模式P和Q中第i个值,P和Q之间的差异性越小,KL散度的值越小,则相似度值越大。

由于KL散度基于分布间的相对熵来计算其相异程度,而不是通过距离度量,因此可有效区别几何距离难以分辨的对象,优于其他基于距离的相似性度量方法,能够准确衡量故障模式之间的相似程度。

作为优选的,所述的模式增量与合并原则为:

计算新增特征模式与原有特征模式的KL相似度,选取最大值Sim(P,Q)max作为该特征的模式相似度值,并根据以下原则判定新增或合并该特征模式:

使用α代表使两对比特征之间相似度有意义的最小相似度阈值,其取值为α=minSim(Fi,Fj),代表现有特征模式中两两特征Fi与Fj之间相似度的最小值。使用β代表特征一般相似与高度相似之间的临界阈值,其取值为β=maxSim(Fi,Fj),代表现有特征模式中两两特征Fi与Fj之间相似度的最大值。可见,相似度阈值α<β,且随特征模式的增量与合并,阈值α与β动态变化。

(1)若β<Sim(P,Q)max,则表示新增特征与原有模式中的特征高度相似,可对其使用调和非线性加权平均法进行合并;

(2)若α<Sim(P,Q)max<β,则表示新增特征与已有特征均相异,不能使用与已有特征合并的方式代替新增特征,所以将该特征增量加入原有模式;

(3)若Sim(P,Q)max<α,则表示新增特征与已有特征的相似度低于最小阈值,代表该新增特征为无意义的噪声干扰值,对其舍弃处理。

作为优选的,所述的有效实例选择为:

通过信息量和代表性两个维度对实例是否有价值做出衡量,选取出既具有丰富信息量又能够代表大多数数据的有效实例传递至下一增量过程,保证故障关联性和数据因果性的延续。

对于信息量,采用对分类效果的影响程度来进行度量。每次按顺序取出一个实例并计算利用其余数据训练分类器时得到的误差E(yr|xr,δ),随后将其放回取出下一实例,由此选择出使分类误差最大的第k个数据

E(yk|xk,δ)=max{E(yr|xr,δ)}

其中,δ为分类器训练模型中的参数集合,yr和yk为输入xr和xk时的输出结果。对于其余数据的误差函数E(yr|xr,δ),采用误分率进行计算。因此,定义任意实例x的信息量为

其中,n为数据样本大小,n-1为去掉实例x后的数据样本大小,ne为分类错误的数据样本个数。选择使信息量eδ(x)大于阈值Δe的实例作为最有信息量的实例放入实例集I,Δe取值为利用所有数据样本进行分类时的误分率。

对于代表性,采用k-means算法对数据样本进行聚类得到各聚类中心,选择各聚类中心附近距其欧式距离小于阈值Δd的实例作为最有代表性的实例放入实例集R,Δd取值为各聚类中心中距离最近的两聚类中心之间距离的1/2。

为选取出同时具有信息量和代表性的实例,得有效实例集U=I∩R。

作为优选的,所述的特征和实例动态评价为:

(1)特征动态遗忘加权

根据新增模式增量与合并原则,计算其动态补偿权重,用以衡量该特征模式随时间变化的重要性改变程度,以权重补偿的形式达到增强有效模式和减少失效模式的作用。由于新增特征与已有特征的相似度能够在一定程度上反映该新增模式对当前模型的重要性,所以对模式相似度值使用下式归一化处理:

其中,minSim(P,Q)表示所有模式相似度中的最小值,maxSim(P,Q)表示所有模式相似度中的最大值。

对原则1)中采取合并操作的高度相似的特征模式,升高其权重以增强并记住有效模式。其动态权重计算方法如下:

Wi+1=Wi+Sim(P,Q)norm

其中,第i+1次对原有特征P进行合并操作时赋予的权重为第i次合并权重与原有特征P和新增特征Q的相似度相加,初次合并时i=0,W0为初始权值,设置为原有特征模式中两两特征之间的最大相似度maxSim(P,Q)。

对原则2)中采取新增操作加入原有模式的特征,为其赋予初始权值,计算方法如下:

W0=Sim(P,Q)norm

对于原则3)中舍弃的新增模式不予考虑,但原有模式中存在与所有新增特征相似度均小于阈值α的情况,采用下式缓慢降低其权重,直至小于阈值α时,表明该特征已变为无效特征,需将其从现有模式中删除使之彻底遗忘。

Wi+1=Wi-Sim(P,Q)norm

其中,第i+1次未在新增模式中出现的特征P的权重为第i次未出现时权重与其相似度做差,特征P初次未出现时i=0,W0为初始权值,同样设置为原有特征模式中两两特征之间的最大相似度maxSim(P,Q)。

(2)实例动态遗忘加权

考虑采用信息量eδ(x)作为实例重要性评价权重,信息量通过分类误差计算,一般为一个相对较小的数值,因此重要性权重Wimport计算为

Wimport=1+eδ(x)

由于设备状态随时间而不断产生变化,较早采集得到的实例可能存在逐渐失效的变化过程,而新增实例中具有较大可能包含更多重要信息,因此对于多次被选择的实例给予其一个动态衰减的遗忘权重Wforget

其中,m为实例在增量过程中被选择的次数。可得实例动态遗忘权重W为

最后将动态加权有效实例集与新增数据样本合并,重新进行下一周期的增量学习过程,完成基于数据驱动增量融合的故障诊断模型的螺旋过程。

本发明的具有以下有益效果:

本发明提出基于数据驱动增量融合的螺旋式结构模型,对增量数据采用非平衡数据处理、特征提取及分类、有效实例选择、特征和实例动态评价四个完整过程进行处理。该模型在充分考虑样本噪声和分布特征的情况下得到利于准确识别故障类型的平衡数据,通过选取特征和实例进行动态遗忘评价及增量合并将有效信息保留并传递下去,从而实现了设备故障快速高效的增量学习和动态评价。通过试验分析,验证了提出的基于数据驱动增量融合的螺旋式结构模型的有效性,使轴承故障诊断效率平均达到98.24%,相比无非平衡数据处理过程的方法平均提高了7.59%,相比其他浅层和无增量深度学习方法平均提高了3.80%,能够实现轴承非平衡故障数据的增量学习和可靠分类诊断。

附图说明

下面结合附图和具体实施方式对本发明作进一步详细的说明。

图1是本发明基于数据驱动增量融合的螺旋式结构模型处理过程图

图2是本发明的螺旋式增量学习过程图;

图3是本发明特征提取与分类模型网络结构图;

图4是本发明基于数据驱动增量融合的螺旋式结构模型流程图;

图5为四个训练集的K值与分类性能G-mean值关系图

图6为四个训练集的隐藏层数与重构误差关系图;

图7为隐藏节点数与重构误差关系图;

图8为四个训练集的倾斜率与分类性能G-mean值关系图;

图9为四个训练集的多数类与少数类诊断准确率对比图;

图10为四个训练集的30次试验训练误差率和测试误差率对比图;

图11为五种模型对四个训练集增量诊断的训练时间对比图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

一种基于数据驱动增量融合的螺旋式结构模型,包括下述步骤:

步骤一:对深沟球轴承使用电火花加工过程中分别在轴承上对内圈、外圈和滚动体布置了3个故障等级的单点故障,选择电机驱动端振动传感器采集正常状态(N)、内圈故障(IRF)、外圈故障(ORF)和滚动体故障(BF)4种状态下的振动信号,采样频率为12kHz,共计1,341,856个数据点,对所述的1,341,856个数据点,使用小波包分解提取振动信号特征,将其按数据所属类别划分为正常样本和故障样本;

步骤二:对步骤一中正常样本和故障样本随机抽取不同倾斜率的五个样本,且每个样本中正常样本的数据点多于故障样本中的数据点,所述的五个样本为四个非平衡训练样本和一个测试样本;

步骤三:将步骤二中所述的每个训练样本等量划分为四组,其中一组作为训练模型,先加入模型中进行训练,得到新的模型后,再将第二组加入,得到新的模型后,再加入第三组,得到新的模型后,加入第四组,以验证模型的增量学习能力;

步骤四:对步骤二中的非平衡样本采用基于划分近邻的重采样方法分别将非平衡样本划分为噪声点、边界点和安全点并用不同策略进行多数类欠采样和少数类过采样,合并得到相对平衡的数据样本;

其中,

多数类欠采样方法为:对于非平衡数据中的多数类样本,通过计算非平衡数据中每个多数类样本的反向K近邻,将其划分为噪声点、边界点和安全点三类,分别采取不同的操作策略进行多数类欠采样,具体划分规则如下:

(1)噪声点:即某多数类样本点的反向K近邻均为少数类样本,则表示该点处于少数类样本包围之中,属于噪声数据;

(2)边界点:即某多数类样本点的反向K近邻中既有多数类样本又存在少数类样本,且无论归属哪一类的样本点数据个数较多,都表明该点处于划分数据类别的决策边界附近;

(3)安全点:即某多数类样本的反向K近邻均为多数类样本,则表示该点处于多数类样本内部且远离决策边界,对分类影响较小。

针对不同数据点的相应采样策略如下:

(1)对于噪声点,为避免其对后续分类效果产生消极影响,采取删除策略;

(2)对于边界点,在欠采样数目允许的情况下,保留所有边界点以辅助决策。当欠采样数目小于边界点数目时,优先选择反向K近邻中多数类个数多于少数类的数据点进行保留,因为其中包含了更多的安全信息,能够有效防止潜在噪声数据的影响;

(3)对于安全点,进行欠采样操作,保留相对靠近决策边界的数据点,即按照安全点与少数类样本中心的距离从大到小排列,优先删除距离较远的安全点。

少数类过采样方法为:对于非平衡数据中的少数类样本,通过计算其K近邻划分为噪声点、边界点和安全点三类,并进一步将边界点细分为危险点和半安全点,分别采取不同的操作策略进行合成少数类过采样,具体划分规则如下:

(1)噪声点:即某少数类样本点的K近邻均为多数类样本,则表示该点处于多数类样本包围之中,属于噪声数据;

(2)危险点:即某少数类样本点的K近邻中既有多数类样本又存在少数类样本,且多数类样本个数大于少数类样本,则表明该点处于划分数据类别的决策边界附近且更靠近多数类;

(3)半安全点:即某少数类样本点的K近邻中既有多数类样本又存在少数类样本,且少数类样本个数大于等于多数类样本,则表明该点处于划分数据类别的决策边界附近且更靠近少数类;

(4)安全点:即某少数类样本的K近邻均为少数类样本,则表示该点处于少数类样本内部且远离决策边界,对分类影响较小。

针对不同数据点采用不同策略进行合成少数类过采样,SMOTE通过在样本与其近邻的连线上随机线性插值选择一点作为新样本的方式来增加样本数量。对每个少数类样本x,搜索其k个最近邻,设采样倍率为n,则在其k个最近邻样本中随机选择n个样本,记为y1,y2,...,yn,在少数类样本x与yi(i=1,2,...,n)之间按下式随机线性插值,构造新的少数类样本ri

ri=x+rand(0,1)*(yi-x)>

其中rand(0,1)表示(0,1)区间内的一个随机数。则根据不同类型数据点的相应采样策略如下:

(1)对于噪声点,为避免其对后续分类效果产生消极影响,采取删除策略;

(2)对于危险点,为防止少数类附近的多数类样本在SMOTE过采样过程中影响生成的新样本,减少多数类对分类决策的消极影响,采取先删除其中的多数类样本,再进行合成少数类过采样的操作;

(3)对于半安全点,由于其处于决策边界附近,且越靠近多数类则说明其越具有重要作用,因此选择多数类附近的样本利用SMOTE过采样,直至达到规定数目;

(4)对于安全点,直接采用SMOTE进行过采样。

另外,在基于划分近邻的重采样方法中对于每一种划分类型的采样数量算法为,应使多数类欠采样减少的数量Nd等于少数类过采样增多的数量Ni,即

其中,Nmaj为多数类样本的数量,Nmin为少数类样本的数量。

对于多数类样本欠采样的每一类数据点,首先对其中的Nn_maj个噪声点进行删除,则欠采样数目Nunder应为Nd-Nn_maj。当安全点个数Ns_maj≥Nunder时,从多数类样本安全点中删除距离少数类中心最远的Nunder个数据点;当安全点个数Ns_maj<Nunder时,在删除全部安全点后选择反向K近邻中少数类个数大于多数类的数据点,优先删除其中距离少数类中心最近的数据点,直至总删除数目达到Nunder

对于少数类样本过采样的每一类数据点,首先对其中的噪声点进行删除,则总合成新样本数目Nover应为少数类中噪声个数Nn_min+Ni。对相对远离决策边界的安全点适当少量合成,而对决策边界附近的危险点和半安全点适当增加合成个数。各个划分类别中新合成的样本数据由每类数据点K近邻中平均多数类占比确定,首先分别计算危险点、半安全点的K近邻中多数类平均占比Rdan、Rhalf

其中,Ndan_maj、Nhalf_maj、分别为每个危险点、半安全点K近邻中多数类的个数,K为规定的K近邻个数,Ndan、Nhalf分别为少数类中危险点、半安全点的个数。对于安全点,设定Rsafe为一个相对小值

其中,Nsafe为少数类中安全点的个数,且随其个数增多Rsafe逐渐减小。则考虑样本分布按比例构造少数类样本各个类型需要合成的新样本数量Nover_dan、Nover_half、Nover_safe

步骤五:将加入随机噪声的平衡数据样本作为去噪自动编码器的输入进行故障特征提取,当存在新增数据时通过模式相似度计算,利用模式增量与合并原则进行特征模式的增量与合并,然后输入SVM分类器中进行轴承故障模式分类诊断,并使用BP算法微调整个分类模型网络中的相关参数;

其中,去噪自动编码器故障特征提取方法为:

对样本x按照qD分布加入随机噪声,使其变成含噪样本

式中,qD为二项随机隐藏噪声。然后通过优化以下目标函数JDAE完成DAE的训练。

式中,L(x,z)为输入样本x与输出y之间的重构误差,fθ()为输入层到隐藏层的编码函数,θ为编码网络的参数集合,gθ′()为隐藏层到输出层的解码函数,θ′为解码网络的参数集合。

其中,模式相似度计算为:

采用能够有效区别几何距离难以分辨的对象的KL散度计算模式相似度Sim(P,Q)

式中Dkl(P||Q)为P和Q两个不同故障特征模式的KL散度

其中,P(i)和Q(i)代表特征模式P和Q中第i个值,P和Q之间的差异性越小,KL散度的值越小,则相似度值越大。

由于KL散度基于分布间的相对熵来计算其相异程度,而不是通过距离度量,因此可有效区别几何距离难以分辨的对象,优于其他基于距离的相似性度量方法,能够准确衡量故障模式之间的相似程度。

另外,模式增量与合并原则为:

计算新增特征模式与原有特征模式的KL相似度,选取最大值Sim(P,Q)max作为该特征的模式相似度值,并根据以下原则判定新增或合并该特征模式:

使用α代表使两对比特征之间相似度有意义的最小相似度阈值,其取值为α=minSim(Fi,Fj),代表现有特征模式中两两特征Fi与Fj之间相似度的最小值。使用β代表特征一般相似与高度相似之间的临界阈值,其取值为β=maxSim(Fi,Fj),代表现有特征模式中两两特征Fi与Fj之间相似度的最大值。可见,相似度阈值α<β,且随特征模式的增量与合并,阈值α与β动态变化。

1)若β<Sim(P,Q)max,则表示新增特征与原有模式中的特征高度相似,可对其使用调和非线性加权平均法进行合并;

2)若α<Sim(P,Q)max<β,则表示新增特征与已有特征均相异,不能使用与已有特征合并的方式代替新增特征,所以将该特征增量加入原有模式;

3)若Sim(P,Q)max<α,则表示新增特征与已有特征的相似度低于最小阈值,代表该新增特征为无意义的噪声干扰值,对其舍弃处理。

步骤六:当有新增数据增量加入模型时,利用有效实例选择方法,从原有数据样本中将既具备信息量又富有代表性的实例选取出来,构成有效实例集;

通过信息量和代表性两个维度对实例是否有价值做出衡量,选取出既具有丰富信息量又能够代表大多数数据的有效实例传递至下一增量过程,保证故障关联性和数据因果性的延续。

对于信息量,采用对分类效果的影响程度来进行度量。每次按顺序取出一个实例并计算利用其余数据训练分类器时得到的误差E(yr|xr,δ),随后将其放回取出下一实例,由此选择出使分类误差最大的第k个数据

E(yk|xk,δ)=max{E(yr|xr,δ)}

其中,δ为分类器训练模型中的参数集合,yr和yk为输入xr和xk时的输出结果。对于其余数据的误差函数E(yr|xr,δ),采用误分率进行计算。因此,定义任意实例x的信息量为

其中,n为数据样本大小,n-1为去掉实例x后的数据样本大小,ne为分类错误的数据样本个数。选择使信息量eδ(x)大于阈值Δe的实例作为最有信息量的实例放入实例集I,Δe取值为利用所有数据样本进行分类时的误分率。

对于代表性,采用k-means算法对数据样本进行聚类得到各聚类中心,选择各聚类中心附近距其欧式距离小于阈值Δd的实例作为最有代表性的实例放入实例集R,Δd取值为各聚类中心中距离最近的两聚类中心之间距离的1/2。为选取出同时具有信息量和代表性的实例,得有效实例集U=I∩R。

步骤七:对提取的有效特征和选择的有效实例进行动态综合评价,分别给予其能够代表重要性随时间变化的动态遗忘权重;

1)特征动态遗忘加权

根据新增模式增量与合并原则,计算其动态补偿权重,用以衡量该特征模式随时间变化的重要性改变程度,以权重补偿的形式达到增强有效模式和减少失效模式的作用。由于新增特征与已有特征的相似度能够在一定程度上反映该新增模式对当前模型的重要性,所以对模式相似度值使用下式归一化处理:

其中,minSim(P,Q)表示所有模式相似度中的最小值,maxSim(P,Q)表示所有模式相似度中的最大值。

对模式增量与合并原则1)中采取合并操作的高度相似的特征模式,升高其权重以增强并记住有效模式。其动态权重计算方法如下:

Wi+1=Wi+Sim(P,Q)norm

其中,第i+1次对原有特征P进行合并操作时赋予的权重为第i次合并权重与原有特征P和新增特征Q的相似度相加,初次合并时i=0,W0为初始权值,设置为原有特征模式中两两特征之间的最大相似度maxSim(P,Q)。

对模式增量与合并原则2)中采取新增操作加入原有模式的特征,为其赋予初始权值,计算方法如下:

W0=Sim(P,Q)norm

对于模式增量与合并原则3)中舍弃的新增模式不予考虑,但原有模式中存在与所有新增特征相似度均小于阈值α的情况,采用下式缓慢降低其权重,直至小于阈值α时,表明该特征已变为无效特征,需将其从现有模式中删除使之彻底遗忘。

Wi+1=Wi-Sim(P,Q)norm

其中,第i+1次未在新增模式中出现的特征P的权重为第i次未出现时权重与其相似度做差,特征P初次未出现时i=0,W0为初始权值,同样设置为原有特征模式中两两特征之间的最大相似度maxSim(P,Q)。

2)实例动态遗忘加权

考虑采用信息量eδ(x)作为实例重要性评价权重,信息量通过分类误差计算,一般为一个相对较小的数值,因此重要性权重Wimport计算为

Wimport=1+eδ(x)

由于设备状态随时间而不断产生变化,较早采集得到的实例可能存在逐渐失效的变化过程,而新增实例中具有较大可能包含更多重要信息,因此对于多次被选择的实例给予其一个动态衰减的遗忘权重Wforget

其中,m为实例在增量过程中被选择的次数。可得实例动态遗忘权重W为

步骤八:将动态加权有效实例集与新增数据样本合并,重新进行增量学习过程,从而实现轴承非平衡故障数据的增量学习和可靠分类诊断。

1、数据描述

使用电火花加工技术分别在轴承型号为6205-2RS JEM SKF深沟球轴承上对内圈、外圈和滚动体布置了3个故障等级的单点故障,选择电机驱动端振动传感器采集的正常状态(N)、内圈故障(IRF)、外圈故障(ORF)和滚动体故障(BF)这4种状态下的振动信号,采样频率为12kHz,共计1,341,856个数据点,并对1,341,856个数据点使用小波包分解各频段的能量值,提取合适的参数特征以区分不同类别。分析数据样本可知,正常数据与故障数据之间存在不平衡现象,正常数据为多数类样本,其余故障数据为少数类样本。为试验本文提出模型的非平衡数据处理能力,分别随机抽样80、40、20、10个故障样例与100个正常样例合并形成4个不同训练样本,20个故障样例与50个正常样例组成测试样本,其中每个样例包含2048个数据点。为试验模型的增量学习能力,将上述每个训练样本等量划分为四组,其中一组用于训练基于数据驱动增量融合的螺旋式结构模型,剩余三组分三次添加至已有模型进行增量学习。具体轴承状态数据样本描述如表1所示。仿真实验在Windows 764位系统Intel-I5CPU计算机R3.2.5平台下完成。

表1 轴承状态数据描述

2、模型参数与结构

1)非平衡数据处理中的K值

基于数据驱动增量融合的螺旋式结构模型采用的基于划分近邻的重采样方法中,近邻选取的个数K在处理非平衡数据过程中非常重要,影响着每一类数据的具体划分情况,因此利用试验的方式进行确定。通过计算重采样算法中不同k值对应的不同G-mean值,来确定其最佳取值。其中G-mean指标能够同时兼顾少数类与多数类的识别率,有效反映出分类器对非平衡数据的性能高低,其计算方式为

其中,TP表示正确分类的少数类样本数量,TN表示正确分类的多数类样本数量,FP表示错分为少数类的多数类数量,FN表示错分为多数类的少数类数量。将k的取值范围定于1~10之间进行讨论,在四个不同训练集中的试验结果如图5所示,G-mean值越大表明分类性能越好,综合考虑G-mean值与计算量后,可得最优k值分别选取为:7、8、5、5。

2)分类模型结构

对于隐藏层数目的确定,设置其他模型参数相同,针对隐藏层数目从1-10层增加分别测试模型在四个不同训练集中的重构误差,实验结果如图6所示,在训练集1、训练集3、训练集4中模型重构误差的变化幅度均在隐藏层数增加至3层后达到平稳,说明继续增加隐藏层数不仅没有降低模型重构误差反而大幅增加了计算量。对于训练集2而言,虽然重构误差一直在随着隐藏层数的增加而逐渐降低,但下降幅度不大,且考虑到后续对于不同倾向率训练集的对比,应选用相同结构的分类模型,因此选取隐藏层数目为3层,构建分类网络模型。

对于隐层节点数目的确定,设置其他模型参数相同,隐藏层数目为3层,设置3层节点个数按通过实验获得的比例1:2:3增加,图7显示了随第一个隐层的节点数增加模型重构误差的变化,其余各隐层节点数可用其推算。由图7可以看出,训练集2、训练集3、训练集4在初始阶段模型重构误差随隐层节点数的增加而急剧下降,但当隐层节点数超过18之后,模型重构误差呈缓慢上升趋势。就训练集1而言,模型重构误差在隐层节点数超过54时急剧下降,且达到90时相对平稳。由于其余训练集的模型重构误差在隐层节点数从18到90增长过程中上升幅度较小,且为保证后续使用相同结构的分类模型对不同倾向率的训练集进行对比,因此选取隐层节点数目分别为90、180、270,构建分类网络模型。

3、结果分析

1)非平衡数据处理试验

以上节确定的模型参数和结构为基础,针对四种不同倾斜率的非平衡训练集,分别采用包含非平衡处理过程的基于数据驱动增量融合的螺旋式故障诊断模型和不包含非平衡处理过程的基于数据驱动增量融合的螺旋式故障诊断模型(None)以及采用随机欠采样(R-U)、随机过采样(R-O)、合成少数类过采样(SMOTE)的分类模型进行对比训练,并使用测试集分别测试模型诊断效果,记录10次试验的准确率和G-mean值并求取平均值,对比结果如表2所示。

表2 非平衡故障诊断结果比较

由表2可得,本文所提基于数据驱动增量融合的螺旋式故障诊断模型在准确率和G-mean方面均优于未进行非平衡数据处理的模型,并且对四个不同倾斜率的非平衡训练集和测试集的分类效果均优于其他仅单一进行欠采样或过采样过程的非平衡数据处理方法。图8为上述五种模型在不同倾斜率下分类性能的变化情况,由此可以看出本文提出的基于数据驱动增量融合的螺旋式故障诊断模型中基于划分近邻的重采样方法较其他方法模型相比,在不同数据倾斜率的情况下均能取的较高的G-mean值,且数据倾斜程度并未明显影响所提方法的分类性能,可见提出的模型对非平衡数据进行了很好的处理。图9为上述五种模型在四个不同训练集中对多数类样本和少数类样本的分类准确率对比,可以看出所提模型不仅达到了很高的准确率,还能够针对少数故障类获得较高的识别率。而其他方法虽然整体准确率较高,但少数类样本识别率偏低。

2)增量学习试验

将4个不同训练集分别划分为四组,其中一组用于训练基于数据驱动增量融合的螺旋式故障诊断模型,剩余三组分三次添加至已有模型进行增量学习。分别使用本文提出的基于数据驱动增量融合的螺旋式故障诊断模型同BP、SVM、AE、DAE方法进行增量学习对比,并使用测试样本测试模型诊断效果,对每组增量数据记录10次试验的准确率、G-mean值和运行时间并求取平均值,计算四组增量数据的训练平均值和测试值对比结果如表3所示。

表3 故障诊断结果比较

由表3可得,本文所提基于数据驱动增量融合的螺旋式故障诊断模型在准确率、G-mean和运行时间方面对于四个不同非平衡倾斜率的训练集均基本优于其他四种算法。从模型诊断效果方面来看,本文所提模型的准确率和G-mean值在不同倾斜率的数据集中均保持了较高的水平,明显优于未添加增量学习的AE和DAE算法,而浅层BP算法和SVM算法虽然取得了极高的训练效果,但BP算法的测试结果较差且训练所需时间较长,SVM算法对不同倾斜率数据的测试效果波动较大。可见提出的模型由于有效选取了增量数据中有效的特征模式和数据实例进行加权合并和传递,考虑了其随时间变化的重要性改变程度,因此使得模型故障诊断效果有了一定程度的提高。图10为针对四个不同训练集分别使用上述五种模型进行30次训练和测试所得分类误差率对比结果,可以看出所提IMH模型在训练和测试中均表现平稳,能够获得比其他模型更加稳定的分类性能。从模型运行时间方面来看,除训练时间由于包含构造深度模型所需的时间开销因此多于SVM算法外,提出的模型在训练时间和测试时间上均优于其他算法,这是由于其他四种算法在面临增量数据时需要重新训练已有模型增加了运行时间,因此表明所提基于数据驱动增量融合的螺旋式故障诊断模型对于减轻模型计算量节约时间成本起到了一定作用。

针对每一次添加增量数据时的训练时间情况进行分析,图11所示为针对4个不同训练集分别将其分四组依次加入训练模型时每一次训练时间的曲线图,同样使用BP算法、SVM算法和无增量学习的AE算法、DAE算法与提出的模型方法进行对比。可见,所提基于数据驱动增量融合的螺旋式故障诊断模型在数据增量的过程中的训练时间并未显著增长,且保持在0-2分钟以内,明显少于除SVM以外的其他三种算法。AE和DAE两种深层算法由于数据规模的增加致使构造模型所需时间大幅上涨,而SVM算法虽然进行增量学习所需的训练时间很少,但训练和测试效果易受数据集倾斜率影响产生较大波动。

由此可见,本文所提基于数据驱动增量融合的螺旋式故障诊断模型与无增量学习过程的方法相比在综合考虑模型精度、G-mean指标和运行时间三方面的情况下具有较为明显的优势。所提故障诊断模型能够通过基于划分近邻的重采样方法对广泛存在的非平衡故障数据进行有效处理,并将新增数据中的有效特征和实例经过动态遗忘加权评价增量合并传递下去,既保留了先前学习的有效信息,又使新增数据中包含的信息得到了应有的重视,有效提高了轴承设备故障分类诊断的性能。

4、结论

为解决设备运行过程中海量、非平衡、高噪声、强因果关联的设备运行数据带来的各种问题,本文提出了基于数据驱动增量融合的螺旋式结构模型,对增量数据采用非平衡数据处理、特征提取及分类、有效实例选择、特征和实例动态评价四个完整过程进行处理。该模型在充分考虑样本噪声和分布特征的情况下得到利于准确识别故障类型的平衡数据,通过选取特征和实例进行动态遗忘评价及增量合并将有效信息保留并传递下去,从而实现了设备故障快速高效的增量学习和动态评价。通过试验分析,验证了提出的基于数据驱动增量融合的螺旋式结构模型的有效性,使轴承故障诊断效率平均达到98.24%,相比无非平衡数据处理过程的方法平均提高了7.59%,相比其他浅层和无增量深度学习方法平均提高了3.80%,能够实现轴承非平衡故障数据的增量学习和可靠分类诊断。

工作原理如下:对于每个增量数据块在其螺旋周期内依次采用以下所提方法进行处理,首先采用基于反向K近邻的欠采样和基于K近邻的过采样技术在充分考虑样本分布特征的情况下,分别减少多数类样本个数和增加少数类样本个数,并排除噪声数据,以获得较为平衡的数据块;随后利用DAE模型提取数据块中的故障特征模式并进行分类诊断,对新增模式基于相似度与原有模式选择合并,以实现故障特征的增量学习;然后当存在新增数据增量加入模型时,在考虑故障增量与原有数据之间具有强因果关联的基础上,选择既具有信息量又具有代表性的实例作为有效实例,经评价后合并至下一新增数据块中进行下一轮处理,以实现故障数据的增量学习;最后根据重要性和时变性两种度量动态综合评价选取的特征和实例,既能够将先前学习的有效信息保存下来,又使新增数据中包含的信息得到应有的重视,以符合设备运行过程的实际情况。

1、基于数据驱动增量融合的螺旋式结构模型结构

本发明具体处理过程如图1所示,完整的螺旋式增量学习过程如图2所示,通过从预处理到动态评价的完整过程解决处理设备运行中不断涌现的新增数据。其中在特征模式提取与分类阶段,通过堆叠多层相连的去噪自动编码器构成深度网络结构,如图3所示,并在深度网络结构的顶层添加具有分类功能的输出层,使用SVM作为分类器进行有监督分类,针对误差使用BP算法微调深度网络结构各层参数,进一步优化整个网络使达到全局最优。

2、算法具体实现

基于数据驱动增量融合的螺旋式结构模型步骤描述如下,流程图如图4所示。

(1)对深沟球轴承使用电火花加工技术分别在轴承上对内圈、外圈和滚动体布置了3个故障等级的单点故障,选择电机驱动端振动传感器采集正常状态(N)、内圈故障(IRF)、外圈故障(ORF)和滚动体故障(BF)4种状态下的振动信号,采样频率为12kHz,共计1,341,856个数据点,并使用小波包分解提取振动信号特征;

(2)对轴承设备故障数据进行预处理,按数据所属类别划分为正常多数类样本和故障少数类样本,通过随机抽样得到不同倾斜率的四个非平衡训练样本和一个测试样本,以验证模型的非平衡数据处理能力。将上述每个训练样本等量划分为四组,其中一组用于训练模型,剩余三组分三次添加至已有模型,以验证模型的增量学习能力;

(3)采用基于划分近邻的重采样方法分别将非平衡样本划分为噪声点、边界点和安全点并用不同策略进行多数类欠采样和少数类过采样,合并得到相对平衡的数据样本;

(4)将加入随机噪声的平衡数据样本作为DAE的输入进行故障特征提取,当存在新增数据时通过模式相似度计算,利用模式增量与合并原则进行特征模式的增量与合并,然后输入SVM分类器中进行轴承故障模式分类诊断,并使用BP算法微调整个分类模型网络中的相关参数;

(5)当有新增数据增量加入模型时,利用有效实例选择方法,从原有数据样本中将既具备信息量又富有代表性的实例选取出来,构成有效实例集;

(6)对提取的有效特征和选择的有效实例进行动态综合评价,分别给予其能够代表重要性随时间变化的动态遗忘权重;

(7)将动态加权有效实例集与新增数据样本合并,重新进行增量学习过程,从而实现轴承非平衡故障数据的增量学习和可靠分类诊断。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号