法律状态公告日
法律状态信息
法律状态
2020-06-30
授权
授权
2018-12-11
实质审查的生效 IPC(主分类):G01M13/00 申请日:20180320
实质审查的生效
2018-11-16
公开
公开
技术领域
本发明属于旋转机械故障诊断及信号处理技术领域,涉及一种基于改进稀疏滤波的机械故障特征自动提取方法。
背景技术
旋转机械振动信号包含关于故障的丰富信息,所以常用做故障信号特征提取数据源之一。直接测得的信号往往包含很多噪声,需要进行信号处理,来实现对信号的特征提取。现有的信号处理技术,包括时域分析技术、频域分析技术、时频分析技术、小波包分析技术等。这些信号处理技术可以实现特定特征的高效提取,但是这些提取的信息往往繁杂,后期的分析处理和进一步提取需要大量人工操作且时间成本很高。同时,为了实现信号特征分类,往往需要得到的特征具有很强的可区分性。传统信号处理方法可以实现信号主要特征的提取但却缺少对这些特征的挑选能力。
近年来,随着工业大数据概念的不断推广,多领域的大数据自动处理广泛使用人工神经网络。在故障诊断领域采用人工神经网络技术,不仅能带来高自动化程度的非线性特征提取能力,也可在很大程度上减少人工干预。故障诊断方面的人工神经网络包括自动编码器、限制玻尔兹曼机、卷积神经网络等多种形式。其中非监督特征学习网络因其特征提取中不需要样本标签,越来越受到人们的关注。
作为人工神经网络的一种,稀疏滤波自提出以来就受到人们的广泛关注。主要有以下两个原因。首先,它作为一种无监督特征提取技术能够有效利用无标签样本。此外,它实现方便,只需要通过很少的几行代码就能实现信号的特征提取。而且在图像识别、语音识别等领域的应用中发现,仅单层稀疏滤波就能达到较好的效果。因此,近年来稀疏滤波技术被逐渐应用到故障诊断领域信号的特征提取,但在实际使用中仍存在以下问题。首先在使用原始信号作为网络训练样本,往往会存在一种叫移变性的问题,这一性质跟图像处理中的平移噪声类似,即样本中需要识别的物品不在图像中的同一位置上。这一性质使得时域信号样本并不规整,网络训练及使用难度加大。如果对时域样本信号进行FFT变换,将会得到各个时域样本的频谱,频谱样本很规整,不再有移变性问题。但是,稀疏滤波具有随着迭代次数性能退化的问题,且仍然存在泛化能力不足的问题,而正则化方法能提高网络泛化能力。一般L2范数正则化方法对于频域信号作为样本的网络性能的提高并不突出。同时,L2范数不能使得学习到的特征具有稀疏性,也不能使提取特征的权值矩阵变得稀疏。而稀疏性对于分类任务是一个十分有效和必要的性质。此外,其他对于权值矩阵正交性加强的方法,都不能明显提高网络的性能。总之,现有的信号处理技术样本训练时间长,网络泛化能力差,导致故障特征的提取准确率低。
发明内容
本发明的目的在于克服现有技术的缺陷,提供一种基于改进稀疏滤波的机械故障特征自动提取方法,通过无监督学习方法进行频域样本特征提取,同时采用正则化策略提高网络泛化能力并通过训练提前终止策略进一步加快了网络的训练速度,从而提高故障特征的提取准确率和稳定性。
为解决上述技术问题,本发明采用以下技术方案。
一种基于改进稀疏滤波的机械故障特征自动提取方法,其特征在于,包括以下步骤:
步骤1.对原始振动信号进行预处理:采用采集得到的原始振动信号分为样本集后作为训练样本,对采样得到的时域样本进行快速傅里叶变换,将原时域样本转换成频域样本,并对样本白化处理;所述步骤1的具体过程为:
1.1.收集样本:采样每个工况下每种故障的原始振动信号,得到所有时域样本
1.2.时域样本转为频域样本:将原时域信号样本
1.3.样本白化处理:将训练样本集
cov(ST)=EUET(1)
式中cov(ST)是S的协方差矩阵,E是特征向量矩阵,U是以特征值为对角元素的对角矩阵;白化后的训练样本集Sw通过下式得到:
Sw=EU-1/2ETS(2)。
步骤2.使用白化处理的频域样本来训练具有L1正则化的稀疏滤波。所述步骤2的具体过程为:
输入经过白化的频域样本为训练数据,此样本通过使用权值矩阵W∈RN×L及训练中的激活函数1映射到特征向量
式中
稀疏滤波的每次迭代优化过程包括以下步骤:
1)行归一化:对特征矩阵f的行进行归一化
2)列归一化:经过列归一化后使各个样本落在L2球上,
3)优化目标函数:对上述归一化过的特征矩阵进行稀疏度优化;使用L1正则化来进一步约束权值矩阵稀疏性,进而对特征矩阵的稀疏性进行约束;
4)训练具有L1正则化的稀疏滤波:通过迭代的方式实现稀疏滤波优化,以上述1)--3)步骤循环一次作为一次迭代,最终经过多次迭代直至达到提前终止要求或最大迭代次数即完成训练;采用拟牛顿法(L-BFGS)的优化算法,设置训练迭代最大次数为100次。
所述的具有L1正则化的稀疏滤波通过以下过程获得:
2a.构造L1正则化的稀疏滤波的目标函数:使用L1范数对权重矩阵进行约束,增加的约束如下式(4)中第2项所示,新的目标函数为:
其中λ1衡量原稀疏滤波项和新的L1正则化项的相对大小,需要进行调节;wij为权重矩阵W的第i行第j列的元素;
2b.设置训练提前终止条件:使训练在达到规定条件下实现提前终止,最终通过权值矩阵来提取旋转机械振动信号的高维故障特征;
提前终止的衡量标准选用特征矩阵的稀疏程度作为标准,上述归一化的特征矩阵为
其中d为特征矩阵的所有元素的均方根值,M为特征矩阵的列数,即训练样本的个数;
步骤3.使用前向传播,计算学习到训练样本的特征;所述步骤3的具体过程为:
通过学习到的权值矩阵W以及激活函数2,计算得到样本特征;在激活函数2处使用一个新的函数σ(x)=log(1+x2),计算过程如下所示:
其中,xi为第i个样本;Wj为权值矩阵W的j行;
步骤4.采用高维特征训练softmax分类器,实现对提取的特征的自动分类;即:使用训练样本的特征及其对应的样本标签训练分类器,通过前向传播得到的特征以及训练样本对应的故障类型标签进行softmax分类器的训练;
步骤5.测试样本故障诊断:通过将设备采集得到的振动数据信号输入到上述训练好的网络,即可实现故障信号的特征自动提取及智能诊断;
所述的稀疏滤波在稀疏滤波训练和局部特征计算中使用不同的激活函数;在网络训练中使用软阈值函数,在局部特征计算中使用f(x)=log(1+x2)激活函数。
与现有技术相比,本发明的优点和有益效果是:
1.本发明通过无监督学习方法进行频域样本特征提取,同时采用正则化策略提高网络泛化能力并通过训练提前终止策略进一步加快了网络的训练,较现有方法更加准确、稳定。通过改进稀疏滤波实现频域样本故障特征的自动提取及诊断。通过向稀疏滤波中加入L1正则化项,提高了其泛化能力、稳定性、诊断准确率等多方面性能,且使得权值矩阵W更加稀疏,更加适合于提取具有区分性的特征,这是现有L2正则化等正则化方法不能实现的。
2.本发明在L1正则化的稀疏滤波的训练中,加入了基于稀疏性的提前终止策略,这使得网络不会过训练。同时,提前终止策略的加入,在网络性能产生退化之前,实现训练终止,使得网络训练的时间成本进一步降低,测试准确率也进一步提高。
3.本发明使用新的激活函数组合,提高了诊断的准确率及抗噪能力。
4.本发明方法可以应用到旋转机械振动系统故障诊断中,用以分析引起机械故障的类型,进行系统的状态监测及故障诊断等。
附图说明
图1是本发明的一种实施例的方法流程图;
图2是本发明的一种实施例的稀疏滤波特征提取部分示意图。
图3是本发明的一种实施例的一组实验结果示意图。
图4是本发明的另一种实施例的实验结果示意图。
具体实施方式
本发明的一种基于改进稀疏滤波的机械故障特征自动提取方法,首先将时域信号样本进行FFT变换,变换得到频域样本。因频域样本的对称性,样本维数减少了一半,实现数据的压缩。因为每个频域样本的相同维数的数据点对应着相同频段的信号幅值,所以频域信号更加规整,极大方便了后续使用。然后,在原有的稀疏滤波中,通过L1正则化对权值矩阵进行稀疏性约束,来进一步加强其稀疏性。同时,使用一种提前终止策略来提早结束训练,以防止过训练的发生。本发明方法可构成一种新型的智能故障诊断网络,包括信号快速傅里叶变换(FFT)前处理、改进稀疏滤波以及softmax分类器,能够大大提高故障诊断准确率并使过拟合风险显著降低。
下面结合附图对发明的技术方案做进一步详细说明:
图1是本发明的一种实施例的方法流程图。如图1所示,本实施例方法包括以下步骤。
第一步:对原始振动信号进行预处理:采用采集得到的原始振动信号分为样本集后作为训练样本,对采样得到的时域样本进行快速傅里叶变换,将原时域信号样本转换成频谱信号样本,并对样本白化处理。具体过程如下:
(1)收集样本:采样每个工况下每中故障的原始振动信号,得到所有时域信号样本
(2)时域样本转为频域样本:将原时域信号样本
(3)样本白化处理:将训练样本集
cov(ST)=EUET(1)
式中cov(ST)是S的协方差矩阵,E是特征向量矩阵,U是以特征值为对角元素的对角矩阵。然后白化后的训练样本集Sw可以通过如下方式计算得到:
Sw=EU-1/2ETS(2)
第二步:使用白化处理的频域样本来训练改进的L1正则化的稀疏滤波,即通过白化后的训练样本集Sw对L1正则化的稀疏滤波进行训练。具体过程如下:
图2是本发明的一种实施例的稀疏滤波特征提取部分示意图。
输入的训练数据为经过白化的频域样本。此样本通过使用权值矩阵W∈RN×L及训练中的激活函数1映射到特征向量
式中
(1)行归一化:主要是为了实现同一种特征的归一化,需对特征矩阵f的行进行归一化。行归一化方法为
(2)列归一化:经过列归一化后可使各个样本落在L2球上,这将有利于下面优化中稀疏性的获取。列归一化方法为
(3)优化目标函数:这时就可以对这些归一化过的特征矩阵进行稀疏度优化了。假设有M个训练样本,原稀疏滤波的目标函数为下式(4)中的第一项。使用L1正则化来进一步约束权值矩阵稀疏性,进而对特征矩阵的稀疏性进行约束。故对稀疏滤波做改进如下:
1.构造L1正则化的稀疏滤波的目标函数。试验中发现,增加权重矩阵的稀疏性将大大提高得到的特征矩阵的稀疏性,同时使得网络的泛化能力得到很大提高及过拟合风险降低,所以需对原目标函数进行改进。因L1范数可实现稀疏,使用L1范数对权重矩阵进行约束,增加的约束如式(4)中第二项所示。新的目标函数为:
其中λ1衡量原稀疏滤波项和新的L1正则化项的相对大小,需要进行调节;wij为权重矩阵W的第i行第j列的元素。
2.设置提前终止条件,即:通过训练提前终止策略来决定迭代次数加快网络训练获得权值矩阵等参数,以实现网络在达到规定条件下实现提前终止,最终通过权值矩阵来提取旋转机械振动信号的高维故障特征。
稀疏滤波训练一般以一个确定的迭代次数作为训练结束的标准,但是在试验中发现,原始稀疏滤波会在达到一个迭代次数后会发生退化,且退化的迭代次数并不确定。设置一个较大的迭代次数,会对网络的性能造成很大的影响,故引入提前终止条件,以使得训练在网络最优训练效果下终止。提前终止的衡量标准选用特征矩阵的稀疏程度作为标准。上述归一化的特征矩阵为
其中d为特征矩阵的所有元素的均方根值,M为特征矩阵的列数,即训练样本的个数。
通过试验知,当p为0.75左右训练效果较好。所以设置激活度终止阈值p0为0.75。优化使用的是拟牛顿法(L-BFGS)的优化算法,设置训练迭代最大次数为100次。
(4)改进稀疏滤波训练:通过改进后的稀疏滤波进行训练。主要通过迭代的方式实现网络优化,以上述(1)~(3)子步骤循环一次作为一次迭代,最终经过多次迭代直至达到提前终止要求或最大迭代次数即完成训练。
第三步使用前向传播,计算学习到的训练样本的特征。
样本特征通过学习到的权值矩阵W以及激活函数2可以计算得到。传统方法中,激活函数1和激活函数2使用同一个函数,本发明为了增强其抗噪性,在激活函数2处使用一个新的函数σ(x)=log(1+x2),计算过程如下所示:
其中,xi为第i个样本;Wj为权值矩阵W的j行;
第四步采用高维特征训练分类器,实现对提取的特征的自动分类,即:使用训练样本的特征及其对应的样本标签训练分类器,通过前向传播得到的特征以及训练样本对应的故障类型标签进行softmax分类器的训练。
softmax回归是常用的分类器。定义上述得到的训练样本的高维特征的故障类别标签为
此分类器实现从高维特征fi到样本所属故障类别yi的映射。训练最后得到权值矩阵W2。其中,经过调节,正则化项系数λ2设置为10E-5。
第五步:测试样本故障诊断。将新的信号输入训练好的网络,即可实现故障信号的特征自动提取及智能诊断。即:通过将设备采集得到的振动数据信号输入到上述训练好的网络,便可通过图2中测试模块步骤进行故障状态的诊断。
本发明实施例的模型训练与测试实例如下。
实例1:数据采用凯斯西储大学公开的轴承故障数据,进行模型训练与测试。其数据可在http://csegroups.case.edu/bearingdatacenter/pages/download-data-file下载。选用48kHz采样频率的数据,故障类型为{正常,内圈故障,外圈故障,滚动体故障},故障深度为{0.18mm,0.36mm,0.53mm},每种故障类型有三种载荷。首先每个故障类型振动信号划分为N=1600个样本点的样本集。对时域样本进行FFT变换,得到每个样本对应的频谱。因为频谱具有对称性,取每个频谱的前一半作为样本,此类频域样本的长度为800。共有3个负载,每个负载下10类故障类型,每个故障类型有200个样本,最终得到6000个样本。此外,不同负载下的同一种故障被视为同一种故障。随机取样本集10%的样本作为训练样本经白化操作后作为最后的输入样本,剩下的为测试样本。使用训练样本对加入L1正则化后的稀疏滤波进行训练,输出维数Nout=700,训练出权值矩阵W。再将未进行白化的训练样本与W右乘后,经过激活函数2后得到特征矩阵f,然后与标签合并进行softmax分类器的训练,训练完成后用测试样本进行测试。最终测试的准确率达到99%以上。
图3是本发明的一种实施例的一组实验结果示意图。为了说明所提出的基于改进稀疏滤波的机械故障特征自动提取方法的有效性,将加入L1正则化项的稀疏滤波即图3(a),加入L2正则化项的稀疏滤波即图3(b),无正则化项但在前向传播中使用新激活函数的稀疏滤波即图3(d),在前向传播中使用原激活函数的稀疏滤波即图3(d)在不同训练样本占总样本百分比时的结果进行对比。可以看出加入L1正则化项且使用新的激活函数的诊断网络效果最好,且使用很少的训练样本就能达到很高的诊断准确率,其泛化能力也得到了很大的提高。
实例2:数据采用齿轮箱故障数据,进行模型训练与测试。数据用加速度传感器采集,采样频率为16384Hz。故障类型为{正常,轻微磨损,中度磨损,断齿},每种故障类型有四种载荷,即四种转速。每个故障类型振动信号首先划分为N=800个样本点的样本集。取每个样本集20%的样本作为训练样本,剩下的80%作为测试样本。对时域样本进行FFT变换,得到每个样本对应的频谱。因为频谱具有对称性,取每个频谱的前一半作为样本,此类样本的长度为400。随机取样本集20%的样本作为训练样本经白化操作后作为最后的输入样本,剩下的为测试样本。所有训练样本矩阵对加入L1正则化项后的稀疏滤波进行训练,输出维数Nout=400,训练出权值矩阵W。再将未进行白化的训练样本与W右乘后,再经过激活函数2后得到特征矩阵f,然后与标签合并进行softmax分类器的训练,训练完成后用测试样本进行测试。最终测试的准确率达到99%以上。
为了说明所提出的基于改进稀疏滤波的机械故障特征自动提取方法的有效性,将几种不同模型:L1正则化的稀疏滤波、L2正则化的稀疏滤波,原稀疏滤波和新激活函数以及原激活函数分别搭配进行对比,结果如下表1所示,其中“L1SF-LOG”表示L1正则化的稀疏滤波+新激活函数;“L2SF-LOG”表示L2正则化的稀疏滤波+新激活函数;“SF-LOG”表示稀疏滤波+新激活函数;“SF-ABS”表示稀疏滤波+原激活函数。每个案例结果都是经过二十次实验计算结果平均的。从结果可以看出,L1正则化的稀疏滤波泛化能力得到了很大的提升,且效果优于L2正则化。
为了说明所提出的基于改进稀疏滤波的机械故障特征自动提取方法的有效性,取上述几种网络组合中的某几种的二十次试验结果进行说明。如图4所示,显然L1正则化的稀疏滤波的测试准确率和稳定性最好。
表1
注:表1中准确率格式为:均值±方差。
方法的格式为:基本网络形式+前向传播中激活函数。
机译: 一种基于稀疏性去除伪影滤波的视频编码和解码方法及装置
机译: 一种运动图像特征的提取方法及基于内容的运动图像搜索方法
机译: 一种基于WordNet的特征合并方法,用于文档自动分类系统的性能改进