首页> 中国专利> 一种基于改进稀疏滤波的机械故障特征自动提取方法

一种基于改进稀疏滤波的机械故障特征自动提取方法

页面导航

摘要
著录项
法律信息
说明书
相似文献

摘要

本发明公开了一种基于改进稀疏滤波的机械故障特征自动提取方法，包括：1.将采集到的信号采样后作为训练样本,对采样到的时域样本进行快速傅里叶变换，将原时域信号样本转换成频谱样本，并对频域样本进行白化。2.使用白化处理的频域样本来训练改进的L1正则化的稀疏滤波，并通过训练提前终止策略来决定迭代次数以加快训练获得权值矩阵等参数，从而提取旋转机械振动信号的高维故障特征。3.使用前向传播，计算训练样本的特征。4.采用高维特征训练分类器，实现对提取的特征的自动分类。5.将设备采集得到的振动数据信号输入到训练好的网络，实现故障信号的特征自动提取。本发明的网络泛化能力强，训练速度快，故障诊断稳定且准确率高。

著录项

公开/公告号CN108827605A

专利类型发明专利
公开/公告日2018-11-16

原文格式PDF
申请/专利权人南京航空航天大学;
展开▼

申请/专利号CN201810229029.5
发明设计人李舜酩;钱巍巍;王金瑞;安增辉;谭延峥;
展开▼

申请日2018-03-20
分类号G01M13/00(20060101);
代理机构32200 南京经纬专利商标代理有限公司;
代理人许方
地址 210016 江苏省南京市秦淮区御道街29号
入库时间 2023-06-19 07:14:02

法律信息

法律状态公告日

法律状态信息

法律状态
2020-06-30

授权

授权
2018-12-11

实质审查的生效 IPC(主分类):G01M13/00 申请日:20180320

实质审查的生效
2018-11-16

公开

公开

说明书

技术领域

本发明属于旋转机械故障诊断及信号处理技术领域，涉及一种基于改进稀疏滤波的机械故障特征自动提取方法。

背景技术

旋转机械振动信号包含关于故障的丰富信息，所以常用做故障信号特征提取数据源之一。直接测得的信号往往包含很多噪声，需要进行信号处理，来实现对信号的特征提取。现有的信号处理技术，包括时域分析技术、频域分析技术、时频分析技术、小波包分析技术等。这些信号处理技术可以实现特定特征的高效提取，但是这些提取的信息往往繁杂，后期的分析处理和进一步提取需要大量人工操作且时间成本很高。同时，为了实现信号特征分类，往往需要得到的特征具有很强的可区分性。传统信号处理方法可以实现信号主要特征的提取但却缺少对这些特征的挑选能力。

近年来，随着工业大数据概念的不断推广，多领域的大数据自动处理广泛使用人工神经网络。在故障诊断领域采用人工神经网络技术，不仅能带来高自动化程度的非线性特征提取能力，也可在很大程度上减少人工干预。故障诊断方面的人工神经网络包括自动编码器、限制玻尔兹曼机、卷积神经网络等多种形式。其中非监督特征学习网络因其特征提取中不需要样本标签，越来越受到人们的关注。

作为人工神经网络的一种，稀疏滤波自提出以来就受到人们的广泛关注。主要有以下两个原因。首先，它作为一种无监督特征提取技术能够有效利用无标签样本。此外，它实现方便，只需要通过很少的几行代码就能实现信号的特征提取。而且在图像识别、语音识别等领域的应用中发现，仅单层稀疏滤波就能达到较好的效果。因此，近年来稀疏滤波技术被逐渐应用到故障诊断领域信号的特征提取，但在实际使用中仍存在以下问题。首先在使用原始信号作为网络训练样本，往往会存在一种叫移变性的问题，这一性质跟图像处理中的平移噪声类似，即样本中需要识别的物品不在图像中的同一位置上。这一性质使得时域信号样本并不规整，网络训练及使用难度加大。如果对时域样本信号进行FFT变换，将会得到各个时域样本的频谱，频谱样本很规整，不再有移变性问题。但是，稀疏滤波具有随着迭代次数性能退化的问题，且仍然存在泛化能力不足的问题，而正则化方法能提高网络泛化能力。一般L2范数正则化方法对于频域信号作为样本的网络性能的提高并不突出。同时，L2范数不能使得学习到的特征具有稀疏性，也不能使提取特征的权值矩阵变得稀疏。而稀疏性对于分类任务是一个十分有效和必要的性质。此外，其他对于权值矩阵正交性加强的方法，都不能明显提高网络的性能。总之，现有的信号处理技术样本训练时间长，网络泛化能力差，导致故障特征的提取准确率低。

发明内容

本发明的目的在于克服现有技术的缺陷，提供一种基于改进稀疏滤波的机械故障特征自动提取方法，通过无监督学习方法进行频域样本特征提取，同时采用正则化策略提高网络泛化能力并通过训练提前终止策略进一步加快了网络的训练速度，从而提高故障特征的提取准确率和稳定性。

为解决上述技术问题，本发明采用以下技术方案。

一种基于改进稀疏滤波的机械故障特征自动提取方法，其特征在于，包括以下步骤：

步骤1.对原始振动信号进行预处理：采用采集得到的原始振动信号分为样本集后作为训练样本,对采样得到的时域样本进行快速傅里叶变换，将原时域样本转换成频域样本，并对样本白化处理；所述步骤1的具体过程为：

1.1.收集样本：采样每个工况下每种故障的原始振动信号，得到所有时域样本其中是第j个样本，含有2N_in个数据点，M为样本的总数目；

1.2.时域样本转为频域样本：将原时域信号样本进行快速傅里叶变换处理，得到的各个样本的频谱，取每个频谱前半部分频谱作为对应的样本；将这些半频谱作为样本组成训练样本集其中是第j个样本含N_in个数据点，N_in也是L1正则化的稀疏滤波的输入维数；用N_out表示网络输出维数的大小，即从每个样本提取出的特征的个数；

1.3.样本白化处理：将训练样本集整理成矩阵形式进行白化处理，过程如下式所示：

cov(S^T)＝EUE^T(1)

式中cov(S^T)是S的协方差矩阵，E是特征向量矩阵，U是以特征值为对角元素的对角矩阵；白化后的训练样本集S_w通过下式得到：

S_w＝EU^-1/2E^TS(2)。

步骤2.使用白化处理的频域样本来训练具有L1正则化的稀疏滤波。所述步骤2的具体过程为：

输入经过白化的频域样本为训练数据，此样本通过使用权值矩阵W∈R^N×L及训练中的激活函数1映射到特征向量上；通过激活函数1来计算获得非线性特征，训练时激活函数1采用软阈值函数：

式中表示特征矩阵f的第i列的第j个特征值，其中ε＝10^-8；

稀疏滤波的每次迭代优化过程包括以下步骤：

1)行归一化：对特征矩阵f的行进行归一化其中fⁱ为行归一化之前的特征矩阵f的第i行，为经过行归一化后的特征矩阵的第i行；

2)列归一化：经过列归一化后使各个样本落在L2球上，其中为列归一化之前的特征矩阵的第j列，为经过列归一化后的特征矩阵的第j列；得到变换后的特征矩阵

3)优化目标函数：对上述归一化过的特征矩阵进行稀疏度优化；使用L1正则化来进一步约束权值矩阵稀疏性，进而对特征矩阵的稀疏性进行约束；

4)训练具有L1正则化的稀疏滤波：通过迭代的方式实现稀疏滤波优化，以上述1)--3)步骤循环一次作为一次迭代，最终经过多次迭代直至达到提前终止要求或最大迭代次数即完成训练；采用拟牛顿法(L-BFGS)的优化算法，设置训练迭代最大次数为100次。

所述的具有L1正则化的稀疏滤波通过以下过程获得：

2a.构造L1正则化的稀疏滤波的目标函数:使用L1范数对权重矩阵进行约束，增加的约束如下式(4)中第2项所示，新的目标函数为：

其中λ₁衡量原稀疏滤波项和新的L1正则化项的相对大小，需要进行调节；w_ij为权重矩阵W的第i行第j列的元素；

2b.设置训练提前终止条件：使训练在达到规定条件下实现提前终止，最终通过权值矩阵来提取旋转机械振动信号的高维故障特征；

提前终止的衡量标准选用特征矩阵的稀疏程度作为标准，上述归一化的特征矩阵为故稀疏度计算公式如下：

其中d为特征矩阵的所有元素的均方根值，M为特征矩阵的列数，即训练样本的个数；是上述稀疏滤波优化中得到的归一化后的特征矩阵；使得矩阵中大于d的元素置1，小于等于d的置0；sum()统计括号中矩阵的非0元素的个数；p是特征矩阵的总体激活程度，其中规定矩阵中大于d的元素为激活。所述的特征矩阵的总体激活程度的终止阈值p₀为0.75。

步骤3.使用前向传播，计算学习到训练样本的特征；所述步骤3的具体过程为：

通过学习到的权值矩阵W以及激活函数2，计算得到样本特征；在激活函数2处使用一个新的函数σ(x)＝log(1+x²)，计算过程如下所示：

其中，xⁱ为第i个样本；W^j为权值矩阵W的j行；为计算得到的第i个样本的第j个特征。

步骤4.采用高维特征训练softmax分类器，实现对提取的特征的自动分类；即：使用训练样本的特征及其对应的样本标签训练分类器，通过前向传播得到的特征以及训练样本对应的故障类型标签进行softmax分类器的训练；

步骤5.测试样本故障诊断：通过将设备采集得到的振动数据信号输入到上述训练好的网络，即可实现故障信号的特征自动提取及智能诊断；

所述的稀疏滤波在稀疏滤波训练和局部特征计算中使用不同的激活函数；在网络训练中使用软阈值函数，在局部特征计算中使用f(x)＝log(1+x²)激活函数。

与现有技术相比，本发明的优点和有益效果是：

1.本发明通过无监督学习方法进行频域样本特征提取，同时采用正则化策略提高网络泛化能力并通过训练提前终止策略进一步加快了网络的训练，较现有方法更加准确、稳定。通过改进稀疏滤波实现频域样本故障特征的自动提取及诊断。通过向稀疏滤波中加入L1正则化项，提高了其泛化能力、稳定性、诊断准确率等多方面性能，且使得权值矩阵W更加稀疏，更加适合于提取具有区分性的特征，这是现有L2正则化等正则化方法不能实现的。

2.本发明在L1正则化的稀疏滤波的训练中，加入了基于稀疏性的提前终止策略，这使得网络不会过训练。同时，提前终止策略的加入，在网络性能产生退化之前，实现训练终止，使得网络训练的时间成本进一步降低，测试准确率也进一步提高。

3.本发明使用新的激活函数组合，提高了诊断的准确率及抗噪能力。

4.本发明方法可以应用到旋转机械振动系统故障诊断中，用以分析引起机械故障的类型，进行系统的状态监测及故障诊断等。

附图说明

图1是本发明的一种实施例的方法流程图；

图2是本发明的一种实施例的稀疏滤波特征提取部分示意图。

图3是本发明的一种实施例的一组实验结果示意图。

图4是本发明的另一种实施例的实验结果示意图。

具体实施方式

本发明的一种基于改进稀疏滤波的机械故障特征自动提取方法，首先将时域信号样本进行FFT变换，变换得到频域样本。因频域样本的对称性，样本维数减少了一半，实现数据的压缩。因为每个频域样本的相同维数的数据点对应着相同频段的信号幅值，所以频域信号更加规整，极大方便了后续使用。然后，在原有的稀疏滤波中，通过L1正则化对权值矩阵进行稀疏性约束，来进一步加强其稀疏性。同时，使用一种提前终止策略来提早结束训练，以防止过训练的发生。本发明方法可构成一种新型的智能故障诊断网络，包括信号快速傅里叶变换(FFT)前处理、改进稀疏滤波以及softmax分类器，能够大大提高故障诊断准确率并使过拟合风险显著降低。

下面结合附图对发明的技术方案做进一步详细说明：

图1是本发明的一种实施例的方法流程图。如图1所示，本实施例方法包括以下步骤。

第一步：对原始振动信号进行预处理：采用采集得到的原始振动信号分为样本集后作为训练样本,对采样得到的时域样本进行快速傅里叶变换，将原时域信号样本转换成频谱信号样本，并对样本白化处理。具体过程如下：

(1)收集样本：采样每个工况下每中故障的原始振动信号，得到所有时域信号样本其中是第j个样本，含有2N_in个数据点，M为样本的总数目。

(2)时域样本转为频域样本：将原时域信号样本进行快速傅里叶变换(FFT)处理，得到的各个样本的频谱。因为频谱具有对称性，取每个频谱前半部分频谱作为对应的频域样本。将这些半频谱作为样本组成训练样本集其中是第j个样本含N_in个数据点，因为频谱的对称性，使得相对于时域样本，频域样本的长度减少了一半。N_in也是L1正则化的稀疏滤波的输入维数，用N_out表示输出维数的大小，即从每个样本提取出的特征的个数。每个时域样本维数为1600维，FFT变换后频域样本为1600维，因其对称性，取前800维作为频域样本。

(3)样本白化处理：将训练样本集整理成矩阵形式即矩阵每一列为一个样本，然后进行白化处理。白化的目的是使分段直接减少相关性同时加速训练收敛。白化使用协方差矩阵的特征值分解，过程如下式所示：

cov(S^T)＝EUE^T(1)

式中cov(S^T)是S的协方差矩阵，E是特征向量矩阵，U是以特征值为对角元素的对角矩阵。然后白化后的训练样本集S_w可以通过如下方式计算得到：

S_w＝EU^-1/2E^TS(2)

第二步：使用白化处理的频域样本来训练改进的L1正则化的稀疏滤波，即通过白化后的训练样本集S_w对L1正则化的稀疏滤波进行训练。具体过程如下：

图2是本发明的一种实施例的稀疏滤波特征提取部分示意图。

输入的训练数据为经过白化的频域样本。此样本通过使用权值矩阵W∈R^N×L及训练中的激活函数1映射到特征向量上，如图2所示。对稀疏滤波来说，非线性特征需通过激活函数1来计算获得的。在试验中，训练时激活函数1采用软阈值函数：

式中表示特征矩阵f的第i列的第j个特征值，其中ε＝10^-8，稀疏滤波的每次迭代优化过程主要有以下三个步骤。

(1)行归一化：主要是为了实现同一种特征的归一化，需对特征矩阵f的行进行归一化。行归一化方法为其中fⁱ为行归一化之前的特征矩阵f的第i行，为经过行归一化后的特征矩阵的第i行。

(2)列归一化：经过列归一化后可使各个样本落在L2球上，这将有利于下面优化中稀疏性的获取。列归一化方法为其中为列归一化之前的特征矩阵的第j列，为经过列归一化后的特征矩阵的第j列。通过上述两个步骤，可得到变换后的特征矩阵

(3)优化目标函数：这时就可以对这些归一化过的特征矩阵进行稀疏度优化了。假设有M个训练样本，原稀疏滤波的目标函数为下式(4)中的第一项。使用L1正则化来进一步约束权值矩阵稀疏性，进而对特征矩阵的稀疏性进行约束。故对稀疏滤波做改进如下：

1.构造L1正则化的稀疏滤波的目标函数。试验中发现，增加权重矩阵的稀疏性将大大提高得到的特征矩阵的稀疏性，同时使得网络的泛化能力得到很大提高及过拟合风险降低，所以需对原目标函数进行改进。因L1范数可实现稀疏，使用L1范数对权重矩阵进行约束，增加的约束如式(4)中第二项所示。新的目标函数为：

其中λ₁衡量原稀疏滤波项和新的L1正则化项的相对大小，需要进行调节；w_ij为权重矩阵W的第i行第j列的元素。

2.设置提前终止条件，即：通过训练提前终止策略来决定迭代次数加快网络训练获得权值矩阵等参数，以实现网络在达到规定条件下实现提前终止，最终通过权值矩阵来提取旋转机械振动信号的高维故障特征。

稀疏滤波训练一般以一个确定的迭代次数作为训练结束的标准，但是在试验中发现，原始稀疏滤波会在达到一个迭代次数后会发生退化，且退化的迭代次数并不确定。设置一个较大的迭代次数，会对网络的性能造成很大的影响，故引入提前终止条件，以使得训练在网络最优训练效果下终止。提前终止的衡量标准选用特征矩阵的稀疏程度作为标准。上述归一化的特征矩阵为故稀疏度计算公式如下：

其中d为特征矩阵的所有元素的均方根值，M为特征矩阵的列数，即训练样本的个数。是上述稀疏滤波优化中得到的归一化后的特征矩阵；使得矩阵中大于d的元素置1，小于等于d的置0。sum()统计括号中矩阵的非0元素的个数。p指的是特征矩阵的总体激活程度，其中规定矩阵中大于d的元素为激活。

通过试验知，当p为0.75左右训练效果较好。所以设置激活度终止阈值p₀为0.75。优化使用的是拟牛顿法(L-BFGS)的优化算法，设置训练迭代最大次数为100次。

(4)改进稀疏滤波训练：通过改进后的稀疏滤波进行训练。主要通过迭代的方式实现网络优化，以上述(1)～(3)子步骤循环一次作为一次迭代，最终经过多次迭代直至达到提前终止要求或最大迭代次数即完成训练。

第三步使用前向传播，计算学习到的训练样本的特征。

样本特征通过学习到的权值矩阵W以及激活函数2可以计算得到。传统方法中，激活函数1和激活函数2使用同一个函数，本发明为了增强其抗噪性，在激活函数2处使用一个新的函数σ(x)＝log(1+x²)，计算过程如下所示：

其中，xⁱ为第i个样本；W^j为权值矩阵W的j行；为计算得到的第i个样本的第j个特征。

第四步采用高维特征训练分类器，实现对提取的特征的自动分类，即：使用训练样本的特征及其对应的样本标签训练分类器，通过前向传播得到的特征以及训练样本对应的故障类型标签进行softmax分类器的训练。

softmax回归是常用的分类器。定义上述得到的训练样本的高维特征的故障类别标签为其中yⁱ∈{1,2,...,R}，R为故障的总类别数。对于每一个fⁱ，及每一个样本提取的特征，softmax分类器分别估计这个特征属于故障类别r＝1,2,...,R的概率p(yⁱ＝r|fⁱ)。其中概率p可以通过最大似然函数进行计算,计算如式(9)中第一项所示。此外，为了减少过拟合风险，在softmax分类器后添加一个二范数正则化项对学习得到的权值矩阵W₂进行限制，其中为权值矩阵W₂的第k行，j列的元素。如式(9)中第二项所示。最后得到分类器的目标函数为：

此分类器实现从高维特征fⁱ到样本所属故障类别yⁱ的映射。训练最后得到权值矩阵W₂。其中，经过调节，正则化项系数λ₂设置为10E-5。

第五步：测试样本故障诊断。将新的信号输入训练好的网络，即可实现故障信号的特征自动提取及智能诊断。即：通过将设备采集得到的振动数据信号输入到上述训练好的网络，便可通过图2中测试模块步骤进行故障状态的诊断。

本发明实施例的模型训练与测试实例如下。

实例1：数据采用凯斯西储大学公开的轴承故障数据，进行模型训练与测试。其数据可在http://csegroups.case.edu/bearingdatacenter/pages/download-data-file下载。选用48kHz采样频率的数据，故障类型为{正常，内圈故障，外圈故障，滚动体故障}，故障深度为{0.18mm，0.36mm，0.53mm}，每种故障类型有三种载荷。首先每个故障类型振动信号划分为N＝1600个样本点的样本集。对时域样本进行FFT变换，得到每个样本对应的频谱。因为频谱具有对称性，取每个频谱的前一半作为样本，此类频域样本的长度为800。共有3个负载，每个负载下10类故障类型，每个故障类型有200个样本，最终得到6000个样本。此外，不同负载下的同一种故障被视为同一种故障。随机取样本集10％的样本作为训练样本经白化操作后作为最后的输入样本，剩下的为测试样本。使用训练样本对加入L1正则化后的稀疏滤波进行训练，输出维数N_out＝700，训练出权值矩阵W。再将未进行白化的训练样本与W右乘后，经过激活函数2后得到特征矩阵f，然后与标签合并进行softmax分类器的训练，训练完成后用测试样本进行测试。最终测试的准确率达到99％以上。

图3是本发明的一种实施例的一组实验结果示意图。为了说明所提出的基于改进稀疏滤波的机械故障特征自动提取方法的有效性，将加入L1正则化项的稀疏滤波即图3(a)，加入L2正则化项的稀疏滤波即图3(b)，无正则化项但在前向传播中使用新激活函数的稀疏滤波即图3(d)，在前向传播中使用原激活函数的稀疏滤波即图3(d)在不同训练样本占总样本百分比时的结果进行对比。可以看出加入L1正则化项且使用新的激活函数的诊断网络效果最好，且使用很少的训练样本就能达到很高的诊断准确率，其泛化能力也得到了很大的提高。

实例2：数据采用齿轮箱故障数据，进行模型训练与测试。数据用加速度传感器采集，采样频率为16384Hz。故障类型为{正常，轻微磨损，中度磨损，断齿}，每种故障类型有四种载荷，即四种转速。每个故障类型振动信号首先划分为N＝800个样本点的样本集。取每个样本集20％的样本作为训练样本，剩下的80％作为测试样本。对时域样本进行FFT变换，得到每个样本对应的频谱。因为频谱具有对称性，取每个频谱的前一半作为样本，此类样本的长度为400。随机取样本集20％的样本作为训练样本经白化操作后作为最后的输入样本，剩下的为测试样本。所有训练样本矩阵对加入L1正则化项后的稀疏滤波进行训练，输出维数N_out＝400，训练出权值矩阵W。再将未进行白化的训练样本与W右乘后，再经过激活函数2后得到特征矩阵f，然后与标签合并进行softmax分类器的训练，训练完成后用测试样本进行测试。最终测试的准确率达到99％以上。

为了说明所提出的基于改进稀疏滤波的机械故障特征自动提取方法的有效性，将几种不同模型：L1正则化的稀疏滤波、L2正则化的稀疏滤波，原稀疏滤波和新激活函数以及原激活函数分别搭配进行对比，结果如下表1所示，其中“L1SF-LOG”表示L1正则化的稀疏滤波+新激活函数；“L2SF-LOG”表示L2正则化的稀疏滤波+新激活函数；“SF-LOG”表示稀疏滤波+新激活函数；“SF-ABS”表示稀疏滤波+原激活函数。每个案例结果都是经过二十次实验计算结果平均的。从结果可以看出，L1正则化的稀疏滤波泛化能力得到了很大的提升，且效果优于L2正则化。

为了说明所提出的基于改进稀疏滤波的机械故障特征自动提取方法的有效性，取上述几种网络组合中的某几种的二十次试验结果进行说明。如图4所示，显然L1正则化的稀疏滤波的测试准确率和稳定性最好。

表1

方法训练准确率(％)测试准确率(％)稀疏滤波+原激活函数10088.35±7.85稀疏滤波+新激活函数10094.51±6.19L2正则化的稀疏滤波+新激活函数10099.13±0.50L1正则化的稀疏滤波+新激活函数10098.80±0.56L2正则化的稀疏滤波+原激活函数10094.82±4.24L1正则化的稀疏滤波+原激活函数10098.05±0.61

注：表1中准确率格式为：均值±方差。

方法的格式为：基本网络形式+前向传播中激活函数。

去获取专利，查看全文>

相似文献

专利
中文文献
外文文献

1. 一种基于改进稀疏滤波的机械故障特征自动提取方法 [P] . 中国专利： CN108827605B . 2020.06.30
2. 一种基于改进稀疏滤波的机械故障特征自动提取方法 [P] . 中国专利： CN108827605A . 2018-11-16
3. A method and apparatus for removing artifact filtering based on sparsity for video encoding and decoding [P] . 日本专利： JP2012510202A . 2012-04-26

机译：一种基于稀疏性去除伪影滤波的视频编码和解码方法及装置
4. METHOD FOR EXTRACTING MOVING IMAGE FEATURES AND CONTENT-BASED MOVING IMAGE SEARCHING METHOD USING THE EXTRACTING METHOD [P] . 韩国专利： KR100811835B1 . 2008-03-10

机译：一种运动图像特征的提取方法及基于内容的运动图像搜索方法
5. A WordNet based feature merge method for Automatic document classification system performance improvement [P] . 韩国专利： KR101562232B1 . 2015-10-23

机译：一种基于WordNet的特征合并方法，用于文档自动分类系统的性能改进