首页> 中国专利> 一种基于不平衡数据集的轴承故障诊断方法及装置

一种基于不平衡数据集的轴承故障诊断方法及装置

摘要

本发明公开了一种基于不平衡数据集的轴承故障诊断方法及装置。本发明在研究了不平衡程度对故障诊断性能的影响的基础上提出了本发明方法,使研究更贴切于实际应用;具体的:本发明采用的是变分自编码器来生成新的样本数据,比现流行的生成对抗网络更加的稳定且更适合一维数据的生成,适合于轴承振动数据的生成;再进一步地,本发明采用的是一维多尺度卷积神经网络,相比于普通的卷积神经网络,一维多尺度卷积神经网络更适合处理一维数据,能够有效的提取一维数据中的特征信息能够取得较好的分类结果;同时本发明采用的评价指标能够更加直观的显示出分类效果。

著录项

  • 公开/公告号CN114894480A

    专利类型发明专利

  • 公开/公告日2022-08-12

    原文格式PDF

  • 申请/专利权人 昆明理工大学;

    申请/专利号CN202210322372.0

  • 发明设计人 李琨;李梦男;

    申请日2022-03-29

  • 分类号G01M13/045(2019.01);G06K9/62(2022.01);G06N3/04(2006.01);G06N3/08(2006.01);

  • 代理机构昆明人从众知识产权代理有限公司 53204;

  • 代理人陈波

  • 地址 650093 云南省昆明市五华区学府路253号

  • 入库时间 2023-06-19 16:20:42

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2023-08-29

    授权

    发明专利权授予

  • 2022-08-30

    实质审查的生效 IPC(主分类):G01M13/045 专利申请号:2022103223720 申请日:20220329

    实质审查的生效

说明书

技术领域

本发明涉及一种基于不平衡数据集的轴承故障诊断方法及装置,属于轴承故障诊断领域。

背景技术

滚动轴承广泛应用于各种机械设备,是旋转机械设备中的重要部件并且起着十分重要的作用。据文献描述工程机械的故障有百分之六十的故障与滚动轴承的故障有关,滚动轴承的故障常常会造成巨大的经济损失甚至人员伤亡。为了防止安全事故和保障人民财产安全,滚动轴承的故障诊断显得尤为重要。

以数据驱动的滚动轴承故障诊断的方法有很多。传统的机器学习方法如贝叶斯分类器、决策树和人工神经网络等,但是机器学习方法无法适应现在大数据时代。目前深度学习十分流行,深度学习能够自动的提取数据特征,减少人工的干扰,所以近年来许多深度学习的方法应用在滚动轴承的故障诊断上。

基于深度学习的方法在轴承故障诊断领域取得了不错的效果,但是大多数方法效果好的前提是滚动轴承的数据是平衡的,即每个类别的样本数据数量是相等的或者相差不大。面对复杂的实际工况,设备通常是正常工作或者经常出现某几种故障,这就导致在实际诊断过程种要面对样本数据不平衡这一问题。样本数据不平衡会导致诊断正确率低下或者不具有实际意义。

目前有许多针对不平衡数据集的方法,主要分为两大类:一类是算法层面,针对数据集不平衡的特点针对性改变算法结构。另一类是减小数据集的不平衡度,达到较好的诊断正确率。

发明内容

本发明提供了一种基于不平衡数据集的轴承故障诊断方法及装置,以用于实现轴承故障诊断。

本发明的技术方案是:一种基于不平衡数据集的轴承故障诊断方法,包括:

获得原始轴承振动信号,构建不同不平衡比的不平衡数据集;

利用变分自编码器对不同不平衡比的不平衡数据集分别进行训练,获得各自的变分自编码器模型及变分自编码器模型生成的生成数据;

将变分自编码器模型生成的生成数据添加到对应的不平衡数据集的中,构建新的数据集,作为平衡后的数据集;

利用一维多尺度卷积神经网络来诊断平衡后的数据集,获得分类结果。

所述原始轴承振动信号包括正常振动信号、0.18mm长度的内圈故障、0.18mm长度的外圈故障、0.18mm的滚动体故障、0.36mm长度的内圈故障、0.36mm长度的外圈故障、0.36mm的滚动体故障、0.54mm长度的内圈故障、0.54mm长度的外圈故障、0.54mm的滚动体故障。

所述不平衡数据集包括多数类的正常样本和少数类的故障样本。

所述不平衡比R采用如下方式构建:

R=Dmin/Dmax

其中,Dmin表示故障样本数量,Dmax表示正常样本数量。

所述利用变分自编码器对不同不平衡比的不平衡数据集分别进行训练,获得各自的变分自编码器模型及变分自编码器模型生成的生成数据,包括:

依次对不平衡数据集中的每一个少数类按照如下步骤处理:将不平衡数据集中的少数类输入至变分自编码器的编码器拟合出少数类信号的概率分布的均值和方差;其次从标准的高斯分布中随机采样计算隐变量;再次把隐变量作为变分自编码器的解码器的输入,获得输出后更新变分自编码器模型;训练结束,获得变分自编码器模型及与少数类相似的生成数据;其中,训练的终止条件为最大迭代次数。

所述一维多尺度卷积神经网络包括若干卷积层、最大池化层和全连接层;输入数据先经过BN层进行归一化,然后依次通过4个一维卷积层和1个全连接层,每个一维卷积层后都跟有一个池化层;第一个卷积层由4个长度不同的卷积核组成,经过第一个卷积层后生成4个特征向量经过池化分别输入到第二个卷积层;第二个卷积层结构和第一个卷积层类似,第二个卷积层输出的4个特征向量经池化后拼接成一个特征向量然后输入到第三个卷积层,第三个卷积层和第四个卷积层是只有一个卷积核的一维卷积层,把经过这两层卷积输出的特征向量展开成一维特征向量,然后输入全连接层进行分类。

一种基于不平衡数据集的轴承故障诊断装置,包括:

第一构建模块,用于获得原始轴承振动信号,构建不同不平衡比的不平衡数据集;

第一获得模块,用于利用变分自编码器对不同不平衡比的不平衡数据集分别进行训练,获得各自的变分自编码器模型及变分自编码器模型生成的生成数据;

第二构建模块,用于将变分自编码器模型生成的生成数据添加到对应的不平衡数据集的中,构建新的数据集,作为平衡后的数据集;

第二获得模块,用于利用一维多尺度卷积神经网络来诊断平衡后的数据集,获得分类结果。

一种处理器,所述处理器用于运行程序,其中,所述程序运行时执行上述中任意一项所述的基于不平衡数据集的轴承故障诊断方法。

一种计算机可读存储介质,其特征在于:所述计算机可读存储介质包括存储的程序,其中,在所述程序运行时控制所述计算机可读存储介质所在设备执行上述中任意一项所述的基于不平衡数据集的轴承故障诊断方法。

本发明的有益效果是:本发明在研究了不平衡程度对故障诊断性能的影响的基础上提出了本发明方法,使研究更贴切于实际应用;具体的:本发明采用的是变分自编码器来生成新的样本数据,比现流行的生成对抗网络更加的稳定且更适合一维数据的生成,适合于轴承振动数据的生成;再进一步地,本发明采用的是一维多尺度卷积神经网络,相比于普通的卷积神经网络,一维多尺度卷积神经网络更适合处理一维数据,能够有效的提取一维数据中的特征信息能够取得较好的分类结果;同时本发明采用的评价指标能够更加直观的显示出分类效果。

附图说明

图1是本发明的流程图;

图2是本发明原始数据集中故障直径为0.18mm故障位置为滚动体故障样本数据的时域波形图和频域波形图;

图3是本发明变分自编码器的结构图;

图4是本发明中变分自编码器生成的生成数据样本,故障直径为0.18mm故障位置为滚动体故障样本数据的时域波形图和频域波形图;

图5是本发明中一维多尺度卷积神经网络的结构图;

图6是本发明表2中部分诊断结果对应的混淆矩阵一(对应表2原始不平衡数据集下的诊断结果的混淆矩阵);

图7是本发明表2中部分诊断结果对应的混淆矩阵二(对应表2加入1170个平衡样本数据诊断结果的混淆矩阵);

图8是本发明表2中部分诊断结果对应的混淆矩阵三(对应表2下加入3402个平衡样本数据诊断结果的混淆矩阵)。

具体实施方式

下面结合附图和实施例,对发明做进一步的说明,但本发明的内容并不限于所述范围。

实施例1:如图1-8所示,一种基于不平衡数据集的轴承故障诊断方法,包括:

获得原始轴承振动信号,构建不同不平衡比的不平衡数据集;

利用变分自编码器对不同不平衡比的不平衡数据集分别进行训练,获得各自的变分自编码器模型及变分自编码器模型生成的生成数据;

将变分自编码器模型生成的生成数据添加到对应的不平衡数据集的中,构建新的数据集,作为平衡后的数据集;

利用一维多尺度卷积神经网络来诊断平衡后的数据集,获得分类结果。

进一步地,可以设置所述原始轴承振动信号包括正常振动信号、0.18mm长度的内圈故障、0.18mm长度的外圈故障、0.18mm的滚动体故障、0.36mm长度的内圈故障、0.36mm长度的外圈故障、0.36mm的滚动体故障、0.54mm长度的内圈故障、0.54mm长度的外圈故障、0.54mm的滚动体故障。

进一步地,可以设置所述不平衡数据集包括多数类的正常样本和少数类的故障样本。

进一步地,可以设置所述不平衡比R采用如下方式构建:

R=Dmin/Dmax

其中,Dmin表示故障样本数量,Dmax表示正常样本数量。

进一步地,可以设置所述利用变分自编码器对不同不平衡比的不平衡数据集分别进行训练,获得各自的变分自编码器模型及变分自编码器模型生成的生成数据,包括:

依次对不平衡数据集中的每一个少数类按照如下步骤处理:将不平衡数据集中的少数类输入至变分自编码器的编码器拟合出少数类信号的概率分布的均值和方差;其次从标准的高斯分布中随机采样计算隐变量;再次把隐变量作为变分自编码器的解码器的输入,获得输出后更新变分自编码器模型;训练结束,获得变分自编码器模型及与少数类相似的生成数据;其中,训练的终止条件为最大迭代次数。

进一步地,可以设置所述一维多尺度卷积神经网络包括若干卷积层、最大池化层和全连接层;输入数据先经过BN层进行归一化,然后依次通过4个一维卷积层和1个全连接层,每个一维卷积层后都跟有一个池化层;第一个卷积层由4个长度不同的卷积核组成,经过第一个卷积层后生成4个特征向量经过池化分别输入到第二个卷积层;第二个卷积层结构和第一个卷积层类似,第二个卷积层输出的4个特征向量经池化后拼接成一个特征向量然后输入到第三个卷积层,第三个卷积层和第四个卷积层是只有一个卷积核的一维卷积层,把经过这两层卷积输出的特征向量展开成一维特征向量,然后输入全连接层进行分类。本发明中一维多尺度卷积神经网络通过4个一维卷积层和1个全连接层连接,该网络模型不仅能通过多个尺度不同的卷积核并行进行卷积,能够扩大感受野,提高特征提取能力和适应性;同时可以避免过拟合和计算量过大;能有效地适应一维轴承的振动数据的故障诊断,提高分类正确率。

再进一步地,结合实验数据,本发明给出可选地具体实施方式如下:

步骤1:获得原始轴承振动信号,构建不同不平衡比的不平衡数据集(即获得多个不平衡数据集);所述原始轴承振动信号包括正常振动信号、0.18mm长度的内圈故障、0.18mm长度的外圈故障、0.18mm的滚动体故障、0.36mm长度的内圈故障、0.36mm长度的外圈故障、0.36mm的滚动体故障、0.54mm长度的内圈故障、0.54mm长度的外圈故障、0.54mm的滚动体故障(本实例电机载荷为1hp)。所述不平衡数据集包括多数类的正常样本和少数类的故障样本;所述不平衡比R采用如下方式构建(面向不平衡数据集的故障诊断研究,实验构造不同类别样本数据量不平衡比为R的数据集):R=Dmin/Dmax;其中,Dmin表示故障样本数量,Dmax表示正常样本数量。

步骤2:对不同不平衡比的不平衡数据集进行诊断,获得分类结果;

将不平衡数据集划分训练集和测试集,将训练集输入到一维多尺度卷积神经网络进行训练,获得训练模型,将测试集输入至训练模型中得到分类结果;将不同不平衡比的不平衡数据集中测试集的分类结果进行对比,获得对比结果:不平衡比的取值越大,分类结果越好;否则,相反;如表1所示,本实施例中,标签为0的数据是轴承正常工作的样本数据,其余9种标签分别代表一类故障;不同不平衡比下的数据集按照4:1划分为训练集和测试集;对不同不平衡比的不平衡数据集进行诊断,获得分类结果如表2中前两组数据所示。表2中前两组数据,即VAE模型生成的样本数为0的两行数据,从实验结果可知,随着不平衡比的增大,少数类正确率对应的结果越好(VAE模型即变分自编码器模型)。

表1实验数据集划分

表2负载1hp下的实验结果

步骤3:利用变分自编码器对不同不平衡比的不平衡数据集分别进行训练,获得各自的变分自编码器模型及变分自编码器模型生成的生成数据;可选地,每一个不平衡数据集的训练过程如下:依次对不平衡数据集中的每一个少数类按照如下步骤处理:将不平衡数据集中的少数类输入至变分自编码器的编码器拟合出少数类信号的概率分布的均值和方差;其次从标准的高斯分布中随机采样计算隐变量;再次把隐变量作为变分自编码器的解码器的输入,获得输出后更新变分自编码器模型;训练结束,获得变分自编码器模型及与少数类相似的生成数据;其中,训练的终止条件为最大迭代次数。如表2中最后四行数据给出了每一个不平衡数据集添加了VAE模型生成的样本个数。

具体而言,所述变分自编码器包括编码器和解码器,训练过程中使用了重参数技巧,重参数的公式如下:

Z=μ+ε·σ

式中:Z为隐变量,μ为编码层计算得到的均值,σ为编码层计算得到的方差,ε表示随机从标准的高斯分布中选取的数据点。

步骤4:将变分自编码器模型生成的生成数据添加到对应的不平衡数据集的中,构成新的数据集,作为平衡后的数据集;通过添加生成数据样本使不平衡数据集的不平衡性减小。通过步骤3生成一些生成数据加入到原始的不平衡数据集中使新的数据集的不平衡比R大于0.5,显著降低不平衡性。

步骤5:利用一维多尺度卷积神经网络来诊断平衡后的数据集,获得分类结果。如表2中最后四行数据所示,相同初始不平衡比的情况下,随着添加VAE模型生成的样本个数的增多,少数类的正确类也上升。

步骤6:将步骤2的分类结果与步骤5的分类结果进行对比,同时选用多个指标来评估故障诊断的结果。对于表2中数据可知,本发明的方法可以较好地解决不平衡数据集下的轴承故障诊断问题。所述评价指标包括少数类的正确率。

少数类准确率的计算公式如下式所示。

式中:T

实验采用的轴承振动信号样本数据长度都为600数据点的一维向量,一维多尺度卷积神经网络输入数据为一维数据,卷积核为一维卷积核;数据输入前进行归一化处理;激活函数选择Relu激活函数;全连接层中使用dropout防止过拟合,比率设置为0.3;更新参数方法选用Adam算法,学习率为0.0001;损失函数选择交叉熵损失函数;训练集与测试集的比为4/1。本申请解码器和编码器都采用2层全连接结构,编码器的输出经重参数化后作为解码器的输入,除解码器的FC5层不使用激活函数外,其它层都使用Tanh激活函数,如图3所示结构,基于该结构的层次特征。

表2中第2行、第4行、第6行对应的诊断结果的混淆矩阵如图6-8所示,混淆矩阵的每一列代表了预测类别,每一列的总数表示预测为该类别的数据的数目;每一行代表了数据的真实归属类别,每一行的数据总数表示该类别的数据实例的数目。

实施例2:一种基于不平衡数据集的轴承故障诊断装置,包括:

第一构建模块,用于获得原始轴承振动信号,构建不同不平衡比的不平衡数据集;

第一获得模块,用于利用变分自编码器对不同不平衡比的不平衡数据集分别进行训练,获得各自的变分自编码器模型及变分自编码器模型生成的生成数据;

第二构建模块,用于将变分自编码器模型生成的生成数据添加到对应的不平衡数据集的中,构建新的数据集,作为平衡后的数据集;

第二获得模块,用于利用一维多尺度卷积神经网络来诊断平衡后的数据集,获得分类结果。

需要说明的是,上述各个模块是可以通过软件或硬件来实现的,例如,对于后者,可以通过以下方式实现:上述各个模块可以位于同一处理器中;和/或,上述各个模块以任意组合的方式位于不同的处理器中。

实施例3:根据本发明实施例的另一方面,提供了一种处理器,所述处理器用于运行程序,其中,所述程序运行时执行上述中任意一项所述的基于不平衡数据集的轴承故障诊断方法。

本发明实施例提供了一种设备,该设备包括处理器、存储器及存储在存储器上并可在处理器上运行的程序,处理器执行程序时实现上述中任意一项所述的基于不平衡数据集的轴承故障诊断方法。

实施例4:根据本发明实施例的另一方面,提供了一种计算机可读存储介质,所述计算机可读存储介质包括存储的程序,其中,在所述程序运行时控制所述计算机可读存储介质所在设备执行上述中任意一项所述的基于不平衡数据集的轴承故障诊断方法。

可选地,在本实施例中,上述计算机可读存储介质可以位于计算机网络中计算机终端群中的任意一个计算机终端中,和/或位于移动终端群中的任意一个移动终端中,上述计算机可读存储介质包括存储的程序。

上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。

在本发明的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。

上面结合附图对本发明的具体实施方式作了详细说明,但是本发明并不限于上述实施方式,在本领域普通技术人员所具备的知识范围内,还可以在不脱离本发明宗旨的前提下做出各种变化。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号