首页> 中国专利> 一种基于模型融合的齿轮箱智能诊断方法

一种基于模型融合的齿轮箱智能诊断方法

摘要

本发明针对单视角特征及单一模型对齿轮箱中滚动轴承复合故障的诊断准确率较低的问题,提出了基于比例冲突分配规则的模型融合故障诊断方法。包括如下步骤:1)对齿轮箱振动信号进行特征提取,针对复杂复合故障,从时域及时频域角度构造特征。2)将多视角特征送入多个子模型中进行初步诊断,得到互补性强的诊断结果。3)模型输出的分类概率由第6类比例冲突分配规则进行融合。实验证明本发明融合模型所得出的结果具有较高的稳定性,并在一定条件下可以提高故障诊断的准确率。

著录项

  • 公开/公告号CN112163474A

    专利类型发明专利

  • 公开/公告日2021-01-01

    原文格式PDF

  • 申请/专利权人 东南大学;

    申请/专利号CN202010966319.5

  • 申请日2020-09-15

  • 分类号G06K9/00(20060101);G06K9/62(20060101);G06N3/04(20060101);G01M13/045(20190101);

  • 代理机构32200 南京经纬专利商标代理有限公司;

  • 代理人罗运红

  • 地址 210000 江苏省南京市玄武区四牌楼2号

  • 入库时间 2023-06-19 09:24:30

说明书

技术领域

本发明属于齿轮箱大数据智能诊断领域,特别涉及一种基于多种人工智能诊 断模型的模型融合齿轮箱诊断方法。

背景技术

近年来,我国风电事业发展迅猛,风力发电技术应用日益广泛。除风电机组 主轴承外,滚动轴承作为关键部件存在与风电齿轮箱中,且采集信号的传播路径 复杂,经常产生于其他部件的耦合故障。因此,如何从复合故障中识别出滚动轴 承和齿轮箱其他部件的故障有着重要的意义。除了常见的轴承故障外,齿轮箱故 障还包括:断齿、点蚀、齿面磨损等。现有的较为行之有效的滚动轴承及齿轮箱 故障诊断方法为振动监测及频谱分析。然而,这些传统方法往往需要大量专业知 识,也无法满足当下对诊断实时性和准确性的要求。很多研究将信号处理技术与 人工智能模型相结合,取得了令人满意的效果。

随着机器学习模型的层出不穷,也出现了针对不同模型组合的相关研究。故 障诊断领域利用模型的互补性分析设备不同状态间的差异,为早期故障和复合故 障的诊断指明了一个方向。模型融合是将从多个模型获得的设备信息进行同步且 全面的分析,形成对设备状态更加客观、更加清晰的诊断。模型融合的关键是对 多个模型的综合处理和分析,使获得的诊断结果更确切、更真实。单一模型对于 复杂设备的诊断往往会发生虚警和漏报的现象,不利于故障的定位和部件的及时 更换。多模型故障融合诊断为设备诊断准确率的提高提供了一条新途径。多模型 融合诊断过程中,诊断的可靠性大大增加,与单一诊断模型相比,利用模型诊断 机制的多样化和互补性,降低了对单一模型的性能优化要求。融合增加了结果的 稳定性,对于复杂设备的诊断,模型在使用过程中更加的可靠。基于此的故障诊 断方法已成为当下研究的热点及趋势,使故障诊断更趋于智能化。

发明内容

本发明的目的为解决现有诊断方法用于齿轮箱故障诊断,尤其是复合故障的 诊断中准确率低、稳定性不足的问题,提出一种能够融合多种大数据方法的融合 框架。

技术方案:融合过程中使用了证据理论的第六类比例冲突再分配方法(PCR6),主要步骤包括:

(1)考察齿轮箱振动信号,通过统计特征提取齿轮箱振动信号时域特征;

(2)考察齿轮箱振动信号,结合连续小波变换和卷积神经网络自动提取齿 轮箱时频特征,此步骤与步骤(1)结合,构造出齿轮箱振动信号的高维特征集。

(3)将步骤(1)和步骤(2)构造的高维特征集输入到子模型中训练子模 型,利用训练好的子模型对样本进行故障诊断,模型输出各自的分类概率;

(4)此步骤的输入为步骤(3)中多个子模型的样本分类概率,将模型输出 的分类概率进行等可靠度调整;

(5)经过调整的多模型输出输入到PCR6进行模型融合,得到最终诊断结 果。

优选的,步骤(1)中:时域特征提取考察振动传感器原始信号,利用统计 公式构造时域特征集。这些统计公式既包括常见的统计值,也包括一些针对时序 信号构造的特征,如峭度和偏斜度等。

优选的,步骤(2)中:小波变换是把原信号同小波函数作卷积运算,它实 际上是度量了信号与小波函数的相似程度。这样,通过选择不同的小波基函数, 就可以检测出信号中与小波形状接近的成分的含量,从而可以用于信号中特征成 分的检测。结合卷积神经网络就可以,通过引入稀疏交互和参数共享,可以高效 的通过反向传播提取信号中的时频信息。时频特征提取中,将振动时域信号送入 到利用连续小波变换进行时频分析,得到时频系数的二维矩阵,然后将二维数字 矩阵输入到卷积神经网络中,得到其全连接层的输出最为齿轮箱振动的时频特征, 设定不同的全连接层神经元数可以得到不同维度的时频特征。

优选的,步骤(3)中,将多视角特征集输入到子模型中进行分类可以得到 初步的诊断结果。合适的子模型需要兼具多样性和稳定性。常用的为下面4中诊 断模型。分别为支持向量机(Support Vector Machine,SVM)、逻辑斯蒂回归 (Logistic Regression,LR)、深度信念网络(Deep Belief Network,DBN)以及梯 度提升树(Gradient Boosting DecisionTree,GBDT)。这些模型在分类问题中有着 成熟的应用,模型原理和优化方式也各具特点。子模型初步诊断中,每一个模型 的输入为齿轮箱振动信号的高维特征(包括步骤(1)中提取的时域特征以及步 骤(2)中提取的时频特征)。模型完成训练后,输出其对每一个样本的分类概率, 以6分类为例,每一个样本对应6分类的分类概率,如[0.1112,0.001,0.256,0.050, 0.101,0.480]。需要注意的是,模型分类概率要进行归一化。

优选的,步骤(4)中,模型融合之前,需要对各模型输出的概率结果进行 调整。PCR6是一种针对等可靠度的多源信息进行融合的一种方法,为了保证子 模型结果具有相同可靠度,同时避免融合过程中一票否决的现象,在进行模型融 合之前,需要对各个模型分类概率进行概率匹配和概率可靠性折扣。这两个步骤 均在分类概率归一化之后进行。调整方式如下:

1)概率匹配由于模型计算机制的差异,导致子模型得出的概率分布不同。 基于SVM模型结果,对模型的概率进行调整。SVM给出的样本分类概率保持不 变,其他模型以SVM的结果为基准进行匹配。对于调整模型,首先计算模型和 SVM模型每个样本分类概率最大值的均值,用两个模型样本最大概率的均值之 比作为模型与SVM模型的差异。调整中,首先使用这个比值首先对模型每个分 类样本概率中最大的分类概率进行调整,然后针对每一个样本分类概率进行归一 化,从而完成调整。具体公式如下:

式中,w

2)概率折扣在PCR6融合过程中,子分类器的分类概率应该具有相同的 可靠度。对于分类准确率不同的分类器,分配相同的可靠度显然是不合理的。因 此,根据验证集准确率的不同,需要对模型分类概率进行相应的折扣。调整中, 依据模型的验证集准确率,需要将模型的分类概率往随机分类的结果调整,具体 计算方法如下:

式中,w

优选的,步骤(5)中,融合过程中,设置不同模型输出概率值的权重,然 后将所有不同模型的概率值乘以权重求和得到故障概率最终的结果,所有模型的 权重之和为1。

本方法重点在于模型融合框架的搭建,利用证据理论将各个模型的故障分类 进行融合,提高诊断的稳定性和准确率。步骤一和步骤二中特征工程和子模型诊 断中,方法和模型不仅限于上述介绍内容,可以根据设备的特点进行调整,将最 新的模型引入到融合框架。

在所述的基于模型融合的齿轮箱故障诊断方法中,融合框架的特点包括:齿 轮箱时域和时频域多视角特征、多模型初步诊断以及第六类比例冲突再分配方法。

有益效果:与现有技术相比,本发明的优点和效果在于:

1.利用统计特征和卷积神经网络结合连续小波变化的方式提取齿轮箱振动 信号时域和时频域的特征,简化了特征构造,降低了主观因素在特征提取过程中 的干扰。

2.选择了一些常见的且模型原理和训练方式差异较大的子模型进行故障的 初步诊断,更好的把握了多视角特征集中的故障差异。

3.提出了对于模型结果进行等可靠度调整的方法,保证了PCR6融合的理论 基础。

4.采用PCR6的融合方法,在模型融合中能够使用全部的训练集,得到了比 常见Stacking和投票表决法更加优异的结果。

附图说明

图1——基于模型融合的齿轮箱故障诊断流程图;

图2——齿轮箱时频特征提取流程图;

图3——不同齿轮箱故下连续小波变换时频图;

图4——卷积神经网络结构图;

图5——测试集准确率。

具体实施方式

图1是基于有效性分析的模糊综合判决流程图。以下结合实际齿轮箱,对本 发明所述的技术方案作进一步的阐述。

1、齿轮箱振动信号多视角特征的获得

使用千鹏公司的齿轮箱公开数据集,输入转速为880r/min,振动信号采样频 率为5120Hz。齿轮箱状态包括正常、点蚀、点蚀磨损、断齿、磨损以及断齿磨 损,构成6分类数据集,其中点蚀磨损和断齿磨损为复合故障。为了更好的反映 融合效果,共构造了3种情况的样本,分别是平衡样本、不平衡样本和小样本情 况。训练样本和测试样本的比例为2:1,样本采样点数均为2000。样本数量及划 分情况如表1所示。

表1样本数量表

时域特征提取考察振动传感器原始信号,利用统计公式构造时域特征集。振 动信号的时域特征对齿轮箱的状态评估直观、简洁、计算复杂度低,但是容易受 到噪声的干扰。实验中利用tsfresh提取了63维特征,具体序列特征的提取方法 可以参考表2。

表2时域特征名称表

时频域特征考察原始振动信号经过小波分析得出的小波二维系数矩阵,利用 CNN卷积层提取特征的功能,构造时频特征集。连续小波变换的时频图2所示。 实验中使用的CNN结构如图3所示。整个卷积神经网络模型包括11层,共有三 个卷积层。每一个卷积层后面连接一个归一化层,dropout层和池化层,用来防 止模型过拟合和整合特征。卷积池化层之后会接有两个全连接层,分别包含 24635,120个神经元。全连接层的每一个神经元都与上一层的全部节点相连, 将卷积池化后的矩阵特征转为一维向量特征,并通过非线性组合减少特征维度。 分类任务中,卷积神经网络通常会在顶层连接一个Softmax层,给出分类的标签。 卷积过程中,卷积核在二维矩阵移动,三个卷积层依次使用8@3×3(即共有8 个大小为3×3得卷积核),16@3×3和8@3×3。

2、子模型初步诊断

本发明所使用的四种故障分类模型为SVM、LR、DBN以及GBDT。采用网 格参数寻优与交叉验证的方式确定模型关键超参数。模型具体参数如表3所示。 模型融合之前,需要对各模型输出的概率结果进行调整。PCR6是一种针对等可 靠度的多源信息进行融合的一种方法,为了保证子模型结果具有相同可靠度,同 时避免融合过程中一票否决的现象,在进行模型融合之前,需要对各个模型分类 概率进行概率匹配和概率可靠性折扣。这两个步骤均在分类概率归一化之后进行。

表3初步诊断子模型参数

3、模型输出等可靠度调整

表4以一个磨损故障样本为例,展示了概率调整和融合的过程。平衡样本条 件下,SVM、LR、DBN和GBDT的分类准确率分别为94.97%、94.97%、94.18% 和95.28%。λ分别为85.61%、91.38%、97.53%和95.57%。由表4可知,在3个 模型分类结果错误的情况下,PCR6根据模型的分类概率给出了正确的故障分类。 这表明在高冲突的样本中,本发明所使用的融合策略获得的结果较投票表决更具 优势。

表4磨损样本模型融合过程(%)

4、PCR6模型融合及结果分析

完整的实验结果如表5所示。随样本量的减少,各模型分类准确率都有所降 低。在样本平衡的情况下,子模型的准确率差别较小,在92%-95%之间。此时, 融合模型不仅实现了对最优子模型抓取,而且获得比最优子模型更加优异的分类 结果。在不平衡样本和小样本条件下,DBN分类准确率有大幅的降低,SVM和 GBDT准确率没有出现较大程度的波动,这造成了子模型间准确率相差过大,给 模型融合带来难度。但是即便在不平衡样本下,融合模型也取得了与最优子模型 同等的准确率。

表5模型测试集准确率(%)

图5(a)对比了4个子模型与PCR6融合模型的测试集准确率。由图可知, 模型在不同样本情况下准确率与PCR6结果的变化趋势基本一致。不平衡样本和 小样本的情况下,各模型的错分样本区别较大,融合效果也有更加明显的提升。 图5(b)比较了本发明使用方法和其他融合方法的测试集准确率,可以看出, 在不同样本情况下,本发明所提出的融合方法均具有最高的分类准确率。究其原 因,对分类标签取众数的方法中仅仅考虑了分类的标签,没有考虑模型能够输出 的更加细致的分类概率,故融合效果最差。Stacking的主要思想是训练模型来学 习使用底层学习器的预测结果。由图示结果可知,在所构造的三种样本集情况下, 本方法的融合结果均优于stacking结果。相较于stacking方法,在本发明所提出 的融合框架下,各个子模型可以完全的学习到训练集上的概率分布和所有训练样 本的差异,而stacking方法中,为防止标签泄露,每一次迭代,模型只学习到了 部分的训练样本,得出的融合结果在测试集上的泛化性就有所降低。

尽管本发明就优选实施方式进行了示意和描述,但本领域的技术人员应当理 解,只要不超出本发明的权利要求所限定的范围,可以对本发明进行各种变化和 修改。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号