首页> 中国专利> 基于LSTM的印刷机轴承故障诊断方法及装置

基于LSTM的印刷机轴承故障诊断方法及装置

摘要

基于LSTM的印刷机轴承故障诊断方法及装置,能够解决印刷机轴承故障预警问题,减少非计划停机,提高轴承使用寿命,降低印刷设备故障率。方法包括:(1)建立作用在时域振动信号上的长短期记忆网络模型;(2)使用该模型对轴承的时域振动信号进行诊断;(3)选取凯斯西储大学轴承数据库的部分数据进行仿真实验,获取故障识别率。

著录项

  • 公开/公告号CN114925809A

    专利类型发明专利

  • 公开/公告日2022-08-19

    原文格式PDF

  • 申请/专利权人 北京印刷学院;

    申请/专利号CN202210399169.3

  • 申请日2022-04-13

  • 分类号G06N3/04(2006.01);G06N3/08(2006.01);G01M13/045(2019.01);

  • 代理机构北京市中闻律师事务所 11388;

  • 代理人冯梦洪

  • 地址 102600 北京市大兴区兴华北路二段1号

  • 入库时间 2023-06-19 16:25:24

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2022-09-06

    实质审查的生效 IPC(主分类):G06N 3/04 专利申请号:2022103991693 申请日:20220413

    实质审查的生效

说明书

技术领域

本发明涉及印刷装备运转监测的技术领域,尤其涉及一种基于LSTM的印刷机轴承故障诊断方法,以及基于LSTM的印刷机轴承故障诊断装置。

背景技术

印刷装备正朝着高速化、精密化、系统化和自动化的方向发展,印刷装备的健康检测系统日益完善,装备运转监测数据已经逐步迈入海量数据的“大数据”时代。利用先进的故障诊断方法对印刷装备进行有效的故障检测、诊断,是保证装备健康、稳定运行的关键。轴承作为印刷装备中最为重要的零件,分析其故障及损坏情况,可以帮助我们改进工作,提高轴承使用寿命,降低印刷设备故障率。

轴承故障诊断的核心方法在于信号特征的提取与模式分类两个部分。在轴承故障诊断领域,常见的特征提取算法有快速傅里叶变化,小波变换以及信号的统计学特征等,常见的模式分类算法有近邻分类器,BP神经网络(也称多层感知器),卷积神经网络等。当下轴承故障诊断的研究热点可以归结为3类:寻找更好的特征表达;寻找最适合的特征表达以及分类器的组合;以及发明新的传感器。

发明内容

为克服现有技术的缺陷,本发明要解决的技术问题是提供了一种基于LSTM的印刷机轴承故障诊断方法,其能够解决印刷机轴承故障预警问题,减少非计划停机,提高轴承使用寿命,降低印刷设备故障率。

本发明的技术方案是:这种基于LSTM(Long Short Term Memory,长短期记忆网络)的印刷机轴承故障诊断方法,其包括以下步骤:

(1)建立作用在时域振动信号上的长短期记忆网络模型;

(2)使用该模型对轴承的时域振动信号进行诊断;

(3)选取凯斯西储大学轴承数据库的部分数据进行仿真实验,获取故障识别率;

所述步骤(1)中,长短期记忆网络模型包含四个神经网络层:

遗忘门层:由Sigmod层组成,决定什么信息应该被神经元遗忘;输入h

f

式中:σ为sigmoid激活函数;W

输入层:由Sigmod层组成,决定要更新的数值;

tanh层:生成一个新的候选数值

组合输入层和tanh层这两层生成一个更新状态值,决定神经元要保存什么信息

i

式中:i

输出层:建立在神经元状态的基础上,拥有一个滤波器;首先使用Sigmod层决定哪一部分的神经元状态需要被输出,然后让神经元状态经过tanh层并乘上Sigmod门限的输出

o

h

式中:o

在传统的循环神经网络中,训练算法一般采用反向传播,当数据为长时间序列时,返回的残差呈指数递减,导致模型权重更新逐渐缓慢,最终呈现出无变化趋势,因此需要一个存储单元来存储丢失的历史信息,本发明选择长短期记忆网络是因为它在处理时间序列数据上具有优势,然后使用该模型对轴承的时域振动信号进行诊断,最后选取凯斯西储大学轴承数据库的部分数据进行仿真实验,结果证实了该模型的可行性和有效性,能够解决印刷机轴承故障预警问题,减少非计划停机,提高轴承使用寿命,降低印刷设备故障率。

还提供了基于LSTM的印刷机轴承故障诊断装置,其包括:

建模模块,其配置来建立作用在时域振动信号上的长短期记忆网络模型;

诊断模块,其配置来使用该模型对轴承的时域振动信号进行诊断;

实验模块,其配置来选取凯斯西储大学轴承数据库的部分数据进行仿真实验,获取故障识别率;

所述建模模块中,长短期记忆网络模型包含四个神经网络层:

遗忘门层:由Sigmod层组成,决定什么信息应该被神经元遗忘;输入h

f

式中:σ为sigmoid激活函数;W

输入层:由Sigmod层组成,决定要更新的数值;

tanh层:生成一个新的候选数值

组合输入层和tanh层这两层生成一个更新状态值,决定神经元要保存什么信息

i

式中:i

输出层:建立在神经元状态的基础上,拥有一个滤波器;首先使用Sigmod层决定哪一部分的神经元状态需要被输出,然后让神经元状态经过tanh层并乘上Sigmod门限的输出

o

h

式中:o

附图说明

图1示出了长短期记忆网络链式结构。

图2示出了长短期记忆网络神经元。

图3示出了Tensorflow环境下生成的长短期记忆网络模型。

图4示出了Softmax函数图像。

图5示出了softmax激活函数配合分类交叉熵的训练和验证准确率曲线图。

图6示出了softmax激活函数配合分类交叉熵的训练和验证loss曲线图。

图7示出了sigmoid激活函数配合二进制交叉熵的训练和验证准确率曲线图。

图8是根据本发明的基于LSTM的印刷机轴承故障诊断方法的流程图。

具体实施方式

长短期记忆网络(LSTM)是一种特殊的循环神经网络(RNN),是为了解决循环神经网络的梯度消失问题而提出的。在传统的循环神经网络中,训练算法一般采用反向传播,当数据为长时间序列时,返回的残差呈指数递减,导致模型权重更新逐渐缓慢,最终呈现出无变化趋势。基于这一问题,需要一个存储单元来存储丢失的历史信息,于是就诞生了长短期记忆网络。

长短期记忆网络和传统的循环神经网络一样拥有链式结构,如图1所示。

如图1所示,这种基于LSTM(Long Short Term Memory,长短期记忆网络)的印刷机轴承故障诊断方法,其包括以下步骤:

(1)建立作用在时域振动信号上的长短期记忆网络模型;

(2)使用该模型对轴承的时域振动信号进行诊断;

(3)选取凯斯西储大学轴承数据库的部分数据进行仿真实验,获取故障识别率;

所述步骤(1)中,与循环神经网络的单层神经网络结构不同,长短期记忆网络包含四个神经网络层,他们以一种特殊的形式交互,如图2所示。长短期记忆网络模型包含四个神经网络层:

遗忘门层:由Sigmod层组成,决定什么信息应该被神经元遗忘;输入h

f

式中:σ为sigmoid激活函数;W

输入层:由Sigmod层组成,决定要更新的数值;

tanh层:生成一个新的候选数值

组合输入层和tanh层这两层生成一个更新状态值,决定神经元要保存什么信息

i

式中:i

输出层:建立在神经元状态的基础上,拥有一个滤波器;首先使用Sigmod层决定哪一部分的神经元状态需要被输出,然后让神经元状态经过tanh层并乘上Sigmod门限的输出

o

h

式中:o

在传统的循环神经网络中,训练算法一般采用反向传播,当数据为长时间序列时,返回的残差呈指数递减,导致模型权重更新逐渐缓慢,最终呈现出无变化趋势,因此需要一个存储单元来存储丢失的历史信息,本发明选择长短期记忆网络是因为它在处理时间序列数据上具有优势,然后使用该模型对轴承的时域振动信号进行诊断,最后选取凯斯西储大学轴承数据库的部分数据进行仿真实验,结果证实了该模型的可行性和有效性,能够解决印刷机轴承故障预警问题,减少非计划停机,提高轴承使用寿命,降低印刷设备故障率。

优选地,所述步骤(1)中,使用的深度学习框架为Google公司的Tensorflow,所用计算机的配置为CPU i7-7700,内存16GB,利用python在Tensorflow环境下搭建长短期记忆网络模型,模型的数据传递图如图3所示。该模型包含输入层、隐藏层、全连接层和输出层,输入层为400x1的二维数组,表示为400个时间步和一个特征;隐藏层包含20个单元,后接全连接层输出10种故障分类中每种分类的可能性,连接激活函数得到最终结果。训练数据经过模型后,计算出目标函数,再通过训练模块更新模型中的权值,最后在测试阶段用训练好的模型来对输入信号进行诊断。

优选地,所述步骤(1)中,网络选用非线性激活函数softmax,损失函数为分类交叉熵;Softmax函数为每一个输出分类的结果赋予一个概率值,表示属于每个分类的可能性;Softmax函数的定义公式如下:

其中,x

优选地,所述步骤(1)中,当使用Softmax函数作为输出节点的激活函数时,使用交叉熵作为损失函数,交叉熵的公式为:

其中,n为batch size,C为输出的节点个数,y为真实分布,也就是样本标签分布,x为预测分布,也就是神经网络的预测得分。

Tensorflow在Keras中提供了两种交叉熵损失函数,二进制交叉熵和多分类交叉熵。分类问题是要softmax激活函数配合分类交叉熵函数使用,而二分类问题要使用sigmoid激活函数配合二进制交叉熵函数适用,但是如果在多分类问题中使用了二进制交叉熵函数最后的模型分类效果会虚高,即比模型本身真实的分类效果好。

本文的实验数据来自于凯斯西储大学(CWRU)滚动轴承数据中心。CWRU数据集是世界公认的轴承故障诊断标准数据集,引用文献较多。在基于深度学习的轴承故障诊断领域,目前被引用数最高的两篇文章的试验数据均来自CWRU轴承数据库。

CWRU滚动轴承中心数据采集系统为:测试台由2hp电机(左)、扭矩传感器(中)、测功机(右)和控制电机装置组成。

优选地,所述步骤(3)中,实验对象为驱动端轴承,被诊断的轴承型号为深沟球轴承SKF6205,轴承的损伤是使用电火花加工的单点损伤,系统采样频率为12kHz,电机转速为1797rpm;轴承故障设置3种缺陷位置,分别是滚动体损伤、内圈损伤和外圈损伤,损伤的直径大小分为0.007inch、0.014inch和0.021inch,共计9种故障类型;轴承转一圈采样400个点,从每一个故障时间序列数据选择120000个采样点,以400个数据点为一个样本,每一个故障数据构成300个样本;正常数据也为300个样本,数据集总共为3000个样本,样本之间无重叠;按照9∶1的比例拆分训练集和测试集,训练集为2700个样本,测试集为300个样本,如表1所示。

表1

优选地,所述步骤(3)中,利用处理好的数据集对搭建的网络进行训练,训练时,优化器为Adam算法,学习率设置为0.001,批量大小batch_size为100,迭代2000次。训练后得到的准确率随迭代次数变化曲线图如图5所示,loss随迭代次数变化曲线图如图6所示,其中由黑色实线组成的曲线为训练数据,由黑色点组成的曲线为测试数据。

迭代后10次的准确率如表2所示。

表2

之后,对测试集单独的错误类型数据分别进行了测试,得到了不同错误类型在该模型下的准确率,如表3所示。

表3

由表中所示数据可以看出,一方面,部分错误分类的测试数据可以达到一个很好的效果,如内环0.021inch损坏类型和外环0.007inch损坏类型可以达到准确率100%。另一方面,滚动体0.021inch损坏错误类型的训练效果相对较差,只达到了92%。

还测试了用sigmoid激活函数配合二进制交叉熵函数解决多分类问题。训练时,优化器、学习率,批量大小和迭代次数等参数设置相同。训练后得到的准确率随迭代次数变化曲线图如图7所示,其中由黑色实线组成的曲线为训练数据,由黑色点组成的曲线为测试数据。

综上所述,得到如下结论:

首先,本文首次提出作用在时域振动信号上的长短期记忆网络模型,对滚动轴承进行故障诊断。根据准确率随迭代次数变化的曲线图可以看出,长短期记忆网络做故障诊断的训练时,一开始很不稳定,但是经过一定次数的迭代后,在某次迭代后可以达到很好的效果,准确率可以达到95%以上。另外,该模型的训练结果在不同故障类型测试数据下表现的效果略有出入,最高可以达到100%,最低达到92%。最后,本文对两种激活函数和损失函数的组合进行了对比,分别是softmax激活函数配合分类交叉熵损失函数和sigmoid激活函数配合二进制交叉熵激活函数。实验表明,softmax激活函数配合分类交叉熵在解决多分类问题上效果更好,想要达到理想的效果所需要的迭代次数也更少。

本领域普通技术人员可以理解,实现上述实施例方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,所述的程序可以存储于一计算机可读取存储介质中,该程序在执行时,包括上述实施例方法的各步骤,而所述的存储介质可以是:ROM/RAM、磁碟、光盘、存储卡等。因此,与本发明的方法相对应的,本发明还同时包括一种基于LSTM的印刷机轴承故障诊断装置,该装置通常以与方法各步骤相对应的功能模块的形式表示。该装置包括:

建模模块,其配置来建立作用在时域振动信号上的长短期记忆网络模型;

诊断模块,其配置来使用该模型对轴承的时域振动信号进行诊断;

实验模块,其配置来选取凯斯西储大学轴承数据库的部分数据进行仿真实验,获取故障识别率;

所述建模模块中,长短期记忆网络模型包含四个神经网络层:

遗忘门层:由Sigmod层组成,决定什么信息应该被神经元遗忘;输入h

f

式中:σ为sigmoid激活函数;W

输入层:由Sigmod层组成,决定要更新的数值;

tanh层:生成一个新的候选数值

组合输入层和tanh层这两层生成一个更新状态值,决定神经元要保存什么信息

i

式中:i

输出层:建立在神经元状态的基础上,拥有一个滤波器;首先使用Sigmod层决定哪一部分的神经元状态需要被输出,然后让神经元状态经过tanh层并乘上Sigmod门限的输出

o

h

式中:o

优选地,所述建模模块中,使用的深度学习框架为Google公司的Tensorflow,所用计算机的配置为CPU i7-7700,内存16GB,利用python在Tensorflow环境下搭建长短期记忆网络模型。

优选地,所述建模模块中,网络选用非线性激活函数softmax,损失函数为分类交叉熵;Softmax函数为每一个输出分类的结果赋予一个概率值,表示属于每个分类的可能性;Softmax函数的定义公式如下:

其中,x

优选地,所述建模模块中,当使用Softmax函数作为输出节点的激活函数时,使用交叉熵作为损失函数,交叉熵的公式为:

其中,n为batch size,C为输出的节点个数,y为真实分布,也就是样本标签分布,x为预测分布,也就是神经网络的预测得分。

以上所述,仅是本发明的较佳实施例,并非对本发明作任何形式上的限制,凡是依据本发明的技术实质对以上实施例所作的任何简单修改、等同变化与修饰,均仍属本发明技术方案的保护范围。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号