首页> 中国专利> 一种基于生成对抗网络的高铁转向系统故障检测LSTM方法

一种基于生成对抗网络的高铁转向系统故障检测LSTM方法

摘要

本发明公开了一种基于生成对抗网络的高铁转向系统故障检测LSTM方法,属于故障诊断技术领域,首先,在列车上搭载信号传感器;在多次正常情况下和多次故障情况下,分别采集震动信号并合成向量后贴标签为;然后将所有贴完标签的向量合并数据集,划分训练集和测试集;在训练集中,选择n个故障向量和m个正常向量,利用生成对抗网络对故障向量进行过采样,得到m‑n个新故障状态向量。利用新故障状态向量,n个故障向量以及m个正常向量,共2m个数据对LSTM网络故障检测模型进行训练,并对测试集进行故障检测;利用测试结果,计算指标G‑mean进行验证;本发明引入生成对抗网络进行过采样,减少了数据不均衡带来的检测错误。

著录项

  • 公开/公告号CN112326276A

    专利类型发明专利

  • 公开/公告日2021-02-05

    原文格式PDF

  • 申请/专利权人 北京航空航天大学;

    申请/专利号CN202011175248.3

  • 发明设计人 张辉;石谦;

    申请日2020-10-28

  • 分类号G01M17/08(20060101);G01H17/00(20060101);G06K9/62(20060101);G06N3/04(20060101);

  • 代理机构11121 北京永创新实专利事务所;

  • 代理人易卜

  • 地址 100191 北京市海淀区学院路37号

  • 入库时间 2023-06-19 09:49:27

说明书

技术领域

本发明涉及高铁列车转向系统故障诊断,属于故障诊断技术领域,具体是一种基于生成对抗网络的高铁转向系统故障检测LSTM方法。

背景技术

近年来,我国高速铁路的建设规模及在高速铁路方面的创新成果均取得了重大进展,高速铁路运营里程的快速增长和运行时序的迅速提高,使得高速列车安全保障技术面临着巨大挑战。如何提升高速铁路的安全性和乘客的舒适度已经成为了高速铁路领域研究的重要方向之一。

转向架作为车体的重要组成部分,其异常状态会体现在转向架和车体的异常震动上,震动信号都是时序信号,传统的故障诊断方法都是基于静态信号,进行基于震动信号的故障诊断时多数方法并不能直接应用。因此基于LSTM(长短期记忆网络)的高铁列车转向架故障诊断方法应运而生,考虑到进行LSTM故障诊断模型训练时,转向架故障数据远小于正常数据,导致数据不均衡,会影响LSTM故障诊断模型精度和故障检测效果,因此需要利用生成对抗网络生成故障数据,减少训练数据的不均衡度,从而提高故障诊断模型精度的方法。

发明内容

针对上述问题,本发明提出了一种基于生成对抗网络的高铁转向系统故障检测LSTM方法,利用生成对抗网络生成故障数据,经过采样后建立LSTM故障检测模型,进而利用故障检测模型进行故障诊断。

所述的基于生成对抗网络的高铁转向系统故障检测LSTM方法,具体步骤包括:

步骤一、针对某高铁列车,在该列车上不同位置都搭载震动信号传感器;

步骤二、在列车转向系统正常的情况下,利用各震动信号传感器测量各位置的震动信号;

其中,每次测量的所有正常位置的震动信号作为一组数据;

步骤三、在列车转向系统故障的情况下,利用各震动信号传感器测量各位置的震动信号;

其中,每次测量的所有故障位置的震动信号作为一组数据;

步骤四、针对每次测量,将正常情况的该组数据合成一个向量,将其贴标签为1;将故障情况的该组数据合成一个向量,贴标签为-1。

步骤五、对正常状态和故障状态下分别测量若干次,并将各向量贴上对应标签,将所有贴完标签的向量合并成一个数据集,并划分训练集和测试集;

步骤六、在训练集中,选择n个故障状态的di维向量F1,F2,…,Fn,m个正常状态的di维向量N1,N2,…,Nm,n<

具体步骤如下:

步骤601、建立三层感知机神经生成网络G,并对权重参数进行随机初始化,使其在(0,1)内均匀分布:

神经生成网络G的公式如下:

其中,

遍历完所有i,k即可得到神经生成网络G的最终输出向量

实际运行过程如下:

首先,判断m-n与n的关系,当m-n小于等于n时,初始化

当m-n大于n时,初始化

步骤602、建立三层感知机神经判别网络D,用于判断神经生成网络G生成的向量是否为真,并对权重参数r

其中,r

遍历完所有i,k即可得到神经判别网络D的输出d

实际运行时,初始化

步骤603、令当前训练迭代步数t=1,将神经生成网络G输出集合g

具体过程为:

将伪故障状态向量g

当故障向量F1,F2,…,Fn数量小于m-n时,将故障向量按顺序从F1依次输入到Fn后,再次从F1依次输入到Fn,循环输入直至数量达到m-n。

当故障向量F1,F2,…,Fn数量大于等于m-n时,按顺序从F1开始选择,至前m-n个向量即可。

目标函数V(D)如下:

其中,D(Fl)代表以Fl为输入的判别网络D的输出结果,D(g

步骤604、保持神经判别网络D更新的权重参数r

具体过程为:

将伪故障状态向量g

步骤605、令迭代步数t=t+1,重复步骤603-604,至迭代步数t大于训练最大迭代步数tmax,得到此时最优的权重参数

步骤606、将故障向量F1,F2,…,Fn,输入最优的权重参数

步骤七、利用新故障状态向量{g'

步骤八、利用对LSTM故障检测的测试结果,计算指标G-mean大小进行验证;

针对某组测试集,用LSTM故障检测模型得到结果:分为故障数据和正常数据;同时结合该测试集真实的正常标签和故障标签,进行如下判断:

当检测结果为故障数据,真实标签为故障标签,则输出计数单位TP;

当检测结果为故障数据,真实标签为正常标签,则输出计数单位FP;

当检测结果为正常数据,真实标签为故障标签,则输出计数单位FN;

当检测结果为正常数据,真实标签为故障标签,则输出计数单位TN;

最后,统计各个计数单位的数量,利用如下公式计算所得到的故障检测的G-mean:

本发明与现有技术相比,具有以下优势和积极效果:

1)、本发明一种基于生成对抗网络的高铁转向系统故障检测LSTM方法,基于LSTM进行故障检测,能够处理震动信号这一时序信号;

2)、本发明一种基于生成对抗网络的高铁转向系统故障检测LSTM方法,引入生成对抗网络进行过采样,减少了数据不均衡带来的检测错误。

附图说明

图1为本发明一种基于生成对抗网络的高铁转向系统故障检测LSTM方法的流程图;

图2为本发明利用生成对抗网络进行过采样,得到新故障状态向量的流程图。

具体实施方式

为了便于本领域普通技术人员理解和实施本发明,下面结合附图对本发明作进一步的详细和深入描述。

本发明公开了一种基于生成对抗网络的高铁转向系统故障检测LSTM方法,首先利用生成对抗网络生成故障数据,并对故障数据进行过采样,在此基础上再进行LSTM模型训练及测试。具体为:在高铁列车转向系统中搭载传感器,测量高铁列车转向系统正常及故障情况下的各部位震动信号。将每组信号分别合成一个向量xi,对该向量对应的正常与故障状态分别贴标签,若正常则令标签yi=1,若故障则令标签yi=-1。将所有采集到的向量xi及yi合成为数据集,并将数据集平均分为训练集与测试集。

在训练集中,对故障状态的向量进行计数,得到故障数据数目n,对正常状态下的向量进行计数,得到正常数据数目m。在故障数据数目n<

将过采样后的所有训练数据组成X,开始进行LSTM故障检测模型训练,并使用训练后的LSTM故障检测模型检测故障。

如图1所示,具体步骤如下:

步骤一、针对某高铁列车,在该列车上不同位置都搭载震动信号传感器;

步骤二、在列车转向系统正常的情况下,利用各震动信号传感器测量各位置的震动信号;

其中,每次测量的所有正常位置的震动信号作为一组数据;

步骤三、在列车转向系统故障的情况下,利用各震动信号传感器测量各位置的震动信号;

其中,每次测量的所有故障位置的震动信号作为一组数据;

步骤四、针对每次测量,将正常情况的该组数据合成一个向量,将其贴标签为1;将故障情况的该组数据合成一个向量,贴标签为-1。

步骤五、对正常状态和故障状态下分别测量若干次,并将各向量贴上对应标签,将所有贴完标签的向量合并成一个数据集,并划分训练集和测试集;

步骤六、在训练集中,选择n个故障状态的di维向量F1,F2,…,Fn,m个正常状态的di维向量N1,N2,…,Nm,n<

具体步骤如下:

步骤601、建立三层感知机神经生成网络G,并对权重参数进行随机初始化,使其在(0,1)内均匀分布:

神经生成网络G的公式如下:

其中,

遍历完所有i,k即可得到神经生成网络G的最终输出向量

实际运行过程如下:

首先,判断m-n与n的关系,当m-n小于等于n时,初始化

当m-n大于n时,初始化

步骤602、建立三层感知机神经判别网络D,用于判断神经生成网络G生成的向量是否为真,并对权重参数r

其中,r

遍历完所有i,k即可得到神经判别网络D的输出标量d

实际运行时,初始化

步骤603、令当前训练迭代步数t=1,将神经生成网络G输出集合g

具体过程为:

将伪故障状态向量g

当故障向量F1,F2,…,Fn数量小于m-n时,将故障向量按顺序从F1依次输入到Fn后,再次从F1依次输入到Fn,循环输入直至数量达到m-n。

当故障向量F1,F2,…,Fn数量大于等于m-n时,按顺序从F1开始选择,至前m-n个向量即可。

目标函数V(D)如下:

其中,D(Fl)代表以Fl为输入的判别网络D的输出结果,D(g

步骤604、保持神经判别网络D更新的权重参数r

具体过程为:

将伪故障状态向量g

步骤605、令迭代步数t=t+1,重复步骤603-604,至迭代步数t大于训练最大迭代步数tmax,得到此时最优的权重参数

步骤606、将故障向量F1,F2,…,Fn,输入最优的权重参数

步骤七、利用新故障状态向量{g'

具体过程如下:

首先,利用训练数据,将交叉熵作为训练目标,利用Adam优化算法训练长短时记忆网络f,训练后得到长短时记忆网络的参数P,b

使得如公式(5)所示交叉熵最大。

其中,x代表训练数据,P,b

然后,按照如下步骤对测试数据进行测试:

(C1)将所得的LSTM网络参数P,b

其中P包括P

(C2)将采集到的待测试数据V

x

其中

(C3)全连接层计算后,将计算结果传递给长短时记忆网络层,进行以下操作;

其中下标L代表输入门,f代表遗忘门,o代表输出门;

输入门:

其中,

遗忘门:

单元状态:

输出门:

最终输出:

(C4)长短时记忆网络层将计算结果传递给全连接层,按照公式(12)所示进行计算;

z

(C5)全连接层的输出结果x,传递给softmax层,经过公式(13)计算,得到检测为故障和正常的概率

最后,取所得输出概率中较大概率的作为检测结果。

步骤八、利用对LSTM故障检测的测试结果,计算指标G-mean大小进行验证;

针对某组测试集,用LSTM故障检测模型得到结果:分为故障数据和正常数据;同时结合该测试集真实的正常标签和故障标签,进行如下判断:

当检测结果为故障数据,真实标签为故障标签,则输出计数单位TP;

当检测结果为故障数据,真实标签为正常标签,则输出计数单位FP;

当检测结果为正常数据,真实标签为故障标签,则输出计数单位FN;

当检测结果为正常数据,真实标签为故障标签,则输出计数单位TN;

最后,统计各个计数单位的数量,利用如下公式计算所得到的故障检测的G-mean:

判断所得到的故障检测G-mean大小。经过生成对抗网络过采样后的训练数据所得的故障检测模型由于更多的考虑了故障数据,因而可以获得更高的G-mean,也就是说分类结果对故障数据更加敏感。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号