首页> 中国专利> 一种基于生成对抗网络的直升机动部件异常检测方法

一种基于生成对抗网络的直升机动部件异常检测方法

摘要

本发明涉及一种基于生成对抗网络的直升机动部件异常检测方法,该方法包括如下步骤,步骤一、直升机健康数据预处理;步骤二、生成对抗网络设计与构件;步骤三、生成对抗网络无监督训练;步骤四、报警阈值设定;步骤五、异常检测;步骤六、阈值自适应在线调整;本发明可充分利用海量直升机动部件健康数据,利用生成对抗网络对健康数据分布进行无监督学习,提高数据利用率,不需大量异常样本即可设置异常检测报警阈值,降低了对数据收集的要求,可随着模型的使用,结合不断补充的健康与异常样本,对异常检测报警阈值进行在线调整,以适应异常检测需求,降低虚警率、提升检测率。

著录项

  • 公开/公告号CN112991579A

    专利类型发明专利

  • 公开/公告日2021-06-18

    原文格式PDF

  • 申请/专利权人 北京航空航天大学;

    申请/专利号CN202110255485.9

  • 申请日2021-03-09

  • 分类号G07C5/08(20060101);G06N3/04(20060101);G06N3/08(20060101);

  • 代理机构11440 北京京万通知识产权代理有限公司;

  • 代理人万学堂

  • 地址 100191 北京市海淀区学院路37号

  • 入库时间 2023-06-19 11:27:38

说明书

技术领域

本发明涉及直升机动部件异常检测技术领域,具体涉及一种基于生成对抗网络的直升机动部件异常检测方法。

背景技术

直升机由于其独特的性能,广泛的用途,受到了各领域的普遍关注。传动系统是直升机中基本而重要的关键系统,承担了直升机的动力传输功能。直升机传动系统的结构特点是存在大量的旋转动部件,从发动机输出的动力经传动系统传输给主旋翼、尾桨等直升机子系统中,动力或载荷传递路径单一,并且飞行过程中始终保持着旋转运行,其中任何一个部件的功能异常或失效都可能导致灾难性事故的发生。因此,对直升机动部件开展异常检测,对提高直升机传动系统运行可靠性与安全性有重要意义。

机器学习、深度学习等数据驱动的方法优于其具备较好的自适应性、不依赖过多专家知识等特点,在直升机动部件异常检测任务中得到了广泛应用。数据驱动的异常检测算法,通过采集直升机健康和异常状态下的数据,训练分类器等模型,使模型学习到区分健康与异常样本的最优分类平面,进而具备异常检测能力。典型的数据驱动的直升机动部件异常检测算法包括基于时频信号分解的异常检测方法、基于阈值的异常检测方法、基于神经网络的异常检测方法等。然而,通常情况下,直升机动部件大多数时间处于正常的工作状态,且故障注入试验难度大、成本高、具备危险性,因此用于异常检测模型训练的异常数据样本难以大量获取。如何在基于大量健康数据与少量异常数据,对直升机动部件开展异常检测,成为亟待解决的问题。

生成对抗网络是一种深度学习模型,其能够通过生成器和判别器的对抗训练,使模型具备对满足特定分布样本的生成和判别能力。因此,利用大量直升机健康状态下的数据对生成对抗网络进行训练,可以得到具备如下能力的模型:1)能够生成与直升机健康数据相似的数据的生成器;2)能够区分输入数据是否来自直升机真实健康样本分布的判别器。进而,利用上述判别器,结合少量异常样本,能够实现基于不平衡样本集的直升机动部件异常检测。此外,在实际在线异常检测过程中,可以随着异常样本的增多,自适应地对报警阈值进行自适应调整,实现检测能力的持续提升。

发明内容

本发明所解决的问题是,当前直升机动部件异常检测方法所具有的:对故障样本数据量要求高、异常判定阈值设置依赖专家经验、难以随着模型使用对阈值进行在线更新等弊端,导致其实际工程适用性较差的问题。

本发明提出了一种基于生成对抗网络的直升机动部件异常检测方法。该方法步骤如下。

步骤一、直升机健康数据预处理:对直升机动部件振动数据进行切割、快速傅里叶变换,完成数据健康数据预处理,得到生成对抗网络训练样本;

步骤二、生成对抗网络设计与构建:根据样本维度与具体任务需要,设计生成对抗网络中生成器网络与判别器网络的结构、激活函数等属性;

步骤三、生成对抗网络无监督训练:根据生成器、判别器网络的目标函数,利用步骤一得到的训练健康样本集对生成对抗网络进行无监督训练,得到具有样本生成能力的生成器和真实分布判别能力的判别器;

步骤四、报警阈值设定:结合少量以同样方式进行预处理之后的异常样本,根据分类错误率最低准则,进行报警阈值设定;

步骤五、异常检测:利用训练得到的判别器和设置的报警阈值,对测试集样本进行异常检测;

步骤六、阈值自适应在线调整:随着在线使用阶段的样本(测试集样本)不断增多,对步骤四中设定的报警阈值,根据分类错误率最低准则进行再调整。

本发明相较于其他直升机动部件异常检测方法,优势在于:

1)可充分利用海量直升机动部件健康数据,利用生成对抗网络对健康数据分布进行无监督学习,提高数据利用率;

2)不需大量异常样本即可设置异常检测报警阈值,降低了对数据收集的要求;

3)可随着模型的使用,结合不断补充的健康与异常样本,对异常检测报警阈值进行在线调整,以适应异常检测需求,降低虚警率、提升检测率。

附图说明

图1为本发明方法流程图;

图2为本发明实施例所用的完整原始振动信号样本图;

图3为数据切割得到的单个振动信号原始样本图;

图4为数据切割得到的单个振动信号的频谱图;

图5A为生成对抗网络第一代训练结束后,在真实样本集中随机抽样得到的一个频谱图;

图5B为生成对抗网络第一代训练结束后,网络生成的一个频谱图;

图6A为生成对抗网络第十一代训练结束后,在真实样本集中随机抽样得到的一个频谱图;

图6B为生成对抗网络第十一代训练结束后,网络生成的一个频谱图;

图7A为生成对抗网络第二十一代训练结束后,在真实样本集中随机抽样得到的一个频谱图;

图7B为生成对抗网络第二十一代训练结束后,网络生成的一个频谱图;

图8A为生成对抗网络第三十一代训练结束后,在真实样本集中随机抽样得到的一个频谱图;

图8B为生成对抗网络第三十一代训练结束后,网络生成的一个频谱图;

图9A为生成对抗网络第四十一代训练结束后,在真实样本集中随机抽样得到的一个频谱图;

图9B为生成对抗网络第四十一代训练结束后,网络生成的一个频谱图;

图10A为生成对抗网络第五十代训练结束后,在真实样本集中随机抽样得到的一个频谱图;

图10B为生成对抗网络第五十代训练结束后,网络生成的一个频谱图;

图11A为生成对抗网络训练全过程中,生成器的损失值变化曲线图;

图11B为生成对抗网络训练全过程中,判别器的损失值变化曲线图;

图12为第一次报警阈值设定结果示意图;

图13为根据第一次设定的报警阈值,对测试集样本进行检测的结果示意图;

图14为报警阈值在线调整之后,根据新的报警阈值对新的测试集样本进行检测的结果示意图;

图15为健康样本数据RMS特征图;

图16为测试样本数据RMS特征图。

具体实施方式

以下结合附图,通过具体实施例,对本发明的基于生成对抗网络的直升机动部件异常检测方法的各个步骤进行详细说明。

本发明提出了一种基于生成对抗网络的直升机动部件异常检测方法。该方法步骤如下。

步骤一、直升机健康数据预处理S1:对直升机动部件振动数据进行切割、快速傅里叶变换,完成数据健康数据预处理,得到生成对抗网络训练样本;

首先对用于模型训练的直升机健康数据进行预处理。

数据切割S11:

由于直升机动部件包含大量旋转机械,振动信号中包含了大量与系统运行状态以及故障相关的模式和信息,因此本发明中采用直升机动部件振动信号作为用于异常检测的原始数据。振动信号的采集和存储通常持续一段时间,因此直升机动部件健康数据表现为一定长度的时间序列。设健康数据采集频率为f(Hz),数据采集时长为t(s),则健康数据总长度为f×t。将完整健康数据切割为长度w的数据段,每段间无重叠点;若健康数据总长度不是w的倍数,则考虑数据采集起始阶段的不稳定等因素,舍弃数据起始段不满样本长度w的点。则完整健康数据共能够切割出样本

快速傅里叶变换S12:

数据切割之后,对每段样本进行快速傅里叶变换,得到每个样本的频谱。

由于振动信号中包含的直升机健康与故障特征大部分在频域中体现,为提升异常检测效果,对切割得到的每个时域振动信号样本进行快速傅里叶变换(FFT),得到样本频谱,作为训练生成对抗网络的输入样本,也作为异常检测阶段给模型的输入样本。记第i个样本的时域振动信号向量为x

步骤二、生成对抗网络设计与构建:根据样本维度与具体任务需要,设计生成对抗网络中生成器网络与判别器网络的结构、激活函数等属性;

生成器构建S22,生成器构建S22也为生成器网络构建。

生成器采用多层神经网络来实现,以维度为z

判别器构建S22,判别器构建S22也为判别器网络构建。

与生成器类似,判别器网络也采用多层神经网络来实现。判别器网络以维度w的样本为输入,以单个神经元为输出。由于异常检测任务中样本的复杂度不同,可根据具体需求设置判别器网络的隐藏层数与每个隐藏层的神经元节点数。同时,为除输入层、输出层外的所有层设置激活函数;输出层激活函数设置为Sigmoid函数(表达式为S(x)=1/(1+e

步骤三、生成对抗网络无监督训练S3:根据生成器、判别器网络的目标函数,利用步骤一得到的训练健康样本集对生成对抗网络进行无监督训练,得到具有样本生成能力的生成器和真实分布判别能力的判别器;

生成器训练S31:

生成器网络目标函数,在对抗训练过程中,生成器的目的是基于输入的随机噪声向量生成与来自真实数据分布的样本尽可能相似的生成样本,以“欺骗”判别器给出错误的判别结果。因此,生成器的训练目标是使自身生成的样本输入判别器后,判别器给出的判别结果尽可能接近于1。基于此,生成器的目标函数如下公式(1)。

其中,z是输入生成器的随机噪声向量,Pz是随机噪声向量分布(可以是高斯分布、均匀分布等),G()是生成器表达的非线性映射函数,D()是判别器表达的非线性映射函数,log是以10为底的对数。

判别器训练S32:

判别器网络目标函数,判别器的目的是对输入的样本进行特征提取和判断,以判别样本是否来自真实数据分布。对于来自真实分布的样本,判别器的目标是给出概率1;对于不是来自真实分布的样本,判别器的目标是给出概率0。基于此,判别器的目标函数如下公式(2)

其中,z是输入生成器的随机噪声向量,P

生成器与判别器的联合对抗训练:

首先,对判别器进行训练。从某种先验分布(如均匀分布、正态分布等)中采集一批噪声样本,记为

按上述方法对判别器训练q次之后,停止此轮判别器训练,开始生成器训练。其中,q是人为设定的控制判别器与生成器训练强度比例的超参数,需要结合具体情况进行设定。在生成器训练时,从上述先验噪声分布中采集一批噪声样本,设置其真实标签为1;将这批样本输入生成器,获得生成样本,再输入判别器,得到判别结果;根据判别结果与真实标签,按照生成器目标函数计算此轮训练的生成器损失,根据损失值利用优化器对生成器网络进行训练。在生成器网络训练时,冻结判别器网络的权重,即判别器网络在此过程中参数不做更新。

以上为生成器与判别器的一轮联合对抗训练。在实际应用中,需要根据具体情况设置对抗训练的轮次数,以使生成器与判别器达到纳什均衡状态。

当联合对抗训练结束后,获得了能够以随机噪声为输入,生成与直升机真实健康数据非常相似的样本的生成器网络;以及能够准确判别输入样本是否来自直升机健康数据分布的判别器网络。

步骤四、报警阈值设定S4:结合少量以同样方式进行预处理之后的异常样本,根据分类错误率最低准则,进行报警阈值设定;

报警阈值设定,结合少量直升机动部件异常数据,对判别器报警阈值进行设定。

使用与健康数据预处理的方式对异常数据进行预处理,包括样本切割与快速傅里叶变换。记预处理之后的少量异常样本集合为

基于此,最终设定的最优报警阈值为使正常/异常样本识别错误数量最少的值。数学表达如下公式(4):

其中,I(·)函数当括号内逻辑表达式为真时,函数值为1;逻辑表达式为假时,函数值为0。

步骤五、异常检测S5:利用训练得到的判别器和设置的报警阈值,对测试集样本进行异常检测;

设定完最优报警阈值T

步骤六、阈值自适应在线调整S6:随着在线使用阶段的样本(测试集样本)不断增多,对步骤四中设定的报警阈值,根据分类错误率最低准则进行再调整。

当样本数量增多时,可能由于报警阈值设定不合理等问题,导致异常检测虚警率、漏报率升高,不满足实际异常检测需求的问题。可结合在线检测阶段收集到的新的异常样本,对设定的报警阈值进行自适应在线调整。具体调整方式与上述报警阈值设定方法所述类似,区别在于在此阈值调整阶段,所使用的样本和标签包含在线检测中补充的样本。

阈值自适应在线调整之后,可使阈值更加满足直升机动部件异常检测需求,降低虚警率和漏报率等指标。

实施例一

在本发明中,以HUMS系统实测的直升机飞行数据为例,对所述方法的有效性进行验证。数据采样率为32768,采样持续时间2秒,共包含65536个点。所述振动传感器布设在直升机附件机匣上,其中正常数据在直升机健康状态下采集,异常数据在直升机尾桨输出轴故障的状态下采集。

步骤一、直升机健康数据预处理S1

图2为本发明实施例所用的完整原始振动信号样本图,图2显示HUMS实测原始数据共持续2秒,飞行振动信号,横轴为数据点个数,纵轴为振动信号振幅。

图3为数据切割得到的单个振动信号原始样本图,横轴为数据点个数,纵轴为振动信号振幅,设定切片长度为2048,即每个样本包含2048个振动样本点。切片后的振动信号样本图。

图4为数据切割得到的单个振动信号的频谱图,图中横轴为频率,纵轴为对应频率位置的能量幅值,

对每个样本时域振动信号进行快速傅里叶变换,得到所有样本的频谱向量。以其中一个样本为例,原始时域信号与对应的频谱向量如下图所示。

由频谱图可以看出,直升机振动信号的特征主要集中在几个关键的特征频率上,相对时域信号而言更能够体现旋转机械的运行关键信息,因此更适合作为异常检测的原始样本。

生成对抗网络设计与构建S2

根据本实施例中数据的复杂程度与实际需求,构建生成器网络,其结构信息如下表1所示。

表1:生成器网络结构信息表

类似地,根据对称原则,构建判别器网络,其结构信息如下表2所示。

表2:判别器网络结构信息表

生成对抗网络无监督训练S3

利用方法流程中定义的生成器损失函数与判别器损失函数对生成对抗网络进行对抗训练。图5A和5B分别为生成对抗网络第一代训练结束后,在真实样本集中随机抽样得到的一个频谱图和生成对抗网络第一代训练结束后,网络生成的一个频谱图;当网络训练至不同阶段时,生成器输出的生成样本和真实样本情况如图5A和5B所示。

生成对抗网络第一代训练结果。

图6A和6B分别为生成对抗网络第十一代训练结束后,在真实样本集中随机抽样得到的一个频谱图和生成对抗网络第十一代训练结束后,网络生成的一个频谱图;生成对抗网络第十一代训练结果。

图7A和7B分别为生成对抗网络第二十一代训练结束后,在真实样本集中随机抽样得到的一个频谱图和生成对抗网络第二十一代训练结束后,网络生成的一个频谱图;生成对抗网络第二十一代训练结果。

图8A和8B分别为生成对抗网络第三十一代训练结束后,在真实样本集中随机抽样得到的一个频谱图和生成对抗网络第三十一代训练结束后,网络生成的一个频谱图;生成对抗网络第三十一代训练结果。

图9A和9B分别为生成对抗网络第四十一代训练结束后,在真实样本集中随机抽样得到的一个频谱图和生成对抗网络第四十一代训练结束后,网络生成的一个频谱图;生成对抗网络第四十一代训练结果。

图10A和10B分别为生成对抗网络第五十代训练结束后,在真实样本集中随机抽样得到的一个频谱图和生成对抗网络第五十代训练结束后,网络生成的一个频谱图;50代训练结束结果图

可以看出,随着生成对抗网络对抗训练的不断进行,生成器所输出的频谱样本与真实样本之间越来越相似,说明生成器的生成能力得到了不断增强,与之对应地,判别器的判别能力也不断提升。

图11A和11B分别为生成对抗网络训练全过程中,生成器的损失值变化曲线图和生成对抗网络训练全过程中,判别器的损失值变化曲线图;

生成器与判别器的损失函数曲线如下图11A和11B所示。

由生成器和判别器的损失曲线可知,在经历训练初始阶段的震荡之后,两个网络的损失值逐渐趋于平稳,且收敛至相近值附近,在收敛值上下小幅波动。说明生成器与判别器在经过一定循环的对抗训练之后,达到纳什均衡状态。

报警阈值设定S4

首先选取选取1800条用于训练的正常样本与400条已知为异常的样本,根据所述方法进行报警阈值设定。设定的最优报警阈值为使正常/异常样本识别错误数量最少的值,即0.5271。

图12为第一次报警阈值设定结果示意图;

异常检测S5

根据此报警阈值对测试集样本进行异常检测,计算得到的混淆矩阵如下表3所示。

表3:报警阈值对测试集样本进行异常检测计算的混淆矩阵表

为体现本发明所提出的异常检测方法的优势,选取工程实际中常用的异常检测方法:特征提取与阈值法,利用相同的数据进行训练和测试。

在目前工程实际应用中,对于只具有健康状态数据而缺少异常故障样本的对象进行诊断时,常用的方法为通过对时域的振动信号样本进行特征提取,提取其信号中的特征信息,之后根据健康状态的特征信息分布获取其分布阈值,并以此阈值为标准进行样本故障诊断。目前工程应用中,对振动信号特征提取应用较为广泛的为提取健康样本时域信号的均方根值(Root Mean Square,RMS),并根据其均方根值分布分析健康状态的上下限阈值,并以此阈值进行测试样本的异常检测。

计算每一个样本的RMS的公式如下式所示:

利用训练集的健康数据样本计算RMS值,计算结果如下图15所示。

图15中横轴为训练集健康样本的序号,纵轴为对应样本的RMS值计算结果。根据健康样本数据分布,可以得到健康样本数据RMS特征阈值上限为7.7682,阈值下限为0.1459。

确定RMS特征阈值上下限后,对测试样本进行同样的计算,RMS特征值分布及与阈值之间的相对关系如下图16所示。

图16中横轴为测试集样本的序号,前1800个样本为健康样本,后400个样本为异常样本。图中两条黑色实线为前述根据训练集健康样本确定的RMS上下限阈值。超过阈值范围的样本被判定为异常样本,落在阈值区间内的样本被判定为健康样本。

根据设定的阈值与测试集样本RMS值计算结果进行异常检测,得到表4的混淆矩阵。

表4:混淆矩阵

可知利用特征值阈值方法进行异常检测,得到的检测准确率为89.6%,低于本发明所提出的基于生成对抗网络的方法。

报警阈值自适应在线调整S6

在实际在线异常检测过程中,由于用于模型训练和阈值设定的样本数量较少,且可能未能完全体现样本真实分布的全貌,因此随着在线样本的增加,模型异常检测率、虚警率等性能指标可能逐渐不满足实际应用要求。在本实施例中,测试集样本可视为在线检测过程中补充的样本,当获取这些在线样本之后,可对设定的报警阈值进行自适应调整,从而提升后续异常检测的性能。

将上一节中的测试集样本纳入到模型训练和初始报警阈值设定所用样本的集合中,对报警阈值进行重新设定。即此时设置的报警阈值,在第一阶段所有样本和第二阶段补充的所有在线样本上取得的检测准确率最高。

阈值调整完毕之后,在新的一批正常和异常样本上进行测试。计算得到的混淆矩阵如下表5所示。

表5:阈值调整完毕之后的新一批正常和异常样本的混淆矩阵表

图14为报警阈值在线调整之后,根据新的报警阈值对新的测试集样本进行检测的结果示意图;异常检测结果可视化如下图14所示。

可以看出,经过自适应调整后的阈值能够更好地对正常和异常样本进行划分,从而实现提高异常检测率、降低虚警率的目的,提升模型在线使用阶段的性能。

需要注意的是,本申请公布实施例的目的在于帮助进一步理解本发明,但是本领域的技术人员可以理解:在不脱离本发明及所附权利要求的精神和范围内,各种替换和修改都是可能的。因此,本发明不应局限于实施例所公开的内容,本发明要求保护的范围以权利要求书界定的范围为准。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号