法律状态公告日
法律状态信息
法律状态
2022-07-22
公开
发明专利申请公布
技术领域
本申请属于航空发动机稳态数据处理领域,特别涉及一种发动机稳态数据层次分析与稳态数据特征值提取方法。
背景技术
本发明涉及航空发动机稳态数据处理领域。由于航空发动机的工作环境及工作特性所致,发动机稳态试验数据常伴有随机噪声干扰,随机噪声的干扰易产生异常值,这将会对稳态值计算结果的准确性造成影响。稳态值计算结果的可靠性与准确性对发动机性能评估、控制规律调节以及发动机专项试验等多项考核工作影响较大,有时可能会因此改变发动机的一些设计结构与共同工作线的选取,直接影响到发动机从设计初期到生产制造全周期内的性能指标考核。
随着发动机测试系统数据采集能力的提升,数据量加大的同时,噪声对数据分析结果的影响也愈发明显,噪声的加入使得稳态数据本身存在结构化。工程上常用的噪声数据/异常值剔除方法主要有两类,第一类方法基于数据源单一正态分布假设,通过选定置信区间来剔除异常值,常见的剔除方法有莱茵达准则、AEDC法;第二类方法为近来新兴的机器学习方法,工程上大多基于闵可夫斯基距离做数据筛选,常见的方法有K-means聚类算法、LOF离异值检测算法等。由于第二类方法的应用时间较短,目前,在航空发动机稳态数据上应用机器学习方法来实现随机噪声的剔除仍处于空白阶段,缺少对航空发动机稳态数据层次结构自适应的方法。航空发动机本身复杂的场能、势能也会加剧稳态数据结构多样化。本发明是一种稳态数据处理方法,基于高斯混合模型的机器学习方法实现对发动机稳态数据层次自动划分,通过对模型参数进行结构分析,实现稳态数据的特征值提取,以表征稳态数据性能,打破传统的取平均、中位数等小样本方法壁垒缺陷,自适应地利用数据样本空间,对大数据、小样本均可实现层次分析并获取稳态数据特征值。
发明内容
本发明主要由航空发动机稳态数据层次划分方法以及稳态数据特征值提取方法的确定2个部分组成。航空发动机稳态数据层次划分方法依托聚类模型算法,在确立模型聚类数量后对不同类别分模型参数进行对比分析后,可达到识别稳态数据随机噪声与有效稳态数据样本点的效果,按照分析后的有效样本数据对分模型参数进行数据融合,提取该稳态数据特征值。
因此,该方法涉及模型选取、求解、类别数量确定、数据参数提取原则这4个部分,具体包括:
步骤S1:获取发动机稳态数据;
步骤S2:通过发动机稳态数据建立高斯混合模型,所述高斯混合模型包括多个高斯混合模型的分模型数据;
步骤S3:将所述分模型数据进行随机噪声剔除,获取有效分模型数据;
步骤S4:提取所述有效分模型数据特征值。
优选的是,步骤S2所述的建立高斯混合模型的具体方法包括:EM算法、PSO算法或者遗传算法。
优选的是,步骤S2所述的建立高斯混合模型的具体步骤包括:给定高斯混合模型分模型的个数,通过迭代求解高斯混合模型直至AIC或者BIC最小。
优选的是,当高斯混合模型分模型的为小样本空间,选择AIC准则作为模型聚类数量的评价标准;当高斯混合模型分模型的为大样本空间,选择BIC准则作为模型聚类数量的评价标准。
优选的是,步骤S4所述的提取所述有效分模型数据特征值,具体为:将所述有效分模型数据进行数据融合后,再提取特征值。
优选的是,所述有效分模型数据的获取方法,具体为:获取各分模型的权重系数、方差与均值;基于权重系数、方差与均值获取有效分模型数据。
优选的是,所述权重系数大于0.1,所述方差均为同一数量级。
本申请的优点包括:
1.本发明实现了对航空发动机稳态数据异常值自动识别,系机器学习方法剔除航空发动机噪声数据的首次应用;
2.该分类方法由于是软分类方法,可依据概率对发动机稳态数据点进行合理分类,分类结果更贴近实际;
3.分类模型的选择更贴近实际数据分布特性,解决不同样本空间分布形式不同所带来的计算方法弊端;
4.本发明通用性较强,可实现不同状态不同工况下的稳态数据随机噪声剔除,并对分类数据进行稳态数据特征值提取,以提供较为可靠的稳态性能值。
附图说明
图1是发动机稳态数据层次分析与稳态数据特征值提取方法流程图。
具体实施方式
为使本申请实施的目的、技术方案和优点更加清楚,下面将结合本申请实施方式中的附图,对本申请实施方式中的技术方案进行更加详细的描述。在附图中,自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。所描述的实施方式是本申请一部分实施方式,而不是全部的实施方式。下面通过参考附图描述的实施方式是示例性的,旨在用于解释本申请,而不能理解为对本申请的限制。基于本申请中的实施方式,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施方式,都属于本申请保护的范围。下面结合附图对本申请的实施方式进行详细说明。
如图本发明主要由航空发动机稳态数据层次划分方法以及稳态数据特征值提取方法的确定2个部分组成。
1.航空发动稳态数据层次划分方法
航空发动机稳态数据层次划分方法依托聚类模型算法,在确立模型聚类数量后对不同类别分模型数据进行对比分析后,可达到识别稳态数据随机噪声与有效稳态数据样本点的效果,按照分析后的有效样本数据对分模型数据进行数据融合,提取该稳态数据特征值。
因此,该方法涉及模型选取、求解、类别数量确定、数据参数提取原则这4个部分。
1.1模型的选择有
在航空发动机整机试验中参数测量采用等精度传感器测量方式,且测量形式符合中心极限定理的使用情况,因此工程上常认为发动机稳态数值服从单一正态分布。但是发动机稳定工作状态往往受工作环境、内部流场势能变化、控制规律以及测试系统电路干扰等多种因素影响,航空发动机稳态参数很难达到真正地参数性能时不变性,数值上处于一定的波动状态。随时间的增长,数据量增长的同时这种波动性愈发明显。
本方法利用混合模型自身良好回归特性,以及工程上的单一正态分布假设具有一定适用性,选择具有软分类特性的高斯混合模型作为数据分类模型,模型表述形式如下:
其中,α
1.2模型求解方法
目前,对于高斯混合模型的求解方法有EM算法,PSO算法,遗传算法等多种求解方法。考虑到工程实际需求,本专利使用EM算法作为该模型的求解方法。具体求解步骤如下:
(1)取参数的初始值开始迭代;
(2)E步:依据当前模型参数,计算分模型k对观测数据yj的响应度
(3)M步:计算新一轮迭代的模型参数
(4)重复第(2)步和第(3)步,直到收敛。
1.3聚类个数确定方法
由于混合模型对样本数据具有回归特性,因此可利用AIC准则(赤池准则)与BIC准则(贝叶斯信息准则)对大小样本空间定阶优势来确定高斯混合模型的分模型数量。在小样本空间选择AIC准则作为模型聚类数量的评价标准,而在大样本空间使用BIC准则作为模型定阶结果的衡量标准。
(1)AIC准则表达式如下:
AIC=2K-2ln(L)
式中,K为模型参数个数,L为模型极大似然函数值。
(2)BIC准则表达式如下:
BIC=KlnN-2ln(L)
式中,K为模型参数个数,L为模型极大似然函数值,N为数据个数。
1.4有效数据的筛选原则
根据1.3的数据分层方法确立最终的高斯分模型组成,可得到各分模型的权重系数、方差与均值。按照1.2中权重系数的计算方法可知,其计算结果为分模型响应度累加在全样本数量的占比情况。针对航空发动机稳态数据波动特性,可将其视为在稳态时域片段上,不同稳态工作点间的数值切换,各稳态工作点所处分模型应具有较大权重系数(一般>0.1),方差参数数量级应相同,且较以往同期数据方差变化不大,按照这一原则可选取去噪后的有效稳态点数据。
2.特征值提取方法
根据1.4中噪声剔除原则,可将高斯混合模型中不同分模型按照权重系数进行排序,选取权重系数较大且方差量级相同的分模型数据作为不同稳定工作点的实际采集数据,即无随机噪声干扰数据源。在该稳定工作状态下其稳态数据的特征值计算方法如下式所示:
式中
以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以所述权利要求的保护范围为准。
机译: 使用稳态序列的扩散加权磁共振层析成像成像方法,其中将非扩散和扩散加权数据集与特征值的扩散加权测量值相结合
机译: 用于在多稳态显示器上写入图像数据的多稳态显示器系统和方法
机译: 数据处理设备,其具有利用特征值的数据处理装置以及用于抵消分析方法以检测特征值的装置