首页> 中国专利> 基于综合距离的在线可更新暖通空调传感器故障检测方法

基于综合距离的在线可更新暖通空调传感器故障检测方法

摘要

本发明涉及暖通空调系统监控及故障诊断技术领域,公开了基于综合距离的在线可更新暖通空调传感器故障检测方法。检测通过构建两层距离模型:第一层采用四种原始的单一距离模型作为一级距离模型获取距离减边界距离的新差值距离;第二层进一步通过新差值距离再次构建单一距离模型作为二级距离模型,从而实现对传感器故障的检测。将新差值距离取代原始样本作为输入,提高了一级距离模型在不同工况样本下的故障检测正确率并降低了错识率,有效的克服了传统的单一距离模型对小幅值故障不敏感的局限性;其中一级距离模型根据实时更新的样本集进行筛选更新,形成动态的综合距离模型,也解决了单一距离模型在线更新上的问题。

著录项

  • 公开/公告号CN112413814A

    专利类型发明专利

  • 公开/公告日2021-02-26

    原文格式PDF

  • 申请/专利权人 武汉科技大学;

    申请/专利号CN202011215524.4

  • 申请日2020-11-04

  • 分类号F24F11/38(20180101);F24F11/64(20180101);

  • 代理机构50230 重庆市信立达专利代理事务所(普通合伙);

  • 代理人陈炳萍

  • 地址 430081 湖北省武汉市和平大道947号

  • 入库时间 2023-06-19 10:02:03

说明书

技术领域

本发明涉及暖通空调系统监控及故障诊断技术领域,具体涉及基于综合距离的在线可更新暖通空调传感器故障检测方法。

背景技术

随着现代科技社会的飞速发展,建筑行业不可忽视的成为了全国能源消耗的巨头之一,其中,暖通空调能耗所占建筑业内的住宅建筑和商业建筑近一半的能耗量。而在暖通空调系统中,传感器一旦发生故障将导致暖通空调系统难以保持运行在高效、节能的控制策略中,因此,能否尽早且准确的将发生故障的传感器检测并划分出来对暖通空调系统节能减耗具备重要意义。

传统的故障检测模型通常通过样本建立单一的故障检测模型,这种单一检测模型仅对于单一的故障标签和均匀分布的原始样本有着较好的检测性能,对于多故障类别、原始样本分布不均的问题就显得束手无策。主成分分析算法主要通过保留主要信息舍弃部分信息来建立故障检测模型,然而舍弃的这部分信息可能存在着样本的重要信息,容易导致过拟合现象的加剧;单类支持向量机算法是典型的处理二检测问题的检测模型,一旦样本数据缺失或者非线性,检测模型的性能就会显著下降;K均值聚类算法对于数据的要求高,不适用于有噪音和异常点的数据集;自动编码器存在着计算能力弱,容易过拟合缺点,更适用于小样本数据。上述模型也都是离线模型,不存在数据和模型的更新。然而在暖通空调系统中,其存储的建筑空调数据存在着多度量,多维度,地域性、大量且实时更新等特点,单一的检测模型难以在特征空间中充分利用样本数据信息建模,在全局中容易存在错误检测、检测性能不高等问题;而且上述的四个算法对同一个样本集建模的侧重不同,难以同时充分利用空调领域原始样本中的数据信息,也无法针对不同的样本集同时取得最佳的故障检测性能。

发明内容

基于以上问题,本发明提供基于综合距离的在线可更新暖通空调传感器故障检测方法。通过构建两层距离模型,在第一层通过四种单一算法建立相应的单一距离模型作为一级距离模型获取距离减边界距离的新差值距离集;在第二层进一步通过新差值距离构建上述四种单一距离模型中检测性能最高的距离模型作为最终的二级距离模型,从而实现对传感器故障的检测。新差值距离由于其去除了边界信息,相比于原始样本变得更加精悍,通过将新差值距离取代原始样本作为输入,来提高故障检测模型对故障检测的正确率并降低错识率,有效的克服了传统的单一距离模型对小幅值故障不敏感的局限性。其中一级距离模型根据实时更新的样本集进行筛选更新,形成动态的综合距离模型,提高了暖通空调系统中传感器的故障检测性能,也解决了传统单一距离模型中在在线更新上的问题。

为实现上述技术效果,本发明采用的技术方案是:

基于综合距离的在线可更新暖通空调传感器故障检测方法,包括如下步骤:

S1、建立综合距离模型,具体流程如下:

1)将暖通空调系统内的正常运行数据作为原始样本集;

2)将原始样本集分为建模集和寻优集两部分,在寻优集中引入故障;对寻优集进行和建模集相同的标准化处理;

3)选取主成分分析算法、单类支持向量机算法、K均值聚类算法和自动编码器算法,输入标准化的建模集训练为四个一级距离模型,通过寻优集对一级距离模型的参数进行寻优,建立最优的四个一级距离模型,剔除检测性能弱的一级距离模型;定义每个一级距离模型的输出距离与其对应的模型边界距离的差值为新差值距离,组合筛选后的最优一级距离模型的输出结果,形成新差值距离集;

4)通过标准化后的新差值距离集分为新建模集和新寻优集,建立基于以上四种算法的二级距离模型,选取性能最好的二级距离模型作为最终的二级距离故障检测模型;其中,二级距离模型的输出结果为单个距离,将其和输出单个距离对应的边界距离作比较,小于则为正常样本,储存至正常样本集A

S2、样本数据更新后启动增量学习训练更新综合距离模型,具体流程为:数据更新后启动增量学习训练新增样本集Ф

进一步地,主成分分析算法具体故障检测流程为:将原始样本数据x投影到主元空间,分解为主元向量

那么,Q

式(2)中,

D

当D

所述单类支持向量机算法故障检测流程为:通过训练正常样本,在其特征空间中构造一个最大化距离平面以实现训练样本与原点距离的最大化,即根据样本y,若样本y到原点的距离小于该距离平面则检测为故障样本,定义单类支持向量机算法的单一距离Qo为最大化距离平面F(y)的负值,其表达式为:

式(4)中,ω和ρ为决策最大化距离平面的参数,ψ为原始样本在特征空间中的映射,此时Q

D

即当D

所述K均值聚类算法故障检测流程为:通过以距离相似度进行检测,将原始样本数据分为K类,定义聚类中心为质心O;计算聚类中非质心样本到每个质心的欧氏距离,通过最小化该欧式距离来寻找最终质心的个数,即聚类个数;根据样本z,定义K均值聚类算法的单一距离Q

将计算得到的Q

D

若得出D

所述自动编码器算法的故障检测流程为:将原始样本输入到隐含层,进行编码重构解码生成重构样本,通过最小化原始样本和重构样本之间的均方差来检测故障样本;根据m维样本p,定义自动编码器算法的单一距离Q

将计算得到的Q

D

若得出的D

所述增量学习的综合距离模型更新的故障检测流程为:原始数据集Ф

样本更新后得到新增样本集Ф

式(10)和式(11)中,N

与现有技术相比,本发明的有益效果是:本发明通过构建两层距离模型,通过构建两层距离模型,在第一层通过四种单一算法建立相应的单一距离模型作为一级距离模型获取距离减边界距离的新差值距离集;在第二层进一步通过新差值距离构建上述四种单一距离模型中检测性能最高的距离模型作为最终的二级距离模型,从而实现对传感器故障的检测。新差值距离由于其去除了边界信息,相比于原始样本变得更加精悍,通过将新差值距离取代原始样本作为输入,来提高故障检测模型对故障检测的正确率并降低错识率,有效的克服了传统的单一距离模型对小幅值故障不敏感的局限性。其中一级距离模型根据实时更新的样本集进行筛选更新,形成动态的综合距离模型,提高暖通空调系统中传感器的故障检测性能,也解决了单一距离模型在在线更新上的问题。

附图说明

图1为实施例1和2中基于综合距离的在线可更新暖通空调传感器故障检测方法的流程图;

图2为实施例1和2中基于增量学习的模型更新原理图;

图3为实施例2中在不同故障幅值下的一级距离模型得检测性能比较图;

图4为实施例2中基于主成分分析算法的一级距离模型的距离Q

图5为实施例2中基于单类支持向量机算法的一级距离模型的距离Q

图6为实施例2中基于K均值聚类算法的一级距离模型的距离Q

图7为实施例2中基于自动编码器算法的一级距离模型的距离Q

图8为实施例2中在不同故障幅值下的二级距离模型的检测性能比较图;

图9为实施例2中二级距离模型的距离Q

具体实施方式

为使本发明的目的、技术方案和优点更加清楚明白,下面结合实施例和附图,对本发明作进一步的详细说明,本发明的示意性实施方式及其说明仅用于解释本发明,并不作为对本发明的限定。

实施例1:

参见图1和图2,基于综合距离的在线可更新暖通空调传感器故障检测方法,包括如下步骤:

S1、建立综合距离模型,具体流程如下:

1)将暖通空调系统内的正常运行数据作为原始样本集;

2)将原始样本集分为建模集和寻优集两部分,在寻优集中引入故障;对寻优集进行和建模集相同的标准化处理;

3)选取主成分分析算法、单类支持向量机算法、K均值聚类算法和自动编码器算法,输入标准化的建模集训练为四个一级距离模型,通过寻优集对一级距离模型的参数进行寻优,建立最优的四个一级距离模型,剔除检测性能弱的一级距离模型;定义每个一级距离模型的输出距离与其对应的模型边界距离的差值为新差值距离,组合筛选后的最优一级距离模型的输出结果,形成新差值距离集;

4)通过标准化后的新差值距离集分为新建模集和新寻优集,建立基于以上四种算法的二级距离模型,选取性能最好的二级距离模型作为最终的二级距离故障检测模型;其中,二级距离模型的输出结果为单个距离,将其和输出单个距离对应的边界距离作比较,小于则为正常样本,储存至正常样本集A

综合距离模型作为二检测模型,将样本在数据空间中映射为距离,和边界距离进行比较,从而对正常样本和故障样本进行划分;此时输出结果为整个综合距离模型的故障检测结果,是将样本通过模型检测后的正常样本集和故障样本集。

S2、样本数据更新后启动增量学习训练更新综合距离模型,具体流程为:数据更新后启动增量学习训练新增样本集Ф

在本实施例中,选取主成分分析,单类支持向量机算法,K均值聚类,自动编码器四个算法,本发明通过构建两层距离模型,通过构建两层距离模型,在第一层通过四种单一算法建立相应的单一距离模型作为一级距离模型获取距离减边界距离的新差值距离集;在第二层进一步通过新差值距离构建上述四种单一距离模型中检测性能最高的距离模型作为最终的二级距离模型,从而实现对传感器故障的检测。新差值距离由于其去除了边界信息,相比于原始样本变得更加精悍,通过将新差值距离取代原始样本作为输入,来提高故障检测模型对故障检测的正确率并降低错识率,有效的克服了传统的单一距离模型对小幅值故障不敏感的局限性。其中一级距离模型根据实时更新的样本集进行筛选更新,形成动态的综合距离模型,提高暖通空调系统中传感器的故障检测性能,也解决了传统单一距离模型中在在线更新上的问题。

本实施例中,所述主成分分析算法具体故障检测流程为:将原始样本数据x投影到主元空间,分解为主元向量

那么,Q

式(2)中,

D

当D

所述单类支持向量机算法故障检测流程为:通过训练正常样本,在其特征空间中构造一个最大化距离平面以实现训练样本与原点距离的最大化,即根据样本y,若样本y到原点的距离小于原点到该距离平面则检测为故障样本,定义单类支持向量机算法的单一距离Qo为最大化距离平面F(y)的负值,其表达式为:

式(4)中,ω和ρ为决策最大化距离平面的参数,ψ为原始样本在特征空间中的映射,此时Qo对应的边界距离To=0,即对应的新差值距离Do为:

D

即当D

所述K均值聚类算法故障检测流程为:通过以距离相似度进行检测,将原始样本数据分为K类,定义聚类中心为质心O;计算聚类中非质心样本到每个质心的欧氏距离,通过最小化该欧式距离来寻找最终质心的个数,即聚类个数;根据样本z,定义K均值聚类算法的单一距离Q

将计算得到的Q

D

若得出D

所述自动编码器算法的故障检测流程为:将原始样本输入到隐含层,进行编码重构解码生成重构样本,通过最小化原始样本和重构样本之间的均方差来检测故障样本;根据m维样本p,定义自动编码器算法的单一距离Q

将计算得到的Q

D

若得出的D

所述增量学习的综合距离模型更新的故障检测流程为:原始数据集Ф

样本更新后得到新增样本集Ф

式(10)和式(11)中,N

实施例2:

参见图1-9,本实施例以冷冻水侧供水温度的传感器故障为例,实验数据采集于武汉市某高校的复合式地源热泵系统的正常运行状态数据,该地源热泵系统的主机为一台额定制冷量为30.4KW的热泵机组。实验数据的采集时间为该机组7、8两月份,时段为上午8点到下午20点,每隔半个小时记录一次数据,记录的特征参数如表1所示。

表1热泵机组特征参数的符号及意义

1)确定原始样本集

筛选明显的异常数据后的数据共772组,作为原始样本集,按照时间顺序令前412组为建模集,后360组为寻优集,寻优集引入一定的正负小幅值的传感器故障。

2)评价指标

引入T

引入T

引入ROC曲线来评价T

引入ROC曲线下包围的面积值记作AUC值,该值可以直接的评价距离模型的性能。AUC∈[0.1,1],显然,AUC值越大,其模型检测性能越高;当AUC值为0.5及以下时,检测模型的检测效果与随机检测类似,不具备故障检测能力。

3)参数选择

3.1一级距离模型的参数选择

表2一级距离模型的相关参数及对应边界距离

3.2二级距离模型的参数选择

选取在四种算法中性能最好的算法建立最终的二级距离模型(将一级距离模型中的输出结果分别通过四种算法建立二级距离模型,比较得到检测性能最好的作为本实施例最终的二级距离模型),其特征参数选择如下:

表3二级距离模型的相关参数及对应边界距离

本实例在比较之下选取K均值聚类算法建立最终的二级距离模型(选择过程将在4.2中展示),此时,根据新差值样本集q=(q

将计算得到的Q′

表4二级距离模型中不同K值下的错识率

4)检测结果

4.1一级距离算法的筛选

从图3种可以看到,在负向上的故障幅值中,基于单类支持向量机的一级距离模型取得了最优的检测性能,整体AUC值在其他三个一级距离模型之上,基于K均值聚类的一级距离模型取得第二优的检测性能;而在正向上,基于K均值聚类的一级距离模型取得最优。整体上基于K均值聚类的一级距离模型检测性能较好,而基于自动编码器的一级距离模型的AUC曲线位置靠下,取得相对较差的检测性能。在图4到图7中,边界距离之上的样本为检测错误的样本,为了样本分布表达清晰,Q

4.2二级距离算法的比较选择

计算结果绘制AUC值变化曲线图。如图8所示,2-主成分分析,2-单类支持向量机算法,2-K均值聚类,2-自动编码器分别表示这四种算法作为二级距离模型下建立的相应模型。

可以看出在四种二级距离模型中,K均值聚类距离模型比其他距离模型都要表现的好;AUC值均值在0.88及以上。对比可以得出,主成分分析距离模型的性能最低,K均值聚类距离模型性能最优。故选取K均值聚类作为最终的二级距离模型。图9展示了二级距离模型Q

4.3不同模型的检测性能比较

本实施例将用所建立的综合距离模型和多数投票组合距离模型,基于原始样本集建立的主成分分析,单类支持向量机算法,K均值聚类,自动编码器这四种单个距离模型共六种方法作比较。表中故障幅值随机选取。

表5不同模型下的在不同故障幅值下的AUC值

表5可以看出,综合距离模型取得了最优的故障检测性能,AUC值均在0.96之上;比基于是原始样本集建立的单一距离模型的最大值提升了4%左右,比多数投票综合策略下也有一定的提高,且在不同故障幅值下的AUC值保持一个稳定的高水平。图9也可以直观的看到Q

表6是所有故障检测方法在未引入故障幅值的寻优集上的错识率,可以看出,综合距离模型的错识率显著降到了0.83%,而其它距离模型则在4%和6%之间。

表6不同故障检测方法在未引入故障的寻优集上的错识率

5)一级距离模型的多样性分析

提出熵测度E来表征参与综合策略的一级距离模型对样本检测的多样性。对于样本集L*,其公式如下:

式(15)中,N为单个距离模型个数,Nα为样本集L*中所有的样本个数,l(Lj)表示样本在N个距离模型中被正确检测的次数。

本实施例以在引入故障幅值的寻优集作为样本集。将不同故障幅值下的一级距离模型输出的最大差值距离定义为差值,将其和对应的熵测度E比较用来表征综合距离模型相比于单个距离模型的提升范围及一级距离模型的输出多样性。表7为随机选取的故障幅值下对应得熵测度和差值列表。

表7不同幅值下的熵测度及差值

表7可以看出熵测度E值和差值在整体上有着一定的相关性,差值较高的故障幅值处其熵测度也较高,这说明在综合距离模型的性能提高的越多的幅值上,其一级距离模型输出的多样性就越丰富。

如上即为本发明的实施例。上述实施例以及实施例中的具体参数仅是为了清楚表述发明验证过程,并非用以限制本发明的专利保护范围,本发明的专利保护范围仍然以其权利要求书为准,凡是运用本发明的说明书及附图内容所作的等同结构变化,同理均应包含在本发明的保护范围内。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号