首页> 中国专利> 一种基于数据挖掘的新能源远程测试设备故障诊断方法

一种基于数据挖掘的新能源远程测试设备故障诊断方法

摘要

本发明公开了一种基于数据挖掘的新能源远程测试设备故障诊断方法,现场获取设备特征信息参数、构建数据库、根据设备运行数据源挖掘构建设备故障数据模型与设备正常运行数据模型、对异常数据进行故障诊断分析、故障预警、判定故障原因等。本发明将离线建模、数据挖掘技术和Internet技术相结合,针对远程测试设备结构复杂、运行数据动态不稳定、设备故障交互影响严重、故障定位预警困难等问题,帮助运维检修人员快速排查故障,对由于隐性故障和显性故障交叉影响产生的复合故障所带来的经济风险、安全风险和维修风险定量化,及时控制大型复杂检测设备隐性故障的扩散,具有诊断准确度高、速度快、大幅度提高检修效率、降低维修费用等优点。

著录项

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2020-02-14

    授权

    授权

  • 2019-12-03

    著录事项变更 IPC(主分类):G01R35/00 变更前: 变更后: 申请日:20171129

    著录事项变更

  • 2018-06-01

    实质审查的生效 IPC(主分类):G01R35/00 申请日:20171129

    实质审查的生效

  • 2018-05-08

    公开

    公开

说明书

技术领域

本发明涉及一种基于数据挖掘的新能源远程测试设备故障诊断方法。

背景技术

测试设备能稳定的工作是完成新能源并网测试任务的根基,伴随着当代工业技术的进步,测试设备向着多元化方向发展。在发展的过程中设备的结构越来越复杂、功能越来越强大、维护难度也来越高,设备故障产生的可能性也随之越来越高。发生较轻的故障会影响设备的测试性能;当发生重大的设备故障时会使设备停止工作、造成其内部元器件损坏,可能会造成重大的测量误差和经济损失。因此如何进行诊断设备故障是保证并网测试准确度的重中之重,故障诊断技术引入到日常测试设备监管中是保证设备安全运行和提高维修效率的一种有效途径。

故障诊断是根据设备运行状态信息查找故障源,并确定相应决策的一门综合性的新兴科学。电力设备故障诊断技术的应用,使设备维修由传统的计划维修逐步过渡到状态维修,提高了并网检测可靠性,减少了事故停电损失,具有重要的经济和社会效益。

早期的故障诊断通常是通过操作人员的直接感触来判断故障类型,若无法直接接触设备,则通过检测工具对设备进行故障检测,通过故障表征和故障起因二者的关系来形成专家经验系统,利用成型的专家经验系统来确定设备的维护工作;后来人们应用数学建模来进行故障诊断,根据己知信息来建造检测器,模拟出输出结果,将结果和原测量结果进行对比,从对比结果中得到设备故障信息;随着设备信息获取技术的发展,人们通过获取的信息来进行故障诊断,主要通过检测器信号的特殊性或者检测器信号频率的变动来进行诊断。

新能源远程测试设备主要应用于新能源并网运行测试,远程设备状态发生变化,将无法及时对并网数据进行精准分析,会影响并网测试结果,进而影响新能源并网运行稳定性,造成重大事故损失,远程测试设备在新能源并网运行测试中的重要性不言而喻,为使测试设备持续保持良好的工作状态,对故障诊断的准确度及故障判定时间有着较高要求。新能源发电分布较为分散,故而新能源远程测试设备并不是固定安装的,一般在多个发电厂之间转场运行,使用条件在不断变化。因此,对新能源远程测试设备进行诊断所采集的数据质量要求较高,同时还需要采集转场过程中的环境条件参数数据及设备振动量等,对暂态数据处理要求高,现有设备诊断方法中采集分析的数据集及数据处理标准不足以满足远程测试设备故障诊断的要求,在此我们提出一种新的设备故障诊断方法,使新能源远程测试设备能快速、精准、全面的进行诊断,减少事故损失,提高并网供电可靠性,具有重要的经济和社会效益。

发明内容

本发明为了解决上述问题,提出了一种基于数据挖掘的新能源远程测试设备故障诊断方法,本发明考虑测试设备数据种类多、数据量大、可靠性要求高的特点,具有快速诊断、易检修、准确度高等突出优势。

为了实现上述目的,本发明采用如下技术方案:

一种基于数据挖掘的新能源远程测试设备故障诊断方法,以下步骤:

-2-

(1)按一定的周期性提取现场测试设备数据,对数据进行标准化处理,形成设备特征信息参数;

(2)根据特征信息参数并获取存储设备运行历史数据,为故障诊断分析和故障预警进行数据准备;从数据库中选择出正常状态数据,同时对剩余的数据的故障状态类型进行标注,针对各类运行状态的数据源进行模型的挖掘构建;

(3)将设备实时监测数据与故障数据模型相匹配,若匹配不成功,且无实际故障发生则返回继续监测设备运行状况;若匹配不成功且有故障发生,则经过专家诊断后将新的故障模式加入故障模型库;若匹配成功,则确定故障类型并将故障定位至具体故障元件,计算由故障项目集引起的显性故障在整个故障库发生的概率;

(4)通过历史故障数据和故障状态数据作为样本对神经网络进行训练,使其达到规定的误差范围,将故障状态的关键因素作为己训练好的神经网络模型的输入值,得到故障元件隐性故障影响值;

(5)根据计算结果确定影响值所属的值域,判断隐性故障的发展程度,预测隐性故障的发展趋势,给出隐形故障预警检测结果,并及时发出警报。

进一步的,所述步骤(1)中,采用小波包分解将带有噪声的特征信息的一维时间序列分解到各相互正交的小波空间中,并得到相应的小波包分解系数;对小波包分解得到的第1个节点对应的小波分解系数进行相空间重构,分别采用互信息方法和Cao提出的伪近邻法选取相空间重构时间延迟和最佳嵌入维数,对小波包分解系数进行相空间重构得到的相空间矩阵。

互信息法和Cao提出的伪近邻法选取相空间重构时间延迟和最佳嵌入维数的具体过程包括:

选取相空间重构时间延迟的具体过程为利用互信息法求延迟时间£,对于由两离散系统{u1,u2,…,un}和{υ1,υ2,…,υm}构成的系统U和V,根据信息论中的相关知识可知,两个系统的信息嫡可分别表示为

其中,Pu(ui)和Pυj)分别为U和V中某事件ui和υj的概率;

在给定U的情况下,得出关于系统V的信息,称为U和V的互信息,计算方法如下:

I(V,U)=H(V)-H(V|U)

其中

其中,P(uij)为事件ui和事件υj的联合分布概率。

定义[u,υ]=[χ(t),χ(t+£)],即u代表时间序列χ(t),υ代表延迟时间为£的时间序列χ(t+£),则I(V,U)显然是与时间延迟相关的函数,记为I(£)。I(£)的值表示在U已知的状态下,系统V的确定性大小。当I(£)=0时表示χ(t+£)完全不可预测,即χ(t)和χ(t+£)不相关;当I(£)取极小值时,表示χ(t)和χ(t+£)是最大程度上的不相关,重构时选取I(£)的第一个最小极值时的£为最优延迟时间。

Cao法选取最佳嵌入维数m的具体过程为:

设一时间序列{χ1,χ2,…,χn},重构时间延迟向量:

Xi(m)=(χi,χi+£,χi+(m-1)£)

式中,m为嵌入维数,£为延迟时间,Xi(m)表示以嵌入维数为m重构的第i个向量。

首先计算相空间中的点在各嵌入维数条件下的最近邻点的距离变化值,即

式中:||·||为向量范数,常用范数为Xi(m+1)为第i个重构相空间向量,嵌入维数为m+1;Xn(i,m)(m+1)为按上述范数定义下,离Xi(m+1)最近的向量,其中n(i,m)为大于1且小于等于N-m£的整数。

其次计算相同维数下距离变化值的平均值。

式中:E(m)为所有a(i,m)的均值。

最后检测E(m)的变化情况。

对于非随机序列,E1(m)会在m>m0(m0为某个定值)后的某一时刻不再变化,则嵌入维数存在。若对于随机序列,E1(m)则会逐渐增加,很难判断E1(m)是在缓慢变化着还是已经稳定。由于实测时间序列长度是有限的,可能会出现随机时间序列的E1(m)会在某一m处停止变化,因此,定义一个用来区分噪声信号和混沌信号的量:

对于随机序列来说,数据间不相关,无论d取值如何,均有E2(m)≡1;对于确定序列,嵌入维数m发生变化,数据相关性也随之变化,故总存在一个m,使得通过同时计算E1(m)和E2(m)来确定最小嵌入维数。

更进一步的,所述步骤(1)中,用LTSA算法来实现相空间中高维数据的非线性维数约简,并采用自适应极大似然估计方法估计出维数约简的目标维数;对相空间重构的高维数据进行维数约简后,根据相空间重构方法反求降噪后的一维小波包分解系数。

进一步的,所述步骤(2)中,采用Oracle数据库来存储设备运行历史数据,为故障诊断分析和故障预警模块做好数据准备;从数据库中选择出正常状态数据,同时对剩余的数据的故障状态类型进行标注,针对各类运行状态的数据源进行模型的挖掘构建。

所述步骤(2)中,构建设备运行历史数据库具体包括故障知识库、故障样本库和设备自身信息库,故障知识库用于存储故障特征、故障信息及处理办法,故障样本库用来存储设备发生故障时此设备的生产信息、实时状态和设备故障信息,设备的实时状态、生产数据库主要存储设备运行时的关键部位参数及设备生产数据,设备自身信息库记录设备名称、设备的型号、设备投入生产的时间、设备的自然年限和/或维修记录的设备自身基础信息。

所述步骤(2)中,模型构建过程中,选取Db10小波基对数据进行3级小波多分辨分析,获得低高频段的3层小波系数;每个故障数据集要计算一个3维的特征向量,应用混合高斯模型对多维特征数据的复杂分布进行描述,生成故障模式数学模型。

所述步骤(3)中,采用下述实时数据判断分析方法:获取实时数据,此处的实时数据为与建模阶段测点相同的数据矩阵,数据量为时间窗长度;应用时域分析手段对实时数据进行时域特征计算,计算的时域特征有均方根值、峰峰值、峭度和方差4个关键指标得到特征向量,判断时域特征向量各个参数均是否在设定之内,若满足条件,则判定为正常运行状态数据,若不满足条件,则判定为故障运行数据。

所述步骤(4)中,通过历史故障数据和故障状态数据作为样本对神经网络进行训练,使其达到规定的误差范围,将故障状态下五个关键因素:显性故障概率、磨损系数、寿命系数、重要系数和故障综合风险值,作为己训练好的神经网络模型的输入值,得到故障元件隐性故障影响值。

所述步骤(4)中,构建BP神经网络,通过历史故障数据和故障状态数据,对神经网络进行学习训练,使其获得故障状态属性值各数据间的关系;当需要对新的样本模式进行隐性故障影响值预测时,神经网络通过再现训练将新的样本故障状态属性的量化值输入神经网络,神经网络输出隐性故障影响值,从而实现对隐性故障状态的预测。

与现有技术相比,本发明的有益效果为:

1)基于小波分析去噪处理与面向特征信息构建的Oracle数据库所提供的设备运行状态数据集,构建了设备正常运行数据模型与设备各类故障数据模型,以故障诊断可能性分析为主,以故障预警分析为补充,共同判定故障原因,弥补了传统故障诊断不够精确、诊断不及时的缺陷,使得本发明更加适合用来诊断大型测试设备。

附图说明

构成本申请的一部分的说明书附图用来提供对本申请的进一步理解,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。

图1为本发明的原理图。

具体实施方式:

下面结合附图与实施例对本发明作进一步说明。

应该指出,以下详细说明都是例示性的,旨在对本申请提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本申请所属技术领域的普通技术人员通常理解的相同含义。

需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本申请的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。

在本发明中,术语如“上”、“下”、“左”、“右”、“前”、“后”、“竖直”、“水平”、“侧”、“底”等指示的方位或位置关系为基于附图所示的方位或位置关系,只是为了便于叙述本发明各部件或元件结构关系而确定的关系词,并非特指本发明中任一部件或元件,不能理解为对本发明的限制。

本发明中,术语如“固接”、“相连”、“连接”等应做广义理解,表示可以是固定连接,也可以是一体地连接或可拆卸连接;可以是直接相连,也可以通过中间媒介间接相连。对于本领域的相关科研或技术人员,可以根据具体情况确定上述术语在本发明中的具体含义,不能理解为对本发明的限制。

本申请提出了一种基于数据挖掘的新能源远程测试设备故障诊断方法,考虑测试设备数据种类多、数据量大、可靠性要求高的特点,具有快速诊断、易检修、准确度高等突出优势。

新能源远程测试设备主要应用于新能源并网运行测试,对并网运行稳定性有一定影响,因此相比较于一般的大型设备,其对故障诊断的准确度及故障判定时间有着较高要求。同时由于新能源发电位置较为分散,新能源远程测试设备并不固定在某一地点,一般在多个发电厂之间转场运行,使用条件不断变化,现有故障诊断方法一般都是针对固定设备的,没有对转场过程数据参数进行采集及处理。为保证较高的诊断准确度,新能源远程测试设备对故障诊断所采集的数据质量要求较高,还需要采集转场过程中的环境条件参数数据及设备振动量等,对数据处理要求严格,现有设备诊断方法中采集分析的数据集及数据处理标准不足以满足远程测试设备故障诊断的要求,为此提出一种新的设备故障诊断方法,对数据采集的方式及特征参数范围进行调整,扩大数据量,并改进对数据源的处理与分析方式,使新能源远程测试设备能快速、精准、全面的进行诊断。

本发明的方法是利用离线建模、数据挖掘技术和Internet技术相结合来构建故障诊断方法,基本内容概括起来主要包括五个方面,一是特征数据处理方法;二是设备运行历史数据库的构建方法;三是各类故障数据模型的构建方法;四是设备故障诊断分析过程的设计方法;五是故障预警模块功能性设计方法;六是建立原型系统框架。

本发明的目的可通过采用由以下技术措施构成的技术方案来实现。本发明提出的基于数据挖掘的新能源远程测试设备故障诊断方法,其方案主要包括以下步骤:

(1)获取设备特征信息参数:从现场测试设备中大量不完全的、有噪声的、模糊的或者随机的数据里按一定的周期性提取有用的信息和知识,利用小波分析法有效的对数据进行标准化处理,并对数据进行去噪、处理不完整的数据,然后将初步处理过的特征信息数据通过以太网实时传递到远程诊断中心;

(2)特征数据存储与建模:在诊断中心存储特征数据,采用Oracle数据库来存储设备运行历史数据,为故障诊断分析和故障预警模块做好数据准备;从数据库中选择出正常状态数据,同时对剩余的数据的故障状态类型进行标注,针对各类运行状态的数据源进行模型的挖掘构建;

3)故障诊断分析:将设备实时监测数据与故障数据模型相匹配,若匹配不成功,且无实际故障发生则返回继续监测设备运行状况;若匹配不成功且有故障发生,则经过专家诊断后将新的故障模式加入故障模型库;若匹配成功,则确定故障类型并将故障定位至具体故障元件,计算由故障项目集引起的显性故障在整个故障库发生的概率;

(4)故障预警:通过历史故障数据和故障状态数据作为样本对神经网络进行训练,使其达到规定的误差范围,将故障状态下五个关键因素:显性故障概率、磨损系数、寿命系数、重要系数、故障综合风险值,作为己训练好的神经网络模型的输入值,得到故障元件隐性故障影响值;根据计算结果确定影响值所属的值域,判断隐性故障的发展程度,预测隐性故障的发展趋势,给出隐形故障预警检测结果,并及时发出警报;

(5)判定故障原因:确定最终的故障诊断结果并通过WEB服务器展现,包括实时数据所属的故障类型、故障发生部分及故障恶化趋势等信息,以便给出更快、更有效的维修决策支持。

在本发明的上述技术方案中,步骤(1)中所述有噪声的特征信息采用小波包分解将一维时间序列分解到各相互正交的小波空间中,并得到相应的小波包分解系数;对小波包分解得到的第1个节点对应的小波分解系数进行相空间重构,分别采用互信息方法和伪近邻法选取相空间重构时间延迟£和最佳嵌入维数m,对小波包分解系数进行相空间重构得到的相空间矩阵;用LTSA算法来实现相空间中高维数据的非线性维数约简,并采用自适应极大似然估计方法估计出维数约简的目标维数;对相空间重构的高维数据进行维数约简后,根据相空间重构方法反求降噪后的一维小波包分解系数。

在本发明的上述技术方案中,步骤(2)中所述的设备运行历史数据库中,故障知识库用于存储故障特征、故障信息及处理办法,故障样本库用来存储设备发生故障时此设备的生产信息、实时状态和设备故障信息,设备的实时状态、生产数据库主要存储设备运行时的关键部位参数及设备生产数据,设备自身信息库记录设备名称、设备的型号、设备投入生产的时间、设备的自然年限、维修记录等设备自身基础信息。

在本发明的上述技术方案中,步骤(2)中所述的模型构建过程中,选取Db10小波基对数据进行3级小波多分辨分析,获得低高频段的3层小波系数;每个故障数据集要计算一个3维的特征向量,表达式如公式(1)所示:

其中i为小波分解层数,w为每层小波分解系数;

应用混合高斯模型对多维特征数据的复杂分布进行描述,生成故障模式数学模型,其中高斯混合模型表达式如公式(2)所示:

式中,Z为特征数据向量,M为模型混合数,wj为混合模型的权重系数,N(z;μj;Σj)为第j个多维单一高斯概率密度函数,按照公式(3)所示计算

式中,u为此密度函数中心点,Σ为此密度函数的协方差矩阵。

在本发明的上述技术方案中,步骤(3)中优先采用下述实时数据判断分析方法:获取实时数据,此处的实时数据为与建模阶段测点相同的数据矩阵,数据量L为时间窗长度N;应用时域分析手段对实时数据进行时域特征计算,计算的时域特征有均方根值、峰峰值、峭度、方差4个关键指标,其计算式如公式(4)、(5)、(6)、(7)所示:

均方根值

峰峰值FF=xmax-xmin(5)

峭度

方差

得到特征向量FV=[xrms,FF,β,Dx];判断时域特征向量各个参数均是否位于Fupper=[xrms,FF,β,Dx]和Flower=[xrms,FF,β,Dx]之间,若满足条件,则判定为正常运行状态数据,若不满足条件,则判定为故障运行数据。

在本发明的上述技术方案中,步骤(4)中利用MATLAB神经网络工具箱创建BP神经网络,工具箱中包含了己编写好的神经网络设计、训练和仿真函数,通过调用便可获得。在BP神经网络设计中,采用H=log 2N(其中H代表隐含层节点个数,N代表输入点数)来确定隐含层节点数。通过历史故障数据和故障状态数据,对神经网络进行学习训练,使其获得故障状态属性值各数据间的关系;当需要对新的样本模式进行隐性故障影响值预测时,神经网络通过再现训练所得的经验、知识和直觉思维,将新的样本故障状态属性的量化值输入神经网络,网络便可输出隐性故障影响值,从而实现对隐性故障状态的预测。

以上所述仅为本申请的优选实施例而已,并不用于限制本申请,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

上述虽然结合附图对本发明的具体实施方式进行了描述,但并非对本发明保护范围的限制,所属领域技术人员应该明白,在本发明的技术方案的基础上,本领域技术人员不需要付出创造性劳动即可做出的各种修改或变形仍在本发明的保护范围以内。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号