公开/公告号CN108119316A
专利类型发明专利
公开/公告日2018-06-05
原文格式PDF
申请/专利权人 云南电网有限责任公司电力科学研究院;
申请/专利号CN201711140823.4
申请日2017-11-16
分类号
代理机构北京弘权知识产权代理事务所(普通合伙);
代理人逯长明
地址 650217 云南省昆明市经济技术开发区云大西路105号
入库时间 2023-06-19 05:34:04
法律状态公告日
法律状态信息
法律状态
2019-11-08
授权
授权
2018-06-29
实质审查的生效 IPC(主分类):F03D17/00 申请日:20171116
实质审查的生效
2018-06-05
公开
公开
技术领域
本申请涉及风力发电机技术领域,尤其涉及一种基于暂态录波数据的风力发电机运行故 障新类型发现方法。
背景技术
随着全球经济一体化的发展和人口数量的不断增多,能源的枯竭和环境恶化这两大问题 已然成为现在人类亟待处理的重要问题。风力发电在发电系统中已经成为了解决能源短缺问 题的重中之重。风力发电作为现代商业化发展前景的成熟技术和新兴产业,已经成为最主要 的替代能源。风力发电机作为风能发电的主要装置,其故障的类型划分成为故障预警与排查 的重要手段。
风力发电机组的安装位置一般偏远,比如高山、荒野、海洋、荒岛等风口处,受到不规 律的变向变负荷的风力作用,以及严寒酷暑等极端温差的持续影响,容易发生故障,造成巨 额的经济损失。针对频繁发生的风力发电机组事故,风力发电机组的智能故障诊断系统技术 引起了国内外相关人员的广泛关注。
在线状态监测与故障诊断系统要能够实时监测主风力发电机组要部件的工作状态,并通 过网络迅速有效的传送至监控终端,并进行故障诊断以判断故障发生的部位和类型,系统需 要涉及到传感器、数据采集、无线网络传输、神经网络诊断等相关技术。这种方法需要在风 电场布置专用的检测装置,比如各种部件的传感器等,直接采集风机部件的运行状态,是一 种直接的故障监控方法。风力发电机组主要由叶片、轮毂、转轴、偏航系统、发电机、齿轮 箱、液压系统、制动系统和控制与安全系统等组成,因此风力发电机的故障类型、故障机理 十分复杂。且由于场地偏远,还需要专门部署针对性的设备,且每种设备仅能监控针对某种 部件,导致设备繁多、部署困难,因此成本很高。
发明内容
本申请提供了一种基于暂态录波数据的风力发电机运行故障新类型发现方法,可用于聚 类出风力发电机新的故障类型,便于更准确的故障处理。
本申请提供了一种基于暂态录波数据的风力发电机运行故障新类型发现方法,该方法包 括:所述方法包括以下步骤:
构造暂态录波数据中侧面数据的多侧面特征向量;
按行构造所述多侧面特征向量的质心矩阵,按列求所述质心矩阵的平均得到超级质心向 量;
初始化置信矩阵;
基于K-means对侧面数据进行聚类,获得聚类结果;
根据聚类结果判定新故障类型。
可选的,上述方法中,所述构造暂态录波数据的侧面数据的多侧面特征向量,具体为:
对暂态录波数据的侧面数据依次进行归一化处理和对齐处理;
选择参考侧面数据,计算各侧面数据到参考侧面数据的欧式距离,构造参考矩阵MR,为>R,LR表示各侧面到参考侧面的相关程度;
求相关向量LR中相邻两元素的差,相关性分布向量DR,设定阈值,选择DR中值大于阈>
可选的,上述方法中,所述初始化置信矩阵中,还包括:
计算所述超级质心向量的算术平均距离向量,构造侧面等级向量;
使用K-means聚类方法聚类,根据聚类计算过程中类簇变化次数,初始化所述置信矩阵。
可选的,上述方法中,所述基于K-means对侧面数据进行聚类中,还包括:
当聚类结果与所述置信矩阵中标记的类簇一致时,增加所述侧面数据的置信度;
否则,降低所述侧面数据的置信度。
可选的,上述方法中,所述根据聚类结果判定新故障类型,具体为,
计算所述聚类结果对应特征向量的均值,得到
通过计算 遍历矩阵AK*N,当矩阵AK*N每一行中不存在元素小于阈值则证明类型i为新类型,否则> 本申请提供的基于暂态录波数据的风力发电机运行故障新类型发现方法,能够以较高性 能和较高类型质量,正确识别高质量的故障类别,为构建自动化的故障预警和故障排除系统 提供参考实现。
附图说明
为了更清楚地说明本申请的技术方案,下面将对实施例中所需要使用的附图作简单地介 绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以 根据这些附图获得其他的附图。
图1为本申请实施例提供的基于暂态录波数据的风力发电机运行故障新类型发现方法的 流程图;
图2为本申请实施例提供的风机暂态录波数据采集设备安装位置示意图。
具体实施方式
为了准确说明本申请,本文解释如下术语及含义。
风力发电:指的是把风的动能转为电能的过程。
风机:风力发电机的简称,指的是将风能转换为机械功,机械功带动转子旋转,最终输 出交流电的电力设备。
电能质量数据:由电能质量监测设备或具有电能质量监测功能的其它监测设备记录的一 段时间内的风机输出的故障录波数据。本专利涉及的电能质量数据主要包括稳态电能质量数 据(如,三相电流、三相电压、三相有功功率、三相无功功率、频率)和暂态电能质量数据 两大类。
暂态录波数据:在电力系统发生故障或不正常运行(如线路短路、接地等,以及系统过 电压、负荷不平衡等)时,故障录波装置或具有故障录波功能的其它监测设备自动地记录电 力系统故障前、后过程的多种电气量(如开关状态变化、电压、电流数值等)的变化情况。 这些电气量称为暂态录波数据。
录波侧面:暂态录波数据中的一个数据列的抽象表示。
数据样本:按照一定抽样规则从被研究总体中取出的部分个体,能正确反映被研究总体 的特征分布情况。本发明中,特指一条暂态录波数据。
侧面数据:暂态录波数据中,其中一个录波侧面对应的数据。
三相电流不平衡:是指在电力系统中三相电流幅值不一致,且幅值差超过规定范围。
数据预处理:是指在数据分析之前,对原始数据进行的一些适应性处理。
聚类:是指将物理或抽象对象的集合,分成由类似的对象组成的多个类的过程。
无监督聚类:在没有标签数据中进行聚类,将类似的对象划分到相同的簇的过程。
K-means聚类方法:是约定聚类个数为K,把包含N个数据对象的集合,划分为满足方 差最小标准的K个类簇的一种算法。
运行故障:风机运行过程中,出现的故障。
故障类型:根据暂态录波数据,映射到按照某种分类原则下的一种运行故障。
新类型发现:根据新的暂态录波数据,判定出现了一种未聚类出的故障类型。
参见图1,图1为本申请实施例提供的基于暂态录波数据的风力发电机运行故障新类型 发现方法的流程图,所述方法具体包括一下步骤:
S101:构造暂态录波数据中侧面数据的多侧面特征向量。
电能质量数据分为稳态和暂态2大类。稳态电能质量问题以波形畸变为特征,主要包括 谐波、波形下陷以及噪声等。暂态电能质量问题通常是以频谱和暂态持续时间为特征,可分 脉冲暂态和振荡暂态2大类。在电力系统发生故障(如线路短路、接地等,以及系统过电压、 负荷不平衡等)时,录波装置自动地记录电力系统故障前、后过程的多种电气量(如开关状 态变化、电压、电流数值等)的变化情况。这些电气量称为暂态录波数据。
通过检测发电机组和并网前的电能质量指标,是实现风电场自身调节,监控风电场并网 对系统影响的重要途径。下面举例进行具体说明,如附图2所示,图2为风电场电流数据监 测点布置示意图,用于电流数据和电压数据的采集,图2中的M1-M5为检测设备布置点,其 中,M1-M4用于检测4个风电机组(风机机端)输出的电能质量指标;M5用于检测整个风 电场的输出电能经两次变压后,接入电网(风电场)前的电能质量指标。电压数据采样分为 两大类,对于风机机端电压数据,由于电压值通常只有690V,采用直接并联取数据的方式, 而对于35kV或110kV电压等级的,则通过采集电流支路所连母线的电压互感器二次侧数据 得到。这些指标值的变化反映发电机组的工作状态。一定时间段积累的数据记录了风电场实 际的运行状态。对这些历史数据的挖掘分析,能归纳出风电机组和风电场输出的正常运行模 式和设备的故障(或潜在故障)模式。
分析暂态录波数据,数据中包含UA、UB、UC、IA、IB、IC、P、Q和F等9个侧面的 数据。每个侧面数据有4800个维度。9侧面数据如下,
X={XUA,XUB,XUC,XIA,XIB,XIC,XP,XQ,XF},
其中,xv={d1,d2,,…,dm}(m表示样本的维度)。
为优选侧面数据,需要针对X中的每个侧面,归一化处理,并计算其相关性。
UA、UB、UC、IA、IB和IC为周期性的波形数据。设每个侧面有n个样本数据。对于 侧面UA的第一个样本数据,平均每λ个数据点是一个周期,在每个周期内找到它们的最大 正值
求归一化系数
对于侧面数据UA,样本数据
每个维度除以归一化系数,即令
作为侧面数据UA的第一个样本数据的归一化结果。
UA侧面数据的其它n-1个样本数据,按照同样方法归一化处理,得到侧面数据UA的n 个样本数据的归一化结果,
采用同样方法,对侧面数据UB、UC、IA、IB、IC等归一化处理,在此不再赘述。
P、Q不具有周期性,把每λ′个数据点,作为一个采样周期,共
归一化系数
同理,对侧面数据P、Q的n个样本,采用与侧面数据UA归一化相同的方式,得到
F数据区域比较稳定,采用直接选取在m个维度上最大值,作为归一化系数,即
Norm=max(d1,d2,…,dm),
针对F侧面数据,采用与侧面数据UA归一化相同的方式,得到归一化结果
最后,得到归一化后的全部样本数据X'={XUA',XUB',…,XF'}。
针对每一个样本数据,在每一个侧面数据中,选择第1个周期中的正值极值点(对于不 是周期性数据的侧面P、Q、F,选择与侧面UA相同周期内,同样数量的数据点作为第1周期)作为标记点,构成标记向量
其中,Marki下标i表示第i个样本;
上标表示侧面数据UA、UB、UC、IA、IB、IC、P、Q、F;
Mark表示对齐时的下标索引值,有
样本对齐
按照向量Marki中的元素值,将每个侧面的标记点对齐,截取自标记点开始,至后续α个>
也就是说,若第1个样本侧面数据UA选择数据
则侧面UB选择数据
保证有相同的长度。
同理,得到侧面UC、IA、IB、IC、P、Q、F的第1个样本数据。
同样,其余的n-1个样本数据,采用相同的方法,得到数据矩阵为
选取侧面数据UA作为参考侧面,将后续各侧面数据与参照侧面数据求欧氏距离,即从
得到样本参考向量
其中,
以此类推,得到其它n-1个样本的参考向量R,然后组成矩阵
针对参考矩阵MR,按列求和,得到相关向量
其中,
LV表示在所有n个样本中,侧面V到侧面UA的欧氏距离总和。
针对向量
构造相关性分布向量DR。
其中,各值为相邻两个元素的差值。
在向量DR中,选择最大的M个值,用其对应的M个录波侧面,构造数据样本的特征向量。
S102:按行构造所述多侧面特征向量的质心矩阵,按列求所述质心矩阵的平均得到超级 质心向量。
根据步骤S101中优选的M个录波侧面,在原始数据中,选择对应的M个侧面数据,构造数据样本的特征向量,Selected_X=[X1,X2,…,XM](1,2,…,M表示选择的侧面),xv={d1,d2,,…,dm}(m表示样本的维度)。
利用K-means算法,针对N个样本中的其中一个侧面(比如V)作为一个独立样本,执行聚类操作,得到该侧面数据的K个类簇中心,称为类簇中心向量
针对其余M-1个侧面数据,采用同样方法得到相应向量,构造质心矩阵
针对质心矩阵SKM*K按列求平均,得到超级质心向量
Super=[super1>2 …>K],
其中,
S103:初始化置信矩阵。
根据特征向量中,每个录波侧面到超级质心的算数平均距离向量
Average_D=[average_D1>2 …>M],
其中,
SKi表示矩阵SKM*K中第i行数据;
Dimensioni表示侧面i的维度。
选择向量Average_D中的最大值average_Dj,规定录波侧面j的侧面等级为l=level_unit。>
Level=[L1>2 …>V]
其中,
在第一个录波侧面下进行初始化操作。使用K-means聚类方法,聚类过程中,循环不断 地自动修正样本的指示矩阵G,
其中,
Gi,j={0,1}:Gi,j=1表示样本i被划分到类簇j中;Gi,j=0表示样本i没有被划分到类簇j中。
同时,聚簇中心矩阵F也随之不断修正。
其中,
矩阵FK*d的每一行Fi代表类簇i的中心位置;
本次循环所有样本到对应聚簇中心的欧氏距离之和为Space1,
上次循环所有样本到对应聚簇中心的欧氏距离之和为Space2,
若|Space1-Space2|≤esplison(esplison值为给定值,一般取1e-5),结束循环,并记录循>
设置向量Shift=[shift1>2 …>n],
其中,向量Shift初始值均为0,n为样本个数。
在本次循环中,如果样本i被划分到的类簇与前一次的循环中被划分的类簇不一致时,向 量Shift中对应的shifti值加1,并将样本i划分到新的类簇中。多次循环结束时,将向量Shift>i与Loop比较。若 对于其它的n-1个样本,进行同样的操作,初始化后的置信矩阵C, 其中,ci,j表示样本i在类簇j中的可信度。 S104:基于K-means对侧面数据进行聚类,获得聚类结果。 针对单个录波侧面执行K-means算法,其中G、F、C都使用前一次处理过程产生的结果。例如,对某一个录波侧面v进行处理。在使用K-means算法循环中,如果样本i在本次 循环中应该被划分到的类簇与前一次的循环中被划分的类簇不一致,则首先判断该置信矩阵C中第i行ci是否全部为0:如果全部为0,将向量Shift中对应的shifti值加1,并将样本划>i,kk值减1(若小于0,则ci,kk置为0),并保持其原类簇标签。>1-Space2|≤esplison。 在循环结束后,将向量Shift中的每一个元素shifti与Loop比较: 若 则将置信矩阵C的ci,k位置的值加上该侧面的等级LV(向量Level元素)。其中,k表示> 按照上述方法依次处理其它录波侧面对应的侧面数据。处理次序为各录波侧面的等级由 小到大的顺序。反复更新指示矩阵G,和置信矩阵C。 全部录波侧面的侧面数据处理完成后,如果满足, 置信矩阵每一行 或者满足, CI≥1; 两个条件之一,则结束聚类过程;否则,跳转到K-means聚类过程,继续循环反复更新 过程,包括CI值更新, CI=CI+increase(increase表示每次的增量,由人为指定) 直到满足结束条件。得到最终由聚类标签G标示的聚类结果。 S105:根据聚类结果判定新故障类型。 根据聚类结果,从K个类簇中,分别选择P个置信度最高(即置信矩阵C中值最大)的样本数据,计算它们M个侧面的均值,得到矩阵 其中, sriv表示录波侧面v下的类簇i的P个可信度最高的样本数据对应的特征向量的均值,M> 根据已知的N类故障,分别优选出P个样本,计算它们对应的特征向量的均值,得到矩 阵 其中, 其中根据公式, 得到类型确认矩阵 DISi,j表示从新的聚类结果中的类簇i到原有的故障类型j的欧氏距离,DISi,j值的大小> 通过计算 选择向量SO中的中位数作为阈值E。 遍历矩阵AK*N。如果矩阵AK*N每一行中不存在元素Aij小于阈值则证明类型i为新类型;> 下面通过具体的实例对本申请实施例进行说明: 经过读取操作将原始数据中的无效参数删除得到500个样本,9个侧面4800个维度下的 数据。 例如侧面UA下第一个样本数据: 得到Norm=507.722,因此 同样的原理我们可以得到侧面UA在其它样本下规一化的数据和侧面UB、UC、IA、IB、 IC所有样本归一化后的数据。 由于侧面P、Q数据不是周期性数据,所以方法有所不同,侧面P下第一样本数据 得到Norm=8.3208,因此 同样的原理我们可以得到侧面P在其它样本下归一化的数据和侧面Q所有样本归一化后 的数据。对于侧面F的处理方式也是不同的,侧面F下第一个样本数据 代入公式Norm=max(d1,d2,…,d4800),得到Norm=50,因此 同样的原理我们可以得到侧面F在其它样本下的归一化数据。 使用归一化后的数据,我们需要在同一个样本中,选择每一个侧面的第一个周期的极值 点,对于第一个样本得到标记 向量Mark1={4,14,25,20,26,9,1,1,1},取α=4700,因此对于第一个样本的侧面UA选 取下标4-4703的数据,侧面UB选取下标14-4713的数据,以此类推对于所有样本,得到标 记向量Mark,进而可得到数据矩阵Xx。 将每个侧面在标记点后4700个数据取出后,计算它们到选定侧面UA的欧氏距离并得到 向量LR=[0,0.5142,0.4921,6.433,6.644,6.17,11.0783,12.625,8.936]。 由向量LR得到向量DR=[0UA,0.4921UC,0.0221UB,5.6558IC,0.263IA,0.211IB,2.292F,>P,1.5467Q]。 阈值设为1,所以我们优选出侧面UA(参考侧面),IC,F,P,Q这五个侧面。 输入样本X={XUA,XIC,XP,XQ,XF},一共500个样本,包括5个侧面和4800个维度。> 使用K-means算法,K=6时,可以求出5个录波侧面,每个录波侧面的6个质心,组成质心矩阵 其中, 超级质心的向量为: Super=[super1>2>3>4>5>6]。 参照公式, 对于, 所以super1=[-12.237> 同理得到super2,super3,super4,super5,super6。 每个录波侧面到超级质心的算数平均距离向量 根据, 得到, 同理得到average_D2、average_D3、average_D4、average_D5, 最终, Average_D=[2.14261 0.73334 0.615 0.633 1.42939]。 向量Average_D中最大值为2.14261,对于l=level_unit,令level_unit=15,则代入公式 可以得到向量 所以,Level=[15 43.8257 52.2131 50.7401 22.4846]。 按照录波侧面等级从大到小处理侧面数据,所以第一个测试的是侧面P。此时,CI=0.01, increase=0.01。在执行K-means算法循环过程中,发现样本1在某次聚类时被分配到了类簇1 中,但是在本次聚类开始之前它是属于类簇5的不一致,所以需要将向量Shift中的shift1的>1=3,代入 又因为结束循环后发现样本1被分配到了类簇1中,所以置信矩阵c1,1值等于录波侧面P> 最终得到初始化置信矩阵: 得到指示矩阵G、类簇中心矩阵F和置信矩阵C,使用基于K-means的多侧面算法,对于除去录波侧面P其它录波侧面按照侧面等级依次对录波侧面Q、IC、F、UA处理。 在处理录波侧面Q时,使用K-means循环,在某次循环中发现样本1在本次循环中被分 配到类簇1中,而在此次循环开始之前被分配到类簇5中,但是在置信矩阵C中发现第1行第1列值c1,1=52.2131,所以更新c1,1=c1,1-1=51.2131,仍将样本1划分到类簇1中,即将G[1][1]> 代入 又因为结束循环后发现样本1被分配到了类簇1中即G[1][1]=1,所以置信矩阵c1,1原来>1,1更新为49.9532。对于其它样本采用同样的方> 当处理完所有的5个录波侧面后,置信矩阵 C中第4行数据为[0 0 15 0 0 0],并不满足结束条件 同时,CI=0.01也不满足CI>1条件; 所以,继续执行基于K-means的多侧面聚类算法,依次处理录波侧面P、Q、IC、F、UA。 根据聚类出来的结果,从6个类簇中的每个类簇中选择20个可信度最高的样本计算它们 的均值,得到矩阵 其中, 根据已知的4个故障类型,分别优选出20个样本,计算其均值,得到矩阵 其中, 根据公式 所以, 对于其它元素我们采用相同的方式,最终得到 矩阵 通过已知4个类型数据中,每个类型中20个优选样本的均值,计算每个类型之间的欧氏 距离,取这些值的中位数作为阈值E。 根据公式 通过计算距离向量 SO=[22149.7 30967.4 16265.6 21167.7 11053.5 26047.6],所以,E=21167.7。 将矩阵A6*4每一行跟阈值E,进行比较我们发现只有第1行和第4行的值是都大于E的,> 以上所述的本发明实施方式,并不构成对本发明保护范围的限定。任何在本发明的精神 和原则之内所作的修改、等同替换和改进等,均应包含在本发明的保护范围之内。 需要说明的是,在本文中,诸如术语“包括”、“包含”或者其任何其他变体意在涵盖非排 他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而 且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有 的要素。 以上所述仅是本发明的具体实施方式,使本领域技术人员能够理解或实现本发明。对这 些实施例的多种修改对本领域的技术人员来说将是显而易见的,本文中所定义的一般原理可 以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限 制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范 围。
机译: 基于统计分析的提供数据分析的方法,系统和非暂态计算机可读记录介质
机译: 基于中尺度数据的风力发电机组自动布局方法及装置
机译: 基于风力发电机组运行数据的清洁方法及系统