首页> 中国专利> 基于录波大数据异常检测的发电机组次同步风险评估方法

基于录波大数据异常检测的发电机组次同步风险评估方法

摘要

一种基于录波大数据异常检测的发电机组次同步风险评估方法。包括以下内容:通过收集同一机组一段时间内所有扭振录波文件,对其中的机端三相电流信号进行傅里叶变换,并提取工频分量、次同步和超同步谐波分量系数,构造原始特征数据集Feature;通过主成分分析法将原始特征数据集进行去相关和数据清洗,得到降维特征数据集Feature_comp;基于得到的降维特征数据集,建立各样本与统计特征间的马氏距离分布,以马氏距离的大小来衡量次同步风险大小,当风险值达到90%或以上时系统报警。本发明快速实现SSO风险的安全评估,为电网运行中SSO防御和抑制提供辅助决策手段。

著录项

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2018-06-26

    授权

    授权

  • 2015-11-04

    实质审查的生效 IPC(主分类):G06K9/00 申请日:20150616

    实质审查的生效

  • 2015-09-30

    公开

    公开

说明书

技术领域

本发明属于电力系统稳定与控制技术领域,具体涉及一种基于录波大数据异 常检测的发电机组次同步风险评估方法,为电力系统稳定与安全运行提供辅助决 策和安全预警。

技术背景

在远距离大容量输电需求的背景之下,由于大量采用串补输电、交直流混合 输电及FACTS设备,使得由此引发的次同步振荡(SSO)严重威胁了电网和发电机 组的安全稳定运行。目前,对SSO研究侧重于机组扭振保护及振荡控制方面, 对电网运行监控缺少振荡防御手段。因此,深入研究机网运行中次同步风险评估 及其预防性控制技术具有重大意义。

目前,机组轴系扭振监测/控制/保护装置产生了大量录波文件,实时记录了 电网运行中机组轴系转速信号和机端电压/电流信号,然而,对录波文件的处理 方式往往是人工的、手动的、故障后有针对性的分析,因此,长年积累下来大量 的历史录波文件,除了用于历史备案外并没有形成能帮助运行人员理解电网运行 状态的知识。另外,关于SSO分析主要从高灵敏度的轴系转速信号出发,借助 一些繁琐的算法和技术(如滤波、阻尼计算)进行处理,而电气量信号仅作为辅助 分析所用,其利用率很小。如果能充分利用这些积累的大量数据挖掘出录波文件 背后蕴含的丰富信息,实现系统SSO快速辨识和安全评估预警,将会大大提升 运行的智能化水平。

发明内容

本发明的目的是通过大量扭振录波文件提供一种次同步风险识别模型,从而 快速实现SSO风险的安全评估,为电网运行中SSO防御和抑制提供辅助决策手 段。

本发明所公开的一种基于录波大数据异常检测的发电机组次同步风险评估 方法,依托扭振系列装置积累的大量历史录波文件中的电流信号,通过特征提取、 降维压缩、模型建立和风险识别等环节实现了SSO风险的快速评估和安全预警。 本发明具体采用以下技术方案:

一种基于录波大数据异常检测的发电机组次同步风险评估方法,其特征在于, 所述方法包括如下步骤:

(1)收集同一发电机组运行中积累的扭振录波文件,通过从中提取机端三 相电流信号ia、ib、ic,建立维数为N×3的数据库,N为录波文件的个数;

(2)针对数据库中每个对象即每个录波文件对应的每一相电流信号,通过 傅里叶变换提取模式特征,构造维数为N×P的特征矩阵Feature,P为每个录波 文件对应的特征指标个数;

(3)将获得的特征矩阵向K个相互正交的坐标轴进行投影,K<P,形成维 数为N×K的降维特征矩阵Feature_comp,其中K个相互正交的坐标方向是由 Feature的协方差矩阵特征分解结果来决定的;

(4)基于上述降维特征矩阵,视每个行向量为一个样本,通过样本反复抽 取、参数可靠估计和马氏距离统计建立基于数据驱动的次同步风险识别模型;

(5)对于实时采集的新录波文件,重复特征提取、降维压缩和距离计算, 并根据建立的次同步风险识别模型实现当前录波运行方式下机组的次同步风险 评估。

本发明还进一步包括以下优选方案:

在步骤(2)中,所述的特征矩阵Feature的构造具体包括:

2.1将N×3维数据库中每个录波文件对应的三个对象即三相电流信号ia、ib、 ic分别进行离散傅里叶变换,得到三相电流的变换序列Ia、Ib、Ic

2.2从每个变换序列中提取工频、次同步和超同步振荡频率对应的幅值作为 模式特征量;

当某发电机组的扭振频率分别为f1,f2,…,fm,m为扭振模态阶数,则从 每个变换序列中提取与频率向量[50-fm,…,50-f2,50-f1,50,50+f1,50+f2,…, 50+fm]对应的幅度向量,得到每个录波文件对应的特征向量:

Featurej=[Aj,1 … Aj,2m+1 Bj,1 … Bj,2m+1 Cj,1 … Cj,2m+1] (1)

式中,j=1,2,…N,下标j代表第j个录波文件,A、B、C分别代表与Ia、Ib、Ic对应的模式特征,数据库中每个对象对应2m+1个特征指标;

2.3综合所有录波文件对应的特征向量,形成维数为N×P的特征矩阵Feature, 其中P=3×(2m+1);

Feature=Feature1TFeature2T...FeatureN-1TFeatureNTT---(2).

在步骤(3)中,通过正交投影获取降维特征矩阵具体实现包括:

3.1标准化特征矩阵Feature,然后计算其协方差矩阵Cov;

3.2对协方差矩阵Cov进行特征值分解,将特征值按照从大到小的顺序排列, 设λ1≥λ2≥…≥λP,与之对应的标准正交特征向量分别记为γ1,γ2,…,γP

3.3求满足条件的最小K值,将标准化后的特征矩阵向特 征向量子空间[γ12,…,γK]投影,获得降维特征矩阵Feaure_comp,同时存储基底 即前述的特征向量子空间[γ12,…,γK]。

在步骤(4)中,基于降维特征矩阵的次同步风险识别模型建立过程具体包 括:

4.1从降维特征矩阵Feaure_comp中随机抽取H个样本,其中N/2≤H≤3N/4, 计算其样本均值T1和协方差矩阵S1

4.2根据样本均值T1和协方差矩阵S1,获取所有N个样本的马氏距离dj

dj=(Feature_compj-T1)S1-1(Feature_compj-T1)T;---(3)

其中,j=1,2,…N,Feature_compj为降维特征矩阵的第j行向量。

4.3从降维特征矩阵中选择对应马氏距离最小的H个样本,计算其样本均值 T2和协方差矩阵S2,当满足det(S2)=det(S1)或det(S2)=0时,其中,det代表行列 式运算,将T1和S1分别作为降维特征矩阵总体分布期望T和方差S的可靠估计; 否则,基于T2和S2重新计算所有样本的马氏距离dj,并选择对应马氏距离最小 的H个样本,计算其样本均值T3和协方差矩阵S3……如此反复,直至 det(Sn+1)=det(Sn)或det(Sn+1)=0时停止迭代,并将Tn和Sn分别作为降维特征矩阵 总体分布期望T和方差S的可靠估计进行存储;

4.4基于步骤4.3中存储的期望T和方差S的可靠估计量,样本马氏距离d 服从自由度为K的卡方分布,当样本的马氏距离d满足时视为异常 样本且存在次同步风险,α为显著性水平。

在步骤(5)中,所述的当前运行方式下次同步风险评估过程具体包括:

5.1对于实时采集的新录波文件,通过对其中的机端三相电流信号进行离散 傅里叶变换,提取与工频、次同步和超同步对应的模式特征向量U;

5.2将U向步骤(3)中存储的基底[γ12,…,γK]投影,得到压缩向量V;

5.3基于步骤(4)中存储的均值T和协方差S,计算压缩向量V的马氏距离 D,当P(x≤D)≥95%时,认为当前运行方式下机组存在次同步风险,且该值越 大风险越大,其中x是自由度为K的卡方分布随机变量取值。

本发明具有以下有益技术效果:本发明是一种数据驱动的风险识别方法,克 服了传统方法的建模复杂、先验参数难确定及只能用于事后分析的缺点。该方法 基于机组积累的历史录波数据中的电气量信号,能够通过对数据的分析,建立扭 振风险评估模型。在应用中,根据实时录波结合风险评估模型,可以快速有效识 别机组当前运行方式下的次同步风险情况,对发电机组健康状态及时掌握,以便 及时采取事故预防措施,具有非常重要的现实价值。

附图说明

图1为本申请公开的发电机组次同步风险评估方法流程图;图2为本发明实 现的装置录波数据接入框图(以3个模态为例);

图3为本发明实现的特征矩阵降维流程图;

图4为本发明实现的次同步风险识别模型建立流程图;

图5为本发明实现的具体实例效果(其中,图(a)为降维特征矩阵维数选择参 考曲线、图(b)为马氏距离分布图、图(c)为部分样本的SSO风险评估举例)。

具体实施方式

下面结合说明书附图和实施例对本发明的技术方案作进一步详细阐述。

如图1所示为本申请公开的发电机组次同步风险评估方法流程图,本发明的 具体实现技术方案如下:

步骤1:收集录波文件,建立数据库

本实施例结合国内某电厂某一火力发电机组运行过程中,CSC-812汽轮发电 机组轴系扭振保护装置记录的录波文件进行说明。如图2所示,装置通过在机组 轴系机头布置冗余转速传感器,机尾处布置PT/CT,为因各种原因引起的SSO 研究提供分析数据,其中,转速信号采样率为1kHz,电压/电流信号采样率为 600Hz。装置包括两种录波方式,一种是装置启动录波,一种是人工手动录波。

该装置某一期间,共记录了2917个录波文件,其中包括2869个装置启动录 波文件和48个人工手动录波文件。通过从各录波文件中抽取机端三相电流信号 ia、ib、ic,建立维数为2917×3的数据库:

录波文件名 电流ia电流ib电流ic20131016023828TSRLB-0.dat       20131228135153TSRLB-0.dat       HMI20140413174313.dat       HMI20140412145423.dat       ……      

步骤2:提取特征,构造特征矩阵

根据图2所示,本实施例对应机组轴系包括高中压缸、低压缸A、低压缸B 和发电机4个集中质量块,其对应3个轴系扭振模态(频率分别为12.5Hz、21.8Hz 和25.5Hz)。按照机电扭振互作用机理,在定子电流中存在与之对应的次同步和 超同步分量,本实现特征提取具体步骤如下:

①以上述数据库中第j个录波文件为例,对其三相电流ia、ib、ic分别进行离 散傅里叶变换,得到变换序列Ia、Ib、Ic

②从Ia、Ib、Ic中分别提取与频率向量[24.5,28.2,37.5,50,62.5,71.8, 75.5]对应的幅度向量,合并所有提取值构成该录波文件对应的特征向量Featurej

Featurej=[Aj,1 … Aj,7 Bj,1 … Bj,7 Cj,1 … Cj,7] (4) 式中,j=1,2,…,2917,A、B、C分别代表与ia、ib、ic对应的模式特征;

③综合数据库中全部2917个录波文件对应的特征向量,构造特征矩阵 Feature,其维数为2917×21。

Feature=A1,1...A1,7B1,1...B1,7C1,1...C1,7A2,1...A2,7B2,1...B2,7C2,1...C2,7......A2917,1...A2917,7B2917,1...B2917,7C2917,1...C2917,7---(5)

步骤3:获取降维特征矩阵,存储主要基底

通过正交变换实现数据压缩的基本原理如下:设有N个样本,每个样本具有 P项测试指标,得到原始数据矩阵

X=X1X2...XN=x11x12...x1Px21x22...x2P......xN1xN2...xNP---(6)

对于P维空间一组完备正交基{ω1,ω2,…,ωP}满足

ωiTωj=0,ij1,i=j(i,j=1,2,...,P)---(7)

则原始数据集X在P维正交基{ω1,ω2,…,ωP}下的投影为

Y=X1X2...XNω1ω2...ωP---(8)

统计学广泛采用方差或标准差表示不确定性,方差或标准差越大,不确定度越大, 信息量越大。因此,原始数据集X沿某一方向ωi投影后的方差可表示为

Vari=1N-1Σi=1N(Xjωi-Xωi)2=ωiTSωi---(9)

式中,和S分别代表原始数据集的期望和协方差矩阵

X=1NΣj=1NXj,S=1N-1Σj=1N(Xj-X)T(Xj-X)---(10)

为了找到方向向量ωi使得式(9)最大化,引入拉格朗日乘子λi,构造无约束优化 问题

max(ωiTSωi+λi(1-ωiTωi))---(11)

该优化问题取得极值点的条件为

i=λiωi (12)

此时,原始数据集沿ωi投影后的方差(即信息量)为

Vari=λi (13)

因此,为了使得投影后数据集的信息量较大,投影方向向量应取与协方差越 较大特征值对应的特征向量。此外,考虑到原始数据集中P个指标的计量单位和 量纲影响,在降维前通常将原始数据矩阵作标准化处理。

最后,结合图3给出基于正交变换的数据降维流程如下:

①标准化特征矩阵Feature,然后计算其协方差矩阵Cov;

②对协方差矩阵Cov进行特征值分解,将特征值按照从大到小的顺序排列, 设λ1≥λ2≥…≥λP,与之对应的标准正交特征向量分别记为γ1,γ2,…,γP

③求满足条件的最小K值,将标准化后的特征矩阵向特 征向量子空间[γ12,…,γK]投影,获得降维特征矩阵Feaure_comp,同时存储基底 [γ12,…,γK]。

基于本实现步骤2获得的2917×21维特征矩阵Feature,图5(a)给出了前 k(k=1,2,…,21)维投影数据的累积信息量与总信息量的比值曲线图。图中结果显示 前5(K=5)维投影数据的信息量达95%以上,因此,将Feature向[γ12,…,γ5]投影 获得维数为2917×5的降维特征矩阵Feature_comp。

步骤4:建立异常检测模型,存储分布中心和方差

通过反复抽取样本和迭代运算可靠估计总体分布参数,根据马氏距离分布建 立异常检测模型的基本原理如下:对于一个含K维观测值的样本矩阵Z

Z=Z1Z2...ZN=z11z12...z1Kz21z22...z2K......zN1zN2...zNK---(14)

假设样本服从K维正态分布,令且|H1|=H,如果det(S1)≠0,计算马氏距离 其中i=1,2,…,N。现在令H2为第一步中马氏距 离最小的H个子样本,即

H2:{Zq1,Zq2,...,ZqH|d1(q1)d1(q2)...d1(qH)d1(i)i{q1,q2,...,qH}}

再按照H2计算出来的均值T2和协方差S2重复上述过程,每次迭代均会导致 det(S)极小化。由于子集的个数H是有限的,因此,一定存在n使得运算收敛, 即det(Sn+1)=det(Sn),认为Sn和Tn为K维正态分布中心T和方差S的可靠估计。 由于K维正态分布下随机变量的马氏距离d近似服从自由度为K的卡方分布, 因此,每一个样本点到分布中心的马氏距离都对应一个卡方分位点使得 其中α为对应样本的显著性水平。如果α很小,如小于0.05, 则可以认为该样本离群,视为异常点,可以推断该样本点是由于结构系统中某一 特殊变动原因引起。

最后,基于步骤3获得的降维特征矩阵Feature_comp,结合图4给出异常检 测模型建立的具体步骤:

①从降维特征矩阵Feaure_comp中随机抽取H个样本,其中N/2≤H≤3N/4, 计算其样本均值T1和协方差矩阵S1

②根据样本均值T1和协方差矩阵S1,获取所有N个样本的马氏距离dj

dj=(Feature_compj-T1)S1-1(Feature_compj-T1)T---(15)

其中,j=1,2,…N.

③从降维特征矩阵中选择对应马氏距离最小的H个样本,计算其样本均值 T2和协方差矩阵S2,当满足det(S2)=det(S1)或det(S2)=0时,将T1和S1分别作为 降维特征矩阵总体分布期望T和方差S的可靠估计。否则,基于T2和S2重新计 算所有样本的马氏距离dj,并选择对应马氏距离最小的H个样本,计算其样本 均值T3和协方差矩阵S3……如此反复,直至det(Sn+1)=det(Sn)或det(Sn+1)=0时停 止迭代,并将Tn和Sn分别作为降维特征矩阵总体分布期望T和方差S的可靠估 计进行存储;

④基于步骤③中存储的期望T和方差S的可靠估计量,样本马氏距离d服从 自由度为K的卡方分布,当满足时视为异常样本且存在次同步风险, α为显著性水平。

对于本实施例步骤3获得的维数为2917×5的降维特征矩阵Feature_comp, 从中反复抽取2187个样本经迭代运算可靠估计出维数为1×5的均值T和维数为 5×5的方差S,并存储这两个估计量。

T=[-0.7568 0.1210 0.2137 0.0805 -0.0507]

S=7.76751.8784-0.45360.2755-0.21641.87842.1930-0.34030.0854-0.0618-0.4536-0.34031.9062-0.03160.01910.27550.0854-0.03160.57370.0113-0.2164-0.06180.01910.01130.5694---(16)

图5(b)给出了本实施例所有2917个样本的马氏距离分布图。

步骤5:SSO风险评估,对于实时采集的新录波文件,重复特征提取、降维 压缩和距离计算,并根据建立的次同步风险识别模型实现当前录波运行方式下机 组的次同步风险评估。

对于本实施例,马氏距离服从自由度为5的卡方分布,对照卡方分布表,当 显著性水平为0.05时对应的马氏距离为11.07,因此,当新样本马氏距离大于 11.07时提供安全报警和辅助决策。图5(c)给出了部分样本的SSO风险评估结果。

以上实施例仅用于帮助理解本发明的核心思想,不能以此限制本发明,对于 本领域的技术人员,凡是依据本发明的思想,在具体实施方式及应用范围上所做 的任何改动,均应包含在本发明的保护范围之内。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号