首页> 中国专利> 一种基于大数据流及迁移学习的配变故障在线诊断方法

一种基于大数据流及迁移学习的配变故障在线诊断方法

摘要

本发明提供一种基于大数据流及迁移学习的配变故障在线诊断方法,包括:(1)梳理现阶段配变的主要在线监测量,提出配变故障在线识别的主要指标;(2)以配变故障在线识别指标为ARIMA算法的输入量,提出基于ARIMA算法的故障在线识别方法,建立基于大数据流的配变故障在线识别模型;(3)求解基于大数据流的配变故障在线识别模型,筛选出可能发生故障的配变;(4)构建配变故障诊断指标体系;(5)建立基于迁移学习算法TrAdaBoost的配变故障诊断模型,对步骤(3)中筛选出的可能发生故障的配变进行故障诊断。本发明较好地解决了配变故障诊断时配变在线监测量种类丰富度不足、配变单体的例行试验数据缺乏的问题。

著录项

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2019-08-23

    授权

    授权

  • 2019-08-09

    著录事项变更 IPC(主分类):G05B23/02 变更前: 变更后: 申请日:20181126

    著录事项变更

  • 2019-05-03

    实质审查的生效 IPC(主分类):G05B23/02 申请日:20181126

    实质审查的生效

  • 2019-04-09

    公开

    公开

说明书

技术领域

本发明属于配电变压器故障诊断领域,具体涉及一种基于大数据流及迁移学习的配变故障在线诊断方法。

背景技术

配电变压器(配变)是重要的变电设备,在配电网中数量庞大,其安全运行是电网稳定可靠运行的基础。因此,及时对配变故障进行识别、准确诊断配变故障类型,对制定配变检修计划、降低事故发生概率、实现风险预警等方面具有重要的理论与现实意义。

变压器的故障诊断主要包括离线诊断技术和在线诊断技术,研究主要围绕于故障特征量的智能化提取、数据挖掘技术在故障诊断中的应用、考虑多元因素的变压器状态评分等方面。其中,输变和配变的故障离线诊断理论体系均较为完善,该技术主要利用变压器例行试验或定期检修得到的油色谱结果、电气量信息、油中物质含量、振动信号等数据,通过关联规则挖掘、分类模型构建、健康指标评分、状态转移预测等方法,得到变压器故障的类型或置信水平。

相比于变压器离线诊断技术,在线诊断技术的难点主要在于对在线监测量丰富度的要求,以往输变和配变仅实现了电压、电流等基本电气量的在线监测,变压器故障诊断主要依据例行试验或定期检修结果,实时性不强;近年来,随着在线监测技术的发展,部分输变安装了非电气量在线监测装置,如在线油色谱监测仪,为输变故障在线诊断提供了重要的数据源,有学者提出了基于实时监测数据和例行试验数据的输变状态在线评估方法,可实现输变故障的及时排查与诊断;然而,配变数量庞大而在线监测装置造价昂贵,在短时间内不可能实现此类装置在配变中的全方位覆盖,这严重制约了配变故障在线诊断技术的发展。此外,除在线监测量种类丰富度不足外,配变单体的例行试验数据也往往较为缺乏,传统基于大数据挖掘的变压器故障诊断方法很难利用这些数据训练出泛化能力较强的故障诊断器,这进一步增加了配变故障诊断的难度。

发明内容

针对现有技术的以上缺陷或改进需求,本发明旨在提供一种基于大数据流及迁移学习的配变故障在线诊断方法,针对配变在线监测量种类丰富度不足、配变单体的例行试验数据也往往较为缺乏的问题,解决配变故障诊断问题。

为了达到上述目的,本发明公开了一种考虑多元因素态势演变的配变迁移学习故障诊断模型,包括如下步骤:

步骤1),梳理现阶段配变的主要在线监测量,提出配变故障在线识别的主要指标;

步骤2),以配变故障在线识别指标为ARIMA算法的输入量,提出基于ARIMA算法的故障在线识别方法,建立基于大数据流的配变故障在线识别模型;

步骤3),求解基于大数据流的配变故障在线识别模型,筛选出可能发生故障的配变;

步骤4),构建配变故障诊断指标体系;

步骤5),建立基于迁移学习算法TrAdaBoost的配变故障诊断模型,对步骤3)中筛选出的可能发生故障的配变进行故障诊断。

进一步的,所述步骤1)中现阶段配变的主要在线监测量以及配变故障在线识别的主要指标分别为:

a.现阶段配变在线监测量包括:电压、电流、有功功率、无功功率,这些监测量由安装在配电台区的监测终端进行采集,每15分钟进行一次,目前已基本实现了全体配变中此四类监测量的在线实时监测;

b.配变故障在线识别的主要指标包括配变短路电抗、短路损耗和空载损耗,这些指标可通过电压、电流、有功功率、无功功率计算得到。

进一步的,所述步骤2)中建立基于大数据流的配变故障在线识别模型具步骤为:

a.选择合适的自回归模型阶数、滑动平均模型阶数和差分阶数,分别建立短路电抗、短路损耗和空载损耗的ARIMA模型;

b.分别利用最小二乘法对短路电抗、短路损耗和空载损耗ARIMA模型中的未知参数进行求解,具体包括:λ12,…,λp12,…,θq

c.根据ARIMA模型中未知参数的求解结果,对t+1时刻的短路电抗、短路损耗和空载损耗进行回归预测,依次记为其中,i表示配变编号,i=1,2,…,N,N表示配变总台数;

进一步的,所述步骤3)中求解基于大数据流的配变故障在线识别模型,筛选出可能发生故障的配变的方法为:

a.根据t+1时刻配变i(i=1,2,…,N)的在线监测量(包括:电压、电流、有功功率、无功功率),计算t+1时刻的短路电抗、短路损耗和空载损耗,依次记为

b.并计算之间的偏差,j=1,2,3,计算公式如下:

c.选择短路电抗、短路损耗和空载损耗的偏差阈值,依次记为若下式中有一式成立

则认为配变i可能存在故障,应利用步骤5)对其是否发生故障及故障类型做进一步的诊断。

进一步的,所述步骤4)中配变故障诊断指标体系为:

a.配变故障诊断指标体系中的元素包括动态指标和准动态指标;

b.动态指标指通过在线监测量(电压、电流、有功功率、无功功率)计算得到的短路电抗(X1)、短路损耗(X2)和空载损耗(X3);

c.准动态指标指定期开展的配变例行试验所获取的试验结果,例行试验主要包括人工巡检、色谱分析、电气试验和油化试验,其中,人工巡检的准动态指标包括油位(X4)、外观(X5)、密封(X6),色谱分析的准动态指标包括H2(X7)、C2H2(X8)、CO(X9)、CH4(X10),电气试验的准动态指标包括绝缘电阻(X11)、吸收比(X12)、直流电阻相间差值(X13)、泄露电流(X14)、介质损耗(X15)、末屏电阻(X16)、电容量误差(X17)、铁芯接地电流(X18),油化试验的准动态指标包括油中微水(X19)、油介损(X20)、油糠醛(X21)。

进一步的,所述步骤5)中建立基于迁移学习算法TrAdaBoost的配变故障诊断模型,对步骤3)中筛选出的可能发生故障的配变进行故障诊断的方法为:

a.对步骤3)中筛选出的可能发生故障的配变进行编号,依次为1,2,…,M,其中M为步骤3)筛选出的可能发生故障的配变的总数;

b.统计配网中配变的故障记录,记为Tb,其中故障记录即为步骤4)中配变故障诊断指标体系中的各物理量和所对应的故障类型;

c.对任意一台可能发生故障的配变i,i=1,2,…,M,统计其历史故障记录,记为Ta,其中故障记录即为步骤4)中配变故障诊断指标体系中的各物理量;

d.将Ta作为目标训练集合,Tb作为辅助训练集合,配变故障诊断指标体系中的各物理量作为输入,故障类型作为输出,利用TrAdaBoost算法对配变i的故障诊断器进行训练;

e.在利用步骤d得到配变i的故障诊断器后,将其最近一次的配变故障诊断指标体系中的物理量作为输入,得到配变i的故障类型;

f.对其他可能发生故障的配变重复步骤c-步骤e,直至所有可能发生故障的配变完成故障诊断。

总体而言,本发明所构思的以上技术方案与现有技术相比,具有以下有益效果:

(1)基于大数据流的配变故障在线识别模型利用ARIMA方法对配变故障进行辨识,可对故障配变进行初步筛选,大大减轻了后续配变故障诊断的工作量;

(2)本发明所建立的配变故障诊断模型针对配变在线监测量种类丰富度不足、配变单体的例行试验数据也往往较为缺乏的问题,较好地解决了配变故障诊断问题。

附图说明

图1是本发明实施例的时间序列长度与预测误差的关系示意图;

图2是本发明实施例的基于短路电抗的配变故障识别示意图。

图3是本发明实施例的配变故障诊断指标体系示意图;

图4是本发明实施例的不同数据量下M2的诊断精确度示意图。

具体实施方式

下面结合本发明中的附图和具体实施例,对本发明中的技术方案进行清楚、完整地描述。

首先介绍ARIMA算法和迁移学习算法TrAdaBoost的理论基础。

本发明采用ARIMA算法对配变故障进行在线识别。ARIMA算法是用于预测分析的一种方法。

如果一个系统在任意时刻t的取值yt,不仅仅与以前时刻的自身之有关,而且还与以前时刻进入系统的扰动相关,那么这样的系统就是自回归滑动平均系统,相应的模型就是回归滑动平均模型。自回归滑动平均模型是回归过程和滑动平均过程的组合。所以可以将其表示为:

yt=λ1yt-12yt-2+...λpyt-pt1εt-12εt-2+...+θqεt-q(1)

其中,

yt-系统在时刻t的取值,

εt-时刻t的白噪声,

p-自回归阶数,

q-滑动平均阶数,

λ12,…,λp12,…,θq-模型的参数,λp≠0,θq≠0,

该模型简记为ARMA(p,q);

ARMA(p,q)是一种平稳时间序列的分析模型,但是在现实生活中的许多时问序列是不平稳的。一般而言,非平稳时间序列经过差分处理后可以转换为平稳时间序列,那称这样的时间序列为齐次非平稳时间序列,其中差分的次数就是齐次的阶。

引入差分算子

引入延迟算子B,有

结合差分算子和延迟算子B,可以得出

设yt为d阶齐次非平稳时间序列,那么是平稳时间序列,则可以利用ARMA(p,q)模型对其进行预测分析,即

其中,

λ(B)=1-λ1B-λ2B2+...λpBp-自回归系数多项式,

θ(B)=1-θ1B+θ2B2+...+θqBq-滑动平均系数多项式;

称式(5)为自回归求和滑动平均模型,记为ARMA(p,d,q)。

其次,本发明采用迁移学习算法TrAdaBoost建立配变故障诊断模型。迁移学习算法TrAdaBoost是一种基于实例的迁移学习算法,具有较强的知识迁移能力。假设TrAdaBoost算法的目标训练集合为Ta,辅助训练集合为Tb,该算法针对两种集合,采用不同的权重调整机制。通过降低辅助集合的误分类样本权重,让分类器忽视不相关的标注样本;同时加强目标集合的误分类样本权重,让分类器重视。TrAdaBoost算法步骤如下:

I、假设Ta样本数量为m,Tb样本数量为n,合并训练集T=Ta∪Tb,迭代次数Iter,基本分类算法Learner,其中

其中,

x-分类器输入向量,

y-为真实标识;

II、初始化权重向量

其中,

III、初始化参数

IV、循环t=1,2,…,Iter

(IV-1)调用Learner,根据T、wt得到弱分类器ht:X→Y;

(IV-2)计算弱分类器ht在Ta上面的错误率:

其中,

ht(xi)-分类器对xi得到的学习标识,

[x]-为判断函数,若x为真,[x]=1,反之[x]=0;

(IV-3)设置弱分类器权重参数αt=ln(1/βt),

(IV-4)目标权重调整参数βt=et/(1-et);

(IV-5)权重更新

(V)输出强分类器

下面,结合一个优选实施例介绍本发明的基于大数据流及迁移学习的配变故障在线诊断方法,该方法包括如下步骤:

请参照图1~4,为本发明的优选实施例,其包括如下步骤:

步骤1),梳理现阶段配变的主要在线监测量,提出配变故障在线识别的主要指标;

步骤2),以配变故障在线识别指标为ARIMA算法的输入量,提出基于ARIMA算法的故障在线识别方法,建立基于大数据流的配变故障在线识别模型;

步骤3),求解基于大数据流的配变故障在线识别模型,筛选出可能发生故障的配变;

步骤4),构建配变故障诊断指标体系;

步骤5),建立基于迁移学习算法TrAdaBoost的配变故障诊断模型,对步骤3)中筛选出的可能发生故障的配变进行故障诊断。

具体的,所述步骤1)中现阶段配变的主要在线监测量以及配变故障在线识别的主要指标分别为:

a.现阶段配变在线监测量包括,电压、电流、有功功率、无功功率这些量由安装在配电台区的监测终端进行采集,每15分钟进行一次,目前已基本实现了全体配变中此四类监测量的在线实时监测。

b.配变故障在线识别的主要指标包括配变短路电抗、短路损耗和空载损耗,这些指标可通过电压、电流、有功功率、无功功率计算得到。

具体的,所述步骤2)中基于大数据流的配变故障在线识别模型为:

a.选择合适的自回归模型阶数、滑动平均模型阶数和差分阶数,分别建立短路电抗、短路损耗和空载损耗的ARIMA模型;

b.分别利用最小二乘法对短路电抗、短路损耗和空载损耗ARIMA模型中的未知参数进行求解,具体包括:λ12,…,λp12,…,θq

c.根据ARIMA模型中未知参数的求解结果,对t+1时刻的短路电抗、短路损耗和空载损耗进行回归预测,依次记为其中,i表示配变编号,i=1,2,…,N,N表示配变总台数;

具体地,在本实施例中,经验证,差分阶数d=2时,非平稳时间序列可以转换为平稳时间序列;同时,为简化分析,令滑动平均阶数q=0;本实施例分析自回归阶数p,即时间序列长度对ARIMA预测精度的影响,一般而言,时间序列长度越长,预测精度越准确但计算效率会有所降低;时间序列长度越短时的情况则相反。在模型M1中,当配变正常运行时,希望预测结果与实际值相差越小越好,避免误报警而增加额外的计算量;而当配变发生故障时,希望预测结果相对不够准确,以及时发现配变中的故障。因此,时间序列长度的选择至关重要。对不同时间序列长度下某台配变在正常与故障时的X1-X3进行预测分析,计算其相对误差。图1显示了该配变的预测误差与时间序列长度的关系图。

具体的,所述步骤3)中求解基于大数据流的配变故障在线识别模型,筛选出可能发生故障的配变的方法为:

a.根据t+1时刻配变i(i=1,2,…,N)的在线监测量(包括:电压、电流、有功功率、无功功率),计算t+1时刻的短路电抗、短路损耗和空载损耗,依次记为

b.并计算之间的偏差,j=1,2,3,计算公式如下:

c.选择短路电抗、短路损耗和空载损耗的偏差阈值,依次记为若下式中有一式成立

则认为配变i可能存在故障,应利用步骤5)对其是否发生故障及故障类型做进一步的诊断。

具体地,在本实施例中,以图1中的X1为例说明偏差阈值的选取方法,在配变正常运行时,X1预测的相对误差趋近于7%,而在配变故障时趋近于25%。偏差阈值不宜过小,以致正常运行的配变容易被识别为故障状态;也不宜过大,以致容易漏选已发生故障的配变。本发明选取(7+25)/2×100%=16%作为图1中X1的偏差阈值。应说明的是,若配变无故障记录,则选取其他故障配变偏移阈值的的平均值作为其偏移阈值。图2显示了以短路电抗(X1)为依据的配变故障识别情况,图中的包络线为不同配变的偏移阈值按从大到小排列的结果,图中的×表示误判情形,即无故障配变的识别结果为有故障,而故障配变被识别出无故障。从图中可以看出,在本算例中故障识别准确率高达97%,验证了本发明配变故障识别方法的准确性。

具体的,所述步骤4)中配变故障诊断指标体系为:

a.配变故障诊断指标体系中的元素包括动态指标和准动态指标;

b.动态指标指通过在线监测量(电压、电流、有功功率、无功功率)计算得到的短路电抗(X1)、短路损耗(X2)和空载损耗(X3);

c.准动态指标指定期开展的配变例行试验所获取的试验结果,例行试验主要包括人工巡检、色谱分析、电气试验和油化试验,其中,人工巡检的准动态指标包括油位(X4)、外观(X5)、密封(X6),色谱分析的准动态指标包括H2(X7)、C2H2(X8)、CO(X9)、CH4(X10),电气试验的准动态指标包括绝缘电阻(X11)、吸收比(X12)、直流电阻相间差值(X13)、泄露电流(X14)、介质损耗(X15)、末屏电阻(X16)、电容量误差(X17)、铁芯接地电流(X18),油化试验的准动态指标包括油中微水(X19)、油介损(X20)、油糠醛(X21)。

具体地,在本实施例中,配变故障诊断指标体系如图3所示。

具体的,所述步骤5)中建立基于迁移学习算法TrAdaBoost的配变故障诊断模型,对步骤3)中筛选出的可能发生故障的配变进行故障诊断的方法为:

a.对步骤3)中筛选出的可能发生故障的配变进行编号,依次为1,2,…,M,其中M为步骤3)筛选出的可能发生故障的配变的总数;

b.统计配网中配变的故障记录,记为Tb,其中故障记录即为步骤4)中配变故障诊断指标体系中的各物理量和所对应的故障类型;

c.对任意一台可能发生故障的配变i,i=1,2,…,M,统计其历史故障记录,记为Ta,其中故障记录即为步骤4)中配变故障诊断指标体系中的各物理量;

d.将Ta作为目标训练集合,Tb作为辅助训练集合,配变故障诊断指标体系中的各物理量作为输入,故障类型作为输出,利用TrAdaBoost算法对配变i的故障诊断器进行训练;

e.在利用步骤d得到配变i的故障诊断器后,将其最近一次的配变故障诊断指标体系中的物理量作为输入,得到配变i的故障类型;

f.对其他可能发生故障的配变重复步骤c-步骤e,直至所有可能发生故障的配变完成故障诊断。

具体地,在本实施例中,为说明本发明基于迁移学习算法TrAdaBoost的配变故障诊断器(记为M2)的精确性,将其与仅通过待诊断配变故障数据训练的诊断器(记为M2_0)进行对比。由于没有辅助故障数据的参与,M2_0将退化为利用AdaBoost算法进行训练,不再具有知识迁移的功能。表1显示了不同迭代次数下M2和M2_0的故障诊断精度。从表中可以看出,随着迭代次数的增加,M2和M2_0的故障诊断精度均呈现上升的趋势,且最后分别收敛于89.3%和79.9%;在不同的迭代次数下,M2的诊断结果精度均高于M2_0。这是由于M2_0仅利用待诊断配变的自身故障数据进行训练,故障数据量少,诊断器的泛化能力较弱,难以根据新的输入状态量得到正确的故障分类结果;而M2借助其他配变的故障信息,利用TrAdaBoost算法将其他配变的故障信息迁移至待诊断配变,有效信息利用率高。

表1 M2与M2_0的诊断对比

为分析目标数据量与辅助数据量对模型M2的影响,利用不同数量的故障数据对M2进行训练,故障诊断的精度如图4所示。从图中可以看出,目标数据与辅助数据数量比值为1时,M2的诊断精度最差。这是由于在这种情况下,目标故障数据与辅助故障数据在数量上处于完全相等的地位,一方面数据量过少导致诊断器的泛化能力较低;另一方面辅助故障数据太少,可迁移的有效信息不足,同样使得诊断器的精度降低。但是一般而言,辅助数据的数量一般比目标数据多,所以这种情形具有理论研究意义,对实践的指导意义不大。当比值小于1时,M2的诊断精度随着比值的增大而迅速减小,这是由于随着辅助数据的减少,配变故障诊断器的泛化能力不断减弱,导致诊断器的精度越来越差。同时,当辅助数据数量一定时,目标数据数量越多,诊断精度越高,这是由于当目标数据数量较多时,其受辅助数据的影响越少,鲁棒性较强,诊断精度有所提高。

本领域的技术人员容易理解,以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号