首页> 中国专利> 基于决策树算法的高压断路器故障诊断方法

基于决策树算法的高压断路器故障诊断方法

摘要

本发明公开了一种基于决策树算法的高压断路器故障诊断方法,所述方法步骤包括:特征选择,选取具有分类能力的特征向量用于训练数据,其包括主触头行程、合闸超程、动作时间、分合闸同期性4组特征向量;决策树生成,计算训练数据集中特征向量的信息增益比,判断信息增益比是否为最大并选择信息增益比最大的特征向量作为决策节点的测试条件,根据C4.5算法生成完整的决策树;决策树剪枝,根据最小化决策树的损失函数对决策树进行剪枝。本发明可以有针对性的安排检修,既能有效避免不必要的检修,节约人力物力,同时又可以防止潜伏性故障继续发展为显性故障最终导致电网事故。

著录项

说明书

技术领域

本发明涉及电器控制保护领域,尤其涉及一种基于决策树算法的高压断路器故障诊断方法。

背景技术

高压断路器作为电力系统中最重要的控制和保护设备,由于其结构复杂,动作相对频繁,因此发生故障的几率较大。若其发生故障将不能控制和保护整个电力系统的安全稳定运行,造成巨大的经济损失。目前检测高压断路器的方法有定期检修、事后检修等方式,定期检修费时费力、盲目性较大,无论断路器是否出现故障,都进行检修,会严重影响设备的使用寿命,因为绝大部分设备是不需要解体、维修的,设备解体后反而会影响其性能。另一种情况是当设备发生故障后才被维护或更换,会使设备的利用率降低,严重时会扩大事故范围,危及整个电网安全。因此,进行高压断路器故障预测能有效改善当前方法的不足,对高压断路器进行在线监测及故障诊断是保证其正常工作的重要手段.之一。

目前,高压断路器故障诊断可归分为3类:第1类是基于信号处理方法,如基于信号模态估计方法、基于小波变换、经验模态分解等;第2类是基于知识故障诊断方法,如专家系统、神经网络、模糊推理等;第3类是基于解析模型的方法,如状态估计法,参数估计法等。基于信号模态估计故障方法适用于被诊断系统的输入输出可以测量,但存在过多的人为因素,故障隶属度确定困难等问题;而基于知识的故障诊断方法应用于难以搭建精确数学模型的故障系统,诊断结果也相对的增加偏差性。

发明内容

本发明针对上述问题,提供一种高压断路器故障诊断方法,结合高压断路器机械特性试验数据,利用决策树分类算法确定高压断路器特征参量与故障阶段之间的关系,从而实现对高压断路器故障阶段进行分类预测。

为了达到上述目的,本发明提供了一种基于决策树算法的高压断路器故障诊断方法,其步骤包括:

S1:输入高压断路器特征数据集与预期目标变量,所述特征数据集为n组数据D=(X

S2:将所述高压断路器特征数据集划分为训练数据集D

S3:设定高压断路器特征数据X

S4:从根节点开始计算所有特征向量A的信息增益比g

其中,H

S5:选择信息增益比最大的特征向量为根节点的特征向量并根据所述根节点特征向量的不同取值建立决策节点;

S6:对于所述决策节点递归地调用S4、S5并再次形成新的决策节点;

S7:依此类推,直到所有特征向量的信息增益比g

S8:对所述决策树进行剪枝操作,计算所述决策树中每个叶子节点的经验熵,所述经验熵计算公式为:

其中D

S9:计算决策树损失函数,所述决策树损失函数计算公式为:

其中,决策树T的叶子节点为t,叶子节点总个数为|T|,叶子节点t的样本数为N

S10:判断所述决策树损失函数是否最小,若最小则选择损失函数最小的决策树作为最终结果,否则将叶子节点向上回缩,即将叶子节点与决策节点进行合并操作并调用S9、S10进行迭代计算,最后形成决策树损失函数最小的简化决策树;

S11:向简化决策树输入测试数据集D

优选方式下,所述高压断路特征数据X

优选方式下,所述预期目标变量分为三个类别,分别为高压断路器故障阶段的早期故障期、偶发故障期以及损耗故障期。

优选方式下,决策节点作为分支选择过程的中间节点存放特征向量的测试条件并根据特征向量的测试条件即特征向量的不同取值建立新的决策节点;叶子节点作为分支选择过程的终止节点存放所述预期目标变量的三个类别并对特征数据进行分类操作。

本发明的有益效果是:本发明基于断路器机械特性试验数据建立算法模型,研究随着高压断路器退化过程中机械特性试验数据的变化规律,从而发现健康数据与断路器故障阶段之间的数学映射关系,这样能够根据预测结果制定检修策略,可以有针对性的安排检修,既能有效避免不必要的检修,节约人力物力,同时又可以防止潜伏性故障继续发展为显性故障最终导致电网事故。

附图说明

图1为高压断路器故障阶段随时间变化曲线;

图2为决策树结构示意图;

图3为决策树算法流程图;

图4为决策树生成过程流程图;

图5为决策树剪枝过程流程图;

图6为机械特性实验中某次分闸操作结果示意图;

图7为主触头行程随开断次数变化曲线;

图8为合闸超程随开断次数变化曲线;

图9为动作时间随开断次数变化曲线;

图10为动作速度随开断次数变化曲线;

图11为分合闸同期性随开断次数变化曲线;

图12为电流持续时间随开断次数变化曲线;

图13为叶子节点数随参数α变化曲线;

图14为决策树深随参数α变化曲线;

图15为数据训练集与测试集精准度随参数α变化曲线;

图16为剪枝后的简化决策树模型。

具体实施方式

实施例:

基于解析模型方法适用于建立较为精确数学模型系统,因此本发明提出一种基于决策树算法的高压断路器故障诊断方法,如图3、4、5所示,其步骤包括:

S1:输入高压断路器特征数据集与预期目标变量,所述特征数据集为n组数据D=(X

S2:将所述高压断路器特征数据集按照比例[0.7,0.3]划分为训练数据集D

S3:设定高压断路器特征数据X

S4:从根节点开始计算所有特征向量A的信息增益比g

其中,H

S5:选择信息增益比最大的特征向量为根节点的特征向量并根据所述根节点特征向量的不同取值建立决策节点;

S6:对于所述决策节点递归地调用S4、S5并再次形成新的决策节点;

S7:依此类推,直到所有特征向量的信息增益比g

S8:对所述决策树进行剪枝操作,计算所述决策树中每个叶子节点的经验熵,所述经验熵计算公式为:

其中D

S9:计算决策树损失函数,所述决策树损失函数计算公式为:

其中,决策树T的叶子节点为t,叶子节点总个数为|T|,叶子节点t的样本数为N

S10:判断所述决策树损失函数是否最小,若最小则选择损失函数最小的决策树作为最终结果,否则将叶子节点向上回缩,即将叶子节点与决策节点进行合并操作并调用S9、S10进行迭代计算,最后形成决策树损失函数最小的简化决策树;

S11:向简化决策树输入测试数据集D

决策树DT,是一个树结构,其每个分支表示特征属性x

使用决策树进行决策的过程就是从根节点开始,测试待分类项中相应的特征属性,并按照其值选择输出分支,直到到达叶子节点,将叶子节点存放的类别作为决策结果。决策树训练过程包括以下3个步骤:特征选择、决策树生成和决策树剪枝,如图3所示。

特征选择在于选取具有分类能力的特征向量用于训练特征数据集,本发明以信息增益比Information Gain Ratio,作为特征向量选择的准则,并最终选取主触头行程、合闸超程、动作时间、分合闸同期性4组特征向量A。特征向量选择首先定义随机变量Y的概率分布为:

P(Y=y

其中n是分类类别个数,p是某一类别的概率,并定义随机变量Y的熵:

熵值越大,随机变量的不确定性就越大,当熵中的概率p

定义特征向量A对训练数据集D

g(D

其中H(D

其中H

决策树的生成算法包括ID3、C4.5等,ID3算法interative dichotomiser 3的核心是在决策树各个节点上应用信息增益准则选择特征,递归地构建决策树。C4.5算法对ID3算法进行了改进,即在决策树生成的过程中,用信息增益比来选择特征,校正应用信息增益时存在偏向于选择取值较多的特征的问题。具体过程是从根节点开始,对节点计算所有可能的特征的信息增益比,选择信息增益比最大的特征作为决策节点的特征,由该特征的不同取值建立子节点即决策节点,再对决策节点递归地调用以上方法,直到所有特征的信息增益比均很小或没有特征可以选择为止,最终到达叶子节点,得到一个决策树。本发明采用C4.5算法递归地产生决策树,流程图如图4所示。

最后对决策树进行剪枝以解决过拟合现象,决策树的剪枝可以通过最小化决策树的损失函数来实现,考虑决策树模型的拟合度和复杂度,所述决策树损失函数计算公式为:

其中,决策树T的叶子节点为t,叶子节点总个数为|T|,叶子节点t的样本数为N

如图1所示,所述预期目标变量分为三个类别,分别为高压断路器故障阶段的早期故障期、偶发故障期以及损耗故障期;第一阶段是早期故障期,高压断路器开始投入运行,由于设计、原材料或者制造工艺中的缺陷,故障率较高,但随着高压断路器投入运行时间的增加,故障率迅速降低;第二阶段是偶然故障期,这一阶段的特点是故障率较低,且较稳定,往往可近似看作常数,高压断路器可靠性指标所描述的就是这个时期,这一时期是工况中的良好使用阶段;第三阶段是损耗故障期,由于磨损、疲劳、老化和耗损等原因,高压断路器的故障率随时间延长而急速增加,在这一阶段往往需要制定检修方案进行大修,或者更换新的断路器。

决策节点作为分支选择过程的中间节点存放特征向量的测试条件并根据特征向量的测试条件即特征向量的不同取值建立新的决策节点;叶子节点作为分支选择过程的终止节点存放所述预期目标变量的三个类别并对特征数据进行分类操作。

实施例中依托国内某开关厂实验室进行断路器的机械特性试验,实验样机为1100kV小型GIS断路器,采用断路器特性测量仪Kocos来测量断路器机械特性试验中的相关数据,如图6所示为在操作电压为143V,低油压条件下碟簧压缩量低油压为51mm时分闸操作的记录数据。

操作试验的额定操作电压为220V,系统压力下额定碟簧压缩量为120mm,在试验过程中,通过设置改变操作电压为143V、220V、240V以及设置碟簧压缩量为51mm、120mm、122mm从而更加全面的考核断路器的稳定性,另外按照试验规程对分闸、合闸及重合闸进行循环操作共10000次左右,随着断路器开断次数的增加,其机械特性参量和其他参量数据随之波动变化。通常情况下,在模型训练前需要对源数据进行预处理,也称为特征工程,主要包括特征提取、特征转换和特征选择。特征提取从原始数据中抽取特征的过程,本实施例中提取部分试验分合闸数据如图7-12所示。

由图7-12中可以看出,由于设定参量操作电压和系统压力的不同,曲线变化呈规律性波动,而整体趋势随着开断次数的增加而变化,可以明显看出主触头行程在5000次左右之后位移量减小,合闸超程波动越来越大,分闸动作时间呈缓慢减小的趋势,分合闸同期性波动呈浴盆曲线规律,而分闸速度和电流持续时间变化较小,这也表明此断路器机械稳定性较高。

由于作为参照组的操作电压和碟簧压缩量是设定特征参量,不易于选作分类模型的特征,本实施例选取额定操作电压为220V及额定碟簧压缩量为120mm的数据作为分类模型的输入数据,一共800组特征数据。考虑合闸超程在断路器故障各阶段变化明显,本实施例利用信息增益比方法对合闸数据的特征参量进行特征选择,并最终选择合闸主触头行程、合闸超程、合闸时间、合闸同期性作为分类特征features,另外定义高压断路器故障的3个阶段早期故障期、偶发故障期、损耗故障期作为预期目标变量label。

在剪枝过程中,考虑决策树模型的复杂度和拟合度,为了获得复杂度相对较低,拟合度相对较高的决策树模型,本实施例根据损失函数最小化原理进行剪枝,以树的深度和叶子节点个数表示树的复杂度,训练集的精确度可表示拟合度,调整参数α大小以确定复杂度和拟合度之间的平衡程度,如图13、14所示。

其中图13描述树深和叶子节点数与的参数α关系,可以看出随着α的值增大,树深层数和节点个数都减少,即树的复杂度降低;图14描述训练集和测试集的精确度与参数α之间的关系,当α的值越接近于零,训练集的精确度越高,即树的拟合度越高,但是测试集的精确度相对较低,也就是过拟合现象,而当α∈(0.02,0.28)时,训练误差和测试误差都较小且相对均衡,此时我们可以得到复杂度相对较低,拟合度相对较高的决策树模型。

根据以上剪枝过程,我们令α=0.15,树深为4层,则叶子节点数有8个,可得如图16所示的决策树模型。

从节点信息中可以看到分类特征的阈值信息,其中samples表示测试集样本数,value表示机械寿命y

以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明披露的技术范围内,根据本发明的技术方案及其发明构思加以等同替换或改变,都应涵盖在本发明的保护范围之内。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号