首页> 中国专利> 一种基于FP-Growth算法的计量主站告警分析模型构建方法

一种基于FP-Growth算法的计量主站告警分析模型构建方法

摘要

本发明涉及一种基于FP‑Growth算法的计量主站告警分析模型构建方法,属于告警管理技术领域。该方法包括以下步骤:S1:梳理计量主站告警关键指标;S2:建立计量主站告警关联规则;S3:构建计量主站告警分析模型。本发明采用计量系统中的告警数据,基于计量主站告警关键指标,通过引入库尔钦斯基(Kulc)度量以及不平衡比(IR),改进FP‑Growth算法,排除关联规则挖掘过程中无意义关联规则的影响,构建一套计量主站告警分析模型,能够有效的协助电力公司更加精准的发现计量主站告警源,高效排查并解决计量主站告警,保障电网稳定运行。

著录项

  • 公开/公告号CN112528458A

    专利类型发明专利

  • 公开/公告日2021-03-19

    原文格式PDF

  • 申请/专利权人 贵州电网有限责任公司;

    申请/专利号CN202010973934.9

  • 发明设计人 安江;

    申请日2020-09-16

  • 分类号G06F30/20(20200101);G06Q50/06(20120101);G06F113/04(20200101);

  • 代理机构51238 成都玖和知识产权代理事务所(普通合伙);

  • 代理人胡琳梅

  • 地址 550000 贵州省贵阳市南明区滨河路17号

  • 入库时间 2023-06-19 10:19:37

说明书

技术领域

本发明属于告警管理技术领域,涉及一种基于FP-Growth算法的计量主站告警分析模型构建方法。

背景技术

在电网系统中,电力计量主站告警具有数据量大、时序性、关联性的特点,当前针对单个计量无效告警事件,已经有相较规范的处理方法。但是计量系统运行情况繁杂,单一告警事件的处理方式难以满足实际业务应用需求,缺少多个告警之间的关联,经常造成误报、漏报等问题。为此需要结合计量系统中的告警数据,基于计量主站告警关键指标,急需一套计量主站告警分析模型。

发明内容

有鉴于此,本发明的目的在于提供一种基于FP-Growth算法的计量主站告警分析模型构建方法,构建一套计量主站告警分析模型。

本发明的第一方面的目的是通过如下技术方案实现的:

一种基于FP-Growth算法的计量主站告警分析模型构建方法,其特征在于:该方法包括以下步骤:

S1:梳理计量主站告警关键指标;

S2:建立计量主站告警关联规则;

S3:构建计量主站告警分析模型。

进一步,所述步骤S1具体为:

计量主站告警关键指标的梳理,主要通过基于计量主站告警据大项、告警检查项、告警原因明细,计量主站告警主要由表计告警、终端告警引起。从计量主站各类型设备中明确终端、表计告警的诱因。

进一步,计量主站告警关键指标主要包括:

(1)电流不平衡:同步发电机定子三相绕组输出数值或相角不相等的电流;

(2)断相:表计的计量回路中的一相或多相断开的现象;

(3)失压:某相负荷电流大于电能表的启动电流,但电压线路的电压低于电能表正常工作电压;

(4)表盖开启:电能表大盖上的铅封开启了;

(5)电能表飞走:电能表的表码示数快于正常表码示数的现象。

进一步,所述步骤S2具体为:

结合计量主站告警关键指标,以项目集N为例,建立事物X与事物Y之间的关联规则:

S21:支持度是衡量关联规则出现频繁程度的重要指标,即在全部事务中,{X,Y}出现的可能性,具体流程如下:

S211:构建计量主站告警关联规则的支持度:

S212:支持度主要目的是通过设定最小支持度阈值(minsup),剔除出现较少的无效规则,保留出现频繁的关联规则,进而筛选得到频繁项集Z:s(Z)≥minsup。

S22:构建计量主站告警关联规则的置信度:

S23:构建库尔钦斯基(Kulc)度量:

S24:构建不平衡比(IR):

进一步,所述步骤S3具体为:

遍历分析对象的特征,基于整理的计量主站告警关键指标,首先是基于计量主站告警告警序列,构建FP-tree树节点;其次是从FP-tree中挖掘频繁模式;最后,评价引入Kulc度量、不平衡比的改进FP-Growth算法准确率,输出得到计量主站告警分析模型。

进一步,所述计量主站告警分析模型的算法流程为:

S31:事务获取:将告警序列划分为事务级,设置窗口初始大小和最大长度,得到事务集合列表。

S32:构建FP-tree:扫描原始数据库,统计每个项目出现的次数,设定最小支持度,以降序排列方式重新排列项目集,得到整理后的事务集合列表。根据整理后的数据列表,依次将项目集加入FP-tree中,得到树状图。

S33:频繁项集挖掘:从FP-tree中挖掘频繁模式,对于每一个项目,梳理得到基础模式项,即以所查找项目为结尾的路径集合。

S34:评价引入Kulc度量、不平衡比的改进FP-Growth算法准确率,得到基于FP-Growth 算法的计量主站告警分析模型。

本发明的第二方面的目的是提供一种计算机装置,包括存储器、处理器及储存在存储器上并能够在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如前所述的方法。

本发明的第三方面的目的是提供一种计算机可读存储介质,其上储存有计算机程序,所述计算机程序被处理器执行时实现如前所述的方法。

本发明的有益效果在于:本发明基于计量系统中的告警数据,能够构建一套基于FP-Growth算法的计量主站告警分析模型,挖掘计量主站告警关联规则。在实践过程中,通过引入库尔钦斯基(Kulc)度量以及不平衡比(IR),改进FP-Growth算法,排除关联规则挖掘过程中无意义关联规则的影响,确定计量主站告警的识别方法,协助电力公司更加精准的发现计量主站告警源,高效排查并解决计量主站告警,保障电网稳定运行。

附图说明

为了使本发明的目的、技术方案和有益效果更加清楚,本发明提供如下附图进行说明:

图1为本发明一种基于FP-Growth算法的计量主站告警分析模型构建流程图;

图2为实例的树状图。

具体实施方式

下面将结合附图,对本发明的优选实施例进行详细的描述。

1、计量主站告警关键指标的梳理

主要通过基于计量主站告警据大项、告警检查项、告警原因明细,计量主站告警主要由表计告警、终端告警引起。从计量主站各类型设备中明确终端、表计告警的诱因。

计量主站告警关键指标主要包括:

(1)电流不平衡:同步发电机定子三相绕组输出数值或相角不相等的电流;

(2)断相:表计的计量回路中的一相或多相断开的现象;

(3)失压:某相负荷电流大于电能表的启动电流,但电压线路的电压低于电能表正常工作电压;

(4)表盖开启:电能表大盖上的铅封开启了;

(5)电能表飞走:电能表的表码示数快于正常表码示数的现象。

2、建立计量主站告警关联规则

结合计量主站告警关键指标,以项目集N为例,建立事物X与事物Y之间的关联规则:

(1)支持度是衡量关联规则出现频繁程度的重要指标,即在全部事务中,{X,Y}出现的可能性。构建计量主站告警关联规则的支持度:

(2)构建计量主站告警关联规则的置信度:

(3)构建库尔钦斯基(Kulc)度量:

(4)构建不平衡比(IR):

整理获得FP-Growth算法挖掘关联规则。

事务项由可实际量化的指标构成。

3、计量主站告警分析模型构建

遍历分析对象的特征,基于整理的计量主站告警关键指标,首先是基于计量主站告警告警序列,构建FP-tree树节点;其次是从FP-tree中挖掘频繁模式;最后,评价引入Kulc度量、不平衡比的改进FP-Growth算法准确率,输出得到计量主站告警分析模型。

3.1事务获取

将告警序列划分为事务级,设置窗口初始大小和最大长度,得到事务集合列表。

实例中,假设计量主站告警序列为I

3.2构建FP-tree

扫描原始数据库,统计每个项目出现的次数,设定最小支持度,以降序排列方式重新排列项目集,得到整理后的事务集合列表。根据整理后的数据列表,依次将项目集加入FP-tree 中,得到树状图。

实例中,设定最小支持度为2,以降序排列方式重新排列告警集,得到整理后的计量主站告警事务集合列表:

实例中,得到如图2所示的树状图。

3.3频繁项集挖掘

从FP-tree中挖掘频繁模式,对于每一个项目,梳理得到基础模式项,即以所查找项目为结尾的路径集合。

实例中,在I

3.4评价引入Kulc度量、不平衡比的改进FP-Growth算法准确率,得到基于FP-Growth 算法的计量主站告警分析模型。

实例中,设置最小支持度为40%,最小置信度为70%。挖掘出的部分频繁项集在满足最小支持度、最小置信度以及Kulc度量的同时,IR均小于0.1,表明该事务具有强关联关系,且属于有意义的关联规则。经过实际查找验证,改进FP-Growth算法准确率达到了91.2%, FP-Growth算法挖掘关联规则准确、有效。得到如下表所示的部分强关联规则结果:

4、结束

最终整体的模型构建实现过程如图1所示。

需要说明书的是,流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本发明的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本发明的实施例所属技术领域的技术人员所理解。

在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,"计算机可读介质"可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。

应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。

本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。

此外,在本发明各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。

上述提到的存储介质可以是只读存储器,磁盘或光盘等。

尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在不脱离本发明的原理和宗旨的情况下在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。最后说明的是,以上优选实施例仅用以说明本发明的技术方案而非限制,尽管通过上述优选实施例已经对本发明进行了详细的描述,但本领域技术人员应当理解,可以在形式上和细节上对其作出各种各样的改变,而不偏离本发明权利要求书所限定的范围。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号