首页> 中国专利> 一种无功优化在线控制中的设备动作次数挖掘方法

一种无功优化在线控制中的设备动作次数挖掘方法

摘要

本发明实施例公开了一种无功优化在线控制中的设备动作次数挖掘方法,涉及电力系统无功优化在线控制领域。针对无功优化控制中采用关联挖掘方法进行计算时挖掘效率较低且不易实现在线设置的问题,采用改进快速模糊关联挖掘配合增量挖掘,实现了无功优化中控制设备动作次数的快速合理设置,通过改进模糊关联挖掘算法改善了设备动作次数挖掘的整体计算效率,而增量挖掘的引入则进一步提高了目标挖掘的效率。从而减轻运行人员在无功优化在线控制中设备动作次数设置方面的诸多繁琐工作,在保证设置结果合理和精确的前提下实现了设备动作次数的快速挖掘和在线设置,以便于无功优化在线控制最终取得较好电压控制效果。

著录项

  • 公开/公告号CN107404120A

    专利类型发明专利

  • 公开/公告日2017-11-28

    原文格式PDF

  • 申请/专利权人 南京工程学院;

    申请/专利号CN201710612017.6

  • 申请日2017-07-25

  • 分类号

  • 代理机构江苏圣典律师事务所;

  • 代理人邓丽

  • 地址 211167 江苏省南京市江宁区弘景大道1号

  • 入库时间 2023-06-19 03:51:20

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2020-04-24

    授权

    授权

  • 2017-12-22

    实质审查的生效 IPC(主分类):H02J3/18 申请日:20170725

    实质审查的生效

  • 2017-11-28

    公开

    公开

说明书

技术领域

本发明涉及电力系统无功优化控制领域,尤其涉及一种无功优化在线控制中的设备动作次数挖掘方法。

背景技术

当前,在电力系统中控制设备上,无功优化在线控制经过多年的研究已经日趋成熟并且取得了广泛的应用。然而,诸如控制设备的动作次数等关键参数的设置较为繁琐且不易把握,经常由于设置不合理常导致实际控制效果受到较大影响。

而传统无功优化中控制设备的参数设置大多依靠运行人员的个人经验进行设置,例如:一天内变压器档位动作次数和补偿设备动作次数这两个重要参数的设置。通常先将一天时段按变电站大致的负荷走势进行划分后,再根据自身的经验逐一设置时段内设备的动作次数,这种主要还是基于人为经验的划分方式,常因运行人员的主观判断或负荷季节性变化而维护不及时等原因,常在系统运行一段时间后出现控制效果不理想的现象,为了保证在线控制的优化效果,运行人员常需要根据负荷变化的特征,对关键参数的设置结果进行不断的调整。而在大型区域电网中,设备参数的频繁调整会给运行人员带来巨大的工作量,并且由于缺乏足够的具有丰富运维经验的运行人员,也很难把握负荷的时段划分以及具体的时段内动作次数的精确的设置,最终导致了大型区域电网系统中的控制效果很难进一步优化。

发明内容

本发明的实施例提供一种无功优化在线控制中的设备动作次数挖掘方法,实现无功优化在线控制中参数的自动合理设置。

为达到上述目的,本发明的实施例采用如下技术方案:

总体流程,包括:

获取挖掘所需要的母线负荷预测结果;

对母线负荷预测数据自动进行划分并获得挖掘所需的时段区间;

选取挖掘所需关联字段并对历史库中各时段数据进行整理;

选取第i个时段内历史库结果并转换部分字段属性;

计算i时段内负荷预测曲线和历史库集合间不同字段属性的相似度;

采用模糊隶属度函数量化各属性对应值;

采用模糊关联规则挖掘方法进行挖掘;

获得满足置信度的强关联规则;

通过i<li,max判断所有时段是否全部挖掘完成(li,max表示当前时段的最大值,i表示所划分出的时段的编号,1≤i≤max),如果都挖掘完成则转入步骤10,否则转入步骤4;

对关联规则进行反模糊化处理,得到设备时段划分和动作次数设置结果;

本次挖掘计算结束。

其中,总体流程若依照执行的先后顺序,具体包括:挖掘前数据准备阶段、挖掘计算和规则生成阶段和根据规则获得参数设置结果的阶段,具体的:

其中:

A所述挖掘前数据准备阶段的步骤包括:

步骤A-1,获取挖掘所需要的母线负荷预测结果;

步骤A-2,对母线负荷预测数据自动进行划分并获得挖掘所需的时段区间;

步骤A-3,选取挖掘所需关联字段,并对历史库中各时段数据执行整理;

步骤A-4,如果不采用在线挖掘,转入步骤B-1,否则转入步骤C-1:

B所述挖掘计算和规则生成阶段的步骤包括:

步骤B-1,选取第i个时段内的历史库结果,并转换字段属性;

步骤B-2,计算i时段内负荷预测曲线和历史库集合之间,不同字段属性的相似度;

步骤B-3,采用模糊隶属度函数量化各属性对应值;

步骤B-4,采用模糊关联规则挖掘方法进行挖掘;

步骤B-5,通过i<li,max判断所有时段是否全部挖掘完成,如果都挖掘完成则转入D-1,否则转入A-4,其中li,max表示当前时段的最大值,i表示所划分出的时段的编号,1≤i≤max;

C在线挖掘计算阶段步骤:

步骤C-1,如果NNewItem<Nmax则入步骤C-2,否则转入B-1,其中,NNewItem表示新增数据条数,Nmax表示给定新增数据最大条数的阀值;

步骤C-2,获取时段i内数据库新增数据,新增数据集合为ZD;

步骤C-3,导入新增数据前的离线挖掘结果,既所有频繁-K项集的结果;

步骤C-4,采用增量挖掘方法对新增数据集进行挖掘,之后转入B-5;D所述根据规则获得参数设置结果的阶段的步骤包括:

步骤D-1,对时段内挖掘获得的频繁集计算置信度和兴趣度;

步骤D-2,获得满足置信度和兴趣度的强关联规则;

步骤D-3采用强关联规则筛选策略,进行规则筛选;

步骤D-4,对关联规则进行反模糊化处理,得到设备时段划分和动作次数设置结果;

步骤D-5,本次挖掘计算结束。

本发明公开了一种无功优化在线控制中的设备动作次数挖掘方法,针对无功优化控制中采用关联挖掘方法进行计算时挖掘效率较低且不易实现在线设置的问题,采用改进快速模糊关联挖掘配合增量挖掘,实现了无功优化中控制设备动作次数的快速合理设置,通过改进模糊关联挖掘算法改善了设备动作次数挖掘的整体计算效率,而增量挖掘的引入则进一步提高了目标挖掘的效率,使得参数的在线设置成为可能。从而减轻运行人员在无功优化在线控制中设备动作次数设置方面的诸多繁琐工作,在保证设置结果合理和精确的前提下实现了设备动作次数的快速挖掘和在线设置,以便于无功优化在线控制最终取得较好电压控制效果。

附图说明

为了更清楚地说明本发明实施例中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。

图1是本发明的总体流程图;

图2是本发明的负荷预测曲线时段划分流程图;

图3是本发明的集合间相似度计算方法流程图;

图4是本发明的一种具体实例的示意图;

图5是本发明的改进模糊关联规则的快速挖掘算法的流程图;

图6是本发明的采用强关联规则筛选策略进行规则筛选的流程图;

图7是本发明的在线增量挖掘方法的流程图。

具体实施方式

为使本领域技术人员更好地理解本发明的技术方案,下面结合附图和具体实施方式对本发明作进一步详细描述。下文中将详细描述本发明的实施方式,所述实施方式的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施方式是示例性的,仅用于解释本发明,而不能解释为对本发明的限制。本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是,本发明的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。应该理解,当我们称元件被“连接”或“耦接”到另一元件时,它可以直接连接或耦接到其他元件,或者也可以存在中间元件。此外,这里使用的“连接”或“耦接”可以包括无线连接或耦接。这里使用的措辞“和/或”包括一个或更多个相关联的列出项的任一单元和全部组合。本技术领域技术人员可以理解,除非另外定义,这里使用的所有术语(包括技术术语和科学术语)具有与本发明所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是,诸如通用字典中定义的那些术语应该被理解为具有与现有技术的上下文中的意义一致的意义,并且除非像这里一样定义,不会用理想化或过于正式的含义来解释。

本发明实施例提供一种无功优化在线控制中的设备动作次数挖掘方法,主要用于无功优化在线控制中关键参数的智能辨识,以解决现有无功优化在线控制中关键参数设置繁琐且设置结果不精确的问题。该方法的总体流程如图1所示,包括:

获取挖掘所需要的母线负荷预测结果;

对母线负荷预测数据自动进行划分并获得挖掘所需的时段区间;

选取挖掘所需关联字段并对历史库中各时段数据进行整理;

选取第i个时段内历史库结果并转换部分字段属性;

计算i时段内负荷预测曲线和历史库集合间不同字段属性的相似度;

采用模糊隶属度函数量化各属性对应值;

采用模糊关联规则挖掘方法进行挖掘;

获得满足置信度的强关联规则;

通过i<li,max判断所有时段是否全部挖掘完成(li,max表示当前时段的最大值,i表示所划分出的时段的编号,1≤i≤max),如果都挖掘完成则转入步骤10,否则转入步骤4;

对关联规则进行反模糊化处理,得到设备时段划分和动作次数设置结果;

本次挖掘计算结束。

其中,总体流程若依照执行的先后顺序,具体包括:挖掘前数据准备阶段、挖掘计算和规则生成阶段和根据规则获得参数设置结果的阶段,具体的:

A所述挖掘前数据准备阶段的步骤包括:

步骤A-1,获取挖掘所需要的母线负荷预测结果;

步骤A-2,对母线负荷预测数据自动进行划分并获得挖掘所需的时段区间;

步骤A-3,选取挖掘所需关联字段,并对历史库中各时段数据执行整理;

步骤A-4,如果不采用在线挖掘,转入步骤B-1,否则转入步骤C-1:

B所述挖掘计算和规则生成阶段的步骤包括:

步骤B-1,选取第i个时段内的历史库结果,并转换字段属性;

步骤B-2,计算i时段内负荷预测曲线和历史库集合之间,不同字段属性的相似度;

步骤B-3,采用模糊隶属度函数量化各属性对应值;

步骤B-4,采用模糊关联规则挖掘方法进行挖掘;

步骤B-5,通过i<li,max判断所有时段是否全部挖掘完成,如果都挖掘完成则转入D-1,否则转入A-4,其中li,max表示当前时段的最大值,i表示所划分出的时段的编号,1≤i≤max;

C在线挖掘计算阶段步骤:

步骤C-1,如果NNewItem<Nmax则入步骤C-2,否则转入B-1,其中,NNewItem表示新增数据条数,Nmax表示给定新增数据最大条数的阀值;

步骤C-2,获取时段i内数据库新增数据,新增数据集合为ZD;

步骤C-3,导入新增数据前的离线挖掘结果,既所有频繁-K项集的结果;

步骤C-4,采用增量挖掘方法对新增数据集进行挖掘,之后转入B-5;D所述根据规则获得参数设置结果的阶段的步骤包括:

步骤D-1,对时段内挖掘获得的频繁集计算置信度和兴趣度;

步骤D-2,获得满足置信度和兴趣度的强关联规则;

步骤D-3采用强关联规则筛选策略,进行规则筛选;

步骤D-4,对关联规则进行反模糊化处理,得到设备时段划分和动作次数设置结果;

步骤D-5,本次挖掘计算结束。

具体的,如图7所示的在线增量挖掘方法的流程,所述步骤C-4,包括:

C-4-1:读入离线挖掘结果和增量数据,并将增量数据存入集合ZD中;

C-4-2:对增量数据集ZD进行模糊化处理;

C-4-3:得到ZD中的候选k-项集

C-4-4:如果k=1,则转入步骤C-4-5,否则转入步骤C-4-13;

C-4-5:如果成立,,则转入C-4-6,否则转入C-4-9,其中,表示:ZD中的第i个频繁1项集,表示D中的频繁1项集的集合;

C-4-6:如果ZD中的频繁1项集在ZD中的支持度大于等于给定支持度Smin,则转入C-4-7,否则转入C-4-9;

C-4-7:计算ZD中的频繁1项集在D中的支持度

C-4-8:如果成立则将更新到集合TL1中并转入C-4-9,否则直接转入C-4-9,其中,n为数据库D的条数,zd为增量数据的条数;

C-4-9:依次设置i=i+1,即每次将i递增1,如果已经遍历完成所有的频繁1项集,则转入C-4-10,否则转入C-4-5;

C-4-10:计算D中的第j个频繁1项集在ZD中的支持度,如果成立,则将更新到集合TL1中并转入C-4-11,否则直接转入C-4-11;

C-4-11:j=j+1,如果已经遍历完D中所有的频繁1项集,则转入C-4-19,否则转入C-4-10;

C-4-12:如果ZD中第i个k-项候选集不在D中的频繁k-项集中,则转入C-4-13,否则转入C-4-15;

C-4-13:如果ZD中的候选k-项集在ZD中的支持度大于等于给定支持度Smin,则转入C-4-14,否则转入C-4-15;

C-4-14:计算在D中的支持度如果成立,则将更新到集合TLk中并转入C-4-15,否则直接转入C-4-15;

C-4-15:依次设置i=i+1,即每次将i递增1,如果已经遍历完ZD中所有的候选k-项集,则转入C-4-16,否则转入C-4-12;

C-4-16:如果成立,则转入C-4-17,否则转入C-4-18,其中,M为属于但不属于的超集;

C-4-17:计算D中的第j个频繁k-项集在ZD中的支持度,如果成立,则将更新到集合TLk中并转入C-4-18,否则直接转入C-4-18;

C-4-18:依次设置j=j+1,即每次将j递增1,如果已经遍历完D中所有的频繁k-项集,则转入C-4-19,否则转入C-4-16;

C-4-19:依次设置k=k+1,即每次将k递增1,如果还有不为空的k项候选集合,则转入C-4-4,否则结束本次计算。

本发明公开了一种无功优化在线控制中的设备动作次数挖掘方法,针对无功优化控制中采用关联挖掘方法进行计算时挖掘效率较低且不易实现在线设置的问题,采用改进快速模糊关联挖掘配合增量挖掘,实现了无功优化中控制设备动作次数的快速合理设置,通过改进模糊关联挖掘算法改善了设备动作次数挖掘的整体计算效率,而增量挖掘的引入则进一步提高了目标挖掘的效率,使得参数的在线设置成为可能。从而减轻运行人员在无功优化在线控制中设备动作次数设置方面的诸多繁琐工作,在保证设置结果合理和精确的前提下实现了设备动作次数的快速挖掘和在线设置,以便于无功优化在线控制最终取得较好电压控制效果。

针对无功优化在线控制中关键参数(比如设备动作次数)设置繁琐且设置结果不易把握的问题,采用关联挖掘的方法,实现了无功优化中关键参数的自动精准辨识,具体通过对历史数据库采用关联挖掘获得不同设备的时段划分和时段内参数的设置结果,引入短期母线负荷预测数据并对预测曲线进行合理划分来获得设备的时段分区,其次对时段内负荷曲线和数据库中的相同时段内数据集进行相似度比较,最终通过时间段内数据库的关联挖掘得到参数的合理分配次数,从而实现无功优化在线控制中参数的自动合理设置。

在减轻运行人员工作强度的同时,也自动及时且合理设置了无功优化在线控制中参数,保证了关键参数设置结果的合理性和精确性,从而提高电网无功优化的整体控制效果,为电网无功优化在线控制效果的进一步提升提供一种切实可行的方法。

在本实施例中,如图2所示,所述步骤A-2包括:

A-2-1,读入母线负荷预测曲线数据;

A-2-2,设定母线负荷预测曲线的峰谷个数阀值N;

A-2-3,对所述母线负荷预测数据按升序排列,得到所述母线负荷预测数据的升序排列的集合S;

A-2-4,选取集合S中前F个数据存入集合SF中,其中,集合SF为包括了集合S中的数据的子集,在默认情况下F=3;

A-2-5,按所述A-2-3中所得的排列顺序,计算集合SF中两个数SFi,t和SFi+1,t之间的时间间隔,如果SFi,t-SFi+1,t≤δ(i=1,...,F-1),其中,δ为设定阀值,默认情况下δ=3,则成立且转入A-2-6,否则转入A-2-7,SFi,t表示集合SF中第i个数,SFi+1,t表示集合SF中第i+1个数;

A-2-6,在集合SF中删除SFi+1,t并补充SN+1进入集合SF,转入A-2-5,SN+1表示集合S中第N+1个数;

A-2-7,对所述母线负荷预测数据按降序排列,得到所述母线负荷预测数据的降序排列的集合J;

A-2-8,选取集合J中前G个数据存入集合JG中,其中,集合JF为包括了集合J中的数据的子集,在默认情况下G=2;

A-2-9,按顺序计算集合JG中两个数JGi,t和JGi+1,t之间的时间间隔,如果JGi,t-JGi+1,t≤δ(i=1,...,G-1),则成立且转入A-2-10,否则转入A-2-11,JGi,t和JGi+1,t分别表示集合JG中第i和i+1个数;

A-2-10,在集合JG中删除JGi+1,t并补充SN+1进入集合SF,转入A-2-9;

A-2-11,合并集合SF和JG,并按时间排序生成新的集合SHFi,t(i=1,...,G+F),并将集合SHFi,t中相邻两个数之间作为为一个时段划分,转入A-2-12;

A-2-12,所述步骤A-2结束。

在本实施例中,在所述步骤A-3中:所选取挖掘所需关联字段具体字段为:表示年月日的日期字段、表示当前时间的字段、表示有功负荷或者无功负荷的字段、表示母线电压值字段、表示变压器档位值字段、表示补偿设备投切状态。

在本实施例中,在所述步骤B-1中,被转换的字段属性包括:将“母线电压值”转换为“电压越线次数”和“电压偏差”;

将“变压器档位值”转换为“变压器动作次数”;

将“补偿设备投切状态”转换为“补偿设备动作次数”。

由于模糊关联规则挖掘中讨论的挖掘对象都为离散量,而本实施例的挖掘条件和属性中除了离散量外还有连续量,例如负荷,电压等都是连续量,因此为了能使用现有的关联规则挖掘算法,有必要对连续量进行离散化处理,将连续属性转变为离散属性通常需要对连续属性进行划分,采用模糊数学中隶属度函数能通过对属性的模糊化较好的避免了划分区间生硬的问题。本实施例对挖掘中各属性进行模糊化处理,其中有功和无功负荷采用图4(a)的三角形隶属度函数表示,电压偏差和电压越限次数采用图4(b)的三角形隶属度函数表示。在所述步骤B-3中,若采用模糊数学中隶属度函数将连续属性转变为离散属性,则各属性对应的模糊语言依次为:

有功和无功负荷定义为{很不相似(SN),不相似(N),有些相似(S),比较相似(B),非常相似(HB)};

母线电压偏差定义为{偏差较小(L),有一定偏差(M),偏差较大(H)};

电压越限次数定义为{无越限,越限次数较少,越限次数较多};

档位动作次数数定义为{较少,正常,较多};

电容器投切次数数定义为{较少,正常,较多}。

本实施例中,还通过将ED和DTW两种方法进行结合,重新设计了如图3所示一种相似度的比较方法:

通常的,集合间不同属性相似度的计算方法可以采用:

欧式距离Euclidenan(ED)的相似性比较的方法,其中,X,Y为两组序列。

m为序列长度,采用欧式距离计算方法对X,Y进行相似性的比对:

计算X,Y之间的距离D(X,Y)后,当D(X,Y)<δ(δ为给定阀值)时,可以判定两组时间序列相似。该方法计算直观简单,实现容易,但对噪声数据较为敏感且不易处理时间轴的形变问题。考虑到欧式距离在处理时间轴形变上的困难,动态时间弯曲距离DTW(DynamicTime Warping)能有效的解决时间轴形变问题,其主要思想为假设有两个时间序列X和Y

n,m分别是其长度,这里可以是n=m,也可以是n≠m,构造矩阵n×m矩阵D。矩阵中每一组值代表时间序列间点间的距离,当xn,ym之间越相似,其值越接近零;相反值越大。在DTW中各点的对应关系不再是一一对应,为了找到序列间最短距离,设置一个扭曲路径W,W=w1,w2,…,wk,…wK,同时max(m,n)≤K≤m+n+1

满足约束条件的两时间序列间的路径很多,但扭曲路径要求满足最小扭曲代价。

基于动态规划理论可知最小路径只需要对矩阵D做局部搜索,假设点(xi,yi)在最优路径上,则点(x1,y1)到点(xi,yi)的子路径也是矩阵最优解。因此最优路径可由起始点(x1,y1)到终点(xn,ym)之间通过递归搜索获得。定义两个序列中任意两点间的DTW距离定义为:

D(i,j)={d(xi,yj)2+[min{D(i-1,j-1),D(r-1,j),D(i,j-1)}]2}1/2(6)

这里d(xi,yj)表示欧式距离,从公式可以看出序列间两个点i,j之间的D(i,j)距离实际是(x1,y1)到(xi,yj)之间的最小累积距离。

由于ED和DTW在曲线相似性比对上都有各自的局限性,本实施例中挖掘对象为日负荷曲线,如果只采用ED进行相似度计算,考虑到日常运行中可能出现的数据缺失,在对历史数据库进行相似度比较时可能会出现较大的精度偏差,这对最终的关联挖掘结果会造成较大影响。但如果采用DTW,虽然在相似度的比对精度上会获得较大提升,但从计算效率来看,由于DTW计算的特点,当数据库采用整年或者多年的数据进行挖掘时,会造成计算量巨大,不利于实际应用。因此本发明首先对传统ED方法进行加权处理,消除曲线振幅平移和伸缩对时间序列相似性产生的影响。标准化的方法主要采用方差和均值进行归一化,假设序列X={x1,x2,…,xn),Y={y1,y2,…,yn)以序列X为例,该序列的均值为方差为D(X)=E(x2)-(E(x))2,标准化采用公式(7)

则原序列X变为X'={x1',x'2,…,x'n),Y变为Y'={y1',y'2,…,y'n),此时采用欧式距离计算两序列的相似度有如下公式:

尽管对序列进行标准化操作有利于序列间的相似度比较,但是在实际数据库中由于通道和数据维护等问题,数据库中常会出现时间点上数据丢失的情况,如果在时间序列比对的相似性计算中只采用标准化ED距离,对一些由于数据点丢失而导致的时间序列不匹配的情况,相似性计算结果可能会出现较大偏差,考虑到DTW在处理时间序列不匹配中的优势,本实施例将ED和DTW两种方法进行结合,重新设计了如图3所示一种相似度的比较方法,即在所述步骤B-2中,包括:

B-2-1,得到母线负荷预测的i个时段划分,并将i个时段内的数据保存到集合Gi中;

B-2-2,读取历史库记录,并存入集合D中,其中,“历史库”具体指存储历史数据的数据库,或者在存储器上开辟的存储历史数据的存储空间,其中主要记录了历史断面的电压,有功,无功,控制设备动作次数等作为历史数据的信息;

B-2-3,计算Gi集合内元素个数,并记为m_Gi

B-2-4,获得时段i内,所述集合D中第j条数据集合Dij,并计算Dij中元素个数,并记为m_Dij

B-2-5,判断m_Gi和m_Dij是否相等,如果m_Gi=m_Dij则采用标准化ED(Euclidenan,欧式距离)距离计算相似度,否则采用标准化DTW(Dynamic>

B-2-6,获得集合间的相似度,如果j<lj,max则令j=j+1,且转入B-2-4,否则转入B-2-7;

B-2-7,完成i时段内所有集合间相似度的计算;

B-2-8,如果i<li,max则令i=i+1,转入B-2-3,否则

转入B-2-9;

B-2-9,所述步骤B-2中的相似度计算结束。

在本实施例中,还提供一种无功优化控制中关键参数的快速挖掘方案,具体的,如图5所示,在所述步骤B-4中,采用快速挖掘算法进行挖掘(比如采用一种基于改进模糊关联规则的快速挖掘算法(Fast Mining Algorithms based on Improved Fuzzy AssociationRules,FMAIFAR)进行挖掘);

所述快速挖掘算法包括:

步骤B-4-1,输入数据集;

步骤B-4-2,利用选定的隶属度函数对所述数据集中属性内的数据进行模糊化处理;

步骤B-4-3,计算每个项集上对应模糊分区的模糊支持度;

步骤B-4-4,令k=1,并由最小支持度得到C1,L1

步骤B-4-5,利用项集L1,得到候选集C2;例如:由L1通过性质1,可以快速得到候选集C2

步骤B-4-6,当时,转入步骤B-4-7,否则转入步骤B-4-9;

步骤B-4-7,利用Lk得到Ck+1;例如:由Lk通过性质2,可快速得到Ck+1

步骤B-4-8,判定Lk+2是否为空,如果则转入步骤B-4-9,否则转入步骤B-4-7;例如:采用性质3可以快速判断Lk+2是否为空,如果则转入步骤B-4-9,否则转入步骤B-4-7;

步骤B-4-9,计算结束。

其中,性质1,性质2和性质3具体可以理解为:

尽管采用模糊关联规挖掘算法(Mining Algorithms based on FuzzyAssociation Rules,MAFAR)则能够较好的将属性模糊化并进行挖掘,但是该方法仍是采用类似Apriori算法的思想进行频繁集的挖掘和计算,因此也沿袭了Apriori算法的一些不足,尤其在计算频繁集的支持度以及生成候选集的时候,耗时较多,计算效率较低。针对以上两个问题,本发明对MAFAR进行改进,给出一种基于改进模糊关联规则的快速挖掘算法(Fast Mining Algorithms based on Improved Fuzzy Association Rules,FMAIFAR),通过引入频繁集的性质来简化挖掘中模糊支持度的计算以及项集间连接判断,提高挖掘效率。

性质1:对一个K-项集I,若包含I[1],I[2],...,I[K-1],I[k]的事务集合分别为T1,T2,...,Tk,则包含I的事务集合为性质1表明包含项集的事务集合等于包含该项集元素的事务交集。本文将这个性质引入模糊关联挖掘中,其主要思想是,在模糊关联挖掘中首先计算出频繁1项集L1,并根据L1进行重新排列,每一行包含项集以及项集对应的事物标识和模糊度值。在生成C2的时候对两个项集利用性质1进行分析求出交集,再根据L1进行模糊支持度的计算,这样每次计算支持度只要利用L1进行求解而不需要反复扫描原数据库,大量节省了计算时间。

性质2:一个频繁项目集的任意子集必定是频繁项目集。性质2表明当进行项集的连接操作时,可以通过子集来判断是否能生成频繁集。

性质3:若Lk能生成Lk+1,假设Lk中的项集个数为m,则必有m>k。性质3表明在判断是否能由Lk生成Lk+1时候,可以直接由Lk中的项集个数进行判断。

为了进一步说明挖掘过程,这里利用一个模糊化后的关联表实例来简要说明FMAIFAR的运行步骤,初始数据库如表1所示:

表1模糊化后的初始数据

首先挑选出满足(minsup=0.3)的项集得到候选集C1,按项集排列如表2所示

表2候选集C1

项集模糊支持度事务列表AH{0.8,0.7,0.1,0.9,0.7,0.8}{T1,T3,T4,T5,T7,T9}BM{0.8,0.5,0.9,0.7,0.1,0.8}{T1,T3,T5,T7,T8,T9}CM{0.7,0.6,0.8,0.9,0.8}{T1,T5,T6,T7,T10}DH{0.8,0.7,0.5,0.8,0.6}{T4,T5,T7,T8,T9}EH{0.8,0.9,0.9,0.8,0.5,0.6}{T1,T3,T5,T6,T7,T9}

根据C1求候选2-项集C2,这里以计算{AH,BM}的支持度为例,首先求包含{AH,BM}的事物集合:{T1,T3,T4,T5,T7,T9}∩{T1,T3,T5,T7,T8,T9}={T1,T3,T5,T7,T9},然后再根据C1中对应项集的模糊支持度求每个项集间的最小交集,得到sup{AH,BM}=0.37,采用同样的方法可以计算所有的2-项集,得到候选2-项集合C2,并根据模糊支持度得到频繁2-项集L2,如表3所示:

表3频繁集L2

项集AH,BMAH,CMAH,EHBM,CMBM,EHCM,EH模糊支持度0.370.300.350.300.330.31

可以看出通过性质1的引入,支持度的计算得到了简化,所有支持度的计算只要在C1项集中进行扫描即可,而C1相比初始数据库进行了大量的冗余信息的删减,因此计算速度加快,随着数据库事物数据的增加,简化计算的效果将更加明显。

在得到L2之后,对L2进行连接操作得到候选3-项集,连接后C3表示为:C3={(AH,BM,CM),(AH,BM,EH),(AH,CM,EH),(AH,BH,EH),(BM,CM,EH),(BM,CM,EH)},对C3进行剪枝得到候选3-项集C'3={(AH,BM,CM),(AH,CM,EH),(BM,CM,EH)},显然采用连接来生成频繁3-项集要经过连接和减枝,并且需要扫描初始数据库,当数据量较大时计算十分耗时。本文通过引入性质2,可以快速得到频繁3-项集,具体做法是:对L2中第一项相同的项集进行组合,例如对{(AH,BM),(AH,CM)},此时只要判断(BM,CM)∈L2,如果成立则(AH,BM,CM)必为频繁3-项集,因为所有的子项都是频繁项集。因此只要通过3步判断,就能得到C3,且不需要重新扫描初始数据库,只要扫描L2即可。最后由L3生成L4的时候,可以直接使用性质3,由于L3中项集的个数为L3=3<4,因此不用判断直接可以得到通过以上的分析可以知道,将三个性质引入到模糊关联挖掘中能够提高计算效率,具体算法的步骤如图5所示。

通过引入短期母线负荷预测数据并对预测曲线按给定峰谷阀值进行划分,从而获得设备的时段分区,其次对时段内负荷曲线和数据库中的相同时段内数据集进行相似度比较,最终通过改进的模糊关联快速挖掘算法得到参数的合理分配次数,从而实现无功优化在线控制中参数的自动合理设置,在减轻运行人员工作强度的同时提高了无功优化在线控制的效果。

进一步的,在本实施例中,还提供一种基于规则筛选策略的无功优化关键参数辨识方案,如图6所示的,通过采用关联挖掘方法挖掘强关联规则,并结合强关联规则筛选策略有效的剔除强关联规则中冗余规则,实现了无功优化中关键参数的自动精准辨识。

具体在所述步骤B-6中,采用强关联规则筛选策略进行规则筛选,包括:

先根据属性间的优先级关系,再根据属性内的优先级关系,对挖掘获得的强关联规则集合按优先级关系进行逐条筛选,获得筛选后的强关联规则并输出。

其中:

属性间的优先级包括:有功负荷(PSN)>电压越线次数>无功负荷>电压偏差;

属性内的优先级包括:有功很不相似<有功不相似<有功有些相似<有功比较相似<有功非常相似、无功很不相似<无功不相似<无功有些相似<无功比较相似<无功非常相似、母线电压偏差较大<母线电压有一定偏差<母线电压偏差较小、越限次数较多<越限次数较少<无越限、档位动作次数较多<档位动作次数正常<档位动作次数较少、电容器投切次数较多<电容器投切次数正常<电容器投切次数较少。

本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于设备实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求的保护范围为准。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号