首页> 中国专利> 一种面向新增电网资源的CIM模型扩展方法及装置

一种面向新增电网资源的CIM模型扩展方法及装置

摘要

本发明实施例公开了一种面向新增电网资源的CIM模型扩展方法及装置,本发明先通过对IEC标准进行提取得到训练数据,根据该训练数据构建一个分类器,然后将新型电网资源相关的新增数据放入此分类器得到新增电网资源的类标记,即新增电网资源应该所属分类的结果,以此结果作为新增资源在原有CIM模型的扩展位置,最终完成模型扩展,进而为电网一二次系统统一建模提供理论支持,有利于提升电力系统调度与控制的智能化水平。

著录项

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2020-06-02

    授权

    授权

  • 2018-03-20

    实质审查的生效 IPC(主分类):G06K9/62 申请日:20171017

    实质审查的生效

  • 2018-02-23

    公开

    公开

说明书

技术领域

本发明涉及电网一二次系统统一建模领域,尤其涉及一种面向新增电网 资源的CIM模型扩展方法及装置。

背景技术

随着智能电网技术的不断深入发展,电力系统已逐渐形成了一张集能量 流、业务流和信息流相结合的智能化网络。能量流反映了发电厂、传输线路、 变电站、用户之间电能量流动;业务流反映电能量传递过程中各个阶段的业 务流转,如发电厂的AGC、脱硫业务,传输过程中超高压、交直流输电、雷 电定位、在线监测业务,变电站内的保护等业务,用户侧的配电、营销、计 量等业务;信息流反映了EMS、DMS、WAMS、AGC、TMR、GIS、营销自 动化等各个业务系统之间的信息传递,这些信息基于各自的标准,如 IEC61970/61968/61850等。能量流、业务流是支撑电网安全稳定运行的基础, 信息流则是贯通电力系统各专业数据和信息互通互联的纽带,是能量流、业 务流能够正常流转的必要条件。

随着智能电网背景下电力系统新技术、新特征的不断涌现,造成传统的 能量流、业务流发生了巨大的转变。新能源接入等新需求导致能量流在发、 输、变、配、用各环节的流转更加复杂,增加了对整个电网监控和预测的难 度;下游业务对上游业务的需求和依赖度越来越高,任何一项工作均需全盘 考虑电力系统运行的整体情况,这就使得各项生产业务之间紧密互联的需求 日益增加;信息流作为能量流、业务流的重要支撑,则决定了各业务系统间 互联与交互所必须的模型、数据、图形等基础条件。随着电网规模的日益增 大和二次一体化的不断推进,电网自动化系统逐步向一体化、智能化方向发 展,这对电力系统信息流高效流转提出了更高的挑战。

然而,目前仍存在着异构系统开放性需求与交互标准不统一之间的矛盾。 国际电工委员会(IEC,International Electrotechnical Commission)的不同工作 组定义不同的应用集之间的信息交换标准,不同类型的电力应用采用不同的 接口标准,如IEC61970系列标准适用于调度主站端EMS系统,IEC61968适 用于配电自动化及用户侧的信息交换,而IEC61850提出了一种公共的通信标 准,并通过对设备的一系列规范化,使其形成一个规范的输出,实现变电站 内系统的无缝连接。各个标准之间需进行消息映射和转换才能进行信息交互。 作为开放性的电网公司,接纳不同的厂家、异构的系统在企业内共存。同时 也造成各个厂家的大量异构系统所采用的标准不统一,无法实时进行友好的 互通。

考虑到目前电力系统运行的传统设备已有完整CIM建模规范,因此对新 增资源的电网系统模型扩展要严格纳入已有的UML模型框架中,可以将其看 作在部分CIM规则下对待扩展的模型进行分类,由于原始模型框架的相对复 杂程度,该过程属于多类分类问题,而该过程中在构造复杂高维判别函数的 困难程度大,影响了模型拓展的效率。

因此,提供一种方法以解决当前CIM模型拓展中对待扩展的模型进行分 类的过程存在的复杂高维判别函数的构造困难程度大,影响模型拓展的效率 的技术问题。

发明内容

本发明实施例提供了一种面向新增电网资源的CIM模型扩展方法及装 置,解决了当前CIM模型拓展中对待扩展的模型进行分类的过程存在的复杂 高维判别函数的构造困难程度大,影响模型拓展的效率的技术问题。

本发明实施例提供了一种面向新增电网资源的CIM模型扩展方法,包括:

S1:根据获取到的提取指令对IEC标准进行原CIM模型的信息提取,得 到训练数据;

S2:根据训练数据和预置分类准则构造分类器;

S3:对获取到的新增电网资源进行特征提取,得到新增数据;

S4:通过分类器对新增数据进行分类,得到新增电网资源的类标记;

S5:根据新增电网资源的类标记确定新增电网资源在原CIM模型中的拓 展位置并对原CIM模型进行拓展,得到拓展后的CIM模型。

优选地,步骤S1具体包括:

根据获取到的提取指令对IEC61970标准进行原CIM模型的信息提取, 得到原CIM模型的资源的5维特征向量和原CIM模型的资源的类标记,并将 原CIM模型的资源的5维特征向量和原CIM模型的资源的类标记进行合并得 到训练数据。

优选地,步骤S3具体包括:

对获取到的新增电网资源进行特征提取,得到新增电网资源的5维特征 向量;

步骤S4为:通过分类器对新增电网资源的5维特征向量进行分类,得到 新增电网资源的类标记。

优选地,根据获取到的提取指令对IEC61970标准进行原CIM模型的信 息提取,得到原CIM模型的资源的5维特征向量和原CIM模型的资源的类标 记具体包括:

S11:获取到对IEC61970标准的提取指令;

S12:对原CIM模型的资源进行资源模型类别的提取,并将得到的资源类 型确定为第一分量,其中,资源模型类别为稳态模型或暂态模型;

S13:对原CIM模型的资源进行资源属性的提取,并将得到的资源属性 确定为第二分量,其中,资源属性为电网能量流资源或电网信息流资源或通 用资源或辅助资源;

S14:对原CIM模型的资源进行第一设备类别的提取,并将得到的第一 设备类别确定为第三分量,其中,第一设备类别为主设备或量测设备或辅助 设备或通用设备;

S15:对原CIM模型的资源进行第二设备类别的提取,并将得到的第二 设备类别确定为第四分量,其中,第二设备类别为导电设备或非导电设备或 二次设备;

S16:对原CIM模型的资源进行第三设备类别的提取,并将得到的第三 设备类别确定为第四分量,其中,第三设备类别为安全设备或网络设备或控 制设备或时间设备;

S17:根据第一分量、第二分量、第三分量、第四分量和第五分量生成原 CIM模型的资源的5维特征向量,并得到原CIM模型的资源的类标记。

优选地,分类器为决策树。

优选地,本发明实施例还提供了一种面向新增电网资源的CIM模型扩展 装置,包括:

第一提取单元,用于根据获取到的提取指令对IEC标准进行原CIM模型 的信息提取,得到训练数据;

构造单元,用于根据训练数据和预置分类准则构造分类器;

第二提取单元,用于对获取到的新增电网资源进行特征提取,得到新增 数据;

分类单元,用于通过分类器对新增数据进行分类,得到新增电网资源的 类标记;

拓展单元,用于根据新增电网资源的类标记确定新增电网资源在原CIM 模型中的拓展位置并对原CIM模型进行拓展,得到拓展后的CIM模型。

优选地,第一提取单元还用于根据获取到的提取指令对IEC61970标准进 行原CIM模型的信息提取,得到原CIM模型的资源的5维特征向量和原CIM 模型的资源的类标记,并将原CIM模型的资源的5维特征向量和原CIM模型 的资源的类标记进行合并得到训练数据。

优选地,第二提取单元还用于对获取到的新增电网资源进行特征提取, 得到新增电网资源的5维特征向量;

分类单元还用于通过分类器对新增电网资源的5维特征向量进行分类, 得到新增电网资源的类标记。

优选地,第一提取单元包括:

获取子单元,用于获取到对IEC61970标准的提取指令;

第一提取子单元,用于对原CIM模型的资源进行资源模型类别的提取, 并将得到的资源类型确定为第一分量,其中,资源模型类别为稳态模型或暂 态模型;

第二提取子单元,用于对原CIM模型的资源进行资源属性的提取,并将 得到的资源属性确定为第二分量,其中,资源属性为电网能量流资源或电网 信息流资源或通用资源或辅助资源;

第三提取子单元,用于对原CIM模型的资源进行第一设备类别的提取, 并将得到的第一设备类别确定为第三分量,其中,第一设备类别为主设备或 量测设备或辅助设备或通用设备;

第四提取子单元,用于对原CIM模型的资源进行第二设备类别的提取, 并将得到的第二设备类别确定为第四分量,其中,第二设备类别为导电设备 或非导电设备或二次设备;

第五提取子单元,用于对原CIM模型的资源进行第三设备类别的提取, 并将得到的第三设备类别确定为第四分量,其中,第三设备类别为安全设备 或网络设备或控制设备或时间设备;

生成子单元,用于根据第一分量、第二分量、第三分量、第四分量和第 五分量生成原CIM模型的资源的5维特征向量,并得到原CIM模型的资源的 类标记。

优选地,分类器为决策树。

从以上技术方案可以看出,本发明实施例具有以下优点:

本发明实施例提供了一种面向新增电网资源的CIM模型扩展方法及装 置,其中,该方法包括:S1:根据获取到的提取指令对IEC标准进行原CIM 模型的信息提取,得到训练数据;S2:根据训练数据和预置分类准则构造分 类器;S3:对获取到的新增电网资源进行特征提取,得到新增数据;S4:通 过分类器对新增数据进行分类,得到新增电网资源的类标记;S5:根据新增 电网资源的类标记确定新增电网资源在原CIM模型中的拓展位置并对原CIM 模型进行拓展,得到拓展后的CIM模型。本发明先通过对IEC标准进行提取 得到训练数据,根据该训练数据构建一个分类器,然后将新型电网资源相关 的新增数据放入此分类器得到新增电网资源的类标记,即新增电网资源应该 所属分类的结果,以此结果作为新增资源在原有CIM模型的扩展位置,最终 完成模型扩展,进而为电网一二次系统统一建模提供理论支持,有利于提升 电力系统调度与控制的智能化水平。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实 施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面 描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲, 在不付出创造性劳动性的前提下,还可以根据这些附图获得其它的附图。

图1为本发明实施例提供的一种面向新增电网资源的CIM模型扩展方法 的一个实施例的流程示意图;

图2为本发明实施例提供的一种面向新增电网资源的CIM模型扩展方法 的一个实施例的流程示意图;

图3为本发明实施例提供的一种面向新增电网资源的CIM模型扩展装置 的一个实施例的结构示意图;

图4为电网公共信息模型规范CIM包的示意图;

图5(a)和图5(b)为应用例中属性x5的元组划分示意图。

具体实施方式

本发明实施例提供了一种面向新增电网资源的CIM模型扩展方法及装 置,解决了当前CIM模型拓展中对待扩展的模型进行分类的过程存在的复杂 高维判别函数的构造困难程度大,影响模型拓展的效率的技术问题。

为使得本发明的发明目的、特征、优点能够更加的明显和易懂,下面将 结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整 地描述,显然,下面所描述的实施例仅仅是本发明一部分实施例,而非全部 的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性 劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。

请参阅图1,本发明实施例提供的一种面向新增电网资源的CIM模型扩 展方法的一个实施例,包括:

101、根据获取到的提取指令对IEC标准进行原CIM模型的信息提取, 得到训练数据;

102、根据训练数据和预置分类准则构造分类器;

103、对获取到的新增电网资源进行特征提取,得到新增数据;

104、通过分类器对新增数据进行分类,得到新增电网资源的类标记;

105、根据新增电网资源的类标记确定新增电网资源在原CIM模型中的拓 展位置并对原CIM模型进行拓展,得到拓展后的CIM模型。

在本实施例中,步骤103和步骤102并不存在先后时序关系,可同时进 行,亦可不同时进行。

本发明先通过对IEC标准进行提取得到训练数据,根据该训练数据构建 一个分类器,然后将新型电网资源相关的新增数据放入此分类器得到新增电 网资源的类标记,即新增电网资源应该所属分类的结果,以此结果作为新增 资源在原有CIM模型的扩展位置,最终完成模型扩展,进而为电网一二次系 统统一建模提供理论支持,有利于提升电力系统调度与控制的智能化水平。

以上为一种面向新增电网资源的CIM模型扩展方法的一个实施例,为进 行更具体的说明,下面提供一种面向新增电网资源的CIM模型扩展方法的另 一个实施例,请参阅图2,本发明提供的一种面向新增电网资源的CIM模型 扩展方法的另一个实施例,包括:

201、根据获取到的提取指令对IEC61970标准进行原CIM模型的信息提 取,得到原CIM模型的资源的5维特征向量和原CIM模型的资源的类标记, 并将原CIM模型的资源的5维特征向量和原CIM模型的资源的类标记进行合 并得到训练数据;

步骤201中的根据获取到的提取指令对IEC61970标准进行原CIM模型 的信息提取,得到原CIM模型的资源的5维特征向量和原CIM模型的资源的 类标记具体包括:

2011、获取到对IEC61970标准的提取指令;

2012、对原CIM模型的资源进行资源模型类别的提取,并将得到的资源 类型确定为第一分量,其中,资源模型类别为稳态模型或暂态模型;

2013、对原CIM模型的资源进行资源属性的提取,并将得到的资源属性 确定为第二分量,其中,资源属性为电网能量流资源或电网信息流资源或通 用资源或辅助资源;

2014、对原CIM模型的资源进行第一设备类别的提取,并将得到的第一 设备类别确定为第三分量,其中,第一设备类别为主设备或量测设备或辅助 设备或通用设备;

2015、对原CIM模型的资源进行第二设备类别的提取,并将得到的第二 设备类别确定为第四分量,其中,第二设备类别为导电设备或非导电设备或 二次设备;

2016、对原CIM模型的资源进行第三设备类别的提取,并将得到的第三 设备类别确定为第四分量,其中,第三设备类别为安全设备或网络设备或控 制设备或时间设备;

2017、根据第一分量、第二分量、第三分量、第四分量和第五分量生成 原CIM模型的资源的5维特征向量,并得到原CIM模型的资源的类标记。

202、根据训练数据和预置分类准则构造分类器;

在本实施例中,该分类器为决策树。

203、对获取到的新增电网资源进行特征提取,得到新增电网资源的5维 特征向量;

204、通过分类器对新增电网资源的5维特征向量进行分类,得到新增电 网资源的类标记;

205、根据新增电网资源的类标记确定新增电网资源在原CIM模型中的拓 展位置并对原CIM模型进行拓展,得到拓展后的CIM模型。

上面是对一种面向新增电网资源的CIM模型扩展方法进行的详细说明, 为便于理解,下面将以一具体应用场景对一种面向新增电网资源的CIM模型 扩展方法的应用进行说明,应用例包括:

(1)准备电网模型分类器训练数据

对于电网模型分类问题来说,原始数据是以UML建模语言描述的面向对 象逻辑体系,涉及到大量的属性继承和类与类之间的关联,这些面向对象的 模型描述在遇到实际电力设备时可以方便的从子类中进行实例化,但对于分 类器而言,继承关系很难直接作为训练与检验数据的属性,构造训练数据集 与检验数据集的关键在于如何从UML建模中提取待分类数据的有用特征。

特征选择是模型扩展分类中的一个关键问题,在此所要面对的根本任务 是如何从大量的继承关系中找出最有效的特征。为了实现扩展模型与原有 CIM模型的无缝融合,在特征提取时用尽可能少量的属性集有效地描述数据 元组,避免过多的属性存在其中导致分类器的性能的降低,另一方面也会由 于大量无效或是意义较少的属性会造成学习生成的规则可解释性变差。

在进行电网模型分类器训练时采用的训练数据集和检验数据集都来自于IEC61970标准的“CIM-schema-cim10”版本,以规范中确定CIM包划分为框架 抽象出数据的有效属性集合。对电网模型中的对象属性选取以5维特征向量 描述。

CIM包是一种将相关模型原件分组的通用办法,包的选择在于使模型更 易于设计和理解,规范中电网公共信息模型由相对完整的一组包构成,模型 扩展的目的一方面在于将新增设备的实例抽象出类属性,归入到合适CIM包 中的子类叶子节点,将公共属性进行泛化实现继承,另一方面可以考虑新增 独立的CIM纳入整个模型体系的框架,完善电网模型结构。对于CIM/UML 模型实例化出来实体,可以具有越过许多包边界的关联,但这并不影响模型 对叶子节点子类的归属,因此一般而言不会将关联抽象成部分属性用来训练 分类器。电网公共信息模型规范CIM包见图4所示。

电网公共信息模型规范CIM包划分:

-核心包(Core)

-域包(Domain)

-发电包(Generation)

-负荷模型包(LoadModel)

-量测包(Meas)

-停运包(Outage)

-保护包(Protection)

-拓扑包(Topology)

-电线包(Wires)

-SCADA包(SCADA)

-计量包(Metering)

-通用包(Common)

-辅助设备包(AuxiliaryEquipment)

-暂态模型包(Dynamics)

从以上CIM包划分可以看出除暂态模型包(Dynamics)外所有包都继承 与Core包,Core包不依赖于任何其他的包,其他包中的大部分都依赖于Core 包的关联和普遍化。但从分类属性提取的角度上看,Core包与Dynamics包没 有对应关系,这种划分不利于构造模型属性向量,考虑到传统CIM模型用于 描述电网资源的稳态(SteadyState)部分,因此将特征属性向量X的第1个分 量x1选取为该对象模型属于稳态模型还是属于暂态模型。域包(Domain)是>

拓扑包(Topology)是Core包的扩展包,用于建立电网资源的连接性(Connectivity)模型,虽然Topology定义与其它的电气特性无关,但是对于 区分电网能量流/信息流资源和通用/辅助资源属于关键属性,因此在此处考虑 将其作为属性向量X的第2个分量x2

随着电网资源的划分,特征属性向量的后面几个分量与已选定属性分量 的无关性逐渐减弱,在特征属性向量的维数较高时可以考虑采用一定的技术 (如相关分析)来识别任意两个给定的属性是否是统计相关,这对于提升分 类器的性能具有一定的好处,但在电网模型分类的应用场景下由于将关联属 性融合隐藏部分信息,会造成分类规则的可解释性变差,因此在选择属性分 量的时候暂不考虑采用相关分析等技术来简化数据元组。对于属性向量X的 第3个分量x3的选定可以考虑从CIM包的继承关系来实现,但是在面对实际电网资源寻找特征属性值时就要结合x2来给出。在选择训练数据集时要保证>3的选择上要枚举所有的属性,对于规范中的CIM包进行合理的>3的枚举属性值如下

x3∈{MainEquipment,Meas,AuxiliaryEquipment,Common}

采用三维特征属性向量描述电力设备资源只能构建出复杂电力系统模型 的基本框架,对于分析电力资源对象的详细特征还远远不够,因此尚需引入 属性向量X的第4个特征分量x4,在构造x4时不仅要考虑是否能够反映CIM>4的枚举属性值如下

x4∈{ConductingEquipment,non-ConductingEquipment,

SecondaryEquipment}

其中,Conductiong Equipment指电网承载能量流的资源,常见的 Equipment都应归属与此类;SecondaryEquipment指电网承载信息流的相关资 源,主要包含常规的二次设备及与电网业务流相关的部分电网资源; non-ConductingEquipment指与电力系统能量流和信息流无关且不属于辅助设 备的资源,如TowerPSR和PolePSR(杆塔类)等。

多分类的属性导致训练出来的分类器包含的分类规则呈指数形式增长, 因此不宜将特征向量的维数选取过多。考虑到实际应用的需求,在特征属性 向量中扩展第5个分量x5,通过关联其继承的父类节点的特征范围,其选择>5作为主要分裂>5的离散取值范围较大,因此此处只给>

{SafeRelevant,NetRelevant,…

ControlRelevant,TimeRelevant,…

……}

由于有些资源不属于任何已有子类的继承,因此对于某些属性值需用 NULL填充,在此NULL不代表空值,而是说明此属性不影响分类的选择。基 于此就可以确定一个电力系统资源对象的属性数据元组X,比如厂矿企业用 电负荷就以用X=(SteadyState,non-Topology,MainEquipment, ConductingEquipment,IndustrialCustomerRelevant)这样的5维特征向量来描 述,分类时应该分入LoadModel中,同时对于站用空调来说,可以用特征向 量X=(SteadyState,non-Topology,AuxiliaryEquipment,ConductingEquipment,StationCustomerRelevant)描述,同样也可以划分为LoadModel中,虽然二者的 特征属性不同,但是类标记都为LoadModel。但是当建模考虑关注对象不同 时,比如考虑站用空调的远程控制从而改变空调设定温度,其特征向量就变 为X=(SteadyState,non-Topology,AuxiliaryEquipment,SecondaryEquipment, SetRelevant),类标记应为RomotePoint。

将标准CIM模型包括的子类(如设备、量测)等进行拆解,分别构造训 练数据集与检验数据集,从而验证分类器在给定检验集上的准确率。由于通 过标准CIM模型构造的训练数据集不存在异常点和错误点,因此不存在过拟 合的问题。确定训练数据与检验数据的特征属性后,就可以为后续步骤构造 数据划分的分类器做好准备。

(2)设定构造分类决策树使用的信息增益分裂准则

分裂准则即属性选择度量,将给定的类标记训练原则按照一定评价准则 分成个体类的方法,分裂准则决定给定节点上的元组如何分裂。

属性选择度量的选定要与分类器应用场景有关,在电网模型分类过程中, 分类器对训练数据的识别不能与CIM模型的固有关系相冲突,因此要使每个 划分是纯粹的,即落在给定划分的所有元组都属于相同的类。使用信息增益 作为属性选择度量,选择具有最高信息增益的属性做节点的分裂属性,从而 反映当前划分的最小随机性。这种方法使对给定元组分类所需的期望测试数 目最小,并确保找到一颗简单的决策树。

对于D中的元组分类所需的期望信息由下式给出:

其中,pi是D中任意元组属于类Ci的概率,并用|Ci,D|/|D|估计,Info(D)>

假设需要按属性A划分D中的元组,其中属性A根据训练数据的观测具 有v个不同的取值{a1,a2,…,av},由于A是离散取值,这些值直接对应于A上>1,D2,…,Dv},其中>j包含D中的元组,它们在A上具有值aj,这些划分将对应于从节点N生成>

其中,|Dj|/|D|充当第j个划分的权重,InfoA(D)是基于按A划分对D的元>A(D)。其中,Gain(A)>A(D)。

表1给出一个类标记的元组训练集D的简单示例,为说明信息增益准则 的计算过程,提取了类标记有两个不同值{LoadModel,RomoteSet}的例子,设 类C1对应于LoadModel,而类C2对应于RomoteSet。类LoadModel有4个元>

表1类标记的训练元组

由D中的元组创建根节点N,为了找出这些元组的分裂准则,必须计算 每个属性的信息增益,首先应计算D中元组分类所需的期望信息:

接下来计算每个属性的期望信息需求,需要对每个属性观察LoadModel 和RomoteSet元组的分布。比如对于x3的MainEquipment属性有2个>3划分,则对D中的>

因此,这种划分的信息增益是

类似的,可以计算Gain(x1)=0.127bit,Gain(x2)=0.128bit,Gain(x4)=0.182bit,>5)=0.520bit,由于x5在属性中具有最高信息增益,被选作分裂属性。节点N用x5标记,并对于每个属性值生长出一个分枝,然后元组据此划分,如>

属性x5具有最高信息增益,因此成为决策树根节点的分裂属性。x5的每>

(3)生成电网模型分类决策树

分类器与决策树具有相同的逻辑结构,因此可以将多级分类器的构造归 为决策树归纳的范畴。决策树是从类标记的训练元组学习获得,其每个内部 节点表示在一个属性上的测试,每个分枝代表一个测试输出,而每个树叶存 放一个类标号,树的最顶层节点是根节点。给定一个类标号未知的元组X, 在决策树上测试元组的属性值,跟踪一条由根节点到叶节点的路径,该叶节 点就存放着该元组的类预测。由于决策树的构造不需要任何领域知识或参数 设置,因此适合于电网CIM模型扩展这类探测式的知识发现过程。

由于训练数据取自于电网公共信息模型规范,不存在噪声点和离群点数 据,因此决策树以自顶向下递归的方式构造,从训练元组集和他们的相关联 的类标号开始构造决策树,随着决策树的构建,训练集递归地划分成较小的 子集。

决策树以自顶向下递归的方式构造,从训练元组集和他们的相关联的类 标号开始构造决策树,随着决策树的构建,训练集递归地划分成较小的子集。 具体步骤如下所述。

1)创建一个节点N;

2)如果训练数据D中元组属同一类C,则返回N作为叶节点,以类C 标记;

3)如果候选属性集合为空,则返回N作为叶节点,标记为D中的多数类;

4)使用分裂准则确定分裂属性,用分裂属性标记节点N;

5)在候选属性集合中删去已确定的分裂属性;

6)对每个分裂属性,定义Dj为D中满足分裂属性的数据元组集合,如>j为空,则添加一个叶节点到节点N,标记为D中的多数类,否则添加一>

7)返回N。

由于电网已建模资源和待扩展资源并不是一无所知的,因此通过分析待 扩展建模的电网资源,合理选择训练数据集,即在公共信息模型规范中提取 出可包含待扩展模型资源的部分构造训练数据集,有效的减少了构造训练集 的工作量的同时,也可以提高分类决策树的性能。

(4)对待扩展建模的电网资源进行分类

对新增电网资源特征进行提取,形成与分类器训练数据同样维度的特征 向量数据元组,利用上述步骤已生成的决策树对新增电网资源的描述数据元 组进行分类,最终获得新增电网资源的类标记。

例如,对二次自动化系统安全防护设备相关新增电网资源进行建模,考 虑在模型中扩展IPS(Intrusion Prevention System)入侵防御系统的时候,基 于已有的专业背景知识得到一个5维特征向量XIPS=(SteadyState,non-Topology,>IPS输入分类>

(5)根据分类标记确定电网模型扩展位置步

在获取到待分类电网资源数据元组的类标记后,对应在CIM模型中确定 新增电网模型的子类归属,从而确定在已有CIM框架中的扩展点,让新增电 网资源继承其父类对象的属性并扩展自身特有的属性,最终实现模型融合。

例如,上述入侵防御系统IPS与防火墙、隔离装置等装置具有相同的类 标记,其父类抽象为信息安防装置,基于分类结果可在CIM模型中在信息安 防装置中进行扩展,入侵防御系统IPS的CIM模型对象继承信息安防装置属 性,并增加反映自身特性的属性,最终实现入侵防御系统IPS此类新增电网 资源的CIM模型扩展。

请参阅图3,本发明实施例还提供了一种面向新增电网资源的CIM模型 扩展装置,包括:

第一提取单元301,用于根据获取到的提取指令对IEC标准进行原CIM 模型的信息提取,得到训练数据;

构造单元302,用于根据训练数据和预置分类准则构造分类器;

第二提取单元303,用于对获取到的新增电网资源进行特征提取,得到新 增数据;

分类单元304,用于通过分类器对新增数据进行分类,得到新增电网资源 的类标记;

拓展单元305,用于根据新增电网资源的类标记确定新增电网资源在原 CIM模型中的拓展位置并对原CIM模型进行拓展,得到拓展后的CIM模型。

在本实施例中,第一提取单元301还用于根据获取到的提取指令对 IEC61970标准进行原CIM模型的信息提取,得到原CIM模型的资源的5维 特征向量和原CIM模型的资源的类标记,并将原CIM模型的资源的5维特征 向量和原CIM模型的资源的类标记进行合并得到训练数据。

在本实施例中,第二提取单元303还用于对获取到的新增电网资源进行 特征提取,得到新增电网资源的5维特征向量;

分类单元304还用于通过分类器对新增电网资源的5维特征向量进行分 类,得到新增电网资源的类标记。

在本实施例中,第一提取单元301包括:

获取子单元3011,用于获取到对IEC61970标准的提取指令;

第一提取子单元3012,用于对原CIM模型的资源进行资源模型类别的提 取,并将得到的资源类型确定为第一分量,其中,资源模型类别为稳态模型 或暂态模型;

第二提取子单元3013,用于对原CIM模型的资源进行资源属性的提取, 并将得到的资源属性确定为第二分量,其中,资源属性为电网能量流资源或 电网信息流资源或通用资源或辅助资源;

第三提取子单元3014,用于对原CIM模型的资源进行第一设备类别的提 取,并将得到的第一设备类别确定为第三分量,其中,第一设备类别为主设 备或量测设备或辅助设备或通用设备;

第四提取子单元3015,用于对原CIM模型的资源进行第二设备类别的提 取,并将得到的第二设备类别确定为第四分量,其中,第二设备类别为导电 设备或非导电设备或二次设备;

第五提取子单元3016,用于对原CIM模型的资源进行第三设备类别的提 取,并将得到的第三设备类别确定为第四分量,其中,第三设备类别为安全 设备或网络设备或控制设备或时间设备;

生成子单元3017,用于根据第一分量、第二分量、第三分量、第四分量 和第五分量生成原CIM模型的资源的5维特征向量,并得到原CIM模型的资 源的类标记。

在本实施例中,分类器为决策树。

所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描 述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应 过程,在此不再赘述。

在本申请所提供的几个实施例中,应该理解到,所揭露的系统,装置和 方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示 意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可 以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个 系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间 的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合 或通信连接,可以是电性,机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作 为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方, 或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或 者全部单元来实现本实施例方案的目的。

另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中, 也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单 元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单 元的形式实现。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售 或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本 发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的 全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个 存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机, 服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步 骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘 等各种可以存储程序代码的介质。

以上所述,以上实施例仅用以说明本发明的技术方案,而非对其限制; 尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应 当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其 中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案 的本质脱离本发明各实施例技术方案的精神和范围。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号