首页> 中国专利> 可解释性电网作业风险评估方法与装置

可解释性电网作业风险评估方法与装置

摘要

本发明公开了一种可解释性电网作业风险评估方法,包括:S1、将电网作业风险管控规则中的每一个规则进行处理得到风险管控元组,利用风险管控元组组成电网作业风险管控知识库;S2、将电网作业内容进行处理得到电网作业内容元组;S3、将步骤S2中的电网作业内容元组在步骤S1中的电网作业风险管控知识库中推理确定该电网作业内容元组对应的风险管控元组集合;S4、根据步骤S3中风险管控元组集合取风险等级最高者作为该条电网作业内容的风险等级输出,并输出对应的风险管控元组集合。本发明同时还提供一种可解释性电网作业风险评估装置,能够有效地进行电网作业的风险管控;另一方面使风险等级的确定具有可解释性。

著录项

  • 公开/公告号CN113111189A

    专利类型发明专利

  • 公开/公告日2021-07-13

    原文格式PDF

  • 申请/专利权人 上海弘玑信息技术有限公司;

    申请/专利号CN202110410345.4

  • 发明设计人 王健;袁野;

    申请日2021-04-16

  • 分类号G06F16/36(20190101);G06F40/247(20200101);G06F40/295(20200101);G06Q10/06(20120101);G06Q50/06(20120101);

  • 代理机构32346 江苏瑞途律师事务所;

  • 代理人徐倩

  • 地址 200232 上海市徐汇区凯滨路183号保利西岸中心B座801室

  • 入库时间 2023-06-19 11:49:09

说明书

技术领域

本发明属于电网调度运行安全技术领域,更具体地说,涉及一种可解释性电网作业风险评估方法与装置。

背景技术

在电网企业中,为确保电能的有效安全输送,设备、线路等的施工作业是核心。不同的设备、线路,不同的作业有不同的施工风险,例如,对于施工风险的划分可以划分为:高风险、中风险、低风险及可接受风险,或者:高风险、中风险、低风险等;不同风险等级的作业在作业计划中被分配不同的管理级别。因而做好风险评估对于电网作业是一项很重要的工作。现有技术中通常采用两种方式来进行风险评估,一是人工根据经验编制作业风险管控规则,作业计划人员依据风险管控规则进行作业风险评估,这种方式存在的问题在于:由于电网作业中风险管控规则较多,只有非常有经验的作业计划人员才能熟悉和套用这些规则;而通常情况下作业计划人员的能力参差不齐,往往会造成风险评估不准确,不利于风险管控,进而造成出现作业不安全的现象,存在极大的安全隐患。

另一个方法是根据作业描述文本和以及标注的风险等级数据,训练一个分类器,用分类器进行作业风险评估。如申请公布日为2018年11月23日,申请公布号为CN108876207A,专利名称为作业风险评估方法、装置、计算机设备和存储介质的中国专利公开了一种技术方案,包括:获取作业类型,根据作业类型获取对应的基准值和现场作业风险评估模型;根据层次分析法确定现场作业风险评估模型中各维度的权重,根据现场作业风险评估模型中各维度的风险影响因素评分以及对应维度的权重得到作业类型对应的动态影响因素分值;根据基准值、动态影响因素分值进行作业风险评估并输出评估结果。通过现场作业风险评估模型中各维度的风险影响因素评分以及对应维度的权重得到动态影响因素分值情况。

申请公布日为2015年11月18日,申请公布号为CN105069709A,专利名称为基于专家经验的电网调度操作过程准动态风险评估方法的中国专利提供了一种技术方案,包括:采集非电力信息、调度指令和电网运行数据,调度指令分解为单项令操作序列;单项令操作序列中各步调度操作的风险包括操作执行时的风险和操作问阳内的风险。选取电压越限、潮流过载和失负荷三种风险指标,引入专家经验对各步调度操作中的风险进行量化,并对基于各指标的风险值进行加权综合获得综合风险值;各步调度操作的综合风险值构成调度操作过程风险值序列,结合风险水平分级标准评估电网调度操作过程风险水平。

申请公布日为2020年12月15日,申请公布号为CN112085345A,专利名称为一种适用于变权重模糊综合评估的电力作业风险评估方法的中国专利公开了一种技术方案,包括获取能够衡量电力作业风险程度的电力作业风险评估指标;利用层次分析法对电力作业风险评估指标进行分层及确定层次间的电力作业风险评估指标相对上一层的电力作业风险评估指标的权重初值;获取每次电力作业前的电力作业风险评估指标的打分值,根据打分值对权重初值进行重新分配,获得重新分配权重值;确定评价对象的评价集合及隶属度计算函数;隶属度计算函数对评价集合进行多层次模糊综合评价,获得模糊综合评价结果;重新分配权重及隶属度最大原则从模糊与综合评价结果的矢量中确定对应的电力作业风险评估等级。

申请公布日为2018年6月29日,申请公布号为CN108229787A,专利名称为基于大数据的电力行业现场作业风险评估方法及系统的中国专利提供了一种技术方案,包括以下步骤:确定风险影响因素;风险因素数据分析及关键因子的提取;风险指标及维度权重设置;作业动态风险值计算的步骤;所述系统包括多源数据采集模块、数据集成模块、风险计算模块和展示模块。该技术方案综合考虑人员能力、作业方法、电网设备状态风险、机械设备及工器具以及作业环境与时间五维度风险因子,实现五维一体的动态风险计算方法,试图提升现场作业风险评估的准确性、科学性。

但上述技术方案存在的问题在于:一是已有风险标注经常不够准确,导致采用错误的数据训练分类器,进而导致分类器出错,造成结果不准确,存在较大的安全风险;二来机器学习分类器是个黑箱,缺乏可解释性,即采用这种方式只能得到一个风险评估的结果,却并不了解评估的依据,人们对风险评估的结果缺少可预测性。

发明内容

1.要解决的问题

针对现有技术中风险评估结果不够准确以及缺少可解释性的问题,本发明提供一种可解释性电网作业风险评估方法与装置。

2.技术方案

为了解决上述问题,本发明所采用的技术方案如下:一种可解释性电网作业风险评估方法,包括以下步骤:S1、将电网作业风险管控规则中的每一个规则进行处理得到风险管控元组,利用风险管控元组组成电网作业风险管控知识库;S2、将电网作业内容进行处理得到电网作业内容元组;S3、将步骤S2中的电网作业内容元组在步骤S1中的电网作业风险管控知识库中推理确定该电网作业内容元组对应的风险管控元组集合;S4、根据步骤S3中风险管控元组集合取风险等级最高者作为该条电网作业内容的风险等级输出,并输出对应的风险管控元组集合。采用本技术方案能够得到更为准确的风险等级,有效进行电网作业的风险管控;另一方面也帮助用户了解当前电网作业内容对应的风险等级的原因,使风险等级的确定具有可解释性。

进一步地,所述电网作业风险管控知识库利用领域词典进行处理得到风险管控元组,所述电网作业内容利用领域词典进行处理得到电网作业内容元组,所述领域词典包括设备词典和操作词典;所述设备词典包括设备的标准词及标准词的同义词集合,所述操作词典包括操作的标准词和标准词的同义词集合。本技术方案中将设备的标准词及其同义词集合,操作的标准词及其同义词集合都纳入领域词典,避免因对同一设备或操作的不同称呼造成识别的差错,提高风险等级判断的准确性。需要说明的是,在电网作业中,设备和操作一般存在对应关系,对此,本领域技术人员应当理解。

进一步地,所述电网作业风险管控知识库为知识图谱或关系型数据库。

进一步地,所述风险管控元组为设备,操作,电压上限,电压下限,设备必备条件,设备补充条件,操作必备条件,操作补充条件的集合,其中,设备为一种特定的设备类型;操作为一个标准的动作;设备必备条件、操作必备条件表示当匹配这条规则时,必须要包含与设备、操作相应的关键词;设备补充条件、操作补充条件表示当匹配这条规则时,如果有与设备、操作相应补充条件关键词,则此规则更适合。

进一步地,所述设备与设备之间的关系为从属和/或包含的关系,操作与操作之间的关系为从属和/或包含的关系。

进一步地,所述步骤S2具体为:

对电网作业内容进行大句、小句识别;

利用领域词典对识别出的大句、小句逐句分出词语,并识别出词语中的设备和操作;

以大句隔离、小句组合原则识别出设备和操作之间的关系;

依次按照句内属性优先原则确定电压类属性和补充属性;

形成电网作业内容元组。

本技术方案通过对电网作业内容进行句子的识别,识别出句子中的的实体词语,即设备和操作,再识别出设备和操作之间的关系即各种属性,从而形成电网作业内容元组。

进一步地,在按照句内属性优先原则确定电压类属性和补充属性之后,还包括利用领域词典对设备和操作的词语进行规范化,然后再形成电网作业内容元组。

进一步地,所述步骤S3具体为:

根据电网作业风险管控知识库中设备的关系推理出电网作业内容元组中的设备实体集合;

根据电网作业风险管控知识库中操作的关系推理出电网作业内容元组中的操作实体集合;

在电网作业风险管控知识库中按照设备集合和作业集合的全组合,推理出满足条件的电网作业管控知识库中的的风险管控元组,获得对应的风险管控元组集合,并将风险管控元组集合的风险等级最高者作为电网作业内容对应的风险等级输出。

进一步地,所述领域词典通过领域文档、电网作业内容和电网作业风险管控规则获得。

本发明同时提供一种可解释性电网作业风险评估装置,包括领域词典构建模块、电网作业风险管控规则信息提取模块、规则推理及风险评级模块、电网作业内容信息提取及结构化模块,其中,领域词典构建模块对领域文档、电网作业内容及电网作业风险管控规则进行分析构建出领域词典;电网作业风险管控规则信息提取模块用于从电网作业风险管控规则中提取元组化信息得到风险管控元组,并将风险管控元组构建成电网作业风险管控知识库;电网作业内容信息提取及结构化模块用于从电网作业内容中提取元组化信息,形成电网作业内容元组;规则推理及风险评级模块用于根据电网作业风险管控知识库推理出电网作业内容元组对应的风险管控元组,获得对应的风险管控元组集合,并将风险管控元组集合的风险等级最高者作为电网作业内容对应的风险等级输出。利用本装置可根据电网作业风险管控知识库推理电网作业内容元组对应的风险和规则,并输出风险等级划分对应的规则,使风险等级划分具有可解释性。

3.有益效果

相比于现有技术,本发明的有益效果为:

(1)本发明能够对电网作业内容进行更准确的风险等级评定,有效解决现有技术不利于电网作业风险管控以及对电网作业内容的风险等级划分不够准确的问题;

(2)本发明能够给出电网作业内容风险评级的原因,帮助人们了解电网作业内容风险评级的依据。

附图说明

图1为本发明的系统架构图;

图2为本发明的总体流程图;

图3为本发明中电网作业风险管控知识图谱元模型示意图;

图4为本发明的风险评级方法流程图;

图5为本发明的领域词典构建示意图。

具体实施方式

下面结合具体实施例对本发明进一步进行描述。

本发明为一种可解释性电网作业风险评估方法和装置,图1示出了装置所包括的模块,具体包括领域词典构建模块、电网作业风险管控规则信息提取模块、规则推理及风险评级模块、电网作业内容信息提取及结构化模块,其中,领域词典构建模块对领域文档、电网作业内容及电网作业风险管控规则进行分析构建领域词典;电网作业风险管控规则信息提取模块用于从电网作业风险管控规则中提取元组化信息得到风险管控元组,并将风险管控元组构建成电网作业风险管控知识库;电网作业内容信息提取及结构化模块用于从电网作业内容中提取元组化信息,形成电网作业内容元组;规则推理及风险评级模块用于根据电网作业风险管控知识库推理出电网作业内容元组对应的风险管控元组,获得对应的风险管控元组集合,并将风险管控元组集合的风险等级最高者作为电网作业内容对应的风险等级输出。

具体实施时,领域词典构建可以利用人工来进行分类构建领域词典,也可以利用算法来实现,本领域采用领域词典构建模块来实现领域词典的构建。领域词典是指本领域内常用术语或词语的集合,如电流互感器、互感器等等,领域词典一般可以从本领域的领域文档(如本领域通用教材、手册、文章等)、电网作业内容和电网作业风险管控规则中提取。领域词典包括设备词典和操作词典;其中设备词典包括设备的标准词及标准词的同义词集合,操作词典包括操作的标准词和标准词的同义词集合。举例来说,电流互感作为电流互感器的缩略词,那么关于互感的设备词典就包括电流互感器、电流互感等。需要说明的是,在电网作业内容中,设备和操作一般来说是存在对应关系的,更具体地说,一个电网作业内容必然存在一个操作,而通常一个操作会对应一个或多个设备,对此,本领域技术人员应当理解。在本发明中,领域词典的作用有两个,一个是在对电网作业内容进行结构化处理得到电网作业内容元组的过程中进行分词时使用,使电网作业内容中的词语能够更准确地被识别;另一个是在对词语进行规范化处理时使用,使领域词典的内容除了标准术语之外还包括一些缩略语、简称、别称等,其目的也是为了最终使电网作业内容中的词语能够更准确地被识别。电网作业风险管控规则信息提取模块、规则推理及风险评级模块、电网作业内容信息提取及结构化模块均采用自然语言处理技术实现。

图2示出了本发明的总的工作流程,即先构建领域词典,然后利用领域词典构建电网作业风险管控知识库,在电网作业风险管控知识库和领域词典都已具备的基础上进行电网作业内容风险评估。下面结合图1和图2来说明本发明的工作流程,具体为:

(1)定义电网作业风险管控知识库的结构,本实施例中,电网作业风险管控知识库为知识图谱,即电网作业风险管控知识图谱,具体实施时,电网作业风险管控知识库还可以采用关系型数据库来实现。如图3示出了电网作业风险管控知识图谱元模型的基本结构,其包括了知识图谱的基本元素,即实体和关系,实体包括设备和操作,关系指的是设备和操作之间的关系。图3中的风险元组即为电网作业风险管控知识图谱中的一个风险管控元组,其包括了两个实体,分别是设备和操作,其中,设备和操作之间存在关系,即操作的对象是设备(设备作为targets),一个操作(操作表示一个动作)通常会对应一个或多个设备,其中的设备是属于上位的概念,是一个大类,在该设备下的小类或者该设备的其中一个部分或部件均可以对应推理到该设备中,即该设备的一种(is-kind-of)或一部分(is-part-of)均能推理对应到该设备,同样的,操作也是一个上位的概念,属于该操作的下位操作的一种(is-kind-of)也能够被推理对应到该操作。在本发明中,电网作业风险管控规则包含一或多个风险管控元组,一个风险管控元组包含一个设备、一个操作,对应一个风险等级。更具体地,还包括电压范围,电压范围可以是枚举值,或定义电压上限和电压下限来限定一个电压范围。设备与设备之间的关系可以为“从属”和/或“包含”的关系,如设备名称可以是一类设备名,其包含更下位的设备概念,还可以是一个设备整体,其包括从属于其的各个部分设备;同样的,操作与操作之间也可以有“从属”和/或“包含”的关系。

电网作业内容信息提取及结构化模块利用自然语言处理技术(NLP,NaturalLanguage Processing)将电网作业风险管控规则中的每一个规则进行结构化处理得到风险管控元组,并将多个风险管控元组组成电网作业风险管控知识库。

本发明中所说的定义电网作业风险管控知识库的结构具体为定义电网作业风险管控知识库中的元组的具体结构,本发明中采用的规则将风险管控元组定义为:{设备,操作,电压上限,电压下限,设备必备条件,设备补充条件,操作必备条件,操作补充条件},即一个风险管控元组是包括了设备,操作,电压上限,电压下限,设备必备条件,设备补充条件,操作必备条件,操作补充条件等属性的一个集合,而该集合确定地指向某一个风险等级,因此当确定一个电网作业内容元组所对应的风险管控元组或者风险管控元组集合之后,即可确定该电网作业内容元组所对应的风险等级。在本实施例中,电压上限、电压下限为电压类属性,设备必备条件,设备补充条件,操作必备条件,操作补充条件为补充类属性。具体实施时,可根据具体情况定义不同的元组,从而得到不同的风险管控元组。设备词典和操作词典的作用在于将同一个设备或操作对应的不同的名称以及一个设备或操作的类别囊括进来。如“避雷器”、“避雷针”等为同一设备的不同表述,电流互感器的上位概念互感器会囊括进设备词典中;以便当电网作业内容元组在电网作业风险管控规则数据库中进行推理时能够更准确地进行推理。更具体地说,一个电网作业内容元组中的内容总是具体而确定的,而电网作业风险管控规则数据库中的内容是上位的,如电网作业内容元组中的设备是电流互感器,而电网作业风险管控规则数据库中的设备是互感器,所谓的推理指的是根据上下位的归属原则从电网作业风险管控规则数据库找到电网作业内容元组中对应的设备和操作,如根据电流互感器找到电网作业风险管控规则数据库中的设备是互感器;而采用设备词典和操作词典可以避免因表述的不同造成遗漏或错误。

如图5所示,利用自然语言处理技术从电网作业内容的文本与电网作业风险管控规则中的文本中发现领域新词,即在无语料的情况下提取上述两个文本中的词语,并过滤掉系统中已存在的“旧词”,得到新词,将所有发现的领域新词构建起来即形成领域词典,而本领域的领域文档(如本领域的通用教材、手册、文章)也是领域词典中的词语来源,即,领域词典内的词来源于领域文档、电网作业内容的文本以及电网作业风险管控规则中的文本。

下面举例说明电网作业风险管控规则,以下罗列的均为电网作业风险管控规则:

1)变电站设备日常巡视作业:可接受的风险;

2)变电站防小动物、防汛、消防设备设施等专项巡视及检查:低风险

3)变电站避雷器阻性电流测试、开关柜局放测试、高频通道测试等相关设备测试、检测作业:可接受的风险;

4)220kV变压器、母线停复电操作:高风险;

5)110kV及以下变电站新建、改扩建投产操作:中风险;

6)220kV-500kV变压器高压套管安装、更换作业:高风险。

电网作业风险管控规则信息提取模块对上述电网作业风险管控规则中的每条管控规则进行信息提取,提取元组化信息得到风险管控元组,若干个风险管控元组构建出电网作业风险管控知识库,如上述第4个220kV变压器、母线停复电操作,可以提取出的元组化信息包括:a、220kV变压器,停复电操作→高风险,b、220kV母线,停复电操作→高风险;a和b两组元组化信息均涉及到电压:220kV;设备:变压器和母线;操作:停复电;对应的风险等级:高风险。具体实施时,风险管控元组具体为:{设备,操作,电压上限,电压下限,设备必备条件,设备补充条件,操作必备条件,操作补充条件},即风险管控元组为设备,操作,电压上限,电压下限,设备必备条件,设备补充条件,操作必备条件,操作补充条件的集合,满足该元组中所有属性的风险管控元组指向某一个风险等级;其中,设备为一种特定的设备类型,如上述的变压器和母线;操作为一个标准的动作,如上述的停复电;电压上限为设备电压范围的高限(上限),电压下限为设备电压范围的低限(下限),当电压为某一个值时,如220kV,可以认为电压上限和电压下限均为220kV;必备条件包括设备必备条件和操作必备条件,设备必备条件、操作必备条件表示当匹配这条规则时,必须要包含相应的关键词;如果没有这些词,一定不属于此规则。补充条件包括设备补充条件和操作补充条件,设备补充条件、操作补充条件表示当匹配这条规则时,如果有补充条件关键词,则此规则更适合,但这些关键词不是必须的,即有这些补充条件更好,更能适用该条规则,但没有这些补充条件,也能够确定该元组对应的规则,并进一步确定对应的风险等级。需要说明的是,具体实施时,风险管控元组可以根据具体情况定义,本发明只是给出一个实施例,本领域技术人员应当理解。

以“110kV新屏T线#3、#5、#12、#21杆避雷器导电连接部位红外检测”为例来进行说明,对应风险管控元组为:设备是“避雷器”,操作是“检测”,电压是110KV,设备必备条件是“导电连接部位”,设备补充条件为空,操作必备条件是"红外",操作补充条件是空,由此就可以得到一个风险管控元组{避雷器,检测,110KV,导电连接部位,空,红外,空}。

(2)当一个电网作业内容输入后,同样利用自然语言处理技术,提取其中关键元组信息,形成电网作业内容元组。

当输入一个电网作业内容后,可以使用自然语言处理技术自动识别其中的设备、设备电压、对设备进行的操作。具体实施时,自然语言处理技术可以是基于规则的信息提取算法,也可以是基于深度学习的命名实体识别算法。提取设备词列表、操作词及电压后,生成电网作业内容元组集合,一个作业内容可以生成多个电网作业内容元组集合。

将电网作业内容转换为电网作业内容元组首先需要对作业内容进行大句、小句识别,本发明定义以“。”、“!”、“;”、“?”分割的是大句;以“,”、“:”分割的是小句;下面举例进行说明,下面5个句子为5个大句:

1、“小电流接地选线装置升级;”,

2、“敷设本期工程相关二次电缆及二次电缆头制作;”,

3、“完成小电流接地选线装置屏内接线及相关屏柜内接线;”,

4、“小电流接地装置屏相关电压、信号、跳闸回路接入、封堵、装置调试及后台数据库完善并上传调度、信号核对;”

5、“验收、整改。”。

下面3个句子为3个大句,其中第一个大句有2个小句:

1、“拆除35kV母线TV端子箱、TV并列装置相关二次电缆,接入新敷设电缆及相关二次回路标识更换;”,

2、“新增35kV母线TV并列装置自动化信息接入及核对;”,

3、“敷设临供电缆将35kV母线二次电压转为新增35kV母线TV并列装置供电(此临供电缆待35kV线保护改造完成后拆除),详见专项方案。”。

将作业内容识别为大句、小句之后,对大小句进行分词,分词时需要借助领域词典,即领域词典收录了该领域中的词汇,利用领域词典可以区分词语,如将“拆除35kV母线TV端子箱”应当拆分成“拆除”、“35kV”、“母线”等,而不是拆分成“拆”、“除35kV母”等非词语,然后再经过电网作业内容信息提取及结构化模块提取作业内容中的信息,形成电网作业内容元组,具体流程如图4所示。

以下为部分电网作业内容示例:

1)110kV细石头变:Ⅱ级设备远方巡视检查;

2)a、调度数据网机柜设备安装、接电、调试、入网;b、网络配线架安装;

3)防小动物检查,以图片形式保存检查情况,(本站保存图片,无需上报);(CSGⅡ系统上使用防小动物封堵及电缆检查记录表作业指导书)(留存纸质记录)(该项工作需开工作票);(需要说明的是:本条指令中括号内的内容并无实际意义,只是用来表示作业内容有时候可能会比较繁杂无意义)。

4)10kV红土寨031断路器停送电操作(配合线路检修);

5)端子箱、机构箱、保护屏柜防潮、防火检查及维护,箱内照明检查及更换;

6)220kV听湖变电站避雷器阻性电流测试。

(3)针对步骤(2)中的电网作业内容元组在电网作业风险管控知识库中推理、进行风险评估,得到对应的风险管控元组集合。即,根据电网作业风险管控规则文本形成的风险管控知识库对电网作业内容元组进行推理得到电网作业内容元组对应的风险管控元组集合,然后输出相应的风险等级和对应的风险管控元组集合。

具体地,根据步骤(1)中的电网作业风险管控知识库推理出步骤(2)中的电网作业内容元组对应的风险管控元组集合,取命中的风险管控元组集合中最高的风险等级作为当前作业的风险等级。

具体实施时,当进行推理时,只要电网作业内容中的设备词匹配到设备类别词或其下位词或其同义词,就认为设备匹配上了;设备类别词指的是描述该类设备的词语,相当于某一类设备的上位概念,如互感器是上位概念,其包括电流互感器和电压互感器,如果电网作业内容中是电流互感器,则只要其匹配到互感器,就认为设备匹配成功。关于操作的匹配也与此类似;而电压必须落在电压范围中才认为是匹配。当匹配成功后,就可以根据风险管控元组中的风险等级确定当前作业的风险等级。如果作业匹配确定了多条风险等级,则以最高的风险等级作为当前作业的风险等级。

参考图4,对本发明从电网作业内容中提取信息形成电网作业内容元组并进行推理的具体流程进行说明:首先,当用户输入电网作业内容语句,一方面,如果电网作业内容中出现语料,直接从语料中发现新词,构建领域词典;另一方面,对电网作业内容进行大句、小句识别,识别出大句、小句之后再利用领域词典进行逐句分词,识别出每个句中的实体,所谓的实体指的是设备、操作。然后再以大句隔离、小句组合原则识别实体间的关系,大句隔离、小句组合原则指的是如果作业内容有两个大句,则需要对两个大句分别进行分析,如果作业内容为若干小句,则需要将该若干个小句组合起来进行分析,以识别作业内容中的实体之间的关系,即设备和操作之间的关系。然后按照句内属性优先原则确定电压类属性识别与分配,句内属性优先原则指的是如果在一个小句内有确定的电压信息,则以该小句中的电压信息为电压上限或电压下限,如果在一个小句内没有确定的电压信息,则以靠近该小句的另一个小句中的电压信息为电压上限或电压下限。举例来说,如果一个小句为“TV并列装置相关二次电缆”,其前一个小句为“拆除35kV母线TV端子箱”,由于第一个小句没有电压,则可以其前一个小句中的35kV为电压范围。类似于语法中的承前省和蒙后省。在一个大句内需要优先考虑电压的属性识别与分配。然后再按照句内属性优先原则识别补充属性,将句中出现的同义词利用领域词典规范化,所谓的规范化即进行术语的标准化,避免因简称、别称的不同造成的差异的存在,进而造成风险识别不准确。然后形成电网作业内容元组,具体实施时,一个电网作业内容可能对应多个电网作业内容元组,形成一个电网作业内容元组列表A,其中,A={a},a是电网作业内容元组。对各电网作业内容元组进行匹配推理,根据电网作业风险管控规则知识库中设备的上下位关系推理出电网作业内容风险管控元组中的设备集合,根据电网作业风险管控规则知识库中操作的上下位关系识别出电网作业内容风险管控元组中的操作集合。之所以识别出设备集合和操作集合,而不是单个的设备或操作的原因在于一条电网作业风险管控规则可能包含多条元组化信息,因此其可能针对多个风险管控元组,而电网作业内容是相对比较具体和下位的信息,针对电网作业内容在包含了多个风险管控元组的风险管控规则知识库中推理,除了具体和下位的概念,同义词的概念、上位的概念都是应当纳入相同的范围的,因此不止一个设备或操作,而是形成集合。

然后在电网作业风险管控规则知识库中按照设备集合和操作集合的全组合查询满足条件的风险管控规则元组集合,所谓设备集合和操作集合的全组合指的是该组合包含了设备和操作,以及设备和操作之间的相互关系,如设备集合包括设备a、b、c,操作组合包括op1、op2、op3,那么设备集合和操作集合的全组合包括a和op1、b和op1、c和op1、a和op2、b和op2、c和op2、a和op3、b和op3、c和op3。然后获取风险管控规则元组集合,即找到上述9中情况对应的风险管控元组,根据对应的风险管控元组得到对应的风险等级的集合,然后再取上述风险等级的集合中的最大风险等级,输出最大风险等级和风险管控规则元组集合,用户就得到电网作业内容对应的风险等级,同时也得到将该作业内容判定为该风险等级的原因,即风险管控规则元组集合。

下面以一个具体的电网作业内容为例来进行说明,假如用户输入的电网作业内容是“端子箱、机构箱、保护屏柜防潮、防火检查及维护,箱内照明检查及更换”,首先,对该条电网作业内容进行大句、小句识别,然后进行拆分,具体拆分为两个小句:“端子箱、机构箱、保护屏柜防潮、防火检查及维护”、“箱内照明检查及更换”。然后对上述两个小句逐句分词并识别其中的实体,以上两个小句的实体设备包括“端子箱”、“机构箱”、“保护屏柜”、“箱内照明”,操作实体为“检查”、“更换”。本条电网作业内容只有一个大句,因此不需要进行大句隔离,只需要对小句中的内容进行组合,最终确定对应的电网作业风险管控元组为:

{端子箱,检查,空,防潮、防火,空,空,空},

{端子箱,检查,空,维护、防火,空,空,空},

{机构箱,检查,空,防潮、防火,空,空,空},

{机构箱,检查,空,维护、防火,空,空,空},

{保护屏柜,检查,空,防潮、防火,空,空,空},

{保护屏柜,检查,空,维护、防火,空,空,空},

{箱内照明,检查,空,空、空,空,空,空},

{箱内照明,更换,空,空、空,空,空,空}。

然后对该元组中的元素进行识别,得到设备的集合和操作的集合,如“端子箱”对应的设备集合可能为“端子箱、配电箱”,“检查”对应的操作集合可能为“检查、检修”等等,然后在风险管控规则知识库中推理设备和操作的全组合,即分别对设备集合和操作集合进行排列组合,然后将组合后的设备、操作的全组合在电网作业风险管控知识库中推理,所谓的推理指的是利用设备或组合的上下位概念来确定电网作业内容元组中的设备是否对应电网作业风险管控知识库中的某个设备,如本实施例中的设备是“端子箱”,而电网作业风险管控知识库中的设备为“配电箱”,由于“端子箱”是“配电箱”的一种,则推理成功,然后再对操作进行类似推理,直到本条电网作业内容元组匹配到电网作业风险管控知识库中的某一个或某几个风险管控元组,得到对应的风险管控元组集合,以上的电网作业内容元组对应的风险等级均为可接受的风险,因此该条电网作业内容对应的风险等级为可接受的风险,同时也输出管控规则集,便于用户了解本条指令为可接受的风险的原因。

本发明利用自然语言识别技术分别对电网作业内容和电网作业风险管控规则进行拆解、识别,得到电网作业内容元组和电网作业风险管控规则知识库,并根据电网作业风险管控规则知识库对电网作业内容元组进行推理,得到对应的风险管控元组集合,一方面,用户能够得到更为准确的风险等级,有利于进行电网作业风险管控,降低电网作业风险;另一方面也了解当前电网作业内容对应的风险等级的原因,使风险等级确定具有可解释性。

本发明中所说的语料指的是自然语言处理技术中的概念,是语言材料,是构成语料库的基本单元。元组是本发明对由设备、操作及一系列条件组成的集合,该设备、操作和一系列条件组成的集合对应一定的风险等级。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号