首页> 中国专利> 配电DTU验收专用语料库的复合网络构建方法

配电DTU验收专用语料库的复合网络构建方法

摘要

本发明公开了配电DTU验收专用语料库的复合网络构建方法,涉及业务内容、句式多变的语句调用语料库的双引擎语义搜索。包括步骤S1:语义抽取,分别采用CNN,RNN和BiLSTM对配网规程等数据源中设备实体、设备属性和关系等非格式化文本进行抽取;步骤S2:知识融合,采用ESIM共指消解模型完成对抽取结果中指代相同的重复性信息的融合;步骤S3:分布式存储语料,对于知识融合的一致性结果采用图数据库与关系性数据库互为补充的分布式数据库模型存储;步骤S4:语义检索,句式固定的语句采用模板匹配,经测试表明,本方案构建的语料库和检索模式具有语义识别准确、关键词检索速度快的特点。

著录项

说明书

技术领域

本发明属于配网终端调试领域,尤其涉及配电DTU验收专用语料库的复合网络构建方法。

背景技术

配电数据终端(data transfer unit,DTU)作为配电网的关键设备,其自动化验收效率直接关乎配网升级改造能否按时交付。目前配电终端的自动化验收,仍需通过现场工作人员与主站运维人员配合触发通信,以单个设备验收为例,传统方式时需要配网主站侧自动化验收人员通过电话与现场人员进行信息核对验收,验收时间较长,模块验收效率较为低下。

近年来,随着能源互联网建设中海量设备、终端接入,对于供电可靠性的要求更加严格。国家有关部门联合电网企业不断强化电力可靠性管理体系建设,推进供电可靠性指标管理与配电业务管理深度融合,对配电网的全面升级改造已经刻不容缓。传统配电终端自动化验收方式难以为继,成为能源互联网可靠运行亟待解决的问题。

知识图谱作为整合电网异构数据资源的核心基础,可以为能源互联网下的电网企业异构数据管理提供有效支持。目前电力行业针对基于知识图谱的知识问答(knowledgebased question answering,KBQA)的研究主要集中在领域命名实体识别方法及客服系统搭建,尚未形成针对配电终端自动化验收的领域知识图谱构建方法以及以智能人机对话为蓝本的自动化验收实施方法。

发明内容

本发明的目的在于克服传统的配电数据终端验收模式中配电主站工作人员等待时间长、重复性工作量大、验收效率低下的问题,提出配电DTU验收专用语料库的复合网络构建方法。

本发明的目的是通过下述技术方法予以实现:

配电DTU验收专用语料库的复合网络构建方法,包括以下步骤:

步骤S1:语义抽取,分别采用CNN,RNN和BiLSTM对包括配网规程在内的数据源中的非格式化文本进行抽取;

步骤S2:知识融合,采用ESIM共指消解模型完成对抽取结果中指代相同的重复性信息的融合;

步骤S3:分布式存储语料,对于知识融合的一致性结果采用图数据库与关系性数据库互为补充的分布式数据库模型存储;

步骤S4:语义检索,句式固定的语句采用模板匹配,涉及业务内容、句式多变的语句调用语料库的双引擎语义搜索;

其中,所述非格式化文本包括设备实体、设备属性和关系。

可选的,包括:

在知识融合过程中采用基于ESIM模型对抽取后的信息进行同指消歧和共指消解,具体为:

α

其中x

可选的,所述方法包括:

以实体关联度对存储在配电自动化领域知识图谱中设备、人员、指标实体进行为分类存储,实体关联度小于等于10的实体存储在MySQL中,实体关联度大于10的实体存储在Neo4j中。

可选的,所述步骤S1中的验收人员手持电网公司统一配发的加密移动终端拨打指定专线后唤起运行于Open5200系统中的智能虚拟调试坐席模块。

可选的,所述步骤S1中现场调试人员与虚拟坐席之间的人机交互过程采用MVC架构。

可选的,所述步骤S2融合的信息包括设备ID信息以及人员身份信息;

所述设备ID信息包含设备的地理位置信息和其在系统中的编号;

所述人员身份信息包含验收人员的姓名和编号。

可选的,具体包括:

步骤S91:现场验收人员拨打专线,虚拟坐席接入主站;

步骤S92:设备ID和验收人员身份信息验证;

步骤S93:按照预定调试计划和验收规则对目标线路上的待调终端逐个进行测试,每台数据终端的现场测试结果与主站遥测数据进行比较,对比结果自动生成验收报告反馈给主站;

步骤S94:若验收报告无异常自动进入下一终端验收过程,若存在数据不匹配则接通主站人工服务,由调试人员与现场验收人员对话后做出进一步决策。

因此,本发明具有如下优点:

1、智能虚拟调试坐席系统具备智能语音交互和语义搜索功能,可实现验收规则执行的自动化和联调数据交互的智能化,集数据高效处理、可靠存储、智能交互于一体。

2、联合图数据库和关系型数据库的分布式存储技术,简化了关系构建流程,提升了检索效率,兼顾了数据存储的完整性和可靠性。

3、基于深度学习的知识抽取技术解决了从电路图拓扑结构(半结构化数据)中采用图映射的方法获取电力设备间关系时数据难以对齐,以及使用条件随机场、支持向量机和决策树等传统机器学习方法从非结构化数据中进行信息提取时结果的准确率和覆盖率难以达到工程应用要求的难题。

附图说明

图1为本发明的业务流程示意图。

具体实施方式

为让本专利的特征和优点能明显易懂,下文特举实施例,作详细说明如下:

配电DTU验收专用语料库的复合网络构建方法,如图1所示,包括以下步骤:

步骤S1:语义抽取,分别采用CNN,RNN和BiLSTM对包括配网规程在内的数据源中的非格式化文本进行抽取;

步骤S2:知识融合,采用ESIM共指消解模型完成对抽取结果中指代相同的重复性信息的融合;

步骤S3:分布式存储语料,对于知识融合的一致性结果采用图数据库与关系性数据库互为补充的分布式数据库模型存储;

步骤S4:语义检索,句式固定的语句采用模板匹配,涉及业务内容、句式多变的语句调用语料库的双引擎语义搜索;

其中,所述非格式化文本包括设备实体、设备属性和关系。

可选的,包括:

在知识融合过程中采用基于ESIM模型对抽取后的信息进行同指消歧和共指消解,具体为:

α

其中x

可选的,所述方法包括:

以实体关联度对存储在配电自动化领域知识图谱中设备、人员、指标实体进行为分类存储,实体关联度小于等于10的实体存储在MySQL中,实体关联度大于10的实体存储在Neo4j中。

可选的,所述步骤S1中的验收人员手持电网公司统一配发的加密移动终端拨打指定专线后唤起运行于Open5200系统中的智能虚拟调试坐席模块。

可选的,所述步骤S1中现场调试人员与虚拟坐席之间的人机交互过程采用MVC架构。

可选的,所述步骤S2融合的信息包括设备ID信息以及人员身份信息;

所述设备ID信息包含设备的地理位置信息和其在系统中的编号;

所述人员身份信息包含验收人员的姓名和编号。

可选的,具体包括:

步骤S91:现场验收人员拨打专线,虚拟坐席接入主站;

步骤S92:设备ID和验收人员身份信息验证;

步骤S93:按照预定调试计划和验收规则对目标线路上的待调终端逐个进行测试,每台数据终端的现场测试结果与主站遥测数据进行比较,对比结果自动生成验收报告反馈给主站;

步骤S94:若验收报告无异常自动进入下一终端验收过程,若存在数据不匹配则接通主站人工服务,由调试人员与现场验收人员对话后做出进一步决策。

具体的,上述方案的实际用例为:

步骤1:使用深度神经网络将文本中的非结构化数据作结构化处理,并将该步骤划分为命名实体识别、属性提取和关系抽取三个子任务。分别用CNN、RNN和BiLSTM实现;

步骤2:经过步骤1知识抽取得到的数据中包含许多重复信息,如3U0、ABC相零序电压、三相零序电压指代对象相同;配电DTU和配电DTU装置具有相同含义。需要通过关系延伸计算实现共指消解。筛选出的数据不存入图谱,将这些数据用作关系数据库与知识图谱的连接;

具体地,采用ESIM共指消解模型,即

α

其中x

在对BiLSTM网络的输出x

步骤3:为有效减轻由于配网各电力设备之间深度耦合、数据关联度高所带来的实体关系构建困难、检索时间长的问题,在提高数据搜索效率的同时尽可能保留知识抽取的全部结果。将步骤2所得目标序列,采用联合图数据库和关系型数据库的分布式存储技术进行存储;

步骤4:本发明提出基于句式匹配和KGDTAAD双引擎语义搜索技术。所述步骤4具体包括:

步骤4.1,通过文本分析明确待识别的节点和待查找对象间的关系;

步骤4.2,将“你好,我是XXX”、“拨打XXX”“正确,请开始”这类句式较为固定的指令应答采用基于ESIM模型与预定义语料库中的句式作模式匹配,结果一致时执行模板库中的预定操作;

步骤4.3,对于包含多条设备运行参数的长语句场景,直接调KGDTAAD形成答案。

步骤5:搭建智能虚拟坐席的软件架构为系统各类应用的开发、运行和管理提供通用的技术支撑,提供统一的交换服务、模型管理、数据管理、图形管理,满足配电网调度各项实时、准实时和生产管理业务的需求,支撑配网各项运行监控应用。

步骤6:通过改进Open5200系统硬件架构、增强了数据吞吐和交互能力,研制出基于聚合语义搜索引擎的分布式硬件处理平台。

步骤1:将配电DTU验收规则文本、历史告警、操作日志等通过NLP技术进行知识抽取和分布式存储,并导入配电终端自动化验收领域知识图谱。

步骤1.1基于深度学习的知识抽取技术

步骤1.1.1,分别用CNN、RNN和BiLSTM实现命名实体识别、属性提取和关系抽取以从非结构化数据中提取出实体、关系、属性等知识要素。

步骤1.1.2,经过知识抽取得到的数据中包含许多重复信息,如3U0、ABC相零序电压、三相零序电压指代对象相同;配电DTU和配电DTU装置具有相同含义。我们需要通过关系延伸计算实现共指消解,筛选出的数据不存入图谱,这些数据可使用关系型数据库与知识图谱中实体作链接。

步骤1.2联合图数据库和关系型数据库的分布式存储技术

若参与联调的各电力设备间的拓扑关系用电路图表示,则采用图数据库进行存储。对于实体属性信息丰富的实体类,以及一些频繁更新的数据(如事件、日志、故障录波等),使用关系型数据库存储。

步骤1.3通过在图数据库实体节点的属性栏建立结构化索引标签,令其指向关系型数据库中对应的表格,实现与知识图谱中数据的链接。

步骤2:聚合AI调度引擎在接收到现场人员的触发指令(主站信道接通、身份信息确认等)后,调起语义检索功能,连接预定语料库和图数据库,按照实体属性丰富度选择检索模式。

步骤3:聚合AI调度引擎与现场人员确认待调设备ID和地理位置息,验证无误后,按照预定调试计划和验收规则对目标线路上的待调DTU逐个进行测试。

步骤4:每台DTU的现场测试结果与主站遥测数据进行比较,结果自动生成验收报告反馈给主站,主站工作人员根据验收报告做出进一步决策。

步骤5:结构化处理后的验收报告,通过深度学习技术构建专家系统,自动生成故障记录、验收规则、处理预案等结构化领域知识,进一步构建或更新配电DTU自动化验收图谱,形成案例知识图谱,用于案例记录、查阅和推理。

以上所述仅为本申请的实施例,并不用以限制本申请,凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号