首页> 中国专利> 油田联合站安全知识库构建方法及计算机设备

油田联合站安全知识库构建方法及计算机设备

摘要

本申请公开了一种油田联合站安全知识库构建方法及计算机设备,属于信息技术领域。本申请通过利用知识图谱技术和自然语言处理技术,对非结构化的油田联合站应急预案文本进行结构化的处理,从而建立油田联合站安全知识库,基于构建完成的知识图谱实现对知识的查询和更新,便于应急预案的查询和更新,提升应急预案的查询效率和更新效率。

著录项

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2022-06-07

    公开

    发明专利申请公布

说明书

技术领域

本申请涉及信息技术领域,特别涉及一种油田联合站安全知识库构建方法及计算机设备。

背景技术

油田联合站田联合站是油田原油集输和处理的中枢。油田联合站目前针对大量潜在风险故障形成了大量的应急预案,当前应急预案主要通过非结构化的文档进行管理,导致应急预案的查询和更新等都非常不方便。

发明内容

本申请实施例提供了一种油田联合站安全知识库构建方法及计算机设备,有助于提高应急预案的查询效率和更新效率。所述技术方案如下:

一方面,提供了一种油田联合站安全知识库构建方法,所述方法应用于计算机设备,所述计算机设备存储有油田联合站应急预案文本,所述方法包括:

确定知识图谱的本体和实体,所述知识图谱的本体包括设备、现象、风险和措施,所述本体包括的设备描述异常工况发生的主体,所述本体包括的现象描述设备监测的参数变化,所述本体包括的风险描述可能导致的问题和故障,所述本体包括的措施描述解决异常工况需要采取的应对措施,所述知识图谱的实体包括设备实体、现象实体、风险实体和措施实体,所述设备实体包括三相分离器、除油器、提升泵和沉降罐,所述现象实体是指一个设备可能发生的具体异常现象,所述风险实体是指一个设备发生异常现象导致的具体故障和风险,所述措施实体是指针对一种异常工况采取的具体应急措施和操作;

根据所述知识图谱的本体和实体,对存储的所述油田联合站应急预案文本执行自然语言处理操作,从而从所述油田联合站应急预案文本提取应急预案知识,所述应急预案知识包括所述知识图谱的实体、实体之间的关系以及实体的属性;

对所述应急预案知识执行知识融合操作,得到融合后的应急预案知识;

将所述融合后的应急预案知识存储至图数据库中;

基于所述图数据库对应急预案进行查询和更新。

在一些实施例中,所述对所述应急预案知识执行知识融合操作,得到融合后的应急预案知识,包括:

对所述应急预案知识执行实体对齐操作以及实体消歧操作。

在一些实施例中,所述基于所述图数据库对应急预案进行查询和更新包括:

接收终端发送的实体查询请求,所述实体查询请求包括所述知识图谱中待查询的实体的实体标识;

以所述实体标识为索引查询所述图数据库,根据查询到的实体生成实体查询响应,所述实体查询响应包括所述查询到的实体;

向所述终端发送所述实体查询响应。

在一些实施例中,所述基于所述图数据库对应急预案进行查询和更新包括:

接收终端发送的关系查询请求,所述关系查询请求包括所述知识图谱中多个实体的标识;

以所述多个实体的标识为索引查询所述图数据库,查询到所述多个实体之间的关系,根据查询到的关系生成关系查询响应,所述关系查询响应包括所述查询到的关系;

向所述终端发送所述关系查询响应。

在一些实施例中,所述基于所述图数据库对应急预案进行查询和更新包括:

接收终端发送的属性查询请求,所述属性查询请求包括所述知识图谱中待查询的属性的属性标识以及所述属性所属的实体的实体标识;

以所述属性标识和所述实体标识索引查询所述图数据库,根据查询到的属性生成属性查询响应,所述属性查询响应包括所述查询到的属性;

向所述终端发送所述属性查询响应。

在一些实施例中,所述基于所述图数据库对应急预案进行查询和更新,包括:

接收终端发送的知识扩充请求,所述知识扩充请求包括新增的应急预案;

根据所述新增的应急预案,获取新增的实体、新增的关系以及新增的属性;

将所述新增的实体、所述新增的关系以及所述新增的属性存储至所述图数据库中。

在一些实施例中,所述基于所述图数据库对应急预案进行查询和更新,包括:

接收终端发送的知识更新请求,所述知识更新请求包括更新的应急预案;

根据所述更新的应急预案,获取更新的实体、更新的关系以及更新的属性;

根据所述更新的实体、所述更新的关系以及所述更新的属性,对所述图数据库中存储的实体、关系以及属性分别进行更新。

在一些实施例中,所述将所述融合后的应急预案知识存储至图数据库中之后,所述方法还包括:

每隔预设时间周期,向订阅了应急预案知识的终端推送所述图数据库存储的应急预案知识。

在一些实施例中,所述将所述融合后的应急预案知识存储至图数据库中之后,所述方法还包括:

根据融合后的应急预案知识中的实体、关系以及属性,生成知识图谱界面,所述知识图谱界面中的元素为实体、关系或者属性;

在屏幕中展示所述知识图谱界面。

另一方面,提供了一种计算机设备,所述计算机设备包括一个或多个处理器和一个或多个存储器,所述一个或多个存储器中存储有至少一条计算机程序,所述至少一条计算机程序由所述一个或多个处理器加载并执行以实现上述油田联合站安全知识库构建方法或者油田联合站安全知识库构建方法的各种可选实现方式。

另一方面,提供了一种计算机可读存储介质,所述存储介质中存储有至少一条计算机程序,所述至少一条计算机程序由处理器加载并执行以实现上述油田联合站安全知识库构建方法或者油田联合站安全知识库构建方法的各种可选实现方式。

另一方面,提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括程序代码,该程序代码存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该程序代码,处理器执行该程序代码,使得该计算机设备执行上述油田联合站安全知识库构建方法或者油田联合站安全知识库构建方法的各种可选实现方式。

本申请实施例提供的技术方案带来的有益效果至少包括:

本申请实施例提供的方法,通过利用知识图谱技术和自然语言处理技术,对非结构化的油田联合站应急预案文本进行结构化的处理,从而建立油田联合站安全知识库,基于构建完成的知识图谱实现对知识的查询和更新,便于应急预案的查询和更新,提升应急预案的查询效率和更新效率。尤其是,知识图谱技术的引入,使得站库安全知识能够以更为智能的方式传递下去,减少了重复学习带来的人力成本,同时知识图谱的自动推理功能,使得对应急工况的诊断与处置避开了人为偏见的影响,提升了应急处置措施的有效性。

附图说明

为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1是本申请实施例提供的一种油田联合站安全知识库构建方法的流程图;

图2是本申请实施例提供的一种基于知识图谱技术的油田联合站安全知识库构建方法的流程图;

图3是本申请实施例提供的一种油田安全知识库构建过程的流程图;

图4是本申请实施例提供的一种计算机设备的结构示意图。

具体实施方式

为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施方式作进一步地详细描述。

下面先对本申请实施例涉及的一些术语相关概念进行介绍。

知识图谱:旨在描述真实世界中存在的各种实体或概念及其关系,其构成一张巨大的语义网络图,节点表示实体或概念,边则由属性或关系构成。知识图谱构建从最原始的数据(包括结构化、半结构化、非结构化数据)出发,采用一系列自动或者半自动的技术手段,从原始数据库和第三方数据库中提取知识事实,并将其存入知识库的数据层和模式层,这一过程包含:信息抽取、知识表示、知识融合、知识推理四个过程,每一次更新迭代均包含这四个阶段。

实体:指的是具有可区别性且独立存在的某种事物。如某一个人、某一个城市、某一种植物等、某一种商品等等。实体是知识图谱中的最基本元素,不同的实体间存在不同的关系。

节点:表示一个实体记录,类似于关系数据库中的一条记录,一个节点包含多个属性和标签。

关系:用于将节点关联起来构成图,关系也称为图论的边。

属性:节点和关系都可以有多个属性,属性由键值对组成。

知识抽取:对于非结构化的文本数据,抽取的知识包括实体、关系、属性。对应的研究问题就有三个,一是实体抽取,也称为命名实体识别,此处的实体包括概念,人物,组织,地名,时间等等。二是关系抽取,也就是实体和实体之间的关系,也是文本中的重要知识,需要采用一定的技术手段将关系信息提取出来。三是属性抽取,也就是实体的属性信息,和关系比较类似,关系反映实体的外部联系,属性体现实体的内部特征。

知识融合:简单理解,就是将多个知识库中的知识进行整合,形成一个知识库的过程,在这个过程中,主要需要解决的问题就是实体对齐。不同的知识库,收集知识的侧重点不同,对于同一个实体,有知识库的可能侧重于其本身某个方面的描述,有的知识库可能侧重于描述实体与其它实体的关系,知识融合的目的就是将不同知识库对实体的描述进行整合,从而获得实体的完整描述。

知识推理:知识推理,就是根据已有的数据模型和数据,依据推理规则,获取新的知识或者结论,新的知识或结论应该是满足语义的。

参见附图1,附图1是本申请实施例提供的一种油田联合站安全知识库构建方法的流程图。附图1所示方法应用于计算机设备,计算机设备存储有油田联合站应急预案文本。

示例性地,附图1所示方法包括步骤S110至步骤S150。

步骤S110、确定知识图谱的本体和实体。

知识图谱的本体包括设备、现象、风险和措施。

本体包括的设备描述异常工况发生的主体,本体包括的现象描述设备监测的参数变化,本体包括的风险描述可能导致的问题和故障,本体包括的措施描述解决异常工况需要采取的应对措施。

知识图谱的实体包括设备实体、现象实体、风险实体和措施实体,设备实体包括三相分离器、除油器、提升泵和沉降罐,现象实体是指一个设备可能发生的具体异常现象,风险实体是指一个设备发生异常现象导致的具体故障和风险,措施实体是指针对一种异常工况采取的具体应急措施和操作。

步骤S120、根据知识图谱的本体和实体,对存储的油田联合站应急预案文本执行自然语言处理操作,从而从油田联合站应急预案文本提取应急预案知识,应急预案知识包括知识图谱的实体、实体之间的关系以及实体的属性。

步骤S130、对应急预案知识执行知识融合操作,得到融合后的应急预案知识。

步骤S140、将融合后的应急预案知识存储至图数据库中。

步骤S150、基于图数据库对应急预案进行查询和更新。

在一些实施例中,对应急预案知识执行知识融合操作,得到融合后的应急预案知识,包括:

对应急预案知识执行实体对齐操作以及实体消歧操作。

在一些实施例中,基于图数据库对应急预案进行查询和更新包括:

接收终端发送的实体查询请求,实体查询请求包括知识图谱中待查询的实体的实体标识;实体查询请求用于请求查询知识图谱中的实体。

以实体标识为索引查询图数据库,根据查询到的实体生成实体查询响应,实体查询响应包括查询到的实体;

向终端发送实体查询响应。

终端接收实体查询响应,实体查询响应获得查询到的实体,从而精准的查询到设备、现象、风险和措施。

在一些实施例中,基于图数据库对应急预案进行查询和更新包括:

接收终端发送的关系查询请求,关系查询请求包括知识图谱中多个实体的标识;关系查询请求用于请求查询知识图谱中不同实体之间的关系。

以多个实体的标识为索引查询图数据库,查询到多个实体之间的关系,根据查询到的关系生成关系查询响应,关系查询响应包括查询到的关系;

向终端发送关系查询响应。

在一些实施例中,基于图数据库对应急预案进行查询和更新包括:

接收终端发送的属性查询请求,属性查询请求包括知识图谱中待查询的属性的属性标识以及属性所属的实体的实体标识;

以属性标识和实体标识索引查询图数据库,根据查询到的属性生成属性查询响应,属性查询响应包括查询到的属性;属性查询请求用于请求查询知识图谱中的实体的属性。

向终端发送属性查询响应。

在一些实施例中,基于图数据库对应急预案进行查询和更新,包括:

接收终端发送的知识扩充请求,知识扩充请求包括新增的应急预案;

根据新增的应急预案,获取新增的实体、新增的关系以及新增的属性;

将新增的实体、新增的关系以及新增的属性存储至图数据库中。

在一些实施例中,基于图数据库对应急预案进行查询和更新,包括:

接收终端发送的知识更新请求,知识更新请求包括更新的应急预案;

根据更新的应急预案,获取更新的实体、更新的关系以及更新的属性;

根据更新的实体、更新的关系以及更新的属性,对图数据库中存储的实体、关系以及属性分别进行更新。

在一些实施例中,将融合后的应急预案知识存储至图数据库中之后,方法还包括:

每隔预设时间周期,向订阅了应急预案知识的终端推送图数据库存储的应急预案知识。

通过这种方式,从而实现了油田联合站安全知识库的智能推送。

在一些实施例中,将融合后的应急预案知识存储至图数据库中之后,方法还包括:

根据融合后的应急预案知识中的实体、关系以及属性,生成知识图谱界面,知识图谱界面中的元素为实体、关系或者属性;

在屏幕中展示知识图谱界面。

通过这种方式,从而实现了油田联合站安全知识库的可视化。

本申请提出了一种基于知识图谱技术的油田联合站安全知识库构建方法,利用知识图谱技术,对非结构化的应急预案文档进行结构化的处理,建立油田联合站安全知识库,可实现对各类应急预案的精准查询与智能推送。

本申请整体的流程图如图2所示。本申请的目的包括:将油田联合站应急预案文本利用自然语言处理技术进行文本提取和标注,将知识结构化,并基于知识图谱技术搭建油田联合站安全知识库。知识图谱技术的引入,使得知识能够以更为智能的方式传递下去,减少了重复学习带来的人力成本,同时知识图谱的自动推理功能,使得对应急工况的诊断与处置避开了人为偏见的影响,提升了应急处置措施的有效性。

本申请整体的技术方案如图3所示。主要内容是建立站库安全知识体系、文本提取和标注、知识更新,最后实现知识的应用。

应急预案知识体系:主要确定应急预案知识的本体、实体,并确定实体之间的关系、属性等基本信息。

知识抽取:从非结构化的应急预案文档中抽取知识,利用自然语言处理技术对文本进行标注与知识抽取,抽取设备信息、现象、风险、措施等四类知识。

知识融合:对抽取出的应急预案知识进行融合,实体对齐,消歧等操作,确定最终知识本体,并对知识进行更新。

知识图谱构建:利用Neo4j等图数据库建立站库应急预案知识图谱,实现对知识库的可视化。

知识应用:基于构建完成的知识图谱实现对知识的检索和融合应用。

本申请的主要应用效果包括:

1)利用自然语言处理技术,对应急预案等非结构化文本进行标注和知识提取,提高了对知识的管理水平;

2)构建了油田联合站应急预案知识体系,确定了知识图谱的本体与实体构建方法;

3)确定了油田联合站应急预案的知识管理过程,方便未来知识的扩展与提升。

以上对上述方法中每个步骤进一步详细说明如下:

1)建立油田联合站应急预案知识体系。

构建站库应急预案知识图谱知识体系主要是确定知识图谱的本体和实体。

本体包括:

设备:描述异常工况发生的主体。

现象:描述设备监测的参数变化。

风险:描述可能导致的问题和故障。

措施:描述解决异常工况需要采取的应对措施。

实体包括:

设备:三相分离器、除油器、提升泵、沉降罐等油田联合站内生产设备都属于设备实体。

现象:指某一设备可能发生的具体异常现象。

风险:某一设备发生异常现象导致的具体故障和风险。

措施:针对某一异常工况采取的具体应急措施和操作。

2)知识抽取:

业务专家按照确定的应急预案知识体系,通过对应急预案文本进行标注,从中提取实体信息,并确定实体的属性、关系等信息。

3)知识融合过程:

用户基于提取的知识内容进行实体对齐,消歧等操作,同时对知识节点的质量进行评估。基于新的应急预案对知识进行扩充和更新。

4)知识应用过程:

将知识节点增加至Neo4j图数据库的实体知识节点,逐步扩展,覆盖所有应急预案知识。同时基于Neo4j图数据库可对应急预案知识进行精准查询和检索,并可基于知识图谱开发相对应的接口,满足信息系统集成需求。

图4是本申请实施例提供的一种计算机设备的结构示意图,该计算机设备400可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上处理器(CentralProcessing Units,CPU)401和一个或一个以上的存储器402,其中,所述存储器402中存储有至少一条计算机程序,所述至少一条计算机程序由所述处理器401加载并执行以实现上述各个方法实施例提供的油田联合站安全知识库构建方法。当然,该计算机设备还可以具有有线或无线网络接口以及输入输出接口等部件,以便进行输入输出,该计算机设备还可以包括其他用于实现设备功能的部件,在此不做赘述。

在示例性实施例中,还提供了一种计算机可读存储介质,例如包括至少一条计算机程序的存储器,上述至少一条计算机程序由可由处理器执行以完成上述实施例中的油田联合站安全知识库构建方法。例如,计算机可读存储介质可以是只读存储器(Read-OnlyMemory,简称:ROM)、随机存取存储器(Random Access Memory,简称:RAM)、只读光盘(Compact Disc Read-Only Memory,简称:CD-ROM)、磁带、软盘和光数据存储设备等。

在示例性实施例中,还提供一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括程序代码,该程序代码存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该程序代码,处理器执行该程序代码,使得该计算机设备执行上述油田联合站安全知识库构建方法。

应理解,在本申请的各种实施例中,上述各过程的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本申请实施例的实施过程构成任何限定。

本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,该程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。

以上描述仅为本申请的可选实施例,并不用以限制本申请,凡在本申请的原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号