首页> 中国专利> 一种基于军事领域知识图谱的问答系统构建方法及系统

一种基于军事领域知识图谱的问答系统构建方法及系统

摘要

本发明公开了一种基于军事领域知识图谱的问答系统构建方法及系统,其方法包括步骤:1)采用混合本体方法进行本体建模;2)利用不同来源的数据构建面向军事领域的知识图谱,并存储于图数据库;3)以调查问卷的方式收集战场信息知识问答问句,以问句中的查询意图为中心构建知识问答查询模板;4)输入自然语言问句,对问句进行分类,得到分类结果;5)根据分类结果为问句匹配对应的查询模板;6)找出问句中的实体来完善查询语句;7)通过查询语句在图数据库中检索答案,并将答案返回。本发明通过自然语言问句的形式帮助用户从军事知识图谱中快速和精准推荐战场态势知识,使指挥员能够准确高效的认知战场态势,具有重要的应用价值。

著录项

  • 公开/公告号CN113806513A

    专利类型发明专利

  • 公开/公告日2021-12-17

    原文格式PDF

  • 申请/专利权人 中国人民解放军国防科技大学;

    申请/专利号CN202111166004.3

  • 申请日2021-09-30

  • 分类号G06F16/332(20190101);G06F16/33(20190101);G06F16/35(20190101);G06F16/36(20190101);G06F40/186(20200101);G06F40/242(20200101);G06F40/247(20200101);G06F40/295(20200101);G06F40/30(20200101);

  • 代理机构43008 湖南兆弘专利事务所(普通合伙);

  • 代理人廖元宝

  • 地址 410073 湖南省长沙市开福区砚瓦池正街47号

  • 入库时间 2023-06-19 13:45:04

说明书

技术领域

本发明主要涉及人工智能技术领域,具体涉及一种基于军事领域知识图谱的问答系统构建方法及系统。

背景技术

知识图谱,就是将人类知识结构化后形成的知识系统,包含基本事实、通用规则和其他有关的信息,可用于信息检索、推理决策等智能技术。知识图谱最早的应用是提升搜索引擎的能力,后来在辅助问答、自然语言理解、推荐计算等多个领域展现出了丰富的应用价值。理解用户的查询意图在于将用户的查询输入构建成结构化语句,或者让用户直接提出结构化的查询,然而这种方式需要用户具备以下能力:熟悉知识图谱数据源、熟悉知识图谱的数据模式、了解知识图谱中数据大致包含哪些内容,熟练掌握结构化的查询语言。然而,大部分的军事用户往往不具备以上的能力,而且目前面向军事领域知识图谱的自动问答系统也尚属空白。

发明内容

本发明要解决的技术问题就在于:针对现有技术存在的问题,本发明提供一种以军事领域知识图谱形式存储军事领域知识、通过自然语言问句的形式作为输入,从军事知识图谱中快速和精准推荐战场态势知识的基于军事领域知识图谱的问答系统构建方法及系统。

为解决上述技术问题,本发明提出的技术方案为:

一种基于军事领域知识图谱的问答系统构建方法,包括步骤:

1)采用混合本体方法进行本体建模;

2)利用不同来源的数据构建面向军事领域的知识图谱,并存储于图数据库;

3)以调查问卷的方式收集战场信息知识问答问句,以问句中的查询意图为中心构建知识问答查询模板;

4)输入自然语言问句,对问句进行分类,得到分类结果;

5)根据分类结果为问句匹配对应的查询模板;

6)找出问句中的实体来完善查询语句;

7)通过查询语句在图数据库中检索答案,并将答案返回。

作为上述技术方案的进一步改进,在步骤1)中,对于不同来源的数据,针对数据间的特性构建局部本体,针对数据间的共性构建全局本体;本体建模时,在模式层定义出知识的类别、每个类别下所属的概念和实体、某类概念和实体所具有的属性以及概念之间、实体之间的语义关系;定义军事领域知识图谱中的实体、关系以及属性,包括:根据战场实际情况和军事人员使用需求,确定实体类型包括主战武器、军种、导弹部队、指挥中心、海军、空军、空军基地、导弹系统、导弹系统组成装置、里程类型、防空导弹旅、防空导弹营、防空导弹连、飞行大队、飞行联队、飞行中队、陆军、雷达站、驻地;关系类型包括:协同、属于、打击、指挥、搭载、攻击、组成、装备、通信、部署于;属性类型涵盖关系属性和实体属性;实体属性包括姓名、工作频段、平均功率、数量、最大作战半径、最大射程、最大探测范围、最大航程、最大速度、武器类型、距离精度、预警距离;关系属性包括打击任务、使用武器。

作为上述技术方案的进一步改进,在步骤2)中,选择Neo4j作为存储知识图谱的图数据库。

作为上述技术方案的进一步改进,在步骤3)中,定义一组模板,模板样式涉及实体、实体+关系、属性、属性值、同义词、标签;用于问句分类的实验数据根据数据库支持的问题查询类型和常见的军事领域知识查询意图由人工标注;查询意图以调查问卷的方式获取,收集战场信息知识问答问句,以问句中的查询意图为中心,人工统计分类后,根据数据库中已有的数据信息和用户查询较多的战场信息,设计军事领域知识问答查询模板。

作为上述技术方案的进一步改进,步骤4)的具体过程为:当输入自然语言问句时,首先对问句进行分词;分词时所采用的方法为jieba分词;构建分词词典,获取知识图谱中的实体名、关系名、属性名及属性值加入自定义分词词典,并将上述名词的同义词列表加入词典;其中分词用于划分出输入问题中所包含的知识图谱中的关键词,并确定这些关键词在知识图谱中的类型。

作为上述技术方案的进一步改进,步骤5)的具体过程为:选择基于模板匹配的方式,对用户问句解析结果匹配合适的查询模板;收集问句当中所涉及到的实体类型,将分词后得到的结果与预先定义的模板进行匹配,找到匹配率最高的模式。

作为上述技术方案的进一步改进,步骤6)的具体过程为:根据抽取出问句中的相关命名实体作为查询条件,将查询模板填充为完整的Cypher查询语句.

作为上述技术方案的进一步改进,步骤7)的具体过程为:得到查询语句后,在图数据库Neo4j中执行查询语句获取答案;其中通过Python第三方库中的py2neo库,可以完成python和图数据库Neo4j的连接;其中py2neo支持图数据库中的结点创建、关系创建、属性创建和结点查询,属性值查询,节点间的关系查询多种对图数据库Neo4j的操作;查询结果以文本和图的形式返回,如果最终没有查询结果则返回提示信息。

本发明还公开了一种基于军事领域知识图谱的问答系统的构建系统,包括:

建模模块,用于采用混合本体方法进行本体建模;

知识图谱构建模块,用于利用不同来源的数据构建面向军事领域的知识图谱,并存储于图数据库;

问答查询模块构建模块,用于以调查问卷的方式收集战场信息知识问答问句,以问句中的查询意图为中心构建知识问答查询模板;

问句解析模块,用于输入自然语言问句,对问句进行分类,得到分类结果;

模板匹配模块,用于根据分类结果为问句匹配对应的查询模板;

查询语句生成模块,用于找出问句中的实体来完善查询语句;

查询模块,用于通过查询语句在图数据库中检索答案,并将答案返回。

本发明进一步公开了一种计算机设备,包括存储器和处理器,所述存储器上存储有计算机程序,其特征在于,所述计算机程序在被处理器运行时执行如上所述的基于军事领域知识图谱的问答系统的构建方法的步骤。

与现有技术相比,本发明的优点在于:

本发明的军事领域的知识图谱的有效语义搜索,允许用户以直观的、透明的、易用的方式对数据进行查询和浏览;通过自然语言问句的形式帮助用户从军事领域知识图谱中获取知识;知识问答系统接收使用自然语言表达的问题,理解用户的意图,获取相关的知识,最终通过推理计算形成自然语言表达的答案并反馈给用户;即本发明通过自然语言问句的形式帮助用户从军事知识图谱中快速和精准推荐战场态势知识,使指挥员能够准确高效的认知战场态势,具有重要的应用价值。

附图说明

图1为本发明的方法在实施例的流程图。

图2为本发明的可视化问答系统的架构图。

具体实施方式

以下结合说明书附图和具体实施例对本发明作进一步描述。

如图1所示,本实施例的基于军事领域知识图谱的问答系统构建方法,包括步骤:

1)采用混合本体方法进行本体建模;

2)利用不同来源的数据构建面向军事领域的知识图谱,并存储于图数据库;

3)以调查问卷的方式收集战场信息知识问答问句,以问句中的查询意图为中心构建知识问答查询模板;

4)输入自然语言问句,对问句进行分类,得到分类结果;

5)根据分类结果为问句匹配对应的查询模板;

6)找出问句中的实体来完善查询语句;

7)通过查询语句在图数据库中检索答案,并将答案返回。

本发明通过自然语言问句的形式帮助用户从军事知识图谱中快速和精准推荐战场态势知识,使指挥员能够准确高效的认知战场态势,具有重要的应用价值。

在一具体实施例中,在步骤1)中,对于不同来源的数据,针对数据间的特性构建局部本体,针对数据间的共性构建全局本体。本体建模时,在模式层定义出知识的类别、每个类别下所属的概念和实体、某类概念和实体所具有的属性以及概念之间、实体之间的语义关系。如武器包含了武器所含子类,如飞行器、导弹、火炮等;某类武器所具有的属性根据不同武器类别的特质而设定,如导弹的属性包括对付目标、作战距离、作战高度、最大速度、制导体制等。部队下属子类包括地面导弹部队和空军部队,各子类下又分为若干子单位,如地面导弹部队下属分为导弹群、营级单位、连级单位等。

定义军事领域知识图谱中的实体、关系以及属性,包括:

根据战场实际情况和军事人员使用需求,确定实体类型包括主战武器、军种、导弹部队、指挥中心、海军、空军、空军基地、导弹系统、导弹系统组成装置、里程类型、防空导弹旅、防空导弹营、防空导弹连、飞行大队、飞行联队、飞行中队、陆军、雷达站、驻地等。

关系类型共10类,包括:协同、属于、打击、指挥、搭载、攻击、组成、装备、通信、部署于。

属性类型涵盖关系属性和实体属性。实体属性共12类:姓名、工作频段、平均功率、数量、最大作战半径、最大射程、最大探测范围、最大航程、最大速度、武器类型、距离精度、预警距离;关系属性包括打击任务、使用武器等。

在一具体实施例中,在步骤2)中,利用不同来源的数据构建面向军事领域的知识图谱,并存储于图数据库;其中选择Neo4j作为存储知识图谱的图数据库。

在一具体实施例中,步骤3)中的具体过程为:定义一组模板,模板样式涉及实体、实体+关系、属性、属性值、同义词、标签等。关于战场知识查询的问句类型没有公开的数据集,在问答网站也难以抓取大量有效的战场态势知识问答问句。因此,用于问句分类的实验数据根据数据库支持的问题查询类型和常见的军事领域知识查询意图由人工标注。查询意图以调查问卷的方式获取,收集战场信息知识问答问句,以问句中的查询意图为中心,人工统计分类后,根据数据库中已有的数据信息和用户查询较多的战场信息,设计了军事领域知识问答查询模板,如表1所示。

表1用户问句分类模板

在一具体实施例中,步骤4)的具体过程为:当输入自然语言问句时,对问句进行分词。分词时所采用的方法为jieba分词。构建分词词典,获取知识图谱中的实体名、关系名、属性名及属性值加入自定义分词词典,并将上述名词的同义词列表加入词典。分词的目的是划分出输入问题中所包含的知识图谱中的关键词,并确定这些关键词在知识图谱中的类型。

在一具体实施例中,在步骤5)中,为了给用户提供准确的答案,本发明的问答系统选择了基于模板匹配的方式,对用户问句解析结果匹配合适的查询模板。模板库已经在上一步建立。图数据库提供了大量准确全面的战场信息,且军事领域知识问答系统问句及答案都有一定的范围,所以对人工创建模板数量的要求较低。在上一步采用jieba分词工具对问句进行分词后可以对问句进行过滤,然后收集问句当中所涉及到的实体类型,将分词后得到的结果与预先定义的模板进行匹配,找到匹配率最高的模式。例如当匹配到“实体+属性”的模式时,用户最有可能查询的为该实体所包含属性的属性值。

在一具体实施例中,在步骤6)中,对用户输入的自然语言问句进行分类后,根据问句的分类结果可以得到用户问句的查询目标和匹配的查询模板。接下来根据抽取出问句中的相关命名实体作为查询条件,将查询模板填充为完整的Cypher查询语句。

表2用户问句与对应查询模板举例

对于问句“导弹旅1的打击对象是什么”,根据分类结果,得到了该问句对应的查询模板“MATCH(m)-[r:打击]->(n)where m.name='%s'return m.name,type(r),n.name,labels(m),labels(n)”。将红方导弹部队‘导弹旅1’作为查询条件填入查询模板,生成完整的Cypher查询语句‘MATCH(m)-[r:打击]->(n)where m.name='导弹旅1'return m.name,type(r),n.name,labels(m),labels(n)’。最后在Neo4j中执行查询语句生成答案。要将用户问句中的‘导弹旅1’识别为对方导弹部队,涉及到自然语言处理中的命名实体识别任务,由Jieba分词工具完成。

在一具体实施例中,在步骤7)中,得到查询语句后,在图数据库Neo4j中执行查询语句获取答案。通过Python第三方库中的py2neo库,可以完成python和图数据库Neo4j的连接,py2neo支持图数据库中的结点创建、关系创建、属性创建和结点查询,属性值查询,节点间的关系查询等多种对图数据库Neo4j的操作。查询结果以文本和图的形式返回,如果最终没有查询结果则返回提示信息。

本发明还公开了一种基于军事领域知识图谱的问答系统的构建系统,包括:

建模模块,用于采用混合本体方法进行本体建模;

知识图谱构建模块,用于利用不同来源的数据构建面向军事领域的知识图谱,并存储于图数据库;

问答查询模块构建模块,用于以调查问卷的方式收集战场信息知识问答问句,以问句中的查询意图为中心构建知识问答查询模板;可以对查询模板进行增加、删除、修改和查看;

问句解析模块,用于输入自然语言问句,对问句进行分类,得到分类结果;

模板匹配模块,用于根据分类结果为问句匹配对应的查询模板;

查询语句生成模块,用于找出问句中的实体来完善查询语句;

查询模块,用于通过查询语句在图数据库中检索答案,并将答案返回。

本实施例的构建系统的后端包括:图形数据库Neo4j,用来存储网络节点及节点间的关系;一个基于Python的Web微框架Flask;neo4j的Python API包py2neo;前端包括:显示节点及关系的Echarts,用于分析和制作可视化图形,其中把存储在Neo4j图数据库的战场态势知识图谱数据显示到前端的可视化问答系统的架构体系如图2所示。

本发明进一步公开了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序在被处理器运行时执行如上所述的基于军事领域知识图谱的问答系统的构建方法的步骤。本发明还公开了一种计算机设备,包括存储器和处理器,所述存储器上存储有计算机程序,所述计算机程序在被处理器运行时执行如上所述的基于军事领域知识图谱的问答系统的构建方法的步骤。

本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,计算机程序可存储于一个计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,计算机程序包括计算机程序代码,计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。计算机可读介质可以包括:能够携带计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质等。存储器可用于存储计算机程序和/或模块,处理器通过运行或执行存储在存储器内的计算机程序和/或模块,以及调用存储在存储器内的数据,实现各种功能。存储器可以包括高速随机存取存储器,还可以包括非易失性存储器,例如硬盘、内存、插接式硬盘,智能存储卡(Smart MediaCard,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)、至少一个磁盘存储器件、闪存器件、或其它易失性固态存储器件等。

以上仅是本发明的优选实施方式,本发明的保护范围并不仅局限于上述实施例,凡属于本发明思路下的技术方案均属于本发明的保护范围。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理前提下的若干改进和润饰,应视为本发明的保护范围。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号