公开/公告号CN114911879A
专利类型发明专利
公开/公告日2022-08-16
原文格式PDF
申请/专利权人 南京航天数智科技有限公司;
申请/专利号CN202210848312.2
发明设计人 徐慧;
申请日2022-07-19
分类号G06F16/28(2019.01);G06N3/04(2006.01);G06N3/08(2006.01);G06Q50/18(2012.01);
代理机构南京众联专利代理有限公司 32206;
代理人杜静静
地址 210012 江苏省南京市雨花台区软件大道180号大数据1号楼6F
入库时间 2023-06-19 16:25:24
法律状态公告日
法律状态信息
法律状态
2023-07-04
发明专利申请公布后的驳回 IPC(主分类):G06F16/28 专利申请号:2022108483122 申请公布日:20220816
发明专利申请公布后的驳回
2022-09-02
实质审查的生效 IPC(主分类):G06F16/28 专利申请号:2022108483122 申请日:20220719
实质审查的生效
技术领域
本发明属于自然语言处理、知识图谱领域,涉及到一种基于图注意力网络的刑事案件知识图谱关系推理方法。
背景技术
随着大数据、人工智能技术的不断发展,产生了大量数据,如何规范好、应用好相关数据,知识图谱应运而生。知识图谱是结构化的语义知识库,用于以符号形式描述物理世界中的概念及其相互关系,其基本组成单位是“实体-关系-实体”三元组,以及实体及其相关属性-值对,实体间通过关系相互联结,构成网状的知识结构。以知识图谱为基础的知识推理也成为研究热点,知识推理的出现可以更好地利用和优化知识图谱。
《新一代人工智能发展规划》将“智慧法院”纳入其中,标志着人工智能技术在司法领域的应用上升到国家战略。在司法领域,普遍存在案多人少的问题,而对于涉案人员多、涉案范围广、涉案时间跨度大等问题的复杂案件,需要更多基层人员参与案件的侦察环节,如此使问题进一步加重。因此,需要一种基于图注意力网络的刑事案件知识图谱关系推理方法,借助刑事案件知识图谱,基于知识推理技术对复杂案件中存在的且容易被忽略的案件关系进行挖掘,辅助侦察办案人员对案件的梳理。
发明内容
本发明主要解决的技术问题在于辅助侦察、检察办案环节,对于时间跨度大、涉及范围广、涉案人员复杂等情况下,办案人员无法全局掌握案件全貌,因此忽略一些重要的案件细节,本发明提供一种基于注意力网络的刑事案件知识图谱关系推理方法。
为达到上述目的,本发明的技术方案如下:一种基于图注意力网络的刑事案件知识图谱关系推理方法,该方法包括如下步骤:
首先构建刑事案件知识图谱,在此基础上,通过图注意力网络计算并更新图谱中实体的表示向量、通过线性变换计算并更新关系表示向量;接着依据ConvKB模型并结合更新后的实体、关系表示向量计算相关三元组的得分,最后通过训练ConvKB模型对三元组合理性判断,从而完成关系推理。
本发明的一种基于图注意力网络的刑事案件知识图谱关系推理方法,包括如下步骤:
1)构建刑事案件知识图谱;
2)基于图注意力网络计算刑事案件知识图谱中实体表示向量;
3)计算刑事案件知识图谱中关系表示向量;
4)基于ConvKB模型计算三元组得分函数;
5)训练ConvKB模型完成刑事案件知识图谱关系推理。
作为本发明的一种改进,所述步骤 1)中,围绕案件相关人物(单位)、案件相关时间、案件相关空间、案件相关财物、犯罪行为等构建刑事案件知识图谱。在刑事案件知识图谱构建过程中,首先构建刑事案件知识图谱的知识体系,其中包括案件相关人物(单位)等一级标签、犯罪嫌疑人、被害人、证人、辩护人、在逃人等二级标签;同时包括各二级标签的数据属性和关系属性;接着采用信息抽取技术从刑事案件卷宗中抽取有效信息对知识体系中涉及的相关知识进行实例化操作,最终形成刑事案件知识图谱。其中先构建知识体系再进行实例化的知识图谱构建方式能够从整体了解知识图谱中包含的知识以及不同知识之间的逻辑关系。
作为本发明的一种改进,所述步骤 2)中,基于图注意力网络,输入特定实体
所述步骤2)中,基于图注意力网络,输入特定实体关联的三元组表示向量,输出更新后的特定实体表示向量,即通过实体周边信息更新实体表示向量,具体计算步骤如下:
2.1从刑事案件知识图谱中获取与实体
2.2随机初始化三元组中的实体和关系表示向量,其中
2.3计算每个三元组的初始表示向量
其中
2.4计算每个三元组相对注意力系数
其中
2.5计算并更新实体
其中
具体计算步骤如下:
作为本发明的一种改进,所述步骤3)中,通过线性变化计算关系表示向量,计算公式如下:
其中
作为本发明的一种改进,所述步骤 4)中,基于ConvKB模型,计算三元组得分函数。ConvKB模型中通过拼接不同卷积操作生成的特征向量得到三元组的表示向量,再通过点积与权重向量相乘得到最终的的得分函数,从而判断该三元组是否有效。基于ConvKB模型可以从不同维度获取三元组的深层语义信息,使判断结果更加准确。
具体计算公式如下:
其中
作为本发明的一种改进,所述步骤5)中,采用Adam优化器最小化损失函数来训练ConvKB模型,其中损失函数采用软边际损失,计算公式如下:
其中当
相对于现有技术,本发明的优点如下:
1)将基于图注意力网络的知识图谱关系推理应用到刑事案件的关系推理中,通过对时间跨度大、跨地区、涉案人员复杂的案件细节中不易挖掘的人物关系、案件关系等关系的推理辅助办案人进行案情梳理;
2)基于图注意力网络,融入相邻实体节点与关系的实体表示向量学习方法,相较于传统的实体表示向量学习方法,加入了关系特征,以学习三元组的权重信息进行实体表示向量的计算与更新,从而能够更好的对当前实体进行表征;
3)采用了ConvKB模型作为解码器,从不同维度获取三元组的深层语义信息,能够更加准确的判断三元组的有效性。
附图说明
图1是基于图注意力网络的刑事案件知识图谱关系推理流程图;
图2是三元组相对注意力系数计算示意图;
图3是基于多头注意机制实体表示向量更新示意图;
图4是ConvKB模型计算流程图。
具体实施方式
为了加深对本发明的认识和理解,下面结合附图详细的介绍本方案。
实施例1:一种基于图注意力网络的刑事案件知识图谱关系推理方法,方法流程图如图1所示,具体包括如下步骤:
1. 构建刑事案件知识图谱;
本发明是基于知识图谱的关系推理,故第一步需要构建刑事案件知识图谱。构建刑事案件知识图谱主要分两个步骤,首先构建刑事案件知识体系,然后对知识体系中涉及的知识进行实例化。
刑事案件知识体系包含案件相关人物(单位)、案件相关时间、案件相关空间、案件相关财物、犯罪行为五类一级标签,各一级标签又分为二级标签,例如案件相关人物(单位)包括犯罪嫌疑人、被害人、证人、扭送人、投案人、受理人、辩护人、在逃人等二级标签;案件相关空间包括作案地点、抓获地点、藏匿地点、销赃地点、犯罪预备地点、运输地点、交易地点等二级标签;犯罪行为包括作案手段、作案动机、危害后果等二级标签。一级标签与二级标签之间的层级关系示例,如表1所示。
表1:一级标签与二级标签之间的层级关系示例;
刑事案件知识体系不仅包括各一级、二级标签之间的层级关系,也包含了各二级标签的数据属性和关系属性,其中数据属性例如犯罪嫌疑人包括姓名、曾用名、年龄、性别、身份证号码、户籍所在地、现居地址、出生日期、文化程度等;作案地点包括地点名称、所在行政区、地域特点等;涉案物品包括物品名称、物品规格、物品颜色等;关系属性例如“侵害”指犯罪嫌疑人、被害人之间的关系;“导致”指犯罪嫌疑人、危害后果之间的关系。
对知识体系进行实例化过程中,采用实体识别、关系抽取、属性抽取等技术从案件卷宗中提取相关信息从而构建刑事案件知识图谱。
2. 基于图注意力网络计算刑事案件知识图谱中实体表示向量;
在该步骤中,基于图注意力网络,模型输入特定实体
2.1从刑事案件知识图谱中获取与实体
2.2随机初始化三元组中的实体和关系表示向量,其中
2.3计算每个三元组的初始表示向量
其中
2.4计算每个三元组相对注意力系数
其中
2.5计算并更新实体
其中
3. 计算刑事案件知识图谱中关系表示向量;
在该步骤中,通过线性变化计算关系表示向量,计算公式如下:
其中
4. 基于ConvKB模型计算三元组得分函数;
在该步骤中,基于ConvKB模型,通过拼接不同卷积操作生成的特征向量得到三元组的表示向量,再通过点积与权重向量相乘得到最终的三元组得分函数,依据得分函数判断该三元组是否有效。ConvKB模型计算流程图如图4所示,得分函数计算公式如下:
其中
5. 训练ConvKB模型完成刑事案件知识图谱关系推理;
在该步骤中,采用Adam优化器最小化损失函数来训练ConvKB模型,其中损失函数采用软边际损失,计算公式如下:
其中当
需要说明的是上述实施例仅仅是本发明的较佳实施例,并没有用来限定本发明的保护范围,在上述技术方案的基础上做出的等同替换或者替代,均属于本发明的保护范围。
机译: 基于知识垂直关系的推理方法
机译: 基于神经网络的知识图不一致性推理方法
机译: 一种基于知识图谱的多用户游戏服务提供方法及其装置