首页> 中国专利> 一种基于关系路径与双层注意力的知识图谱嵌入方法

一种基于关系路径与双层注意力的知识图谱嵌入方法

摘要

本发明公开了一种基于关系路径与双层注意力的知识图谱嵌入方法。依次包括以下步骤:步骤1:构建双层注意力编码器,在深度学习技术的基础上结合关系路径学习知识图谱嵌入;步骤2:根据步骤1得到的嵌入表示,引入生成对抗网络对学得的嵌入表示施加正则化约束。通过联合优化嵌入表示学习和对抗训练,模型可以得到一个更加鲁棒的嵌入表示,可以有效地提升下游任务的性能,例如链路预测等。

著录项

  • 公开/公告号CN113806559A

    专利类型发明专利

  • 公开/公告日2021-12-17

    原文格式PDF

  • 申请/专利权人 东南大学;

    申请/专利号CN202111122504.7

  • 发明设计人 何洁月;王金梦;张乃心;

    申请日2021-09-24

  • 分类号G06F16/36(20190101);G06N3/04(20060101);G06N3/08(20060101);

  • 代理机构32206 南京众联专利代理有限公司;

  • 代理人许小莉

  • 地址 210096 江苏省南京市玄武区四牌楼2号

  • 入库时间 2023-06-19 13:45:04

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2022-01-04

    实质审查的生效 IPC(主分类):G06F16/36 专利申请号:2021111225047 申请日:20210924

    实质审查的生效

说明书

技术领域

本发明涉及一种知识图谱嵌入方法,具体涉及一种基于关系路径与双层注意力的知识图谱嵌入方法。

背景技术

知识图谱嵌入(Knowledge Graph Embedding,KGE)属于表示学习的范畴,关键思想是将实体和关系嵌入到低维连续的向量空间中,在保留知识图谱固有结构的同时简化操作,学到的嵌入表示可以进一步用于各种任务中,如知识库补全、推荐系统等。知识图谱表示学习领域已提出了大量相关模型,尽管已有的基于深度学习的KGE模型比浅层模型很大程度地提升了嵌入的表达能力,但仍然存在一些问题:(1)它们通过堆叠多个网络层传播高阶邻域内的信息,容易发生过度平滑,即模型过深时高阶邻域中的信息会剧减,从而无法充分提取知识图谱中的语义信息;(2)它们通常仅利用知识图谱中存在的三元组事实,并且往往只考虑实体之间的直接关系,忽略了“间接关系”的重要性。实际上实体之间存在着大量的多步路径,并且蕴含了丰富的推理模式;(3)知识图谱中的关系是至关重要的,但是以往模型通常利用权重矩阵更新关系表示,对关系的嵌入学习比较简单。(4)另外,复杂的网络结构缺乏正则化约束,容易发生过拟合问题,导致模型的鲁棒性和泛化能力较差。

发明内容

发明目的:针对上述存在的问题,本发明设计了一种基于关系路径与双层注意力的知识图谱嵌入方法,即HARPA(Hierarchical Attention with Relation Paths forKnowledge Graph Embedding Adversarial Learning)。具体来说,HARPA模型包含两部分:双层注意力编码器和对抗训练模块。双层注意力编码器首先在三元组级别挖掘三元组和邻域中的信息,不用堆叠多个注意力层便可获取高阶邻域的信息,更好地利用邻域信息辅助模型学习嵌入;然后在路径级别采用注意力机制衡量路径与对应关系之间的语义相似性,并基于三元组级别的关系嵌入建模路径,进一步使用路径表示更新关系嵌入,最后使用ConvKB模型作为解码器执行链路预测任务,将学得的实体关系表示输入到解码器中,更好地维持了三元组之间的平移特性。在嵌入过程中同时引入生成对抗网络指导编码器的嵌入表示学习过程,可以将生成对抗网络模块视作整个模型的正则化项,约束知识图谱嵌入表示学习的过程,从而缓解过拟合的问题并增强模型的鲁棒性。

技术方案:本发明所述的一种基于关系路径与双层注意力的知识图谱嵌入方法依次包括以下顺序执行的步骤:

步骤1.构建双层注意力编码器,包含三元组级别和路径级别,首先在三元组级别学习实体嵌入和关系嵌入,通过注意力机制计算三元组的权重系数后更新实体表示,以获取邻域内邻居节点对中心实体的不同影响,然后将学得的嵌入表示输入到下一层;然后在路径级别根据对应关系与路径之间的语义相似性筛选路径,紧接着基于三元组级别的嵌入建模路径表示,并通过注意力机制计算路径的权重后进一步更新关系嵌入,解码器进一步提取三元组和路径中的信息,并维持三元组的平移特性;

步骤2.根据步骤1得到的嵌入表示,引入生成对抗网络对学得的嵌入表示施加正则化约束。

进一步地,步骤1中所述双层注意力编码器基于图注意力网络(Graph AttentionNetwork,GAT)构建,具体包括如下步骤:

步骤1.1.在三元组级别,对GAT加以改进,在计算邻域中不同三元组对中心实体的影响时考虑关系:针对每个中心实体,首先在头实体、尾实体和关系的初始表示上执行线性转换,然后使用激活函数以确保注意力非负即获得每个三元组的嵌入表示:

其中,

步骤1.2.获得每个三元组的嵌入表示后按式(2)得到邻域内每个三元组的相对注意力系数:

其中,α

步骤1.3.进一步使用多头注意力机制更新实体的嵌入表示:

其中,M表示使用注意力机制的总次数,||表示拼接,

步骤1.4.在三元组级别的最后一层注意力网络上,采用平均操作聚合嵌入表示:

其中,

经过堆叠多层注意力后的实体嵌入表示矩阵为

同时,在输入的关系嵌入上使用参数矩阵ω

其中,

步骤1.5.在路径级别,获取到知识图谱中的所有路径后,首先基于直接关系与对应路径之间语义相似性的方法筛选出可靠的路径,对于实体对(h,t)之间的任意一条路径p

其中,

步骤1.6.在拼接路径表示与对应关系r的表示后执行线性变换,再使用激活函数σ计算路径p

其中,

得到每条路径与关系的相似性得分

步骤1.7.得到最终参与训练的路径后,基于三元组级别学到的嵌入表示,进一步更新关系嵌入,在注意力层匹配实体对之间的直接关系和路径,按照式(9)(10)计算每条路径的相对注意力系数:

其中,w,V为参数矩阵,

其中,

步骤1.8.聚合三元组级别的关系表示与路径级别对应的路径表示更新嵌入,以获取最终的关系嵌入表示

HARPA基于三元组平移转换的思想,通过度量经过关系平移后的头实体与尾实体之间的L

其中,d

步骤1.9.最小化基于margin的损失函数训练模型,从而学得实体和关系的嵌入表示:

其中,[x]

进一步地,步骤1中所述解码器采用ConvKB模型作为解码器,进一步提取三元组和路径中的信息,并维持三元组的平移特性的具体方法是:

将每个三元组嵌入表示为三列矩阵的形式,再使用多个1D过滤器进行卷积得到多个不同特征图,然后将多个特征图串联在一起得到一个单独的向量,即三元组的嵌入表示,最后使用点积计算三元组的分数:

其中,f(h,r,t)为三元组得分函数,concat(·)表示连接操作,

最后通过最小化soft-margin损失函数训练解码器,损失函数带有权重向量θ的L

其中,L

进一步地,步骤2具体包括如下步骤:

步骤2.1.从双层编码器中获取实体嵌入表示的分布p

其中,x

步骤2.2.将嵌入表示作为正样本,生成样本作为假样本输入到判别器D中,当对抗博弈的过程达到平衡时,判别器无法区别输入的数据来自于生成器还是编码器,通过式(20)进行对抗训练达到理想状态:

其中,min

有益效果:

本发明提供一种基于关系路径与双层注意力的知识图谱嵌入方法,双层注意力编码器首先在三元组级别上基于注意力计算不同邻居实体对中心实体的影响,从而学习实体表示;接着在路径级别根据路径与关系之间的语义相似性筛选路径,并再次使用注意力机制基于三元组级别的关系嵌入建模路径,从而进一步更新关系表示,最后使用ConvKB作为解码器执行链路预测任务,将学得的实体关系表示输入到解码器中,更好地维持了三元组之间的平移特性;在嵌入过程中同时引入了一个对抗训练模块,即使用生成对抗网络为编码器学习嵌入表示的过程施加约束,并在嵌入表示学习过程中建模了一定的不确定性,以缓解模型的过拟合问题,并且增强模型的鲁棒性。模型最终联合优化嵌入表示学习和对抗训练过程,对抗训练模块可以看作是整个模型的正则化项,其包含以下优点:

(1)一种新颖的基于关系路径与双层注意力的知识图谱嵌入表示对抗学习模型HARPA,通过在深度学习技术的基础上结合关系路径辅助模型学习嵌入。相比于现有的方法,利用注意力机制与关系路径充分地提取了知识图谱中三元组、高阶邻域以及多步路径中的丰富语义信息,提高了嵌入表示的表达能力;

(2)通过引入生成对抗网络作为对抗训练模块,为嵌入表示过程建模了一定的不确定性,并为嵌入表示学习过程施加正则化约束。在对抗训练过程中,判别器在与生成器博弈的过程中对编码器进行正则化,最终使得模型更具鲁棒性,并且有效地缓解了模型的过拟合问题。

附图说明

图1本发明中HARPA算法的流程图;

图2为嵌入维度D对性能影响示意图;

图3为相似度阈值Sim对性能影响示意图;

图4为对抗学习率lr_adv对性能影响示意图;

图5为间距值γ对性能影响示意图;

图6为消融实验示意图;

图7为实施例中实体邻域样例。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白,下面结合具体实施例和说明附图对本发明作进一步说明,应当理解,此处所描述的优先实施例仅用于说明和解释本发明,并不用于限定本发明。

本发明所述的一种基于关系路径与双层注意力的知识图谱嵌入方法依次包括以下顺序执行的步骤:

步骤1.构建双层注意力编码器,包含三元组级别和路径级别,首先在三元组级别学习实体嵌入和关系嵌入,通过注意力机制计算三元组的权重系数后更新实体表示,以获取邻域内邻居节点对中心实体的不同影响,然后将学得的嵌入表示输入到下一层;然后在路径级别根据对应关系与路径之间的语义相似性筛选路径,紧接着基于三元组级别的嵌入建模路径表示,并通过注意力机制计算路径的权重后进一步更新关系嵌入,解码器进一步提取三元组和路径中的信息,并维持三元组的平移特性;

步骤2.根据步骤1得到的嵌入表示,引入生成对抗网络对学得的嵌入表示施加正则化约束。引入生成对抗网络(Generative Adversarial Network,GAN)作为模型的一个正则化项,引入这一模块的有两个优点:作为正则化项可以更好的指导编码器提取输入的有用信息;生成对抗训练可以帮助模型学习出更鲁棒的嵌入表示,可以有效缓解过拟合的问题,提高了模型的泛化能力。

进一步地,步骤1中所述双层注意力编码器基于图注意力网络(Graph AttentionNetwork,GAT)构建,具体包括如下步骤:

步骤1.1.在三元组级别,对GAT加以改进,在计算邻域中不同三元组对中心实体的影响时考虑关系:针对每个中心实体,首先在头实体、尾实体和关系的初始表示上执行线性转换,然后使用激活函数以确保注意力非负即获得每个三元组的嵌入表示:

其中,

步骤1.2.获得每个三元组的嵌入表示后按式(2)得到邻域内每个三元组的相对注意力系数:

其中,α

特别注意的是:为了更好地利用高阶邻域的信息,这里的N

步骤1.3.进一步使用多头注意力机制更新实体的嵌入表示:

其中,M表示使用注意力机制的总次数,||表示拼接,

步骤1.4.在三元组级别的最后一层注意力网络上,采用平均操作聚合嵌入表示:

经过堆叠多层注意力后的实体嵌入表示矩阵为

同时,在输入的关系嵌入上使用参数矩阵ω

其中,

步骤1.5.在路径级别,获取到知识图谱中的所有路径后,首先基于直接关系与对应路径之间语义相似性的方法筛选出可靠的路径,对于实体对(h,t)之间的任意一条路径p

其中,

步骤1.6.在拼接路径表示与对应关系r的表示后执行线性变换,再使用激活函数σ计算路径p

其中,

得到每条路径与关系的相似性得分

步骤1.7.得到最终参与训练的路径路径后,基于三元组级别学到的嵌入表示,进一步更新关系嵌入,在注意力层匹配实体对之间的直接关系和路径,按照式(9)(10)计算每条路径的相对注意力系数:

其中,w,V为参数矩阵,

其中,

步骤1.8.聚合三元组级别的关系表示与路径级别对应的路径表示更新嵌入,以获取最终的关系嵌入表示

HARPA基于三元组平移转换的思想,通过度量经过关系平移后的头实体与尾实体之间的L

其中,d

步骤1.9.最小化基于margin的损失函数训练模型,从而学得实体和关系的嵌入表示:

其中,[x]

进一步地,步骤1中所述解码器采用ConvKB模型作为解码器,利用ConvKB的评分函数对学得的三元组嵌入表示进行打分以评估三元组的置信度,这一过程的目标使得嵌入表示具有更高的表达能力,从而提升嵌入表示在下游任务上的性能。进一步提取三元组和路径中的信息,并维持三元组的平移特性的具体方法是:

将每个三元组嵌入表示为三列矩阵的形式,再使用多个1D过滤器进行卷积得到多个不同特征图,然后将多个特征图串联在一起得到一个单独的向量,即三元组的嵌入表示,最后使用点积计算三元组的分数:

其中,f(h,r,t)为三元组得分函数,concat(·)表示连接操作,

最后通过最小化soft-margin损失函数训练解码器,损失函数带有权重向量θ的L

其中,L

进一步地,步骤2具体包括如下步骤:

步骤2.1.从双层编码器中获取实体嵌入表示的分布p

其中,x

步骤2.2.将嵌入表示作为正样本,生成样本作为假样本输入到判别器D中,当对抗博弈的过程达到平衡时,判别器无法区别输入的数据来自于生成器还是编码器,通过式(20)进行对抗训练达到理想状态:

其中,min

为了验证模型学习到的嵌入表示的有效性,本文在四个通用知识图谱上进行了链路预测(LinkPrediction)实验,除此之外,还进行了参数学习和消融分析进一步验证模型的有效性,本文使用的数据集的如表1所示。

表1实验所用数据集

图2展示了,随着嵌入维度的不断增大,模型在链路预测任务上的指标值先以较快的速度增长,然后缓慢增长,最终逐渐趋于稳定。

图3展示了,在根据路径与关系的语义相似性筛选路径时,随着相似度阈值的增加,整体上结果有所提升,表明通过提高相似度阈值可以获取到更加可靠的路径,进一步学到更高质量的编码表示。

图4展示了,在使用margin-based作为编码器的目标函数时,不同规模的数据集对最优的间距值有不同的要求,图4中(a)为Kinship数据集,(b)为WN18RR数据集。

图5展示了,随着对抗学习率初始时的不断增大,指标值均有所提升,但是当学习率继续增大时,指标值有所下降,说明学习率过小时,模型收敛较慢,可能没有达到最优解,而学习率过高时,模型学习时间加快,可能提前到达拟合点,跳出最优解,容易发生过拟合现象。

图6展示了,当去掉HARPA模型中的路径与对抗训练模块(HARPA-adv-path)时,模型的性能最差且波动较大;添加路径之后(HARPA-adv),模型性能明显上升,说明了结合关系路径可以有效提升模型学习嵌入表示的能力;而HARPA模型的性能优于HARPA-adv,并且可以看出HARPA-adv有一定的波动,HARPA模型则呈现稳定上升的趋势,说明在结合路径的基础上进一步引入生成对抗网络,有效地增强了模型学得的嵌入表示的鲁棒性。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号