首页> 中国专利> 基于结构语义融合的大规模混合图特征学习方法

基于结构语义融合的大规模混合图特征学习方法

摘要

本发明提供一种基于结构语义融合的大规模混合图特征学习方法,包括:获取训练语义标签信息集Strain,获取节点对集Pe,Pe={(u,v)},遍历节点对(u,v);判断遍历节点对(u,v)是否完成;若判断获知遍历节点对(u,v)未完成,则对节点u进行负采样,并计算相连损失函数和不相连损失函数;若判断获知节点u在Vtrain中,则根据Strain计算语义损失函数;更新节点u的初始化特征表示、节点v的初始化特征表示以及负采样得到的节点的初始化特征表示;重复判断遍历节点对(u,v)是否完成,直到遍历节点对(u,v)完成。本发明提供的基于结构语义融合的大规模混合图特征学习方法,根据语义标签信息对节点的特征表示进行校正,将语义标签信息作为图特征学习的一部分,提高了图特征学习的质量。

著录项

  • 公开/公告号CN107944489A

    专利类型发明专利

  • 公开/公告日2018-04-20

    原文格式PDF

  • 申请/专利权人 清华大学;

    申请/专利号CN201711169332.2

  • 发明设计人 王建民;龙明盛;裴忠一;黄向东;

    申请日2017-11-17

  • 分类号G06K9/62(20060101);G06K9/72(20060101);

  • 代理机构11002 北京路浩知识产权代理有限公司;

  • 代理人王莹;吴欢燕

  • 地址 100084 北京市海淀区清华园北京100084-82信箱

  • 入库时间 2023-06-19 05:05:07

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2019-09-27

    著录事项变更 IPC(主分类):G06K9/62 变更前: 变更后: 申请日:20171117

    著录事项变更

  • 2018-10-16

    授权

    授权

  • 2018-05-15

    实质审查的生效 IPC(主分类):G06K9/62 申请日:20171117

    实质审查的生效

  • 2018-04-20

    公开

    公开

说明书

技术领域

本发明涉及计算机数据分析技术领域,尤其涉及一种基于结构语义融合的大规模混合图特征学习方法。

背景技术

从图中可以挖掘大量有价值的信息,例如哪些节点具有较高的相似度,哪些节点形成了一个社区,可能存在哪些潜在的连接关系等。图特征学习作为图数据挖掘领域的一个重要技术,为在图数据上应用机器学习算法提供了基础。图特征学习的目标是为图中每个节点生成一个特征向量,以作为机器学习算法的输入,得到符合图特性的分析结果或者模型。

现有技术中公开了多种图特征学习方法,其中大批工作针对如何保持图结构的问题被提出,并且这类基于连接结构的图特征学习方法取得了很好的效果。但是在实际应用中,图节点经常带有一些标签,比如社交网络中个人的教育背景、职业背景、兴趣爱好,内容分享网站中博客和图文的标签、分组等。这些标签对于图数据挖掘问题具有重要意义,而这些标签包含的信息往往无法通过基于连接结构的图特征学习方法挖掘到。另外,有一些研究工作基于图节点社区信息、图节点附带的文本或图片信息来进行图特征学习。

现有技术中基于连接结构的图特征学习方法无法挖掘到图节点标签包含的信息,而基于图节点社区信息、图节点附带的文本或图片信息来进行图特征学习的方法不适用于对标签信息的挖掘,也不能法挖掘到图节点标签包含的信息,图特征学习的质量较低。

发明内容

(一)要解决的技术问题

本发明的目的是提供一种基于结构语义融合的大规模混合图特征学习方法,解决了现有技术中的图特征学习方法不能挖掘到图节点标签包含的信息,以及图特征学习质量较低的技术问题。

(二)技术方案

为了解决上述技术问题,一方面,本发明提供一种基于结构语义融合的大规模混合图特征学习方法,包括:

获取训练语义标签信息集Strain,所述Strain为训练节点集Vtrain对应的语义标签信息的集合,所述Vtrain是从图中按照预设采样比例随机采样获得的若干个节点的集合,所述图为G,G=(V,E,S),其中,V为图节点,E为图中的边,S为图语义标签信息;

获取节点对集Pe,Pe={(u,v)},其中,节点对(u,v)为所述节点对集Pe中的一个元素,节点u和节点v为从所述E中采样获得的某条边对应的两个节点;

遍历所述节点对集Pe中的所有节点对(u,v);

判断所述遍历是否完成;

若判断获知所述遍历未完成,则对所述节点u进行负采样,并计算相连损失函数和不相连损失函数;

若判断获知所述节点u在所述Vtrain中,则根据所述Strain计算语义损失函数;

根据相连损失函数、不相连损失函数和语义损失函数,更新所述节点u的初始化特征表示、所述节点v的初始化特征表示和所述负采样得到的节点的初始化特征表示,得到所述节点u的新的特征表示、所述节点v的新的特征表示以及所述负采样得到的节点的新的特征表示;

重复判断所述遍历是否完成,直到所述遍历完成。

进一步地,所述方法还包括:

根据节点语义标签信息si和标签lj,生成标签lj的特征表示LFj,其中,所述节点语义标签信息si为训练节点i的语义标签信息,所述si为所述Strain中的元素,所述标签lj为标签集Lj中的元素,所述标签集Lj为训练节点i所包含的标签的集合,所述训练节点i为所述Vtrain中的节点,j为正整数。

进一步地,所述方法还包括:

根据正态分布函数随机初始化所述V的特征表示,得到所述V的特征表示的集合NF,NF={NFk,k∈[1,n]},其中,NFk为节点k的特征表示,n为所述V中节点的个数,n、k为正整数。

进一步地,所述获取节点对集Pe,Pe={(u,v)}具体为:

根据所述E中每条边的权重占所有边权重之和的比例对所述E进行采样,得到节点对集Pe,Pe={(u,v)},其中,节点对(u,v)为所述节点对集Pe中的一个元素,节点u和节点v为从所述E中采样获得的某条边对应的两个节点。

进一步地,所述对所述节点u进行负采样,并计算相连损失函数和不相连损失函数具体为:

根据预设正负比例对所述节点u进行负采样,得到节点对集其中,节点对(u,w)为所述节点对集中的一个元素,节点u和节点w为不相邻的两个节点;

计算相连损失函数,具体为,

其中,Lossstructure(u,v)为相连损失函数,NFu为节点u的特征表示,NFv为节点v的特征表示;

计算不相连损失函数,具体为,

其中,为不相连损失函数,NFu为节点u的特征表示,NFw为节点w的特征表示。

进一步地,所述根据所述Strain计算语义损失函数具体为:

其中,为语义损失函数,标签lu为标签集Lu中的元素,标签为标签集中的元素,所述标签集Lu为节点u所包含的标签的集合,所述标签集为标签集L与所述标签集Lu的差集,所述标签集L为图中所有节点包含的标签的集合,NFu为节点u的特征表示,LFu为标签lu的特征表示,为标签的特征表示。

进一步地,所述方法还包括:

若判断获知所述节点u不在所述Vtrain中,则根据相连损失函数和不相连损失函数,更新所述节点u的初始化特征表示、所述节点v的初始化特征表示和所述负采样得到的节点的初始化特征表示,得到所述节点u的新的特征表示、所述节点v的新的特征表示以及所述负采样得到的节点的新的特征表示。

另一方面,本发明提供一种基于结构语义融合的大规模混合图特征学习装置,包括:

获取模块,用于获取训练语义标签信息集Strain,所述Strain为训练节点集Vtrain对应的语义标签信息的集合,所述Vtrain是从图中按照预设采样比例随机采样获得的若干个节点的集合,所述图为G,G=(V,E,S),其中,V为图节点,E为图中的边,S为图语义标签信息;

获取节点对集Pe,Pe={(u,v)},其中,节点对(u,v)为所述节点对集Pe中的一个元素,节点u和节点v为从所述E中采样获得的某条边对应的两个节点;

遍历模块,用于遍历所述节点对集Pe中的所有节点对(u,v);

计算模块,用于判断所述遍历是否完成;

若判断获知所述遍历未完成,则对所述节点u进行负采样,并计算相连损失函数和不相连损失函数;

若判断获知所述节点u在所述Vtrain中,则根据所述Strain计算语义损失函数;

更新模块,用于根据相连损失函数、不相连损失函数和语义损失函数,更新所述节点u的初始化特征表示、所述节点v的初始化特征表示和所述负采样得到的节点的初始化特征表示,得到所述节点u的新的特征表示、所述节点v的新的特征表示以及所述负采样得到的节点的新的特征表示;

所述计算模块,还用于重复判断所述遍历是否完成,直到所述遍历完成。

再一方面,本发明提供一种用于基于结构语义融合的大规模混合图特征学习的电子设备,包括:

存储器和处理器,所述处理器和所述存储器通过总线完成相互间的通信;所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令能够执行上述方法。

又一方面,本发明提供一种计算机程序产品,所述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,使所述计算机执行上述的方法。

又一方面,本发明提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述的方法。

(三)有益效果

本发明提供的基于结构语义融合的大规模混合图特征学习方法,根据语义标签信息对节点的特征表示进行校正,将语义标签信息作为图特征学习的一部分,提高了图特征学习的质量。

附图说明

图1为依照本发明实施例的基于结构语义融合的大规模混合图特征学习方法示意图;

图2为依照本发明实施例的基于结构语义融合的大规模混合图特征学习方法的逻辑流程图;

图3为依照本发明实施例的基于结构语义融合的大规模混合图特征学习装置示意图;

图4为本发明实施例提供的用于基于结构语义融合的大规模混合图特征学习的电子设备的结构示意图。

具体实施方式

为了使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

实施例1:

图1为依照本发明实施例的基于结构语义融合的大规模混合图特征学习方法示意图,如图1所示,本发明实施例提供一种结构语义融合的大规模混合图特征学习方法,包括:

步骤S10、获取训练语义标签信息集Strain,所述Strain为训练节点集Vtrain对应的语义标签信息的集合,所述Vtrain是从图中按照预设采样比例随机采样获得的若干个节点的集合,所述图为G,G=(V,E,S),其中,V为图节点,E为图中的边,S为图语义标签信息;

步骤S20、获取节点对集Pe,Pe={(u,v)},其中,节点对(u,v)为所述节点对集Pe中的一个元素,节点u和节点v为从所述E中采样获得的某条边对应的两个节点;

步骤S30、遍历所述节点对集Pe中的所有节点对(u,v);

步骤S40、判断所述遍历是否完成;

步骤S50、若判断获知所述遍历未完成,则对所述节点u进行负采样,并计算相连损失函数和不相连损失函数;

步骤S60、若判断获知所述节点u在所述Vtrain中,则根据所述Strain计算语义损失函数;

步骤S70、根据相连损失函数、不相连损失函数和语义损失函数,更新所述节点u的初始化特征表示、所述节点v的初始化特征表示和所述负采样得到的节点的初始化特征表示,得到所述节点u的新的特征表示、所述节点v的新的特征表示以及所述负采样得到的节点的新的特征表示;

步骤S80、重复判断所述遍历是否完成,直到所述遍历完成。

具体的,首先,需要构建包含语义标签信息的图G=(V,E,S),其中,V为图节点,E为图中的边,S为图语义标签信息;S={si,i∈[1,n]},n为图节点个数,si为节点语义标签信息,Li为节点i包含的标签的集合,其中,为节点i包含的第k个标签。L为图中所有标签的全集。

然后,获取训练语义标签信息集Strain,所述Strain为训练节点集Vtrain对应的语义标签信息的集合,所述Vtrain是从图中按照预设采样比例随机采样获得的若干个节点的集合。所述预设采样比例可以设置为rl={0.01,0.05,0.1},根据该比例从S中随机选取用于生成全局节点特征表示的训练语义标签信息集Strain

然后,获取节点对集Pe={(u,v)},其中,节点u和节点v为从所述E中采样获得的某条边对应的两个节点;

然后,遍历节点对(u,v);

判断所述遍历节点对(u,v)是否完成;

若判断获知所述遍历节点对(u,v)未完成,则对所述节点u进行负采样,并计算相连损失函数和不相连损失函数;在对节点u进行负采样时,需要结合图的具体特点,可以按照预设的正负比例re={0.1,0.2,0.5}进行采样。

若判断获知所述节点u在所述Vtrain中,则根据所述Strain计算语义损失函数;

根据相连损失函数、不相连损失函数和语义损失函数,更新所述节点u的初始化特征表示、所述节点v的初始化特征表示和所述负采样得到的节点的初始化特征表示,得到所述节点u的新的特征表示、所述节点v的新的特征表示以及所述负采样得到的节点的新的特征表示;对所述节点u的初始化特征表示、所述节点v的初始化特征表示以及所述负采样得到的节点的新的特征表示进行更新,可以通过反向传播算法完成。

重复判断所述遍历节点对(u,v)是否完成,直到所述遍历节点对(u,v)完成,最终得到全局节点的特征表示。

进一步地,所述方法还包括:

根据节点语义标签信息si和标签lj,生成标签lj的特征表示LFj,其中,所述节点语义标签信息si为训练节点i的语义标签信息,所述si为所述Strain中的元素,所述标签lj为标签集Lj中的元素,所述标签集Lj为训练节点i所包含的标签的集合,所述训练节点i为所述Vtrain中的节点,j为正整数。

具体的,将节点语义标签信息si看做句子,每个标签lj看做词,利用自然语言学习中生成词特征的skip-gram模型生成标签lj的特征表示LFj。其中,所述节点语义标签信息si为训练节点i的语义标签信息,所述si为所述Strain中的元素,所述标签lj为标签集Lj中的元素,所述标签集Lj为训练节点i所包含的标签的集合,所述训练节点i为所述Vtrain中的节点,j为正整数。

进一步地,所述方法还包括:

根据正态分布函数随机初始化所述V的特征表示,得到所述V的特征表示的集合NF,NF={NFk,k∈[1,n]},其中,NFk为节点k的特征表示,n为所述V中节点的个数,n、k为正整数。

具体的,按照正态分布函数随机初始化图中所有节点的特征表示,得到图节点特征表示集NF,NF={NFk,k∈[1,n]},其中,NFk为节点k的特征表示,每个NFk是长度为m实数特征向量,n为所述V中节点的个数,n、k为正整数。

进一步地,所述获取节点对集Pe,Pe={(u,v)}具体为:

根据所述E中每条边的权重占所有边权重之和的比例对所述E进行采样,得到节点对集Pe,Pe={(u,v)},其中,节点对(u,v)为所述节点对集Pe中的一个元素,节点u和节点v为从所述E中采样获得的某条边对应的两个节点。

具体的,按照所述E中每条边的权重ωuv占所有边权重之和的比例对E进行采样,得到节点对集合Pe={(u,v)},其中,节点u和节点v为从所述E中采样获得的某条边对应的两个节点;ωuv越大,则u和v在学习过程中起到的作用越大。

进一步地,所述对所述节点u进行负采样,并计算相连损失函数和不相连损失函数具体为:

根据预设正负比例对所述节点u进行负采样,得到节点对集其中,节点对(u,w)为所述节点对集中的一个元素,节点u和节点w为不相邻的两个节点;

计算相连损失函数,具体为,

其中,Lossstructure(u,v)为相连损失函数,NFu为节点u的特征表示,NFv为节点v的特征表示;

计算不相连损失函数,具体为,

其中,为不相连损失函数,NFu为节点u的特征表示,NFw为节点w的特征表示。

具体的,根据图的具体特点,利用负采样(negative sampling)技术,按照预设正负比例,对节点u进行负采样得到节点对集合其中,节点对(u,w)为所述节点对集中的一个元素,u和w代表负采样得到的不相邻的两个节点。应用中,正负比例re可以设置为re={0.1,0.2,0.5}。

然后,计算相连损失函数,具体为,

其中,Lossstructure(u,v)为相连损失函数,NFu为节点u的特征表示,NFv为节点v的特征表示。

该相连损失函数刻画直接相邻的两个节点u和v的特征表示在表征相连关系时带来的误差;该误差越小,则NFu和NFv越能够体现节点u和v的连接关系。负采样得到的是若干个点对(u,w1)、(u,w2)等,然后将(u,v)、(u,w1)、(u,w2)都用于计算相连损失函数。

然后,计算不相连损失函数,具体为,

其中,为不相连损失函数,NFu为节点u的特征表示,NFw为节点w的特征表示。

该不相连损失函数刻画不相邻的两个节点u和w的特征表示在表征不相连关系时带来的误差;该误差越小,则NFu和NFw越能够体现节点u和w的不连接关系。负采样得到的是若干个点对(u,w1)、(u,w2)等,然后将(u,v)、(u,w1)、(u,w2)都用于计算不相连损失函数。

进一步地,所述根据所述Strain计算语义损失函数具体为:

其中,为语义损失函数,标签lu为标签集Lu中的元素,标签为标签集中的元素,所述标签集Lu为节点u所包含的标签的集合,所述标签集为标签集L与所述标签集Lu的差集,所述标签集L为图中所有节点包含的标签的集合,NFu为节点u的特征表示,LFu为标签lu的特征表示,为标签的特征表示。

具体的,若判断获知所述节点u在所述Vtrain中,则根据所述Strain计算语义损失函数,具体的计算方法为:

其中,为语义损失函数,标签lu为标签集Lu中的元素,标签为标签集中的元素,所述标签集Lu为节点u所包含的标签的集合,为标签集Lu中的第k个元素,所述标签集为标签集L与所述标签集Lu的差集,所述标签集L为图中所有节点包含的标签的集合,NFu为节点u的特征表示,LFu为标签lu的特征表示,为标签的特征表示,LFu作为节点u的特征空间的锚点。

该语义损失函数刻画某个点的特征表示在表达语义标签信息时带来的误差;该误差越小,则NFu越能够体现u和lu的关联关系,以及u和的不关联关系。

进一步地,所述方法还包括:

若判断获知所述节点u不在所述Vtrain中,则根据相连损失函数和不相连损失函数,更新所述节点u的初始化特征表示、所述节点v的初始化特征表示和所述负采样得到的节点的初始化特征表示,得到所述节点u的新的特征表示、所述节点v的新的特征表示以及所述负采样得到的节点的新的特征表示。

图2为依照本发明实施例的基于结构语义融合的大规模混合图特征学习方法的逻辑流程图,下面以图2所示的逻辑流程图作为本实施例的一个例子对本发明实施例的方法做进一步地说明,如图2所示:

首先,需要构建包含语义标签信息的图G=(V,E,S),并且载入混合图数据G。

然后,采样语义标签信息,即,从图中按照预设采样比例随机采样获得的若干个节点的集合Vtrain,得到与所述训练节点集Vtrain对应的训练语义标签信息集Strain

然后,进行语义标签特征表示的学习,即,根据节点语义标签信息si和标签lj,生成标签lj的特征表示LFj。初始化节点特征表示,即,根据正态分布函数随机初始化所述V的特征表示,得到所述V的特征表示的集合NF={NFk,k∈[1,n]},其中,NFk为节点k的特征表示,n为所述V中节点的个数,n、k为正整数。

然后,按权重进行边采样,即,根据所述E中每条边的权重占所有边权重之和的比例对所述E进行采样,得到节点对集Pe={(u,v)},其中,节点对(u,v)为所述节点对集Pe中的一个元素,节点u和节点v为从所述E中采样获得的某条边对应的两个节点。

然后,遍历采样的边,即,对边对应的节点对(u,v)进行遍历。

然后,判断遍历是否完成,进行负采样,计算结构损失函数和负例结构损失函数,所述结构损失函数又叫相连损失函数,负例结构损失函数又叫不相连损失函数。

然后,判断语义标签是否被采样,即,判断所述节点u是否在所述Vtrain中,若被采样,则计算语义损失函数,并根据所述语义损失函数,利用反向传播算法更新节点的特征表示,其中,节点u、节点v以及负采样得到的节点的初始化特征表示都进行更新。

重复判断所述遍历是否完成,直到所述遍历完成,最终得到全局节点的特征表示。

若节点u对应的语义标签信息未被采样,则根据所述相连损失函数和所述不相连损失函数,利用反向传播算法更新节点的特征表示。

重复判断所述遍历是否完成,直到所述遍历完成,最终得到全局节点的特征表示。

本发明实施例提供的基于结构语义融合的大规模混合图特征学习方法,根据语义标签信息对节点的特征表示进行校正,将语义标签信息作为图特征学习的一部分,提高了图特征学习的质量。并利用学习中基于连接结构的部分传播语义信息对全局节点的影响,使得在语义信息较少时即可以有效的提升整体的特征学习效果,具备良好的实用性。通过采样学习策略,保证了较低的算法复杂度,以适应大规模图的特征学习。

实施例2:

图3为依照本发明实施例的基于结构语义融合的大规模混合图特征学习装置示意图;如图3所示,本发明实施例提供一种基于结构语义融合的大规模混合图特征学习装置,用于完成上述实施例所述的方法,包括获取模块10、遍历模块20、计算模块30和更新模块40,其中,

获取模块10用于获取训练语义标签信息集Strain,所述Strain为训练节点集Vtrain对应的语义标签信息的集合,所述Vtrain是从图中按照预设采样比例随机采样获得的若干个节点的集合,所述图为G,G=(V,E,S),其中,V为图节点,E为图中的边,S为图语义标签信息;

获取节点对集Pe,Pe={(u,v)},其中,节点对(u,v)为所述节点对集Pe中的一个元素,节点u和节点v为从所述E中采样获得的某条边对应的两个节点;

遍历模块20用于遍历所述节点对集Pe中的所有节点对(u,v);

计算模块30用于判断所述遍历是否完成;

若判断获知所述遍历节未完成,则对所述节点u进行负采样,并计算相连损失函数和不相连损失函数;

若判断获知所述节点u在所述Vtrain中,则根据所述Strain计算语义损失函数;

更新模块40用于根据相连损失函数、不相连损失函数和语义损失函数,更新所述节点u的初始化特征表示、所述节点v的初始化特征表示和所述负采样得到的节点的初始化特征表示,得到所述节点u的新的特征表示、所述节点v的新的特征表示以及所述负采样得到的节点的新的特征表示;

所述计算模块,还用于重复判断所述遍历是否完成,直到所述遍历完成。

本发明实施例提供的基于结构语义融合的大规模混合图特征学习装置,根据语义标签信息对节点的特征表示进行校正,将语义标签信息作为图特征学习的一部分,提高了图特征学习的质量。并利用学习中基于连接结构的部分传播语义信息对全局节点的影响,使得在语义信息较少时即可以有效的提升整体的特征学习效果,具备良好的实用性。通过采样学习策略,保证了较低的算法复杂度,以适应大规模图的特征学习。

实施例3:

图4为本发明实施例提供的用于基于结构语义融合的大规模混合图特征学习的电子设备的结构示意图,如图4所示,所述设备包括:处理器(processor)801、存储器(memory)802和总线803;

其中,处理器801和存储器802通过所述总线803完成相互间的通信;

处理器801用于调用存储器802中的程序指令,以执行上述各方法实施例所提供的方法,例如包括:

获取训练语义标签信息集Strain,所述Strain为训练节点集Vtrain对应的语义标签信息的集合,所述Vtrain是从图中按照预设采样比例随机采样获得的若干个节点的集合,所述图为G,G=(V,E,S),其中,V为图节点,E为图中的边,S为图语义标签信息;

获取节点对集Pe,Pe={(u,v)},其中,节点对(u,v)为所述节点对集Pe中的一个元素,节点u和节点v为从所述E中采样获得的某条边对应的两个节点;

遍历所述节点对集Pe中的所有节点对(u,v);

判断所述遍历是否完成;

若判断获知所述遍历未完成,则对所述节点u进行负采样,并计算相连损失函数和不相连损失函数;

若判断获知所述节点u在所述Vtrain中,则根据所述Strain计算语义损失函数;

根据相连损失函数、不相连损失函数和语义损失函数,更新所述节点u的初始化特征表示、所述节点v的初始化特征表示和所述负采样得到的节点的初始化特征表示,得到所述节点u的新的特征表示、所述节点v的新的特征表示以及所述负采样得到的节点的新的特征表示;

重复判断所述遍历是否完成,直到所述遍历完成。

实施例4:

本发明实施例公开一种计算机程序产品,所述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,计算机能够执行上述各方法实施例所提供的方法,例如包括:

获取训练语义标签信息集Strain,所述Strain为训练节点集Vtrain对应的语义标签信息的集合,所述Vtrain是从图中按照预设采样比例随机采样获得的若干个节点的集合,所述图为G,G=(V,E,S),其中,V为图节点,E为图中的边,S为图语义标签信息;

获取节点对集Pe,Pe={(u,v)},其中,节点对(u,v)为所述节点对集Pe中的一个元素,节点u和节点v为从所述E中采样获得的某条边对应的两个节点;

遍历所述节点对集Pe中的所有节点对(u,v);

判断所述遍历是否完成;

若判断获知所述遍历未完成,则对所述节点u进行负采样,并计算相连损失函数和不相连损失函数;

若判断获知所述节点u在所述Vtrain中,则根据所述Strain计算语义损失函数;

根据相连损失函数、不相连损失函数和语义损失函数,更新所述节点u的初始化特征表示、所述节点v的初始化特征表示和所述负采样得到的节点的初始化特征表示,得到所述节点u的新的特征表示、所述节点v的新的特征表示以及所述负采样得到的节点的新的特征表示;

重复判断所述遍历是否完成,直到所述遍历完成。

实施例5:

本发明实施例提供一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机执行上述各方法实施例所提供的方法,例如包括:

获取训练语义标签信息集Strain,所述Strain为训练节点集Vtrain对应的语义标签信息的集合,所述Vtrain是从图中按照预设采样比例随机采样获得的若干个节点的集合,所述图为G,G=(V,E,S),其中,V为图节点,E为图中的边,S为图语义标签信息;

获取节点对集Pe,Pe={(u,v)},其中,节点对(u,v)为所述节点对集Pe中的一个元素,节点u和节点v为从所述E中采样获得的某条边对应的两个节点;

遍历所述节点对集Pe中的所有节点对(u,v);

判断所述遍历是否完成;

若判断获知所述遍历未完成,则对所述节点u进行负采样,并计算相连损失函数和不相连损失函数;

若判断获知所述节点u在所述Vtrain中,则根据所述Strain计算语义损失函数;

根据相连损失函数、不相连损失函数和语义损失函数,更新所述节点u的初始化特征表示、所述节点v的初始化特征表示和所述负采样得到的节点的初始化特征表示,得到所述节点u的新的特征表示、所述节点v的新的特征表示以及所述负采样得到的节点的新的特征表示;

重复判断所述遍历是否完成,直到所述遍历完成。

本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于一计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。

以上所描述的装置及设备等实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。

通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。

最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号