首页> 中国专利> 带有停留时间的图卷积网络会话推荐方法及系统

带有停留时间的图卷积网络会话推荐方法及系统

摘要

本发明提出了一种带有停留时间的图卷积网络会话推荐方法及系统,获取会话涉及的项目和带停留时间的历史会话序列;对历史会话序列中的停留时间进行缩放;构建有向会话图,根据停留时间和出现次数,设置会话图中边的权重;通过图卷积网络,提取会话图中的特征向量;用基于惩罚项的特征选择方法重复特征进行筛选;利用注意力机制捕获用户长期和短期偏好,预测用户对项目的偏好;本发明将停留时间合并到会话图中作为图卷积网络的输入,得到的节点向量特征经过特征选择层作为目标注意力网络的输入,防止过拟合,提高推荐的精确度。

著录项

  • 公开/公告号CN114861040A

    专利类型发明专利

  • 公开/公告日2022-08-05

    原文格式PDF

  • 申请/专利权人 齐鲁工业大学;

    申请/专利号CN202210365942.4

  • 发明设计人 姜雪松;柴慧慧;马浩翔;

    申请日2022-04-08

  • 分类号G06F16/9535(2019.01);G06F16/332(2019.01);G06F16/335(2019.01);G06K9/62(2022.01);G06N3/04(2006.01);

  • 代理机构济南圣达知识产权代理有限公司 37221;

  • 代理人于凤洋

  • 地址 250353 山东省济南市长清区大学路3501号

  • 入库时间 2023-06-19 16:16:00

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2022-08-23

    实质审查的生效 IPC(主分类):G06F16/9535 专利申请号:2022103659424 申请日:20220408

    实质审查的生效

  • 2022-08-05

    公开

    发明专利申请公布

说明书

技术领域

本发明属于计算机技术推荐算法领域,尤其涉及带有停留时间的图卷积网络会话推荐算法。

背景技术

本部分的陈述仅仅是提供了与本发明相关的背景技术信息,不必然构成在先技术。

伴随着互联网的发展,各种各样的信息层出不穷。信息过载使人们找到需要的信息异常困难,推荐系统的出现,解决了这一问题。基于会话的推荐算法,帮助用户匹配不同的需求,已经在流媒体、电子商务等广泛应用,具有高度的实用价值。

在现实生活中,短视频、淘宝购物以及家电产业链等场景都是根据历史记录进行推荐;用户在一个项目上的停留时间反映了对项目的喜爱程度,停留时间越长,表明喜爱程度越高,像京东、淘宝这种购物网站,通常会记录用户的浏览时间,根据用户的浏览时间,以此分析出用户的偏好。相比于根据点击次数对用户进行推荐,提高了推荐的效率。传统的推荐算法是根据用户的历史记录进行推荐,忽略项目之间的潜在关系,基于会话的推荐是根据用户在一段时间内的会话序列进行推荐,最可能反映用户的短期兴趣偏好,基于图神经网络的会话推荐,不仅能反映用户的短期兴趣偏好,还能挖掘项目之间的潜在关系,对用户进行长期偏好预测,通过结合用户短期偏好和长期偏好,进行精准推荐。

Wu,Zhu等人提出基于会话的图神经网络推荐算法,把图神经网络应用到基于会话的推荐,证明了图神经网络在推荐方面的优越性;Wang,Cai等人提出的基于会话的注意力增强图神经网络推荐算法,该方法利用目标注意力网络捕获了与目标项目相关的特定用户兴趣,利用自我注意机制捕获不同项目的不同优先级;但这两种推荐算法存在以下问题:只是固定地把会话序列构造成会话图,忽略了可以引入一些特性合并到会话图中,导致推荐效果不佳,而且经过图神经网络得到的节点向量特征,容易出现过拟合问题。

发明内容

为克服上述现有技术的不足,本发明提供了一种带有停留时间的图卷积网络会话推荐方法,将停留时间合并到会话图中作为图卷积网络的输入,得到的节点向量特征经过特征选择层作为目标注意力网络的输入,防止过拟合,提高推荐的精确度。

为实现上述目的,本发明的一个或多个实施例提供了如下技术方案:

本发明第一方面提供了带有停留时间的图卷积网络会话推荐方法;

带有停留时间的图卷积网络会话推荐方法,包括:

获取项目和会话序列,对会话序列中的停留时间进行缩放;

基于停留时间缩放后的会话序列,构建有向会话图,根据停留时间和边的出现次数,设置会话图中边的权重;

通过图卷积网络提取会话图中的特征,用基于惩罚项的特征选择方法对重复特征进行筛选;

利用注意力机制捕获用户长期和短期偏好,根据用户长期和短期偏好进行项目推荐。

进一步的,所述用户交互序列S={v

进一步的,采用归一化和反归一化两种方法对停留时间进行缩放。

进一步的,构建有向会话图G

权重的计算方式为停留时间与出现次数相乘,表示两个节点之间关系的强度。

进一步的,图卷积网络中节点特征向量的提取方式,包括以下过程:

根据会话图,提取项目特征向量;

基于项目特征向量,通过激活函数,聚合节点的邻居信息;

利用遗忘门、输入门和输出门,获取保留的特征信息;

利用激活函数,得到保留的特征信息中的候选信息;

对遗忘门保留的信息和输入门选择的候选信息合并,得到最终的新信息;

用输出门对得到的新信息进行选择输出。

进一步的,所述特征选择,基于L1惩罚项的逻辑回归模型,保留特征中推荐值相同的特征,用L2惩罚项的逻辑回归模型进行优化。

进一步的,所述特征选择具体逻辑为:如果特征权重在L1为1,建一个相似的集合,如果它们的权重在L2中差别并不大并且权重在L1中为0,就将这个集合中的特征划分为L1中的等权值。

本发明第二方面提供了带有停留时间的图卷积网络会话推荐系统。

带有停留时间的图卷积网络会话推荐系统,包括:

停留时间缩放模块,被配置为:获取项目和会话序列,对会话序列中的停留时间进行缩放;

会话图构建模块,被配置为:基于停留时间缩放后的会话序列,构建有向会话图,根据停留时间和边的出现次数,设置会话图中边的权重;

特征提取和选择模块,被配置为:通过图卷积网络提取的会话图中的特征,用基于惩罚项的特征选择方法对重复特征进行筛选;

项目推荐模块,被配置为:利用注意力机制捕获用户长期和短期偏好,根据用户长期和短期偏好进行项目推荐。

本发明第三方面提供了一种计算机可读存储介质,其上存储有程序,该程序被处理器执行时实现如本发明第一方面所述的带有停留时间的图卷积网络会话推荐方法中的步骤。

本发明第四方面提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的程序,所述处理器执行所述程序时实现如本发明第一方面所述的带有停留时间的图卷积网络会话推荐方法中的步骤。

以上一个或多个技术方案存在以下有益效果:

本发明针对会话推荐算法,提出将停留时间引入到图神经网络会话推荐之中,并增加特征选择层,对推荐的准确率和召回率进行了改进。

改进会话序列预处理的表示方式,提出把停留时间合并到会话图中,不仅反映用户对产品的兴趣,还能反映项目之间的潜在关系。

引入特征选择层,解决过拟合问题,同时将利用目标注意力网络捕获与目标项目相关的特定用户兴趣,利用自我注意力机制获得不同项目的不同优先级,再结合用户的长期和短期偏好更全面的推荐,提高预测的性能和精度。

本发明附加方面的优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。

附图说明

构成本发明的一部分的说明书附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。

图1为第一个实施例的方法流程图。

图2为第二个实施例的系统结构图。

具体实施方式

应该指出,以下详细说明都是示例性的,旨在对本发明提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本发明所属技术领域的普通技术人员通常理解的相同含义。

需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本发明的示例性实施方式。

在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。

本发明提出的总体思路:

基于会话的图卷积网络以会话序列S和停留时间T作为输入,然后输出所有可能点击项目的概率

实施例一

本实施例公开了一种带有停留时间的图卷积网络会话推荐方法;

如图1所示,带有停留时间的图卷积网络会话推荐方法,包括:

S11:获取项目和会话序列,对会话序列中的停留时间进行缩放;

基于会话推荐算法中,V={v

根据时间戳计算停留时间,测量单位为毫秒(ms),因为停留时间分布太过稀疏,影响用户兴趣的获取,所以将停留时间合并到会话图之前,对停留时间进行缩放,采用归一化和反归一化两种方法对停留时间进行缩放,停留时间与关系强度是正相关关系(即两个项目之间的停留时间越长,它们之间的关系越强)时,用归一化方法;停留时间与关系强度是负相关关系(即两个项目之间的停留时间越短,它们之间的关系越强)时,用反归一化方法。

归一化的公式:

反归一化的公式:

在公式(1)和公式(2)中,t

S12:基于停留时间缩放后的会话序列,构建有向会话图,根据停留时间和边的出现次数,设置会话图中边的权重;

每个会话交互序列S都可以构建一个有向的会话图G

S13:通过图卷积网络提取会话图中的特征,用基于惩罚项的特征选择方法对重复特征进行筛选。

将每个项目v∈V嵌入到统一的向量空间,节点向量e∈R

公式(3)中,U

公式(4)计算v

公式(9)中,利用tanh(·)函数重新输入信息,

公式(10)表示经过遗忘门保留的信息和经过输入门选择的新信息合并在一起,形成最终的新信息。公式(11)表示经过输出门从最终的新信息中选择部分信息,形成e

图卷积网络输出的特征存在过拟合问题,本申请增加特征选择层,采用基于惩罚项的方法对特征进行选择。

采用基于L1惩罚项的逻辑回归模型,保留特征中最终推荐值相同的特征,结合L2惩罚项的逻辑回归模型对剩余的特征进行优化。具体的说,如果特征权重在L1为1,形成一个相似的集合,集合中权重在L2中差别不大并且权重在L1中为0的特征,则将该特征划分为L1的等权值特征。

S14:利用注意力机制捕获用户长期和短期偏好,根据用户长期和短期偏好进行项目推荐。

构建目标注意力网络和自我注意力机制,利用目标注意力网络激活与目标项目相关的用户兴趣,采用自我注意力机制捕获用户的长期偏好,同时考虑到遥远项目之间的复杂转换,进一步计算会话s中所有项目v

实施例二

本实施例公开了带有停留时间的图卷积网络会话推荐系统;

如图2所示,带有停留时间的图卷积网络会话推荐系统,包括:

停留时间缩放模块,被配置为:获取项目和会话序列,对会话序列中的停留时间进行缩放;

会话图构建模块,被配置为:基于停留时间缩放后的会话序列,构建有向会话图,根据停留时间和边的出现次数,设置会话图中边的权重;

特征提取和选择模块,被配置为:通过图卷积网络提取带会话图中的特征,用基于惩罚项的特征选择方法对重复特征进行筛选;

项目推荐模块,被配置为:利用注意力机制捕获用户长期和短期偏好,根据用户长期和短期偏好进行项目推荐。

实施例三

本实施例的目的是提供一种计算机可读存储介质。

一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本公开实施例1所述的带有停留时间的图卷积网络会话推荐方法中的步骤。

实施例四

本实施例的目的是提供一种电子设备。

一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的程序,所述处理器执行所述程序时实现如本公开实施例1所述的带有停留时间的图卷积网络会话推荐方法中的步骤。

以上实施例二、三和四的装置中涉及的各步骤与方法实施例一相对应,具体实施方式可参见实施例一的相关说明部分。术语“计算机可读存储介质”应该理解为包括一个或多个指令集的单个介质或多个介质;还应当被理解为包括任何介质,所述任何介质能够存储、编码或承载用于由处理器执行的指令集并使处理器执行本发明中的任一方法。

本领域技术人员应该明白,上述本发明的各模块或各步骤可以用通用的计算机装置来实现,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。本发明不限制于任何特定的硬件和软件的结合。

上述虽然结合附图对本发明的具体实施方式进行了描述,但并非对本发明保护范围的限制,所属领域技术人员应该明白,在本发明的技术方案的基础上,本领域技术人员不需要付出创造性劳动即可做出的各种修改或变形仍在本发明的保护范围以内。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号