首页> 中国专利> 一种基于多行为特征融合的电商会话推荐方法、系统、装置及介质

一种基于多行为特征融合的电商会话推荐方法、系统、装置及介质

摘要

本发明公开了一种基于多行为特征融合的电商会话推荐方法及系统。该方法包括以下步骤:获取电商数据库中用户对商品的点击、收藏、购买、加入购物车四种会话行为数据;构建一种基于多行为特征融合的电商会话推荐模型,该模型包括行为特征提取模块、商品特征提取模块、商品高阶特征提取模块、会话特征提取模块和商品推荐模块;使用电商数据库中的四种会话行为数据对所述的电商会话推荐模型进行训练;利用训练好的电商会话推荐模型对会话中的用户进行商品推荐,输出推荐结果。本发明利用电商会话推荐模型融合会话中的多行为特征,能有效提升推荐性能。

著录项

  • 公开/公告号CN115659277A

    专利类型发明专利

  • 公开/公告日2023-01-31

    原文格式PDF

  • 申请/专利权人 南京邮电大学;

    申请/专利号CN202211299136.8

  • 发明设计人 卢官明;丁佳伟;鲍秉坤;余鹏航;

    申请日2022-10-21

  • 分类号G06F18/25;G06F18/22;G06Q30/06;G06N3/04;G06N3/08;

  • 代理机构南京经纬专利商标代理有限公司;

  • 代理人罗运红

  • 地址 210033 江苏省南京市栖霞区广月路30-06号

  • 入库时间 2023-06-19 18:29:06

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2023-01-31

    公开

    发明专利申请公布

说明书

技术领域

本发明涉及数据挖掘领域,特别是一种基于多行为特征融合的电商会话推荐方法、系统、装置及介质。

背景技术

电商会话推荐是指在电商应用场景下,利用用户的匿名会话信息,即用户在短时会话中已经交互的商品,预测用户即将交互的商品,它是推荐系统的一个重要分支和子课题,尤其是现在人们越来越关注个人隐私,会话推荐不使用用户的隐私信息,在推荐系统上有非常大的优势。

最初的会话推荐广泛采用马尔科夫链的方法,通常采用前一次的交互项来预测下一个可能交互的项目。Rendle等人将马尔科夫链和矩阵分解进行结合,用于预测下一个交互项;Le等人通过加入上下文信息来构建马尔客人付模型以提升推荐性能;但是这种方法是在强独立性的假设下进行的,这会限制预测的准确性。近年来,随着深度学习的发展,循环神经网络被广泛应用在会话推荐中。Hidasi等人提出了GRU4Rec模型,第一次将循环神经网络用于会话推荐;Tan等人升级了GRU4Rec模型,提升了推荐性能并缓解了过拟合问题;liu等人利用多层感知器和注意力网络以提升推荐性能。但是循环神经网络是基于依赖假设进行的,假设任何相邻的交互都必须包含顺序关系。在依赖假设下,该方法只能捕获逐点依赖,而不能捕获集体依赖。图神经网络凭借其强大的图结构优势能够捕获节点之间复杂的依赖关系,在近期的会话推荐研究中得到了广泛应用。Wu等人提出的SR-GNN模型首次将图网络应用到会话推荐,并通过加入注意力机制,增强会话表示;Xu等人提出的GC-SAN使用多层自注意力网络,学习更准确的会话表示。图神经网络强大的节点学习能力,使得会话推荐的性能得到很大的提升。

虽然图神经网络的应用极大地提升了会话推荐的性能,但是基于点击行为的特征学习不能全面反映商品特征和会话特征。实际上,用户除了对商品存在点击行为外,还会发生对商品的收藏、购买、加入购物车等其他行为,这些行为同样会影响特征学习。现有的模型很少会考虑除了点击行为之外的其他行为,导致商品特征学习不全面,造成推荐性能的下降。

发明内容

发明目的:针对现有技术的不足,本发明目的在于提供一种基于多行为特征融合的电商会话推荐方法及系统,通过多级门控循环单元网络融合主要行为(点击行为)特征向量和三种次要行为(收藏、购买、加入购物车三种行为)特征向量,学习到具有多重特征的商品特征向量,并利用L层门控图神经网络学习商品高阶特征向量,解决现有方法商品特征学习不全面的问题,同时在学习会话特征向量时,利用一个门控循环单元网络融合全局兴趣特征向量和当前兴趣特征向量,更新会话特征学习方式,能有效提升推荐性能。

技术方案:本发明为实现上述发明目,本发明提出一种基于多行为特征融合的电商会话推荐方法,该方法包括以下步骤:

S1:获取电商数据库中用户对商品的点击、收藏、购买、加入购物车四种会话行为数据;

S2:构建一种基于多行为特征融合的电商会话推荐模型,该模型包括行为特征提取模块、商品特征提取模块、商品高阶特征提取模块、会话特征提取模块和商品推荐模块;

所述的行为特征提取模块,用于提取用户在会话中对商品的点击、收藏、购买、加入购物车四种行为的特征向量;其中,点击行为是主要行为,收藏、购买、加入购物车三种行为是基于点击行为发生的次要行为;

所述的商品特征提取模块,由分级的门控循环单元网络构成,用于对所提取的四种行为特征向量进行融合,输出商品特征向量;其中分级的门控循环单元网络由三级门控循环单元网络构成:

第一级门控循环单元网络以收藏行为特征向量和购买行为特征向量为输入,自适应学习收藏行为特征向量和购买行为特征向量的重要性权重,并对其进行加权求和,得到收藏与购买行为特征的融合特征向量;

第二级门控循环单元网络以收藏与购买行为特征的融合特征向量和加入购物车行为特征向量为输入,自适应学习两种特征向量的重要性权重,并对其进行加权求和,得到次要行为的融合特征向量;

第三级门控循环单元网络以次要行为的融合特征向量和点击行为特征向量为输入,自适应学习两种特征向量的重要性权重,并对其进行加权求和,得到商品特征向量;

所述的商品高阶特征提取模块,由门控图神经网络构成,以会话中用户对商品的点击顺序关系构建的邻接矩阵以及商品特征向量为输入,提取商品高阶特征向量;

所述的会话特征提取模块,由注意力模块和门控循环单元网络构成,对当前兴趣特征向量和全局兴趣特征向量进行自适应融合,输出会话特征向量;

所述的商品推荐模块,通过向量点积运算计算会话特征向量与候选商品特征向量的相似度,根据相似度从高到低进行排序,向用户推荐相似度排名前K位的商品;

S3:使用电商数据库中的四种会话行为数据对所述的电商会话推荐模型进行训练;

S4:利用训练好的电商会话推荐模型对会话中的用户进行商品推荐,输出推荐结果。

优选的,所述步骤S2中的行为特征提取模块,提取用户在会话中对商品的点击、收藏、购买、加入购物车四种行为特征向量的具体步骤如下:

S2.1.1:对电商数据库中n个商品{v

S2.1.2:对收藏、购买、加入购物车三种次要行为进行one-hot编码,并分别嵌入到d

S2.1.3:针对商品v

S2.1.4:针对商品v

优选的,所述步骤S2中的商品特征提取模块,对所提取的四种行为特征向量进行融合输出商品特征向量的具体步骤如下:

S2.2.1:第一级门控循环单元网络以商品v

g

m

其中,

S2.2.2:第二级门控循环单元网络以收藏与购买行为特征的融合特征向量和加入购物车行为特征向量为输入,自适应学习两种输入特征向量的重要性权重,并对其进行加权求和,得到次要行为的融合特征向量,其表达式为:

g

n

其中,

S2.2.3:第三级门控循环单元网络以次要行为的融合特征向量和点击行为特征向量为输入,自适应学习两种输入特征向量的重要性权重,并对其进行加权求和,得到商品特征向量,其表达式为:

g

其中,

优选的,所述步骤S2中的商品高阶特征提取模块,以会话中用户对商品的点击顺序关系构建的邻接矩阵以及商品特征向量为输入,提取商品高阶特征向量的具体步骤如下:

S2.3.1:针对会话s中不同的商品v

S2.3.2:对于会话s中的商品v

其中,

S2.3.3:利用门控网络的更新门,自适应学习在第k层门控图神经网络中,商品v

其中,

S2.3.4:利用门控网络的重置门,自适应学习在第k层门控图神经网络中,商品v

其中,

S2.3.5:计算商品v

其中,

S2.3.6:当k=L时,得到v

其中,

优选的,所述步骤S2中的会话特征提取模块,对当前兴趣特征向量和全局兴趣特征向量进行自适应融合输出会话特征向量的具体步骤如下:

S2.4.1:针对会话s中按顺序点击的商品v

S2.4.2:通过软注意力机制计算会话中的每一个商品的高阶特征向量与当前兴趣特征向量的权重系数,根据权重系数计算得到全局兴趣特征向量,其表达式为:

其中,

S2.4.3:使用门控循环单元网络对得到的当前兴趣特征向量和全局兴趣特征向量进行自适应融合,得到会话特征向量,其表达式为:

g

s

其中,

优选的,所述步骤S2中的商品推荐模块,通过向量点积运算计算会话特征向量与候选商品特征向量的相似度得分向量,候选商品为电商数据库中的n个商品,其表达式为:

其中,

y

根据相似度得分向量的归一化值从高到低进行排序,向用户推荐排名前K位的商品,其中,K为正整数。

此外,本发明提出一种基于多行为特征融合的电商会话推荐系统,该系统由行为特征提取模块、商品特征提取模块、商品高阶特征提取模块、会话特征提取模块和商品推荐模块构成;

所述的行为特征提取模块,用于提取用户在会话中对商品的点击、收藏、购买、加入购物车四种行为的特征向量;其中点击行为是主要行为,收藏、购买、加入购物车三种行为是基于点击行为发生的次要行为;

所述的商品特征提取模块,由分级的门控循环单元网络构成,用于对所提取的四种行为特征向量进行融合,输出商品特征向量;其中分级的门控循环单元网络由三级门控循环单元网络构成:

第一级门控循环单元网络以收藏行为特征向量和购买行为特征向量为输入,自适应学习收藏行为特征向量和购买行为特征向量的重要性权重,并对其进行加权求和,得到收藏与购买行为特征的融合特征向量;

第二级门控循环单元网络以收藏与购买行为特征的融合特征向量和加入购物车行为特征向量为输入,自适应学习两种特征向量的重要性权重,并对其进行加权求和,得到次要行为的融合特征向量;

第三级门控循环单元网络以次要行为的融合特征向量和点击行为特征向量为输入,自适应学习两种特征向量的重要性权重,并对其进行加权求和,得到商品特征向量;

所述的商品高阶特征提取模块,由门控图神经网络构成,以会话中用户对商品的点击顺序关系构建的邻接矩阵以及商品特征向量为输入,提取商品高阶特征向量;

所述的会话特征提取模块,由注意力模块和门控循环单元网络构成,对当前兴趣特征向量和全局兴趣特征向量进行自适应融合,输出会话特征向量;

所述的商品推荐模块,通过向量点积运算计算会话特征向量与候选商品特征向量的相似度,根据相似度从高到低进行排序,向用户推荐相似度排名前K位的商品;

此外,本发明提出一种基于多行为特征融合的电商会话推荐装置,包括至少一台计算设备,所述计算设备包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述计算机程序被加载至处理器时实现根据权利要求1-7任一项所述的一种基于多行为特征融合的电商会话推荐方法。

此外,本发明提出一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现根据权利要求1-7任一项所述的一种基于多行为特征融合的电商会话推荐方法。

有益效果:与现有技术相比,本发明的技术方案具有以下有益技术效果:

1.通过多行为特征融合,丰富了商品特征表示,在后续的特征学习过程中,能够更好的把握用户的会话目的,实施更具针对性的推荐;

2.利用多级门控循环单元网络自适应学习各种行为之间的关系,使得模型具备很好的可训练性,提高了会话推荐系统的鲁棒性和泛化性;

3.利用门控循环单元网络融合全局兴趣特征和当前兴趣特征,更新会话特征学习方式,进一步提升会话推荐系统的性能。

附图说明

图1是本发明的一种基于多行为特征融合的电商会话推荐方法;

图2是本发明中所使用的多级门控循环单元网络结构图;

图3是本发明中学习会话中商品高阶特征向量的门控图神经网络示意图;

图4是本发明中融合全局兴趣特征向量和当前兴趣特征向量的门控循环单元网络结构图。

具体实施方式

下面结合说明书附图对本发明的具体实施方式进一步的详细说明。

如图1所示,本发明实施例提供的一种基于多行为特征融合的电商会话推荐方法,主要包括如下步骤:

步骤S1获取电商数据库中用户对商品的点击、收藏、购买、加入购物车四种会话行为数据:本实施例使用UserBehavior数据库,该数据库是阿里巴巴提供的一个淘宝用户行为数据库;本数据库包含了2017-09-11至2017-12-03之间有行为的约一百万随机用户的所有行为(行为包括点击、收藏、购买、加入购物车),数据集的每一行表示一条用户行为,由用户ID、商品ID、商品类目ID、行为类型和时间戳组成,并以逗号分隔;对数据库中的会话数据进行预处理,针对长度为w的会话,将会话的前w-1个点击的商品作为本实施例中的训练样本,将会话中最后一个点击的商品作为该训练样本的验证样本,数据库中的所有会话均按照上述方法是进行处理。

步骤S2构建一种基于多行为特征融合的电商会话推荐模型,该模型包括行为特征提取模块、商品特征提取模块、商品高阶特征提取模块、会话特征提取模块和商品推荐模块;

S2.1行为特征提取模块:提取用户在会话中对商品的点击、收藏、购买、加入购物车四种行为特征向量的具体步骤如下:

S2.1.1:对电商数据库中n个商品{v

S2.1.2:对收藏、购买、加入购物车三种次要行为分别进行嵌入编码,得到d

S2.1.3:针对商品v

S2.1.4:针对商品v

S2.2商品特征提取:如图2所示,对所提取的四种行为特征向量进行融合输出商品特征向量的具体步骤如下:

S2.2.1:第一级门控循环单元网络以商品v

g

m

其中,

S2.2.2:第二级门控循环单元网络以收藏与购买行为特征的融合特征向量和加入购物车行为特征向量为输入,自适应学习两种输入特征向量的重要性权重,并对其进行加权求和,得到次要行为的融合特征向量,其表达式为:

g

n

其中,

S2.2.3:第三级门控循环单元网络以次要行为的融合特征向量和点击行为特征向量为输入,自适应学习两种输入特征向量的重要性权重,并对其进行加权求和,得到商品特征向量,其表达式为:

g

其中,

通过误差反向传播算法不断迭代训练商品特征提取模块,直至模型参数达到最优。之后,就可将四种行为特征向量输入到训练好的商品特征提取模块来提取商品特征向量v

S2.3商品高阶特征提取模块:如图3所示,以会话中用户对商品的点击顺序关系构建的邻接矩阵以及商品特征向量为输入,提取商品高阶特征向量的具体步骤如下:

S2.3.1:以数据库中的训练样本会话s为例,其验证样本为v

S2.3.2:以训练样本会话s中的商品v

其中,

S2.3.3:利用门控网络的更新门,自适应学习在第k层门控图神经网络中,商品v

其中,

S2.3.4:利用门控网络的重置门,自适应学习在第k层门控图神经网络中,商品v

其中,

S2.3.5:计算商品v

其中,

S2.3.6:当k=L时,得到v

其中,

通过误差反向传播算法不断迭代训练商品高阶特征提取模块,直至模型参数达到最优。之后,就可将商品特征向量输入到训练好的商品高阶特征提取模块来提取对应的商品高阶特征向量。

S2.4会话特征提取模块:如图4所示,对当前兴趣特征向量和全局兴趣特征向量进行自适应融合输出会话特征向量的具体步骤如下:

S2.4.1:以数据库中的训练样本会话s为例,针对训练样本会话s中的按顺序点击的商品v

S2.4.2:通过软注意力机制计算会话中的每一个商品的高阶特征向量与当前兴趣特征向量的权重系数,根据权重系数计算得到全局兴趣特征向量,其表达式为:

其中,

S2.4.3:使用门控循环单元网络对得到的当前兴趣特征向量和全局兴趣特征向量进行自适应融合,得到会话特征向量,其表达式为:

g

s

其中,

通过误差反向传播算法不断迭代训练会话特征提取模块,直至模型参数达到最优。之后,就可将商品高阶特征向量输入到训练好的会话特征提取模块来提取会话特征向量。

S2.5商品推荐模块:通过向量点积运算计算会话特征向量与候选商品特征向量的相似度得分向量,候选商品为电商数据库中的n个商品,其表达式为:

其中,

y

根据相似度得分向量的归一化值从高到低进行排序,向用户推荐排名前K位的商品,本实施例中,K=5。

将推荐结果与训练样本会话s的验证样本v

步骤S3使用电商数据库中的四种会话行为数据对所述的电商会话推荐模型进行训练:本实施例中,使用UserBehavior数据库中的训练样本,采用反向传播算法,利用交叉熵函数作为损失函数,对所述的电商会话推荐模型进行迭代训练,直至模型中的所有参数达到最优。

步骤S4利用训练好的电商会话推荐模型对会话中的用户进行商品推荐,输出推荐结果。

本领域技术人员可以理解,可以对实施例中的步骤进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个系统中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号