首页> 中国专利> 信息推荐模型训练方法、信息推荐方法及存储介质

信息推荐模型训练方法、信息推荐方法及存储介质

页面导航

摘要
著录项
说明书
相似文献

摘要

本申请公开了一种信息推荐模型训练方法、信息推荐方法、装置、电子设备及存储介质，其中，信息推荐模型训练方法包括：将至少一个商品数据样本和一个店铺数据样本输入至信息推荐模型，得到所述至少一个商品数据样本对应的第一预测结果和所述一个店铺数据样本对应的第二预测结果；基于所述第一预测结果与所述第二预测结果中每个预测结果与对应的标定结果之间的差值，确定所述信息推荐模型的总损失值；根据所述总损失值更新所述信息推荐模型的权重参数；其中，所述至少一个商品数据样本和所述一个店铺数据样本从同一用户对商品页面和店铺页面的访问数据中提取得到。

著录项

公开/公告号CN113129053A

专利类型发明专利
公开/公告日2021-07-16

原文格式PDF
申请/专利权人北京沃东天骏信息技术有限公司;北京京东世纪贸易有限公司;
展开▼

申请/专利号CN202110335635.7
发明设计人温肖谦;吴骏宇;徐通;
展开▼

申请日2021-03-29
分类号G06Q30/02(20120101);G06Q30/06(20120101);G06F16/2458(20190101);G06N3/04(20060101);
代理机构11270 北京派特恩知识产权代理有限公司;
代理人周丽莎;张颖玲
地址 100176 北京市大兴区经济技术开发区科创十一街18号院2号楼4层A402室
入库时间 2023-06-19 11:52:33

说明书

技术领域

本申请涉及人工智能的信息处理技术领域，尤其涉及一种信息推荐方法、装置、电子设备及存储介质。

背景技术

推荐系统根据用户对某一领域的兴趣特点，向用户推荐用户感兴趣的信息。相关技术中，使用神经网络模型如深度神经网络(DNN，Deep Neural Networks)来学习用户浏览和偏好店铺之间的关系。由于店铺推荐场景下，用户浏览店铺的行为数据稀疏，推荐结果不够精确。

发明内容

有鉴于此，本申请实施例提供一种信息推荐模型训练方法、信息推荐方法、装置、电子设备及存储介质，以至少解决相关技术推荐结果不精确的问题。

本申请实施例的技术方案是这样实现的：

本申请实施例提供了一种信息推荐方法，所述方法包括：

将至少一个商品数据样本和一个店铺数据样本输入至信息推荐模型，得到所述至少一个商品数据样本对应的第一预测结果和所述一个店铺数据样本对应的第二预测结果；

基于所述第一预测结果与所述第二预测结果中每个预测结果与对应的标定结果之间的差值，确定所述信息推荐模型的总损失值；

根据所述总损失值更新所述信息推荐模型的权重参数；

其中，所述至少一个商品数据样本和所述一个店铺数据样本从同一用户对商品页面和店铺页面的访问数据中提取得到。

其中，上述方案中，所述信息推荐模型包括串联的至少两个隐藏层；所述将至少一个商品数据样本和一个店铺数据样本输入至信息推荐模型之后，所述方法包括：

将所述至少一个商品数据样本、所述一个店铺数据样本和所述用户的用户特征输入至所述信息推荐模型，得到所述至少一个商品数据样本对应的特征向量和所述一个店铺数据样本对应的特征向量；

将得到的两个特征向量中的任一特征向量在相邻的两个隐藏层之间传递时，所述方法包括：

在同一隐藏层中，将两个特征向量中的第一特征向量与第二特征向量进行叠加处理，得到用于输入至下一隐藏层的第一特征向量。

上述方案中，所述将所述至少一个商品数据样本、所述一个店铺数据样本和所述用户的用户特征输入至所述信息推荐模型，包括：

将所述至少一个商品数据样本和所述用户特征输入至所述嵌入层，得到所述至少一个商品数据样本对应的特征向量；

将所述一个店铺数据样本和所述用户特征输入至所述嵌入层，得到所述一个店铺数据样本对应的特征向量。

上述方案中，所述确定所述信息推荐模型的总损失值，包括：

基于所述第一预测结果与对应的标定结果之间的差值，计算第一损失值；

基于所述第二预测结果与对应的标定结果之间的差值，计算第二损失值；

对所述第一损失值和所述第二损失值进行加权处理，计算所述信息推荐模型的总损失值。

上述方案中，所述方法还包括：

从样本库中确定至少两个批次的样本；所述至少两个批次中的每个批次的样本包括至少一个商品数据样本和一个店铺数据样本；每个批次的所有样本从同一用户在同一设定时间段产生的访问数据中提取得到。

本申请实施例还提供了一种信息推荐方法，所述方法包括：

将至少一个商品数据和一个店铺数据输入至信息推荐模型，得到所述至少一个商品数据对应的第三预测结果和所述一个店铺数据对应的第四预测结果；

对所述第三预测结果和所述第四预测结果进行加权处理，得到所述一个店铺数据对应的总预测结果；

基于得到的总预测结果进行店铺信息推荐；

其中，所述信息推荐模型采用上述任一项所述的信息推荐模型训练方法训练得到；所述至少一个商品数据和所述一个店铺数据从同一用户对商品页面和店铺页面的访问数据中提取得到。

本申请实施例还提供了一种信息推荐模型训练装置，包括：

预测单元，用于将至少一个商品数据样本和一个店铺数据样本输入至信息推荐模型，得到所述至少一个商品数据样本对应的第一预测结果和所述一个店铺数据样本对应的第二预测结果；

第一确定单元，用于基于所述第一预测结果与所述第二预测结果中每个预测结果与对应的标定结果之间的差值，确定所述信息推荐模型的总损失值；

更新单元，用于根据所述总损失值更新所述信息推荐模型的权重参数；

其中，所述至少一个商品数据样本和所述一个店铺数据样本从同一用户对商品页面和店铺页面的访问数据中提取得到。

本申请实施例还提供了一种信息推荐装置，包括：

输入单元，用于将至少一个商品数据和一个店铺数据输入至信息推荐模型，得到所述至少一个商品数据对应的第三预测结果和所述一个店铺数据对应的第四预测结果；

第一处理单元，用于对所述第三预测结果和所述第四预测结果进行加权处理，得到所述一个店铺数据对应的总预测结果；

推荐单元，用于基于得到的总预测结果进行店铺信息推荐；

本申请实施例还提供了一种电子设备，包括：处理器和用于存储能够在处理器上运行的计算机程序的存储器，

其中，所述处理器用于运行所述计算机程序时，执行上述任一项所述的信息推荐模型训练方法的步骤，或执行上述信息推荐方法的步骤。

本申请实施例还提供了一种存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现上述任一项所述的信息推荐模型训练方法的步骤，或执行上述信息推荐方法的步骤。

在本申请实施例中，基于同一用户访问数据中提取得到的至少一个商品数据样本和一个店铺数据样本，通过至少一个商品数据样本和一个店铺数据样本训练信息推荐模型，在训练过程中，基于至少一个商品数据样本对应的第一预测结果与相应的标定结果、一个店铺数据样本对应的第二预测结果与相应的标定结果，确定信息推荐模型的总损失值，并根据总损失值更新信息推荐模型。对于同一用户，商品数据样本和店铺数据样本均可以反映用户对购物的偏好，在信息推荐模型的训练过程中，商品数据样本和店铺数据样本都作为训练样本，可以增加训练样本来源的多样性，克服因店铺数据样本缺乏多样性而导致信息推荐模型的泛化能力较差的问题，使店铺推荐场景下推荐结果更为精确。

附图说明

图1为本申请实施例提供的一种信息推荐模型训练方法的流程示意图；

图2为本申请实施例提供的一种信息推荐方法的流程示意图；

图3为本申请应用实施例提供的一种信息推荐模型训练方法的示意图；

图4为本申请应用实施例提供的一种店铺信息推荐方法的示意图；

图5为本申请实施例提供的一种信息推荐模型训练装置的结构示意图；

图6为本申请实施例提供的一种信息推荐装置的结构示意图；

图7为本申请实施例提供的一种电子设备的结构示意图。

具体实施方式

推荐系统根据用户对某一领域的兴趣特点，向用户推荐用户感兴趣的信息。相关技术中，使用神经网络模型如DNN来学习用户浏览和偏好店铺之间的关系。店铺推荐场景下，需要进行精准的店铺推荐，以获得更高的点击和转化率，但因为用户浏览店铺的行为数据稀疏，推荐结果不够精确。

基于此，本申请实施例提供的信息推荐模型训练方法、信息推荐方法、装置、电子设备及存储介质，通过至少一个商品数据样本和一个店铺数据样本训练信息推荐模型，在训练过程中，基于至少一个商品数据样本对应的第一预测结果与相应的标定结果、一个店铺数据样本对应的第二预测结果与相应的标定结果，确定信息推荐模型的总损失值，并根据总损失值更新信息推荐模型。由于在信息推荐模型的训练过程中，商品数据样本和店铺数据样本均作为训练样本，增加了训练样本来源的多样性，可以克服因店铺数据样本缺乏多样性而导致信息推荐模型的泛化能力较差的问题，使店铺推荐场景下推荐结果更为精确。

为了使本申请的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本申请进行进一步详细说明。应当理解，此处描述的具体实施例仅仅用以解释本申请，并不用于限定本申请。

图1为本申请实施例提供的信息推荐模型训练方法的实现流程示意图。如图1示出的，信息推荐模型训练方法包括：

S101：将至少一个商品数据样本和一个店铺数据样本输入至信息推荐模型，得到所述至少一个商品数据样本对应的第一预测结果和所述一个店铺数据样本对应的第二预测结果。其中，所述至少一个商品数据样本和所述一个店铺数据样本从同一用户对商品页面和店铺页面的访问数据中提取得到。

一个用户访问商品页面产生商品页面的访问数据，从商品页面的访问数据中提取得到商品数据样本；同一个用户访问店铺页面产生店铺页面的访问数据，从店铺页面的访问数据中提取得到店铺数据样本；将提取得到的至少一个商品数据样本和一个店铺数据样本作为输入数据，输入至信息推荐模型，采用信息推荐模型对输入数据进行处理，得到至少一个商品数据样本对应的第一预测结果和一个店铺数据样本对应的第二预测结果。

这里，商品数据样本和店铺数据样本基于同一个用户的访问数据产生，都可以包括结构化数据和非结构化数据。商品数据样本包括商品标识、商品在设定周期内的页面展示次数、被点击次数、转化率等，转化率基于页面展示次数和被点击次数确定。店铺数据样本包括店铺标识、店铺用户评分、上架商品数量和主营品类等。所有的标识可以是汉字名称等非结构化数据形式，可以是对应的数字ID的结构化数据形式。

至少一个商品数据样本和一个店铺数据样本可以从样本库中同一用户对商品页面和店铺页面的访问数据中提取得到。样本库可以存在于电子设备的本地数据库，也可以存在于远程数据库。

S102：基于所述第一预测结果与所述第二预测结果中每个预测结果与对应的标定结果之间的差值，确定所述信息推荐模型的总损失值。

在获取到至少一个商品数据样本对应的第一预测结果，以及一个商品数据样本对应的第二预测结果的情况下，基于第一预测结果与对应的标定结果之间的差值、第二预测结果与对应的标定结果之间的差值，计算信息推荐模型的总损失值。

S103：根据所述总损失值更新所述信息推荐模型的权重参数。

根据信息推荐模型总损失值对信息推荐模型进行权重参数的更新，以提升信息推荐模型输出的推荐结果的准确率。其中，将信息推荐模型的总损失值在信息推荐模型中进行反向传播，在将总损失值反向传播至信息推荐模型的各个层的过程中，根据总损失值计算出损失函数的梯度，并沿梯度的下降方向更新反向传播到当前层的权重参数。

将更新后得到的权重参数，作为训练完毕的信息推荐模型所使用的权重参数。

这里，可设定更新停止条件，在满足更新停止条件时，将最后一次更新得到的权重参数，确定为训练完毕的信息推荐模型所使用的权重参数。更新停止条件如设定的训练轮次(epoch)，一个训练轮次即为根据至少一个视频样本和至少一个图片样本对信息推荐模型训练一次的过程。当然，更新停止条件并不限于此，例如还可为设定的平均准确率(mAP，mean Average Precision)等。

需要说明的是，损失函数(loss function)用于度量模型的预测值与真实值(标定结果)之间的不一致程度。在实际应用中，通过最小化损失函数来实现模型训练。

反向传播是相对于前向传播而言的，前向传播是指模型的前馈处理过程，而反向传播的方向与前向传播的方向相反。反向传播指根据模型输出的结果对模型各个层的权重参数进行更新。例如，模型包括嵌入层、隐藏层，则前向传播是指按照嵌入层-隐藏层的顺序进行处理，反向传播是指按照隐藏层-嵌入层的顺序，依次更新各个层的权重参数。

在本实施例提供的方案中，基于同一用户访问数据中提取得到的至少一个商品数据样本和一个店铺数据样本，通过至少一个商品数据样本和一个店铺数据样本训练信息推荐模型，在训练过程中，基于至少一个商品数据样本对应的第一预测结果与相应的标定结果、一个店铺数据样本对应的第二预测结果与相应的标定结果，确定信息推荐模型的总损失值，并根据总损失值更新信息推荐模型。对于同一用户，商品数据样本和店铺数据样本均可以反映用户对购物的偏好，在信息推荐模型的训练过程中，商品数据样本和店铺数据样本都作为训练样本，利用跨域的迁移学习解决数据稀疏问题，以商品数据样本作为源域，对店铺数据样本的目标域进行迁移学习，可以增加训练样本来源的多样性，克服因店铺数据样本缺乏多样性而导致信息推荐模型的泛化能力较差的问题，使店铺推荐场景下推荐结果更为精确。

其中，在一实施例中，所述信息推荐模型包括串联的至少两个隐藏层；所述将至少一个商品数据样本和一个店铺数据样本输入至信息推荐模型之后，所述方法包括：

将得到的两个特征向量中的任一特征向量在相邻的两个隐藏层之间传递时，所述方法包括：

在同一隐藏层中，将两个特征向量中的第一特征向量与第二特征向量进行叠加处理，得到用于输入至下一隐藏层的第一特征向量。

将至少一个商品数据样本、一个店铺数据样本和用户的用户特征输入信息推荐模型，得到至少一个商品数据样本对应的一个特征向量和一个店铺数据样本对应的一个特征向量，信息推荐模型包括串联的至少两个隐藏层，特征向量在串联的至少两个隐藏层之间传递时，同一隐藏层中的两个特征向量按照设定权重参数进行计算，得到下一隐藏层中的两个特征向量。这里，第一特征向量表征得到的两个特征向量中的任一特征向量；第二特征向量表征得到的两个特征向量中除第一特征向量之外的另一特征向量。

以第k层隐藏层的特征向量向第k+1层隐藏层的特征向量传递时，如公式1所示出：

其中，

这里，至少一个商品数据样本可以是一个商品数据样本，也可以是两个或更多的商品数据样本。在输入为多个商品数据样本时，基于多个商品的每个商品的商品数据样本提取到的特征进行编码，得到一个特征向量。

将源域的商品数据样本对应的特征向量和目标域的店铺数据样本对应的特征向量进行相互迁移与学习，两个域共享隐藏层的参数，这样，在信息推荐模型的训练过程中，商品数据样本和店铺数据样本均作为训练样本，利用跨域的迁移学习解决数据稀疏问题，以商品数据样本作为源域，对店铺数据样本的目标域进行迁移学习，增加了训练样本来源的多样性。

在一实施例中，所述将所述至少一个商品数据样本、所述一个店铺数据样本和所述用户的用户特征输入至所述信息推荐模型的嵌入层，包括：

将所述至少一个商品数据样本和所述用户特征输入至所述嵌入层，得到所述至少一个商品数据样本对应的特征向量；

将所述一个店铺数据样本和所述用户特征输入至所述嵌入层，得到所述一个店铺数据样本对应的特征向量。

信息推荐模型包括嵌入层和串联的至少两个隐藏层，将至少一个商品数据样本、一个店铺数据样本和用户的用户特征输入至信息推荐模型的嵌入层中，进行特征提取处理，基于至少一个商品数据样本和对应的用户的用户特征，得到至少一个商品数据样本对应的特征向量；基于一个店铺数据样本和对应的用户的用户特征，得到一个店铺数据样本对应的特征向量，这样，可以得到至少一个商品数据样本对应的一个特征向量和一个店铺数据样本对应的一个特征向量。

这里，商品数据样本和店铺数据样本基于同一个用户的访问数据产生，至少一个商品数据样本可以是一个商品数据样本，也可以是两个或更多的商品数据样本。在输入为多个商品数据样本时，通过输入嵌入层进行特征提取处理，基于多个商品的每个商品的商品数据样本提取到的特征进行编码，得到一个特征向量。

商品数据样本和店铺数据样本均可分为结构化数据和非结构化数据。商品数据样本包括商品标识、商品在设定周期内的推荐次数、商品标签被点击次数、转化率等，转化率基于推荐次数和被点击次数确定。店铺数据样本包括店铺标识、店铺在设定周期内的页面展示次数、店铺标签被点击次数、转化率、店铺用户评分、上架商品数量和主营品类等，转化率基于推荐次数和被点击次数确定。用户特征用于表征用户画像，包括用户标识、年龄、价格偏好标签等。这里的推荐可以理解为商品或店铺的图标、名称在对应页面的展示，使用户可以浏览到商品或店铺。所有的标识可以是汉字名称等非结构化数据形式，可以是对应的数字ID的结构化数据形式。

这样，至少一个商品数据样本对应的特征向量和一个店铺数据样本对应的特征向量可以分别表征商品和用户行为、店铺和用户行为，以商品和用户行为为源域、店铺和用户行为为目标域，进行共同用户的跨域学习，从而解决模型存在的数据稀疏问题。

例如，将商品数据样本和用户特征输入至嵌入层，得到商品数据样本对应的特征向量为[用户ID，商品ID，最近7天商品平均一次被点击的所需推荐次数，商品评论数]。将店铺数据样本和用户特征输入至嵌入层，得到店铺数据样本对应的特征向量为[用户ID，店铺ID，最近7天店铺平均一次被点击的所需推荐次数，店铺评论数]。这里，最近7天商品平均一次被点击的所需推荐次数、最近7天店铺平均一次被点击的所需推荐次数可以认为是商品或店铺的7天内转化率。

实际应用中，数据样本可以是[1126744308，228，4309，1002624]。

在一实施例中，所述确定所述信息推荐模型的总损失值，包括：

基于所述第一预测结果与对应的标定结果之间的差值，计算第一损失值；

基于所述第二预测结果与对应的标定结果之间的差值，计算第二损失值；

对所述第一损失值和所述第二损失值进行加权处理，计算所述信息推荐模型的总损失值。

在信息推荐模型的训练过程中，基于至少一个商品数据样本对应的第一预测结果与相应的标定结果之间的差值为第一损失值，一个店铺数据样本对应的第二预测结果与相应的标定结果之间的差值为第二损失值，第一损失值和第二损失值进行加权处理，得到信息推荐模型的总损失值。总损失值的计算，可以采取公式2计算得到：

y＝w

其中，

在本实施例提供的方案中，基于同一用户访问数据中提取得到的至少一个商品数据样本和一个店铺数据样本，通过至少一个商品数据样本和一个店铺数据样本训练信息推荐模型，对于同一用户，商品数据样本和店铺数据样本均可以反映用户对购物的偏好，在信息推荐模型的训练过程中，商品数据样本和店铺数据样本都作为训练样本，利用跨域的迁移学习解决数据稀疏问题，以商品数据样本作为源域，对店铺数据样本的目标域进行迁移学习，可以增加训练样本来源的多样性，克服因店铺数据样本缺乏多样性而导致信息推荐模型的泛化能力较差的问题，使店铺推荐场景下推荐结果更为精确。

在训练过程中，基于至少一个商品数据样本对应的第一预测结果与相应的标定结果、一个店铺数据样本对应的第二预测结果与相应的标定结果，确定信息推荐模型的总损失值，并根据总损失值更新信息推荐模型的权重参数。这样，通过两个双损失目标的优化学习，更新权重参数，进而使信息推荐模型推荐结果更为精确。

在一实施例中，所述方法还包括：

样品库中存储有至少两个批次的样本，每个批次的样本包括从同一用户在同一设定时间段产生的访问数据中提取得到至少一个商品数据样本、一个店铺数据样本，从样品库中根据设定条件确定至少两个批次的样品。这里，一个批次的所有样品，都对应同一用户在同一设定时间段产生的访问数据，设定时间段可以根据信息推荐效果确定，如7天。样本库可以存在于电子设备的本地数据库，也可以存在于远程数据库。

在相同时间段内，因为用户可能产生某类偏好，如最近7天用户需要去探望新出生的婴儿，就会对纸尿裤、奶粉等母婴用品类的商品存在偏好，相对应的店铺偏好也会是包括母婴用品品类的店铺，也就是说，商品的偏好和店铺的偏好之间的关联度高，以同一设定时间段内商品数据样本作为源域，对店铺数据样本的目标域进行迁移学习，提升了数据之间内在的关联程度，使店铺推荐场景下推荐结果更为精确。

实际应用中，还可以使至少两个批次的样本对应两种标定结果，分别为正样本和负样本，根据设定条件从样本库中确定99个批次的正样本和1个负样本作为训练集。这里，正样本是用户访问了对应的店铺，负样本是用户未访问对应的店铺。

图2示出了本申请实施例提供的信息推荐方法的流程示意图。如图2示出的，信息推荐方法包括：

S201：将至少一个商品数据和一个店铺数据输入至信息推荐模型，得到所述至少一个商品数据对应的第三预测结果和所述一个店铺数据对应的第四预测结果；其中，

所述信息推荐模型采用上述任一项所述的信息推荐模型训练方法训练得到；所述至少一个商品数据和所述一个店铺数据从同一用户对商品页面和店铺页面的访问数据中提取得到。

一个用户访问商品页面产生商品页面的访问数据，从商品页面的访问数据中提取得到商品数据；同一个用户访问店铺页面产生店铺页面的访问数据，从店铺页面的访问数据中提取得到店铺数据；将提取得到的至少一个商品数据和一个店铺数据作为输入数据，输入至信息推荐模型，采用信息推荐模型对输入数据进行处理，得到至少一个商品数据对应的第三预测结果和一个店铺数据对应的第四预测结果。这里，信息推荐模型采用上述任一项所述的信息推荐模型训练方法训练得到。

S202：对所述第三预测结果和所述第四预测结果进行加权处理，得到所述一个店铺数据对应的总预测结果。

将得到的至少一个商品数据对应的第三预测结果和一个店铺数据对应的第四预测结果进行加权处理，得到这个店铺数据对应的总预测结果。这里，加权处理的权重参数可以是两个双损失目标的优化学习得到的权重参数，可以是根据实际信息推荐效果设定的。

S203：基于得到的总预测结果进行店铺信息推荐。

基于得到的总预测结果进行店铺信息推荐。这里，总预测结果可以是转化率，转化率基于推荐次数和被点击次数确定，转化率越高，在越少的所需推荐次数下店铺的链接即被点击，推荐的店铺更符合用户的偏好。

实际应用中，基于至少两次采用信息推荐模型进行推荐时对应得到的至少两个总预测结果进行排序，从中确定设定数量的店铺进行店铺信息推荐。

下面结合应用实施例对本申请再作进一步的详细描述。

图3示出了本申请应用实施例提供的一种信息推荐模型训练方法的示意图，通过源域的商品数据样本对目标域的店铺数据样本进行辅助训练，通过CoNet模型来进行同一个用户的跨域信息学习，十字绣网络(Cross-stitch Networs)将源域的信息迁移学习，解决数据稀疏问题，使店铺推荐场景下推荐结果更为精确。

并且，模型通过对两个域的损失目标进行优化学习，借助多任务间的噪声平衡以及表征偏置来实现更好的泛化性能，进而提升推荐系统性能。

数据准备：

借助用户访问店铺的埋点日志，通过相应埋点的解析工作，以用户是否点击店铺链接作为标签(1表示用户点击了店铺链接，反之0则表示用户未点击店铺链接)，以转化率作为学习的目标。

商品数据样本和店铺数据样本基于同一个用户的访问数据产生，商品数据样本和店铺数据样本均可分为结构化数据和非结构化数据。商品数据样本包括商品标识、商品在设定周期内的推荐次数、商品标签被点击次数、转化率等。用户特征用于表征用户画像，包括用户标识、年龄、价格偏好标签等。店铺数据样本包括店铺标识、店铺在设定周期内的页面展示次数、店铺标签被点击次数、转化率、店铺用户评分、上架商品数量和主营品类等。将当天两个域中的同一个用户的访问数据存储至数据库中。

训练及评估过程：

在数据准备阶段的数据库中取出设定时间段的99个正样本数据和1个用户未交互的负样本数据，以此构造训练集进行模型训练。首先将输入的数据进行嵌入操作得到对应的特征向量，然后将特征向量传递至隐藏层。如图3所示出，信息推荐模型主要由三层前向神经网络以及两个交叉单元构成，交叉单元即是对两域相互信息迁移与学习的过程，源域和目标域共享网络层的参数，采用交叉损失函数进行学习，得到总损失值

损失值，

在构造验证集的时候，随机采样1个正样本数据和99个用户未交互的负样本，然后预测正样本在候选集中的推荐排序位置。在模型训练过程中主要用到了HR@K、NDCG@K、MRR@K三个常用的排序推荐指标进行模型结果评估，相比于传统的算法模型具有较好的指标提升结果，取K＝10。

表1指标结果对比

应用实施中，对应的店铺信息推荐方法的流程示意图如图4所示：

当用户访问店铺页面进行请求时，获取用户特征、历史设定时间段内点击过的商品1/2/3的商品数据、候选店铺列表的店铺1的店铺数据。

将至少一个商品数据样本和一个店铺数据样本、一个用户的用户特征输入至信息推荐模型，经过嵌入操作，得到至少一个商品数据样本对应的特征向量和一个店铺数据样本对应的特征向量。

分别将得到至少一个商品数据样本和对应的特征向量和一个店铺数据样本对应的特征向量输入至训练好的CoNet算法的信息推荐模型的第一隐藏层，特征向量在信息推荐模型中的相邻的两个隐藏层之间传递时，以第一隐藏层向第二隐藏层传递为例，各自域的特征向量会接收到对方域的特征向量，在原有的隐藏层特征向量的基础上按照设定权重参数进行计算，再输入到第二隐藏层，这里也就是交叉单元实现两域相互信息迁移与学习的过程。具体公式参照公式1。

经过交叉单元作用后，两域将最后一层隐藏层的输出进行相加，得到这个这个店铺1的总预测结果。

重复上述方式得到每个候选店铺的总预测结果。

根据每个候选店铺的总预测结果进行排序，返回总预测结果最佳的设定数量个候选店铺给用户，作为推荐信息。

为实现本申请实施例的方法，本申请实施例还提供了一种信息推荐模型训练装置，设置在电子设备上，如图5所示，该装置包括：

预测单元501，用于将至少一个商品数据样本和一个店铺数据样本输入至信息推荐模型，得到所述至少一个商品数据样本对应的第一预测结果和所述一个店铺数据样本对应的第二预测结果；

第一确定单元502，用于基于所述第一预测结果与所述第二预测结果中每个预测结果与对应的标定结果之间的差值，确定所述信息推荐模型的总损失值；

更新单元503，用于根据所述总损失值更新所述信息推荐模型的权重参数；

其中，所述至少一个商品数据样本和所述一个店铺数据样本从同一用户对商品页面和店铺页面的访问数据中提取得到。

其中，在一实施例中，所述预测单元501，用于：

将所述至少一个商品数据样本、所述一个店铺数据样本和所述用户的用户特征输入至所述信息推荐模型的嵌入层，得到所述至少一个商品数据样本对应的特征向量和所述一个店铺数据样本对应的特征向量；

所述预测单元501，用于：

将得到的两个特征向量中的任一特征向量在相邻的两个隐藏层之间传递时，在同一隐藏层中，将两个特征向量中的第一特征向量与第二特征向量进行叠加处理，得到用于输入至下一隐藏层的第一特征向量。

在一实施例中，所述预测单元501，用于：

将所述至少一个商品数据样本和所述用户特征输入至所述嵌入层，得到所述至少一个商品数据样本对应的特征向量；

将所述一个店铺数据样本和所述用户特征输入至所述嵌入层，得到所述一个店铺数据样本对应的特征向量。

在一实施例中，所述第一确定单元502，用于：

基于所述第一预测结果与对应的标定结果之间的差值，计算第一损失值；

基于所述第二预测结果与对应的标定结果之间的差值，计算第二损失值；

对所述第一损失值和所述第二损失值进行加权处理，计算所述信息推荐模型的总损失值。

在一实施例中，所述装置还包括：

第二确定单元，用于从样本库中确定至少两个批次的样本；所述至少两个批次中的每个批次的样本包括至少一个商品数据样本和一个店铺数据样本；每个批次的所有样本从同一用户在同一设定时间段产生的访问数据中提取得到。

实际应用时，所述预测单元501、第一确定单元502、更新单元503、第二处理单元、第二确定单元可由基于信息推荐模型训练装置中的处理器，比如中央处理器(CPU，CentralProcessing Unit)、数字信号处理器(DSP，Digital Signal Processor)、微控制单元(MCU，Microcontroller Unit)或可编程门阵列(FPGA，Field-Programmable Gate Array)等实现。

需要说明的是：上述实施例提供的信息推荐模型训练装置在进行信息推荐模型训练时，仅以上述各程序模块的划分进行举例说明，实际应用中，可以根据需要而将上述处理分配由不同的程序模块完成，即将装置的内部结构划分成不同的程序模块，以完成以上描述的全部或者部分处理。另外，上述实施例提供的信息推荐模型训练装置与信息推荐模型训练方法实施例属于同一构思，其具体实现过程详见方法实施例，这里不再赘述。

为实现本申请实施例的方法，本申请实施例还提供了一种信息推荐装置，设置在电子设备上，如图6所示，该装置包括：

输入单元601，用于将至少一个商品数据和一个店铺数据输入至信息推荐模型，得到所述至少一个商品数据对应的第三预测结果和所述一个店铺数据对应的第四预测结果；

第一处理单元602，用于对所述第三预测结果和所述第四预测结果进行加权处理，得到所述一个店铺数据对应的总预测结果；

推荐单元603，用于基于得到的总预测结果进行店铺信息推荐；

实际应用时，所述输入单元601、第一处理单元602、推荐单元603可由基于信息推荐模型中的处理器，比如CPU、DSP、MCU或FPGA等实现。

需要说明的是：上述实施例提供的信息推荐模型在进行信息推荐时，仅以上述各程序模块的划分进行举例说明，实际应用中，可以根据需要而将上述处理分配由不同的程序模块完成，即将装置的内部结构划分成不同的程序模块，以完成以上描述的全部或者部分处理。另外，上述实施例提供的信息推荐模型与信息推荐方法实施例属于同一构思，其具体实现过程详见方法实施例，这里不再赘述。

基于上述程序模块的硬件实现，且为了实现本申请实施例的信息推荐模型训练方法，本申请实施例还提供了一种电子设备，如图7所示，电子设备包括：

通信接口1，能够与其它设备比如网络设备等进行信息交互；

处理器2，与所述通信接口1连接，以实现与其它设备进行信息交互，用于运行计算机程序时，执行上述一个或多个技术方案提供的方法。而所述计算机程序存储在存储器3上。

当然，实际应用时，电子设备中的各个组件通过总线系统耦合在一起。可理解，总线系统用于实现这些组件之间的连接通信。总线系统除包括数据总线之外，还包括电源总线、控制总线和状态信号总线。但是为了清楚说明起见，在图7中将各种总线都标为总线系统。

本申请实施例中的存储器3用于存储各种类型的数据以支持电子设备的操作。这些数据的示例包括：用于在电子设备上操作的任何计算机程序。

可以理解，存储器3可以是易失性存储器或非易失性存储器，也可包括易失性和非易失性存储器两者。其中，非易失性存储器可以是只读存储器(ROM，Read Only Memory)、可编程只读存储器(PROM，Programmable Read-Only Memory)、可擦除可编程只读存储器(EPROM，Erasable Programmable Read-Only Memory)、电可擦除可编程只读存储器(EEPROM，Electrically Erasable Programmable Read-Only Memory)、磁性随机存取存储器(FRAM，ferromagnetic random access memory)、快闪存储器(Flash Memory)、磁表面存储器、光盘、或只读光盘(CD-ROM，Compact Disc Read-Only Memory)；磁表面存储器可以是磁盘存储器或磁带存储器。易失性存储器可以是随机存取存储器(RAM，Random AccessMemory)，其用作外部高速缓存。通过示例性但不是限制性说明，许多形式的RAM可用，例如静态随机存取存储器(SRAM，Static Random Access Memory)、同步静态随机存取存储器(SSRAM，Synchronous Static Random Access Memory)、动态随机存取存储器(DRAM，Dynamic Random Access Memory)、同步动态随机存取存储器(SDRAM，SynchronousDynamic Random Access Memory)、双倍数据速率同步动态随机存取存储器(DDRSDRAM，Double Data Rate Synchronous Dynamic Random Access Memory)、增强型同步动态随机存取存储器(ESDRAM，Enhanced Synchronous Dynamic Random Access Memory)、同步连接动态随机存取存储器(SLDRAM，SyncLink Dynamic Random Access Memory)、直接内存总线随机存取存储器(DRRAM，Direct Rambus Random Access Memory)。本申请实施例描述的存储器3旨在包括但不限于这些和任意其它适合类型的存储器。

上述本申请实施例揭示的方法可以应用于处理器2中，或者由处理器2实现。处理器2可能是一种集成电路芯片，具有信号的处理能力。在实现过程中，上述方法的各步骤可以通过处理器2中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器2可以是通用处理器、DSP，或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。处理器2可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者任何常规的处理器等。结合本申请实施例所公开的方法的步骤，可以直接体现为硬件译码处理器执行完成，或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于存储介质中，该存储介质位于存储器3，处理器2读取存储器3中的程序，结合其硬件完成前述方法的步骤。

可选地，所述处理器2执行所述程序时实现本申请实施例的各个方法中由电子设备实现的相应流程，为了简洁，在此不再赘述。

在示例性实施例中，本申请实施例还提供了一种存储介质，即计算机存储介质，具体为计算机可读存储介质，例如包括存储计算机程序的存储器3，上述计算机程序可由电子设备的处理器2执行，以完成前述方法所述步骤。计算机可读存储介质可以是FRAM、ROM、PROM、EPROM、EEPROM、Flash Memory、磁表面存储器、光盘、或CD-ROM等存储器。

在本申请所提供的几个实施例中，应该理解到，所揭露的装置、电子设备和方法，可以通过其它的方式实现。以上所描述的设备实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，如：多个单元或组件可以结合，或可以集成到另一个系统，或一些特征可以忽略，或不执行。另外，所显示或讨论的各组成部分相互之间的耦合、或直接耦合、或通信连接可以是通过一些接口，设备或单元的间接耦合或通信连接，可以是电性的、机械的或其它形式的。

上述作为分离部件说明的单元可以是、或也可以不是物理上分开的，作为单元显示的部件可以是、或也可以不是物理单元，即可以位于一个地方，也可以分布到多个网络单元上；可以根据实际的需要选择其中的部分或全部单元来实现本实施例方案的目的。

另外，在本申请各实施例中的各功能单元可以全部集成在一个处理单元中，也可以是各单元分别单独作为一个单元，也可以两个或两个以上单元集成在一个单元中；上述集成的单元既可以采用硬件的形式实现，也可以采用硬件加软件功能单元的形式实现。

本领域普通技术人员可以理解：实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成，前述的程序可以存储于一计算机可读取存储介质中，该程序在执行时，执行包括上述方法实施例的步骤；而前述的存储介质包括：移动存储设备、ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。

或者，本申请上述集成的单元如果以软件功能模块的形式实现并作为独立的产品销售或使用时，也可以存储在一个计算机可读取存储介质中。基于这样的理解，本申请实施例的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机、服务器、或者网络设备等)执行本申请各个实施例所述方法的全部或部分。而前述的存储介质包括：移动存储设备、ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。

需要说明的是，本申请实施例所记载的技术方案之间，在不冲突的情况下，可以任意组合。除非另有说明和限定，术语“连接”应做广义理解，例如，可以是电连接，也可以是两个元件内部的连通，可以是直接相连，也可以通过中间媒介间接相连，对于本领域的普通技术人员而言，可以根据具体情况理解上述术语的具体含义。

另外，在本申请实例中，“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解“第一\第二\第三”区分的对象在适当情况下可以互换，以使这里描述的本申请的实施例可以除了在这里图示或描述的那些以外的顺序实施。

以上所述，仅为本申请的具体实施方式，但本申请的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本申请揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本申请的保护范围之内。因此，本申请的保护范围应以所述权利要求的保护范围为准。

在具体实施方式中所描述的各个实施例中的各个具体技术特征，在不矛盾的情况下，可以进行各种组合，例如通过不同的具体技术特征的组合可以形成不同的实施方式，为了避免不必要的重复，本申请中各个具体技术特征的各种可能的组合方式不再另行说明。

去获取专利，查看全文>

相似文献

专利
中文文献
外文文献

1. 信息推荐模型训练方法、信息推荐方法及存储介质 [P] . 中国专利： CN113129053A . 2021-07-16
2. 信息推荐模型训练方法、信息推荐方法、装置及设备 [P] . 中国专利： CN112464100A . 2021-03-09
3. INFORMATION RECOMMENDATION METHOD AND SYSTEM, STORAGE MEDIUM STORING INFORMATION RECOMMENDATION PROGRAM, INFORMATION STORAGE METHOD AND DEVICE, AND STORAGE MEDIUM STORING INFORMATION STORAGE PROGRAM [P] . 日本专利： JPH11338869A . 1999-12-10

机译：信息推荐方法和系统，存储介质存储信息推荐程序，信息存储方法和装置以及存储介质存储信息存储程序
4. MATCHING INFORMATION RECOMMENDATION SYSTEM, MATCHING INFORMATION RECOMMENDATION METHOD, STORAGE MEDIUM WITH MATCHING INFORMATION RECOMMENDATION PROGRAM STORED THEREIN, AND SIMULTANEOUS APPLICATION SYSTEM FOR HOUSING-RELATED COMMODITY IN CONTRACT [P] . 日本专利： JP2002170004A . 2002-06-14

机译：配套信息推荐系统，配套信息推荐方法，存储了配套配套信息推荐程序的存储介质以及合同中与住房有关的商品同时应用系统
5. INFORMATION RECOMMEND SYSTEM, INFORMATION RECOMMEND METHOD AND NON-TRANSITORY COMPUTER-READABLE STORAGE MEDIUM [P] . 美国专利： US2017280197A1 . 2017-09-28

机译：信息推荐系统，信息推荐方法和非暂时性计算机可读存储介质