首页> 中国专利> 一种基于双层胶囊网络的短视频点击率预测方法

一种基于双层胶囊网络的短视频点击率预测方法

摘要

本发明公开了一种基于双层胶囊网络的短视频点击率预测方法。该方法利用短视频平台中用户的正反馈和负反馈数据,判断用户对正面情感占主要部分的正反馈序列和负面情感占主要部分的负反馈序列中每个模块的情感,预测用户对目标短视频的点击率。本方法主要由四个部分组成:第一部分是利用第一层胶囊网络从用户正反馈和负反馈信息中抽取模块特征;第二部分是将两种模块特征和目标短视频进行一一配对,组合成逻辑单元;第三部分是利用第二层胶囊网络从逻辑单元中抽取用户对短视频的不同模块的情感;第四部分是基于用户对当前短视频的情感特征,进行短视频点击率的预测。

著录项

  • 公开/公告号CN112307258A

    专利类型发明专利

  • 公开/公告日2021-02-02

    原文格式PDF

  • 申请/专利权人 中国计量大学;

    申请/专利号CN202011334084.4

  • 发明设计人 顾盼;

    申请日2020-11-25

  • 分类号G06F16/735(20190101);G06F16/78(20190101);G06N3/04(20060101);

  • 代理机构

  • 代理人

  • 地址 310018 浙江省杭州市下沙高教园区学源街258号

  • 入库时间 2023-06-19 09:47:53

说明书

技术领域

本发明属于互联网服务技术领域,尤其是涉及一种基于双层胶囊网络的短视频点击率预测方法。

背景技术

短视频是一种新型的且时间较短的视频。短视频的拍摄不需要使用专业设备,也不需要专业技巧。用户直接通过手机就可以很方便地进行拍摄和上传到短视频平台,因此短视频平台的短视频数量增长得非常快。这使得对有效短视频推荐系统的需求非常迫切,有效的短视频推荐系统可以提升用户体验和用户黏性,从而给平台带来巨大的商业价值。

近些年,很多研究者提出了基于视频的个性化推荐方法。这些方法可以分为三类:协同过滤、基于内容的推荐和混合推荐方法。但是相比于视频,短视频有着不同的特点:描述文本质量较低、时长较短且用户在一段时间内的交互序列较长。因此,短视频推荐是一个更具有挑战性的任务,并且有研究者提出了一些方法。例如,Wei等人采用图卷积结构去融合短视频的多模态信息,进而更好地模拟用户的偏好;Chen等人利用分层的注意力机制去计算物品和类目这两种级别的重要性,得到更准确的预测结果;Li等人结合正负反馈数据,并使用基于图的循环神经网络去建模,最后得到用户的偏好。

尽管这些方法取得不错的结果,但是这些结构很少结合用户的正反馈信息和负反馈信息共同来预测用户行为。负反馈信息指用户看了短视频的封面,却没有点击观看的行为。其中,Li等人的研究同时使用用户的正反馈序列和负反馈序列,但是他们计算的是用户对短视频整体的偏好,而没有细粒度地讨论正反馈和负反馈的具体作用。本方法利用短视频平台中用户的正反馈和负反馈数据,判断用户对序列每个模块的情感,预测用户对目标短视频的点击率。同时本方法认为用户正反馈和负反馈序列中都同时存在正面情感和负面情感,但是在用户正反馈序列中正面情感占主要部分,用户负反馈序列中负面情感占主要部分。通常来讲,同一用户对点击的短视频和未点击的短视频的同一种模块属性特征(如,短视频的主题),不可能都同时出现强烈的同种情感。

发明内容

本发明所要解决的技术问题是提供一种利用短视频平台中用户的正反馈和负反馈数据,判断用户对序列每个模块的情感,预测用户对目标短视频的点击率。本方法认为用户正反馈和负反馈序列中都同时存在正面情感和负面情感,但是在用户正反馈序列中正面情感占主要部分,用户负反馈序列中负面情感占主要部分。所以预测用户对目标短视频的点击率,应该分析用户正反馈和负反馈序列中对短视频不同模块的偏好。为此,本发明采用以下技术方案:

一种基于双层胶囊网络的短视频点击率预测方法,包括以下步骤:

分别从用户点击序列和未点击序列抽取模块属性特征。对于一个用户的点击行为序列

其中,

其中,

将用户从点击序列和未点击序列中抽取的模块属性特征和目标短视频进行匹配,生成逻辑单元:

其中,

根据从用户正反馈和负反馈序列中抽取出的逻辑单元,生成用户的正面情感和负面情感。本方法认为,用户正反馈和负反馈中都同时存在正面情感和负面情感,但是在用户正反馈序列中正面情感占主要部分,用户负反馈序列中负面情感占主要部分。所以本方法改进胶囊网络,从正反馈和负反馈序列中抽取出的逻辑单元中抽取情感特征:

其中,

其中,p∈{+,-},

根据用户正面和负面情感,预测用户对目标短视频的点击率。给定情感胶囊s

其中,k∈{pos,neg},

根据模型特性,设计损失函数。通过用户对目标短视频的点击率预测值

其中,y∈{0,1}是真实值,代表用户是否点击了目标短视频。σ是sigmoid函数。最后采用Adam优化器更新模型参数。

本发明的有益技术效果如下:

(1)本发明提出了一种基于双层胶囊网络的短视频点击率预测方法,从用户的正反馈和负反馈信息中分析用户对短视频不同模块的不同情感,进而得到更准确的预测。

(2)本发明从实际场景出发,同时从用户正反馈和负反馈序列中抽取正面情感和负面情感,丰富用户行为特征,从而使模型得到更好的效果。

(3)本发明从实际场景出发,考虑用户正反馈序列和负反馈中正面情感的主次地位,以及用户负反馈序列和正反馈序列中负面情感的主次地位。改进胶囊网络的框架和动态路由算法。

附图说明

图1为本发明一种基于双层胶囊网络的短视频点击率预测方法的流程示意图;

图2为本发明一种基于双层胶囊网络的短视频点击率预测方法的模型框架图。

具体实施方式

为了进一步理解本发明,下面结合具体实施方式对本发明提供的一种基于双层胶囊网络的短视频点击率预测方法进行具体描述,但本发明并不限于此,该领域技术人员在本发明核心指导思想下做出的非本质改进和调整,仍然属于本发明的保护范围。

短视频点击率预测任务是建立一个模型去预测用户点击短视频的概率。用户的历史序列表示为

为此,本发明提出了一种基于双层胶囊网络的短视频点击率预测方法。它根据用户对短视频的正反馈和负反馈信息,挖掘出用户对短视频不同模块的情感,预测用户对目标短视频的点击率。这里的正反馈是指用户点击了短视频;负反馈是指平台展示了短视频的封面,但是用户没有点击短视频,说明用户对短视频没有兴趣。本方法认为用户对短视频的不同模块有不同的情感,且用户正反馈和负反馈序列中都同时存在正面情感和负面情感,但是在用户正反馈序列中正面情感占主要部分,用户负反馈序列中负面情感占主要部分。所以预测用户对目标短视频的点击率,应该分析用户正反馈和负反馈序列中对短视频不同模块的偏好。

本方法主要由四个部分组成,如图2所示。第一个部分是利用第一层胶囊网络从用户正反馈和负反馈信息中抽取模块特征。第二个部分是将两种模块特征和目标短视频进行一一配对,组合成逻辑单元(logit unit)。第三个部分是利用第二层胶囊网络从逻辑单元中抽取用户对短视频的不同模块的情感。第四个部分是基于用户对当前短视频的情感特征,进行短视频点击率的预测。

如图1所示,按照本发明的一个实施例,本方法包括如下步骤:

S100,分别从用户点击序列和未点击序列抽取模块属性特征。对于一个用户的点击行为序列

其中,

其中,

S200,将用户从点击序列和未点击序列中抽取的模块属性特征和目标短视频进行匹配,生成逻辑单元:

其中,

S300,根据从用户正反馈和负反馈序列中抽取出的逻辑单元,生成用户的正面情感和负面情感。本方法认为,用户正反馈和负反馈中都同时存在正面情感和负面情感,但是在用户正反馈序列中正面情感占主要部分,用户负反馈序列中负面情感占主要部分。所以本方法改进胶囊网络,从正反馈和负反馈序列中抽取出的逻辑单元中抽取情感特征:

其中,

其中,p∈{+,-},

S400,根据用户正面和负面情感,预测用户对目标短视频的点击率。给定情感胶囊s

其中,k∈{pos,neg},

S500,根据模型特性,设计损失函数。通过用户对目标短视频的点击率预测值

其中,y∈{0,1}是真实值,代表用户是否点击了目标短视频。σ是sigmoid函数。最后采用Adam优化器更新模型参数。

上述对实施例的描述是为方便于本技术领域的普通技术人员能理解和应用本发明。熟悉本领域技术的人员显然可以容易地对上述实施例做出各种修改,并把在此说明的一般原理应用到其他实施例中而不必经过创造性的劳动。因此,本发明不限于上述实施例,本领域技术人员根据本发明的揭示,对于本发明做出的改进和修改都应该在本发明的保护范围之内。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号