首页> 中国专利> 基于流行度和社交网络的个性化用户原创视频预取方法及系统

基于流行度和社交网络的个性化用户原创视频预取方法及系统

摘要

本发明公开了一种基于流行度和社交网络的个性化用户原创视频预取方法及系统。该方法先收集视频流行度信息,用户之间社交关系,视频之间关联关系以及用户历史行为信息;基于流行度信息,将用户原创视频分为热门视频和长尾视频;计算用户对热门视频的偏好度并排序,生成热门视频预取列表;构建图模型,实现用户和视频的相关度测量,为用户生成长尾视频预取列表;加权线性融合热门视频预取列表和长尾视频预取列表,构建个性化的混合预取模型;在保证用户当前观看视频流畅的情况下,基于个性化混合预取模型,为用户预取排名靠前的一部或多部视频。本系统提高了用户原创视频预取的命中率和准确度,提升了用户原创视频服务的质量,改进了用户的观看体验。

著录项

  • 公开/公告号CN103974097A

    专利类型发明专利

  • 公开/公告日2014-08-06

    原文格式PDF

  • 申请/专利权人 南京大学镇江高新技术研究院;

    申请/专利号CN201410219254.2

  • 发明设计人 叶保留;徐轩绚;陆桑璐;

    申请日2014-05-22

  • 分类号H04N21/258(20110101);H04N21/466(20110101);H04N21/238(20110101);

  • 代理机构32237 江苏圣典律师事务所;

  • 代理人贺翔

  • 地址 212000 江苏省镇江市高新园区南纬四路36号

  • 入库时间 2023-12-17 01:29:34

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2017-03-01

    授权

    授权

  • 2014-09-03

    实质审查的生效 IPC(主分类):H04N21/258 申请日:20140522

    实质审查的生效

  • 2014-08-06

    公开

    公开

说明书

技术领域

本发明涉及一种基于流行度和社交网络的个性化用户原创视频预取方法及 系统,属于视频预取的技术领域。

背景技术

随着Web2.0时代的到来,用户不再是单纯的信息接收者,而是同时成为了 了信息的发布者,以优酷网和土豆网为代表,基于用户原创内容的视频网站受到 广大用户的高度追捧,但是多组研究结果都表明用户的观看体验不能让人满意, 播放产生的时延占视频时长的比重较高。减少视频播放时延的相关方法包括:提 高服务器的软硬件性能,增加网络带宽,基于网络代理和基于内容分发网络,然 而这些方法都有相应的劣势,相比之下视频预取技术能够很好的降低用户可感受 时延,同时产生较小的开销。

但是由于基于用户原创内容的视频服务在用户行为和视频内容上具有很多 区别于传统视频服务的特点,例如视频数量很多,视频长度较短,内容数据较少, 极快的内容产生速度,不同的流行度分布以及社会网络的存在。因此传统的视频 预取算法并不能够很好的适用于用户原创内容视频服务。

用户原创视频的流行度分布表现出极端的不平衡,一部分视频有着很高的流 行度,选择观看这部分视频时,用户通常考虑视频的流行度以及是否符合自己的 兴趣。另一部分视频虽然流行度不高,却通过不同的传播途径,被感兴趣的用户 观看,主要的传播途径包括用户之间的社交关系以及视频之间的关联关系。

因此,有必要提出一种能够综合考虑不同流行度视频,充分利用用户社交关 系,视频关联关系,视频流行度信息以及用户历史行为数据的,适用于用户原创 视频的视频预取方法和系统,以有效的提高视频预取的命中率和准确度,提升用 户原创视频服务的质量,改进用户的观看体验。

发明内容

本发明所要解决的技术问题是提供一种基于流行度和社交网络的个性化用 户原创视频预取方法及系统。该方法及系统提高了视频预取的命中率和准确度, 提升用户原创视频服务的质量,改进了用户的观看体验。

为了达到上述目的,根据本发明的一方面,本发明提供了一种基于流行度和 社交网络的用户原创视频预取方法,包括如下步骤:

1)信息获取:获取用户对视频的历史行为信息,用户与用户之间的社交关 系,视频与视频之间的关联关系以及原创视频的流行度信息;

2)视频分类:基于用户原创视频的流行度信息,将视频分为热门视频和长 尾视频两类;

3)热门视频预取列表生成:基于原创视频的流行度信息以及用户历史行为 信息,计算用户对热门视频的偏好度,根据偏好度降序排序,为用户生成热门视 频预取列表;

4)图模型构建:基于获取的用户历史行为信息,用户之间的社交关系以及 视频之间的关联关系构建图模型,其中的每一个节点或边拥有与实际物理类型一 致的节点或关系类型,每一条边拥有与实际关系强度一致的边权值;

5)长尾视频预取列表生成:基于图模型,利用基于最短路径权值的相关度 测量方法,测量用户和视频的相关度,根据相关度降序排序,为用户生成长尾视 频预取列表;

6)混合预取模型生成:基于获取的用户的历史行为信息,对热门视频预取 列表和长尾视频预取列表进行加权线性融合,构建个性化的混合预取模型;

7)生成预取视频列表:在保证用户当前观看视频流畅的情况下,基于个性 化混合预取模型,为用户预取排在最靠前的一部或多部视频推荐。

在上述用户原创视频预取方法中,所述信息获取步骤包括:若在应用系统中 存在用户与用户之间的社交关系或者视频与视频之间的关联关系,则获取这些信 息,若无,则无需获取;用户对视频的历史行为信息包括用户对视频的观看,分 享,上传或收藏行为。

在上述用户原创视频预取方法中,在所述热门视频预取列表生成步骤之前还 包括:对用户历史行为数据进行预处理步骤,具体为:只保留用户对视频肯定的 信息;在非评分系统中,包括用户对视频的观看、分享、收藏以及上传信息。

在上述用户原创视频预取方法中,其所述视频分类步骤具体为:首先,利用 视频观看次数衡量视频流行度,按照视频流行度从高到低排序;其次,累计观看 次数占总观看次数80%,流行度排名前10%的视频为热门视频,若流行度排名前 10%的视频累计观看次数不足总观看次数的80%,根据流行度排名向后扩展热门 视频,直至满足累计观看次数占总观看次数80%;最后,排除所有热门视频,剩 余视频为长尾视频。

在上述用户原创视频预取方法中,其所述热门视频预取列表生成步骤中,偏 好度计算的具体过程为:首先,利用视频观看次数计算视频流行度;其次,利用 用户历史行为信息计算用户对视频的兴趣因子;最后,结合流行度和兴趣因子, 计算用户的视频的偏好度。

在上述用户原创视频预取方法中,其所述图模型构建步骤具体为:首先,将 用户实体及视频实体映射为图中相应的节点,并且用实体的类型作为相应节点的 类型;其次,若用户之间存在社交关系,则在对应的节点之间添加边,边的权值 代表社交关系强度,若视频之间存在关联关系,则在对应的节点之间添加边,边 的权值代表关联关系强度;最后,若用户对视频有肯定行为信息,则在用户与该 视频间添加边,边的权值代表肯定行为的强度。

在上述用户原创视频预取方法中,其所述长尾视频预取列表生成步骤中,相 关度计算的具体过程为:首先,计算得到节点之间的最短路径,若节点之间不存 在路径,相关度为0;其次,计算单条最短路径的权值;最后,采用最短路径的 权值之和作为节点之间的相关度。

在上述用户原创视频预取方法中,其所述混合预取模型生成步骤具体为:利 用用户历史行为信息,分别计算用户对热门视频及长尾视频的行为数量占总行为 数量的比例,将计算结果作为热门视频预取列表和长尾视频预取列表的权值,对 热门视频预取列表和长尾视频预取列表进行加权线性融合。

此外,本发明提供了一种基于流行度和社交属性的个性化用户原创视频预取 系统,包括:信息获取模块,用于获取用户对视频的历史行为信息,用户与用户 之间的社交关系,视频与视频之间的关联关系以及视频自身的流行度信息;预处 理模块,用于保留肯定的信息;视频分类模块,用于基于用户原创视频的流行度 信息,将视频分为热门视频和长尾视频两类;热门视频预取列表生成模块,用于 基于视频流行度和用户历史行为信息,计算用户对热门视频的偏好度,生成热门 视频预取列表;图模型构建模块,用于基于用户对视频的历史行为信息,用户之 间的社交关系以及视频之间关联关系构建含有节点类型以及边权值的图模型;长 尾视频预取列表生成模块,用于基于图模型,利用基于最短路径权值的相关度测 量方法,计算用户和长尾视频的相关度,生成长尾视频预取列表;混合预取模型 生成模块,用于基于用户历史行为信息,计算热门视频预取权值及长尾视频预取 权值,加权线性融合热门视频预取列表和长尾视频预取列表,生成个性化混合预 取模型;视频预取模块,用于在保证用户当前观看视频流畅的情况下,基于个性 化混合模型,为用户预取排在最靠前的一个或多个视频。

本发明提出了一种基于流行度和社交网络的个性化用户原创视频预取方法 及系统。第一次基于用户原创视频流行度的分布将视频分为热门视频和长尾视频 两类,根据用户观看这两类视频的不同特点,充分利用用户社交关系,视频关联 关系,视频流行度信息以及用户历史行为数据,挖掘了用户对未观看视频的偏好 程度,对两类视频分别生成视频预取列表,通过混合预取模型加权线性融合这两 类视频预取列表。因此有效的提高了视频预取的命中率和准确度,提升了用户原 创视频服务的质量,改进了用户的观看体验。

附图说明

图1为本发明基于流行度和社交网络的个性化用户原创视频预取方法的步 骤流程图;

图2为本发明实施例的场景描述示意图;

图3为本发明实施例的图模型示意图;

图4为本发明实施例的视频预取示意图;

图5为本发明基于流行度和社交网络的个性化用户原创视频预取系统的结 构示意图。

具体实施方式

本发明提供了一种基于流行度和社交网络的个性化用户原创视频预取方法 及系统。下面结合附图进行详细说明。

参照图1,图1为本发明基于流行度和社交属性的个性化用户原创视频预取 方法的步骤流程图,包括如下步骤:

信息获取步骤101:获取用户对视频的历史行为信息,用户与用户之间的社 交关系,视频与视频之间的关联关系以及视频自身的流行度信息;

视频分类步骤102:基于用户原创视频的流行度信息,将用户原创视频分为 热门视频和长尾视频两类;

热门视频预取列表生成步骤103:基于视频流行度以及用户对视频的历史行 为信息,计算用户对热门视频的偏好度,根据偏好度降序排序,为用户生成热门 视频预取列表;

图模型构建步骤104:基于用户对视频的历史行为信息,用户之间的社交关 系以及视频之间的关联关系构建图模型,其中的每一个节点或边拥有与实际物理 类型一致的节点或关系类型,每一条边拥有与实际关系强度一致的边权值;

长尾视频预取列表生成步骤105:基于图模型,利用基于最短路径权值的相 关度测量方法,测量用户和视频的相关度,根据相关度降序排序,为用户生成长 尾视频预取列表;

生成混合预取模型步骤106:基于获取的用户的历史行为信息,对热门视频 预取列表和长尾视频预取列表进行加权线性融合,构建个性化的混合预取模型;

视频预取步骤107:在保证用户当前观看视频流畅的情况下,基于个性化混 合预取模型,为用户预取排在最靠前的一部或多部视频推荐。

实际中一种优选的处理方式是,在热门视频预取列表生成步骤之前还包括预 处理步骤,对用户历史行为信息进行处理,只保留用户对视频肯定的信息;在非 评分系统中,包括用户对视频的观看、分享、收藏以及上传信息。

下面结合一个用户原创视频服务平台的例子,详细描述本方法的具体实施方 式。参照图2,图2是本实施例的场景描述图,本实施例描述了一个用户原创视 频服务平台,视频有自身的内容信息;用户之间可以建立社交关系;用户可以观 看、收藏、上传、分享视频;视频之间存在关联关系,由用户在上传视频时添加。

根据用户对视频的行为,可以构建用户-视频关系矩阵R,如果用户i对视频 j有过观看、收藏、上传或者分享行为,Rij为1,否则Rij为0。R是一个m×n维 的矩阵,m为系统中用户数量,n为系统中视频数量。

根据流行度分布对视频进行分类:首先,利用视频观看次数衡量视频流行度, 具体如公式(1),其中Pk表示视频k的流行度,Mk表示视频k被观看的次数。 其次,按照视频流行度从高到低排序,累计观看次数占总观看次数80%,流行度 排名前10%的视频为热门视频,若流行度排名前10%的视频累计观看次数不足总 观看次数的80%,根据流行度排名向后扩展热门视频,直至满足累计观看次数占 总观看次数80%;最后,排除所有热门视频,剩余视频为长尾视频。)表示热门 视频集合,表示长尾视频集合

Pk=log(Mk+1)(1)

下面介绍生成热门视频预取列表过程中用户对热门视频的偏好度计算方法。 首先,利用公式(1)计算视频k的流行度Pk;其次,计算用户i对视频k的兴趣 因子Ii(k),具体如公式(2),其中F表示用户i有过肯定行为视频的集合, 表示和视频k最相似的N部视频的集合,Sim(k,j)表示视频k和视频j的 相似度。

相似度采用余弦相似度计算得到,具体如公式(3),其中N(k)表示喜欢视频 k的用户集合,并按最大值进行归一化,具体如公式(4)。

Sim(k,j)=|N(k)IN(j)||N(k)|×|N(j)|---(3)

Sin(k,j)=Sim(k,j)maxjSim(k,j)---(4)

最后利用公式(5)计算用户i对热门视频k的偏好度Si(k)。

Si(k)=Pk×Ii(k)(5)

接下来基于用户-视频关系矩阵R,用户与用户之间的社交关系以及视频与 视频之间的关联关系,构建图模型。图模型是指一个边带权值的无向图 G(U,V,E,R,W;Φ)。其中U代表用户集合,包括所有的用户节点;V代表视频集 合,包括所有的视频节点;E代表图中边的集合,包括社交网络中节点之间所有 的关系以及所有的用户肯定行为;R代表关系类型集合,包括所有的关系类型; Φ:E→R,代表关系类型的映射函数;W代表图G中边的权值,衡量了某种关 系的强度;E中所有的边e,都属于一种关系类型,Φ(e)∈R;e(u,v)∈E, u,v∈U|V,代表节点u和节点v之间存在某种类型的关系;而w(e)代表e这一 条边的权值;其中|R|>1,当|R|=1的时候,G退化为一个用户‐物品二分图。

根据图模型的定义,具体构建过程如下:

1)将用户实体及视频实体映射为图G中相应的节点,并且用实体的类型作 为相应节点的类型;

2)若用户ui和用户uj之间存在社交关系,则添加边e(ui,uj),边的权值ω(e) 代表社交关系强度,利用公式(6)计算,其中Fi代表用户i的好友集合,Fj代 表用户j的好友集合;

ω(e)=|FiIFj||FiUFj|---(6)

3)若视频vi和视频vj之间存在关联关系,则添加边e(vi,vj),边的权值ω(e) 代表关联关系强度,利用公式(7)计算,其中R)i代表视频i的相关视频集合,代表视频j的相关视频集合。如果视频vj同样也是视频vi的相关视频,由于是无 向图,边e(vj,vi)已经存在,所以不需要在添加新的边,只需要更新边的权值为 原来的两倍;

4)若用户ui对视频vj有肯定行为,则添加边e(ui,vj),边的权值ω(e)为1/n, 代表肯定行为的强度,其中n为用户ui有过肯定行为的视频总数

下面参照图3介绍生成长尾视频预取列表过程中,基于图模型,用户ui和长 尾视频vj之间的相关度计算方法:

1)在G中,判断节点ui和节点vj之间是否有路径相连,如果没有,相似度 为0;如果有,计算得到节点ui和节点vj之间所有的最短路径,定义Γ(ui,vj)为 图G中节点ui和节点vj之间所有最短路径的集合。虽然G是一个边带权值的图, 但是在计算节点之间最短路径的时候,不考虑节点之间边的权值,仅考虑路径上 边的数量;

2)对节点ui和节点vj之间的最短路径ρ∈Γ(ui,vj),计算得到其的权值 ω(ρ)。假设最短路径ρ={ui,K,vj},ω(ρ)可以根据公式(8)计算得到,用 {n1,K,nk}来代表最短路径ρ经过的节点,n1即ui,nk即vj。ω(ni,ni+1)代表边 e(ni,ni+1)的权值,out(ni)表示节点ni的度。;

ω(ρ)=Πi=1kω(ni,ni+1)|out(ni)|---(8)

3)对节点ui和节点vj之间的所有最短路径ρ∈Γ(ui,vj),将其权值ω(ρ)相 加,计算得到节点ui和节点vj的相关度sim(ui,vj),如公式(9)所示;

sin(ui,vj)=ΣρΓ(ui,vj)ω(ρ)---(9)

下面介绍构建个性化混合预取模型的步骤。由于是个性化混合预取模型,需 要充分考虑不同用户的特征。以用户ui为例,利用用户ui对视频的历史行为信息, 计算热门视频预取列表的权值ωP(ui)和长尾视频预取列表的权值 ωL(ui),通过线性加权融合的方法,融合热门视频预取列表和长尾视频预取列表, 生成个性化混合预取模型具体如公式(10)。

热门视频预取列表权值ωP(ui)的计算具体如公式(11),长尾视频预取列表 权值ωL(ui)的计算具体如公式(12)。

接下来参照图4介绍视频预取的步骤:

1)视频缓存被分为两个部分,播放缓存及预取缓存,播放缓存用于缓存当 前正在观看视频内容的数据块,预取缓存用于缓存预取视频内容的片头数据块;

2)从服务器处接受个性化混合预取模型,在之后的播放过程中利用这个混 合预取模型预测用户未来可能观看的视频内容;

3)数据调度策略包括两个阶段,在每个调度周期内,先利用下载带宽下载 紧急数据块到播放缓存,以保证用户当前正在观看的视频能够流畅的播放,紧急 数据块是指按照视频的播放顺序,播放时间临近当前播放时间的数据块;如果下 载完紧急数据块之后仍有富余的下载带宽,基于混合预取模型预测用户未来可能 观看的视频,并使用剩余的下载带宽将视频的片头内容,预取到预取缓存中。

最后,参照图5来描述基于流行度和社交网络的个性化用户原创视频预取系 统。如图5所示,本系统具体包括:信息获取模块501,用于获取用户对视频的 历史行为信息,用户与用户之间的社交关系,视频与视频之间的关联关系以及视 频自身的流行度信息;预处理模块502,用于保留肯定的信息;视频分类模块503, 用于基于用户原创视频的流行度分布,将视频分为热门视频和长尾视频两类;热 门视频预取列表生成模块504,用于基于视频流行度和用户历史行为信息,计算 用户对热门视频的偏好度,生成热门视频预取列表;图模型构建模块505,用于 基于用户对视频的历史行为信息,用户之间的社交关系以及视频之间关联关系构 建含有节点类型以及边权值的图模型;长尾视频预取列表生成模块506,用于基 于用户之间社交关系,视频之间关联关系以及用户历史行为信息,计算用户和长 尾视频的相关度,生成长尾视频预取列表;混合预取模型生成模块507,用于基 于用户历史行为信息,计算热门视频预取权值及长尾视频预取权值,加权线性融 合热门视频预取列表和长尾视频预取列表,生成个性化混合预取模型;视频预取 模块508,用于在保证用户当前观看视频流畅的情况下,基于个性化混合模型, 为用户预取排在最靠前的一个或多个视频

由此,实现了本发明实施例的基于流行度和社交网络的个性化用户原创视频 预取系统。

在此说明的是,系统实施例的原理与方法实施例的原理是相同的,相互之间 可以互相参照即可。在此不再赘述。

虽然结合附图描述了本发明的实施例,但不应理解为对本发明的限制。应当 指出,对于本技术领域的技术人员来说,在不脱离本发明原理和范围的前提下, 还可以作出若干修改和变型,这些修改和变型也应视为在本发明的保护范围之 内。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号