首页> 中国专利> 基于用户兴趣学习的个性化广告推送方法与系统

基于用户兴趣学习的个性化广告推送方法与系统

摘要

本发明实施例涉及一种基于用户兴趣学习的个性化广告推送方法和系统,所述方法包括:通过多任务排序学习得到多个用户兴趣模型;根据所述用户兴趣模型,在视频中提取兴趣物体;提取所述兴趣物体的多种视觉特征,根据所述视觉特征在广告库中检索相关的广告信息。通过本发明实施例提供的方法和系统,推送的广告和视频内容紧密相关,从一定程度上满足了用户的个性化要求,实现了个性化的广告推送。

著录项

  • 公开/公告号CN102334118A

    专利类型发明专利

  • 公开/公告日2012-01-25

    原文格式PDF

  • 申请/专利权人 华为技术有限公司;北京大学;

    申请/专利号CN201080006502.5

  • 申请日2010-11-29

  • 分类号G06F17/30(20060101);

  • 代理机构

  • 代理人

  • 地址 518129 广东省深圳市龙岗区坂田华为总部办公楼

  • 入库时间 2023-12-18 04:12:59

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2022-07-05

    专利权的转移 IPC(主分类):G06F17/30 专利号:ZL2010800065025 登记生效日:20220622 变更事项:专利权人 变更前权利人:华为技术有限公司 变更后权利人:华为云计算技术有限公司 变更事项:地址 变更前权利人:518129 广东省深圳市龙岗区坂田华为总部办公楼 变更后权利人:550025 贵州省贵阳市贵安新区黔中大道交兴功路华为云数据中心 变更事项:专利权人 变更前权利人:北京大学 变更后权利人:北京大学

    专利申请权、专利权的转移

  • 2013-08-28

    授权

    授权

  • 2012-03-14

    实质审查的生效 IPC(主分类):G06F17/30 申请日:20101129

    实质审查的生效

  • 2012-01-25

    公开

    公开

说明书

技术领域

本发明涉及图像处理领域,特别涉及一种基于用户兴趣学习的个性化广 告推送方法与系统。

背景技术

近年来,互联网上的视频数目在迅速增加,而这些海量视频的存在极 大地促进了在线视频广告等服务的发展。目前,已经有多种基于不同准则 将视频和广告关联的方法在视频网站和视频播放软件中投入了使用。一般 来说,这些方法主要强调对预定义广告的推送,包括:

1)时域插入广告。如附图1(a)所示,指在视频的开头缓冲、中途暂停或 结尾播放一段预定义的广告,形式可以为图片、视频等。

2)周边关联广告。如附图1(b)所示,指当视频播放时,在视频播放器的 周边(如网页、播放器边框)显示预定义广告。

3)部分叠加广告。如附图1(c)所示,指在视频的部分内容上叠加小型 广告(图片或简单的FLASH),通常不影响视频主要部分。

目前,以上三种广告推送的方法都得到了广泛的应用。然而这些广告 推送的效果并不理想,比如第1种方法播放广告时,用户常常处于浏览其 他网页的状态,降低了广告效果;第2种方法虽然干扰较小,但广告常常 被作为网页背景而忽视;第3种方法则在一定程度上影响了用户正常的观 看体验。而最主要的问题在于,上述推送的广告与内容的关联程度一般较 低,且不能满足每个用户个性化的兴趣需求,因此广告所达到的效果较差。

发明内容

本发明实施例提供一种基于用户兴趣学习的个性化广告推送方法和 系统,用以解决现有的推送广告与内容的关联程度低,且不能满足每个用 户个性化兴趣需求的问题。

本发明实施例提供了一种基于用户兴趣学习的个性化广告推送方法, 包括:

通过多任务排序学习得到多个用户兴趣模型;

根据所述用户兴趣模型,在视频中提取兴趣物体;

提取所述兴趣物体的多种视觉特征,根据所述视觉特征在广告库中检 索相关的广告信息。

本发明实施例还提供了一种基于用户兴趣学习的个性化广告推送系 统,包括:

兴趣模型学习模块,用于通过多任务排序学习得到多个用户兴趣模 型;

兴趣物体提取模块,用于根据所述用户兴趣模型,在视频中提取兴趣 物体;

广告检索模块,用于提取所述兴趣物体的多种视觉特征,根据所述视 觉特征在广告库中检索相关的广告信息。

由上述技术方案可知,本发明实施例利用多任务排序学习算法获得用 户兴趣模型,并在此基础上针对不同用户自动提取视频中的兴趣区域,然 后使用兴趣区域进行广告信息关联。通过这样的方式提供的广告不仅和视 频内容紧密相关,而且从一定程度上满足了用户的个性化要求,实现了个 性化的广告推送。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实 施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面 描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲, 在不付出创造性劳动的前提下,还可以根据这些附图获得其他的实施方式。

图1为现有的广告推送方法示意图;

图2为本发明实施例提供的基于用户兴趣学习的个性化广告推送方法 流程示意图;

图3为本发明实施例提供的用户兴趣模型学习流程示意图;

图4为本发明实施例提供的视频兴趣物体提取流程示意图;

图5为本发明实施例提供的在视频兴趣物体提取流程中获取的关键帧 的兴趣度分布示意图;

图6为本发明实施例提供的基于用户兴趣学习的个性化广告推送系统 示意图;

图7为本发明实施例提供的基于图6所示系统的数据流动示意图;

图8为依据本发明实施例提供的方法和系统生成的广告推送效果示意 图。

具体实施方式

下面结合附图对本发明的具体实施例作进一步详细的说明。

在本发明提供的实施例中,系统首先根据预先收集的内容各异的场景 集合与用户对这些场景的兴趣反馈,采用一种多任务排序学习算法训练得 到用户兴趣模型,并同时得到场景分类及用户分类。包括场景底层视觉特 征提取、场景和用户初始随机分类、兴趣模型参数计算等步骤。然后,系 统在播放视频的同时检测关键帧,根据在模型学习过程中得到的场景类 别,将关键帧所对应的场景分类,再由各用户的兴趣模型分别计算生成兴 趣度图。最后,利用区域生长的方法,从兴趣度图中生成一个兴趣度较高 的区域作为兴趣物体,并根据其多种特征在广告信息库中检索相关广告, 最后输出带个性化广告的视频流。其中,兴趣物体的特征反映物体不同角 度不同层次的视觉特性,包括但不限于颜色、结构、轮廓、纹理特征,优 选地,本发明实施例中提取兴趣物体的HSV颜色直方图、Gabor直方图、SIFT 直方图、视纹特征。同时检索方法为一种快速匹配算法,并且对于不同特 征采取不同的匹配方法。

图2为本发明实施例提供的基于用户兴趣学习的个性化广告推送方法 的流程示意图。如图2所示,本实施例可以包括以下步骤:

步骤201、兴趣模型学习:通过多任务排序学习算法得到多个用户兴 趣模型。

其中,如图3所示,该步骤进一步包括:

步骤2011、获取各种场景以及用户对各场景的兴趣反馈。

具体地,所述场景可以包括多个方面的主题,比如广告、新闻、卡通、 电影等。用户可以通过简单的交互,在这些场景中标注出兴趣物体。由于 即使在相同的场景中,不同用户的感兴趣点也不一样,因此可以用如下方 式来表征场景集合、用户集合及它们之间的联系:

代表包含K个场景的场景集合,其中Sk表示第k 个场景;

代表包含M个用户的用户集合,其中Um表示第m个用户;

两者之间的联系通过表示。其中当且仅当 用户Um对场景Sk进行了交互并标注出兴趣物体。假设场景Sk被划分成宏块 的集合则用户Um在场景Sk上标注的兴趣物体和 场景Sk中宏块的关系可以引出另一个二值集合其中 当且仅当场景Sk中的第i个宏块ski属于用户标注的兴趣物体的一部 分。

步骤2012、从局部和全局两方面提取各场景中各宏块的底层视觉特 征。

具体地,将每个场景划分成宏块的集合,并计算每个宏块的底层视觉 特征。而整个场景底层视觉特征可以通过组合宏块的底层视觉特征来得 到。在一个实施例中,可以将场景划分成16乘16大小的宏块,并提取多 尺度多视觉通道中的局部对比度特征,作为每个宏块的底层视觉特征。同 时,通过计算宏块与其所在的整个场景的多种视觉统计特性的差异,以获 得宏块的全局视觉特征。

对于宏块Ski,设xki代表其特征向量,那么对于一个场景Sk,代表了其所有宏块的特征向量集合。利用该集合,可以通过某 种组合变换得到场景整体的特征向量vk和兴趣物体的特征向量在一个 实施例中,vk定义为场景各宏块的特征向量的期望和标准差,定义为兴 趣物体内各宏块的特征向量的期望和标准差。因此训练用户兴趣模型的任 务就转变成寻找一个模型(或函数)这个模型能根据场景Sk中, 不同的宏块Ski的特征向量xki,赋于其不同的实数值。然后对该实数值进 行排序,设排序结果为πk(φ)={φ(xk1),φ(xk2),......φ(xkn)},那么最终目 标就是减小模型输出的排序结果πk(φ)和用户反馈的排序结果的差距。

步骤2013、将场景和用户随机进行初步分类。

具体地,所述初步分类可以通过随机划分场景和用户聚类来进行。另 一种直观的方法是根据场景内容的相似性和用户兴趣反馈的相似性对场 景和用户分别进行初步分类。在本实施例中,场景内容相似通过步骤302 中得到的场景特征vk进行计算,而用户兴趣相似通过每个用户选取的兴趣 物体特征进行计算。初步分类的结果用α={αki∈{0,1}}和β={βmj∈{0,1}}表示,αki=1当且仅当Sk为第i类场景,βmj=1当且仅当Um为第j类用户。

步骤2014、根据两者分类结果,初始化用户兴趣模型。

具体地,初始化用户兴趣模型需要先构建待优化的目标函数。目标函 数分为两部分,在本实施例中,将其形式化为:

αki∈{0,1},对于任意k,

βmj∈{0,1},对于任意m。

其中是兴趣模型参数集合,是场景分类集合,是用户分类集合, 为经验损失,为根据先验知识确定的惩罚损失。 如果假设表示场景Sk由用户兴趣模型φij预测出的兴趣度图与 用户Um的实际兴趣度图之间的差异,则经验损失可以定义为:

在一个实施例中,我们可以将定义为:

其中,是一个线性的用户兴趣模型,而为其参数向量。 上式中,如果事件x成立,则[x]I=1,否则[x]I=0。同时,对于惩罚损失 将其分为四类基于先验知识设定的惩罚项之和。即有:

上式中,εs,εu,εd,εc等四个加权系数根据在验证数据集上的效果设 置。其中,Ωs指场景聚类惩罚,主要计算场景与场景之间特征向量vk的 差异,当两个场景有着相同内容但是却在不同场景分类里,该惩罚值偏大。 在一个实施例中,我们将场景聚类惩罚定义为:

Ωs=Σk0<k1KΣiI(αk0i-αk1i)2[cos(vk0,vk1)]+

其中,表示场景特征向量和之间的余弦距离,[x]+表示 max(0,x)。

Ωu指用户聚类惩罚,主要计算用户所选兴趣物体的特征的差异, 当相同偏好的用户被分到不同类别时,该惩罚值变大。在一个实施例中, 我们将用户聚类惩罚定义为:

Ωu=Σm0<m1MΣjJ(βm0j-βm1j)2δm0m1

其中,表示用户m0和m1之间的相似度,定义为:

上式中,Ts是一个预定义阈值;是一个常数,用来将归一化 到[0,1]范围。

Ωd指模型差别惩罚,主要计算不同模型在不同情况下的预测损失,鼓 励不同类别用户模型给出不同的预测。这是因为对于同一类别用户模型, 在不同的场景类别下预测也不相同。在一个实施例中,我们将用户聚类惩 罚定义为:

Ωd=ΣiIΣj0<j1|J|Σk=1Kl(πk(φij0),-πk(φij1))+ΣjJΣi0<i1|I|Σk=1Kl(πk(φi0,j),-πk(φi1j))

Ωc指模型复杂度惩罚,通过计算模型参数模的总和得到,当采取的模 型复杂时,该部分较大。在一个实施例中,我们将模型复杂度惩罚定义为:

Ωc=ΣiIΣjJ||wij||22

在模型更新过程中,我们可以用该惩罚项控制用户和场景分类数,可 以避免产生过于复杂的模型。

步骤2015、在得到的用户兴趣模型基础上依次更新场景分类和用户分 类。

步骤2016、根据新的场景和用户的分类结果再次训练得到新的用户兴 趣模型。

步骤2017、判断是否达到预定义迭代次数或目标函数小到一定值?如 果是,则执行步骤2018;如果否,则返回步骤2015。

步骤2018、将最后一次迭代得到的用户兴趣模型,以及场景与用户的 类别作为最终的用户兴趣模型,以及场景与用户分类。

需要说明的是,步骤2014中初步计算兴趣模型的依据是尽量减小经 验损失。步骤2015中更新场景和用户分类是在得到的用户兴趣模型基础 上进行的,比如场景聚类更新可以根据减小模型预测错误和提高场景之间 内容相似性,而用户聚类更新可以根据已知的兴趣模型和提高用户之间的 偏好相似性。然后再次由新得到的两者分类计算新的用户兴趣模型,重复 迭代更新的步骤,直到满足定义的条件(达到定义的次数或者目标函数值 小到一定程度)。步骤2018之后,得到的场景和用户分类以及用户兴趣模 型就作为以后多任务提取兴趣物体的依据。

步骤202、兴趣物体提取:根据用户兴趣模型,在视频中提取兴趣物 体。

其中,如图4所示,该步骤进一步包括:

步骤2021、检测出视频流中代表性的关键帧作为一个关键场景。

具体地,通过计算一个视频镜头内所有帧之间的相似度,并寻找与其 他帧相似度最高的帧,做为代表性的关键帧。

步骤2022、提取当前场景各宏块底层视觉特征并计算出场景整体底层 视觉特征。

具体地,使用和兴趣模型学习过程相同的底层视觉特征,先分别提取 出当前场景每个宏块的底层视觉特征,然后计算出场景整体底层视觉特 征。在本实施例中,采取各宏块特征的期望与标准方差作为场景整体特征。

步骤2023、根据整体底层视觉特征将场景分类。

具体地,利用步骤2022中得到的整体底层视觉特征作为分类该场景 的依据,在已知的场景类中选择最接近的一类。优选地,可以训练一个支 持向量机进行此分类工作。在知道当前用户类别和场景类别的前提下,利 用已知的用户兴趣模型就可以对场景中每个宏块的兴趣程度进行排序。

步骤2024、根据用户兴趣模型对场景各宏块的兴趣程度排序。

步骤2025、由排序结果映射成每个候选块的兴趣程度,得到场景兴趣 度分布。

具体地,对步骤2024中排序的结果进行映射,以便转换成有利于兴 趣度图表示的数值范围,比如转换为[0,1]之间的小数。在一个实施例中, 对排序后的序号Cn∈{0,...N-1}进行映射,采取一个值域为[0,1]的四次方 函数进行此映射工作。由此得到场景的兴趣度图,如图5所示。

步骤2026、选取全局兴趣度最高的候选块。

步骤2027、用区域生长算法以此生成一块兴趣度较高区域。

需要说明的是,本步骤中生成兴趣度较高区域的算法并不限于区域生 长算法,也可以是其他算法。

步骤2028、由兴趣区域得到兴趣物体。

通过执行上述步骤,用户感兴趣的物体被从视频中提取出。

步骤203、关联广告检索:提取出所述兴趣物体的多种视觉特征,根 据这些特征,在广告库中检索相关的广告信息。

本发明实施例提供的基于用户兴趣学习的个性化广告推送方法,利用 多任务排序学习算法获得用户兴趣模型,并在此基础上针对不同用户自动 提取视频中的兴趣区域,然后使用兴趣区域进行广告信息关联。通过这样 的方式提供的广告不仅和视频内容紧密相关,而且从一定程度上满足了用 户的偏好,实现了个性化的广告推送。

如图6所示,本发明实施例还提供了一种基于用户兴趣学习的个性化 广告推送系统,包括:兴趣模型学习模块61,兴趣物体提取模块62和广告 检索模块63。其中,兴趣模型学习模块61用于通过多任务排序学习得到多 个用户兴趣模型;兴趣物体提取模块62用于根据所述用户兴趣模型,在视 频中提取兴趣物体;广告检索模块63用于提取所述兴趣物体的多种视觉特 征,根据所述视觉特征在广告库中检索相关的广告信息。

进一步地,所述兴趣模型学习模块61还可以包括以下子模块:

特征提取子模块611,用于获取训练数据中的各种场景,提取所述各 场景中各宏块的底层视觉特征;

初始化子模块612,用于根据所述底层视觉特征,随机将用户和场景 分别组合为多个类别,并为每类用户在每类场景上初始化一个兴趣模型;

优化子模块613,用于使用初始化后的兴趣模型在训练集上建立损失 函数,作为最优化目标,通过最优化算法,最小化所述损失函数,进而更 新各个兴趣模型参数值,优化用户和场景的聚类划分;

结果获取子模块614,用于获取最终的用户和场景聚类以及多个用户 兴趣模型。

进一步地,所述兴趣物体提取模块62还可以包括以下子模块:

关键帧检测子模块621,用于接收输入的视频流,检测所述视频流中 内容具有代表性的关键帧;

特征计算子模块622,用于对每一个关键帧,根据其宏块的底层视觉 特征计算出该关键帧对应场景的整体视觉特征;

场景归类子模块623,用于根据所述整体视觉特征,将所述关键帧对 应的场景归入构建用户兴趣模型过程中所划分的场景类别中的其中一类;

兴趣度计算子模块624,用于根据用户兴趣模型,计算所述关键帧所 在场景的兴趣度分布图;

区域生长子模块625,用于通过区域生长算法在所述兴趣度分布图上 获得兴趣度最高的区域,作为兴趣物体。

图7为数据在本发明实施例提供的基于用户兴趣学习的个性化广告推 送系统中各模块之间的流动示意图,以进一步说明本发明实施例提供的基 于用户兴趣学习的个性化广告推送系统中各模块的连接关系。如图7所示:

在用户兴趣学习的过程中,预定义场景集合和用户兴趣反馈数据流首 先进入特征提取子模块611,特征提取子模块611将提取得到的某种底层视 觉特征和用户兴趣反馈一起输入到初始化子模块612,初始化子模块612对 用户和场景进行随机分类,并根据分类结果初始化最初的用户兴趣模型, 得到初步随机场景和用户分类及兴趣模型,然后将这些结果发送给优化子 模块613,通过迭代算法进行优化,以更新兴趣模型的参数,并更新用户 和场景的分类,直到达到预定的条件之后,结果获取子模块614从最后的 一次迭代结果获得最终的用户分类结果和场景分类结果,以及相应的用户 兴趣模型;在个性化广告推送过程中,关键帧检测子模块621接收输入视 频流,检测出内容具有代表性的关键帧,将该关键帧输出给特征计算子模 块622进行关键帧对应场景的整体底层视觉特征计算,计算出的特征数据 流伴随结果获取子模块614提供的信息分别流经场景归类子模块623与兴 趣度计算子模块624,生成关键帧所在场景的兴趣度分布图,然后,区域 生长子模块625根据兴趣度分布图输出兴趣物体给广告检索模块63,以提 取多种视觉特征并检索广告信息库后最终输出带有个性化广告的视频流。

本发明实施例提供的基于用户兴趣学习的个性化广告推送系统,利用 多任务排序学习算法获得用户兴趣模型,并在此基础上针对不同用户自动 提取视频中的兴趣区域,然后使用兴趣区域进行广告信息关联。通过这样 的方式提供的广告不仅和视频内容紧密相关,而且从一定程度上满足了用 户的偏好,实现了个性化的广告推送。

依据本发明实施例提供的方法和系统生成的广告推送结果如图8所 示。

本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步 骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于一计算机 可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤; 而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代 码的介质。

最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其 限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术 人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或 者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技 术方案的本质脱离本发明各实施例技术方案的精神和范围。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号