首页> 中国专利> 一种基于关键词推荐的视频社会关注度提高方法

一种基于关键词推荐的视频社会关注度提高方法

摘要

本发明公开了一种基于关键字推荐的视频社会关注度提高方法。本发明采用语义相关性和深度学习的方法,推荐视频的关键字,提高视频的社会关注度。方法基于关键词之间的语义相关性以及对视频内容的深度学习,首先根据用户的初始关键词寻找与初始关键词语义最相关的若干语义关键词;然后利用深度学习分析视频内容挖掘出实体关键词;最后按照一定的标准排序这两部分关键字,推荐给用户最相关的关键词。本发明推荐的关键词兼顾了关键词与视频内容的相关度以及吸引社会关注度的潜力,提高了视频的社会关注度,是一种既高效又实用的视频关键字推荐方法。本发明可以用于在线社会化媒体分析,数据挖掘以及视频标签推荐领域。

著录项

  • 公开/公告号CN106528633A

    专利类型发明专利

  • 公开/公告日2017-03-22

    原文格式PDF

  • 申请/专利权人 杭州电子科技大学;

    申请/专利号CN201610884840.8

  • 申请日2016-10-11

  • 分类号G06F17/30(20060101);

  • 代理机构杭州君度专利代理事务所(特殊普通合伙);

  • 代理人杜军

  • 地址 310018 浙江省杭州市下沙高教园区2号大街

  • 入库时间 2023-06-19 01:48:18

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2019-07-02

    授权

    授权

  • 2017-04-19

    实质审查的生效 IPC(主分类):G06F17/30 申请日:20161011

    实质审查的生效

  • 2017-03-22

    公开

    公开

说明书

技术领域

本发明属于在线社会化媒体分析,数据挖掘、视频标签推荐技术领域,特别设计一种基于关键词推荐的视频社会关注度提高方法。

背景技术

在传统的因特网应用中,搜索引擎是用户发现网络内容的重要工具。因此,目前针对提高网络内容社会关注度的方法主要是面向搜索引擎提出的。而在社会化媒体中,尤其是像YouTube、Flickr和优酷这样的多媒体分享网站中,除了搜索引擎之外,推荐系统也是社会关注度的一个重要来源。因而需要同时挖掘搜索引擎和推荐系统提高社会关注度的潜力,才能更有效地提高社会媒体内容的社会关注度。

搜索引擎虽然有足够的内容让用户去发现,但是随着互联网的信息量飞速增长以及人们对搜索引擎要求的越来越高,搜索引擎也显现出一定的局限性,如覆盖率低,结果不准确,返回不相关的结果等等。推荐系统虽然可以推荐出相关度很高的结果,但是推荐结果的范围还是受到了一定的限制,而且不同的推荐系统的推荐结果也会呈现非常大的差别。

深度学习作为目前的新技术,也可以应用到提高视频的社会关注度方面。深度学习在视频方面的应用主要表现在提取视频内容信息,而且可以保障提取视频内容信息的准确性。

发明内容

针对上诉问题,本发明公开了一种基于关键词推荐的视频社会关注度提高方法,该方法推荐的关键词能够同时兼顾与视频内容的相关度以及吸引社会关注度的潜力。

本发明解决其技术问题采用的技术方案是:

一种基于关键词推荐的视频社会关注度提高方法,该方法采用以下步骤实现:

步骤1——获取视频初始关键词:

依据给定的视频,结合用户上传视频时提供的视频初始标题关键词,给出与视频相关的K个初始关键词。

步骤2——初始关键词WordNet语义扩展:

根据初始关键词在WordNet上找寻语义相似的关键词,扩展成WordNet初步语义关键词集合。

步骤3——主流视频分享网站再扩展:

利用初步语义关键词集合,在主流视频分享网站中进行搜索,提取可以吸引更多社会关注度的关键词,扩展成最终的语义关键词集合。

步骤4——提取视频实体关键词集合:

通过深度学习技术,挖掘视频内容信息,形成视频实体关键词集合。

步骤5——排序关键词集合:

考虑关键词的相关度和社会关注度,根据关键词出现次数以及关键词与初始关键词集合的平均相关度两方面排序视频语义和实体两个关键词集合,确认最终提供给用户的关键词集。

本发明具有的有益效果是:

1、本发明通过WordNet语义词典对初始关键词进行语义上的扩展,由于WordNet语义词典本身对词条在语义方面进行了很好的整理归纳,因此扩展出的语义关键词集合保证了与初始视频标题在语义上的相关性,提高了语义层次的质量,也促进了关键词的多样性。

2、本发明通过主流视频分享网站进一步扩展语义关键词集合,根据同类或者相似主题的视频通常可以在多个网站上搜索到这个思想,结合视频分享网站搜索引擎和推荐系统这两个能力扩展语义关键词集合,该语义关键词集合不但与视频内容相关,而且还增加了关键词的多样性和社会关注度。

3、本发明通过深度学习技术对视频内容进行分析以及识别,可以搜集到与视频真实内容最贴切的实体信息,提高了最终要提供给用户的关键词的真实性和准确性。

4、本发明通过关键词出现次数以及关键词与初始关键词的平均相关度两方面排序关键字集合,既衡量了关键词与初始关键词集合的相关程度,又衡量了关键词的社会关注度。

5、本发明可以用于在线社会化媒体分析,数据挖掘领域,尤其可以用于视频标签推荐领域。

附图说明

图1为本发明关键词推荐的总体框架图。

图2为本发明关键字排序的流程图。

具体实施方式

下面结合附图和具体实施应用过程对本发明进一步说明:

参照图1执行步骤来说明本发明的实施过程:

步骤1——获取视频初始关键词:

依据给定的视频,用户在上传视频时,可以在视频上传界面提供用户自己认为合适准确的视频初始标题,提取视频初始标题中的K个关键词作为初始标题关键词集合X。

步骤2——初始关键词WordNet语义扩展:

根据初始关键词集合,对于每一个关键词,输入WordNet语义词典当中,输出与这个关键词语义相关的若干个词条,选取语义上最相关的2-3个关键字,最终构成基于WordNet扩展的初步的语义关键词集合。这样扩展的视频关键词不仅保证了与初始视频标题在语义上的相关性,提高了语义层次的质量,而且促进了关键词的多样性。

步骤3——主流视频分享网站再扩展:

依据同类或者相似主题的视频通常可以在多个视频分享网站上搜索到,所以我们可以在多个视频分享网站上搜集同类或者相似主题的视频信息。我们利用了视频分享网站的搜索引擎和推荐系统两大能力,基于主流视频分享网站扩展视频关键词可以分为以下两步:

1)搜索引擎搜索

对于WordNet扩展的初步的语义关键词集合,组成2-3组关键词,在主流视频分享网站上利用网站搜素引擎对每组关键词进行搜素,提取每个网站搜索出的排名前10的视频,搜集这些视频的标题关键字加入到语义关键词集合中。

2)推荐系统推荐

针对第一步中通过搜素引擎搜索出的前列的视频,搜集视频网站对这些视频通过推荐系统推荐的相关视频,同样的,这里我们把这些相关视频的标题关键字加入到语义关键词集合中。

通过以上两个步骤,我们充分的利用了视频分享网站的搜索引擎的搜索能力和推荐系统的推荐能力,借助这两个能力所扩展的语义关键词集合不但与视频内容相关,而且还增加了关键词的多样性和社会关注度。

步骤4——提取视频实体关键词集合:

依据视频的时长,我们定长的提取视频关键帧,组成视频关键帧集。把视频关键帧作为输入,输入到已经用ImageNet训练好的深度学习框架Caffe中,输出相应的视频关键帧实体信息识别结果,加入到视频实体关键词集合中。通过深度学习技术对视频内容的分析以及识别,我们可以搜集到与视频真实内容最贴切的实体信息,在一定程度上提高了最终要提供给用户的关键词的真实性和准确性。

步骤5——排序关键词集合:

NGD相似度距离计算如下:

其中h(t)和h(Xi)表示利用Google引擎搜索关键词t和初始标题关键词集合X中的关键词Xi分别返回的搜索条数,h(t,Xi)表示同时搜索这两个关键字返回的搜索条数,N表示Google索引的网页数(在不输入任何搜索条件下Google引擎可以搜索到的网页数)。如果距离值越接近0,表示两个关键字在语义上就越相关;如果距离值越接近无穷大,两个关键字在语义上就越不相关。

TF-SIM排序算法如下:

其中Tt表示关键词t出现的次数,X表示初始标题关键词集合,n表示初始标题关键词集合X中关键词的个数。

语义和实体关键词个数分配计算如下:

Tn=Ts+δTs>

其中Tn表示需要推荐给用户的关键词数,Ts表示从语义关键词集合中提取的关键词数,δTs表示从实体关键词集合中提取的关键词数,δ值根据经验设定为0.5。

参照图2的流程关键词集合相关度排序分为以下四步:

1)关键词频数计算:对关键词集合中的关键词按出现次数排序关键词集合,并记录每个关键词的出现次数。得到一个无重复的关键词集合。

2)NGD距离计算:对无重复的关键词集合利用公式(1)计算与初始标题关键词集合的平均相关度。

3)TF-SIM(相似度值)排序计算:通过前两步计算得到的关键词出现次数和关键词与初始关键词集合的平均相关度代入公式(2)算法公式,排序关键词集合。

4)最终关键词提取:通过公式(3)计算,得出最终推荐给用户的关键词集合。

关键词排序标准应该综合考虑相关度和社会关注度,公式(2)从两个因素进行衡量:关键词出现次数和关键词与初始关键词集合的平均相关度。第一个因素通过关键词出现次数衡量了关键词吸引社会关注度的潜力。第二个因素通过计算与初始关键词集合的相关度衡量了关键词的与视频的相关度。两个因素之间互相制约,如果关键词出现次数多,但是相关度低,那么得分肯定受到影响,反之亦然。通过这两个因素的计算,最终确定推荐给用户最有利的关键词。

上述实施例并非是对于本发明的限制,本发明并非仅限于上述实施例,只要符合本发明要求,均属于本发明的保护范围。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号