首页> 中国专利> 一种内容对象预测方法和装置以及内容对象推荐方法

一种内容对象预测方法和装置以及内容对象推荐方法

摘要

公开了一种内容对象预测方法和装置以及内容对象推荐方法。基于第一内容对象(待预测内容对象)的内涵信息确定与第一内容对象相似的第二内容对象(对标内容对象)。基于第一内容对象的外延信息、第二内容对象的外延信息以及第二内容对象的用户响应历史数据,例如通过经过训练的预测模型,对第一内容对象的用户响应进行预测。内涵信息包括与内容对象的内容质量有关的信息。外延信息包括内容对象的内容质量以外的信息。预测模型可以是基于深度神经网络和/或多任务学习的机器模型。由此,实现了一种能够结合内容对象的内容质量方面的信息来进行预测的内容对象预测方案。

著录项

  • 公开/公告号CN113298283A

    专利类型发明专利

  • 公开/公告日2021-08-24

    原文格式PDF

  • 申请/专利权人 阿里巴巴集团控股有限公司;

    申请/专利号CN202011116181.6

  • 发明设计人 刘兰波;秦刚;蔡龙军;

    申请日2020-10-19

  • 分类号G06Q10/04(20120101);G06F16/9535(20190101);

  • 代理机构11452 北京展翼知识产权代理事务所(特殊普通合伙);

  • 代理人屠长存

  • 地址 英属开曼群岛大开曼资本大厦一座四层847号邮箱

  • 入库时间 2023-06-19 12:19:35

说明书

技术领域

本公开涉及互联网上的信息预测和推荐技术,特别涉及内容对象预测和内容对象推荐。

背景技术

在例如一部电视剧上线之前,如果能准确预估它上线后的流量表现,对公司的采购、宣发、运营等工作有巨大价值。

如果采用人工预估,往往只能进行定性判断,而在定量判断上无法做到全面考虑、精准计算。

近年来,随着计算机技术的发展,开始采用机器算法来进行预测。然而,目前的机器预测方法基本上都是从主创人员、制作公司等外延信息入手,预测电视剧流量。

然而,如上所述,在目前的机器预测算法中,仅能基于外延信息来进行预测,无法引入内容质量。

另一方面,随着观众审美层次的提升,内容质量对流量的影响越来越大。在预测过程中要引入内容质量时,面临难以量化、难以与流量挂钩的问题。

因此,目前不论是采用人工预估还是机器算法预估,都难以实现准确预测。

同样地,在其它各种内容对象的预测领域,也存在难以结合内容质量进行量化预测的问题。

可见,仍然需要一种能够结合内容对象的内容质量来进行预测的方法。

发明内容

本公开要解决的一个技术问题是提供一种内容对象预测方案,其能够结合内容对象的内容质量方面的信息来进行预测。

根据本公开的第一个方面,提供了一种内容对象预测方法,包括:基于第一内容对象的内涵信息确定与第一内容对象相似的第二内容对象;以及基于第一内容对象的外延信息、第二内容对象的外延信息以及第二内容对象的用户响应历史数据,对第一内容对象的用户响应进行预测。

可选地,基于第一内容对象的内涵信息确定与第一内容对象相似的第二内容对象的步骤包括:针对内涵信息的至少一个维度,分别确定就该维度的内涵信息而言与第一内容对象相似的第二内容对象;以及/或者结合内涵信息的至少两个维度,确定就该至少两个维度的内涵信息的结合而言与第一内容对象相似的第二内容对象;以及/或者综合内涵信息的多个维度,确定与第一内容对象相似的第二内容对象。

可选地,基于第一内容对象的内涵信息确定与第一内容对象相似的第二内容对象的步骤包括:针对内涵信息的至少一个维度,分别对第一内容对象打分;以及根据所述至少一个维度中各个维度的分值,确定与第一内容对象相似的第二内容对象。

可选地,针对内涵信息的至少一个维度分别对第一内容对象打分的步骤包括:接收专家针对所述至少一个维度分别对第一内容对象打分的打分结果;以及/或者对第一内容对象进行内涵分析,以便对第一内容对象打分。

可选地,内容对象是内容数据,对第一内容对象进行内涵分析的步骤包括下述至少一项:对第一内容对象的文本进行自然语言处理;对第一内容对象的音频进行音频分析处理;对第一内容对象的视频或图像进行计算机视觉分析处理。

可选地,基于第一内容对象的外延信息、第二内容对象的外延信息以及第二内容对象的用户响应历史数据对第一内容对象的用户响应进行预测的步骤包括:将第一内容对象的外延信息、第二内容对象的外延信息以及第二内容对象的用户响应历史数据输入经过训练的预测模型,得到期望的预测结果。

可选地,将第一内容对象的外延信息、第二内容对象的外延信息以及第二内容对象的用户响应历史数据输入经过训练的预测模型得到期望的预测结果的步骤包括:将多个第二内容对象的外延信息和用户响应历史数据分别与第一内容对象的外延信息一起输入预测模型,得到对应于该第二内容对象的部分预测结果,结合多个第二内容对象分别对应的部分预测结果,得到期望的预测结果。

可选地,将多个第二内容对象的外延信息和用户响应历史数据与第一内容对象的外延信息一起输入预测模型,得到期望的预测结果。

可选地,预测模型是基于深度神经网络和/或多任务学习的机器模型。

可选地,内涵信息包括与内容对象的内容质量有关的信息。

可选地,外延信息包括内容对象的内容质量以外的信息。

可选地,内涵信息包括下述至少一个维度:内容分类、内容题材、内容节奏、情节张力、人物表现、人物关系、男女主角配对(CP)感、角色间关系复杂度。

可选地,外延信息包括下述至少一个维度:主创人员、制作公司、相关知识产权。

可选地,用户响应包括下述至少一个维度:呈现数据、点击数据、播放数据、声量、成交数据、成交价格、成交总额、收益、用户评价。

可选地,用户响应包括与用户信息关联的用户响应。

可选地,第二内容对象的用户响应历史数据包括与第一内容对象的用户响应属于相同和/或不同维度的用户响应历史数据。

可选地,基于第一内容对象的内涵信息确定与第一内容对象相似的第二内容对象的步骤可以包括:基于第一内容对象的内涵信息确定与第一内容对象相似的多个内容对象;以及响应于筛选指令,从多个内容对象中选择至少一个第二内容对象。

根据本公开的第二个方面,提供了一种内容对象预测装置,包括:对标装置,基于第一内容对象的内涵信息确定与第一内容对象相似的第二内容对象;以及预测装置,基于第一内容对象的外延信息、第二内容对象的外延信息以及第二内容对象的用户响应历史数据,对第一内容对象的用户响应进行预测。

可选地,对标装置包括:打分装置,用于针对内涵信息的至少一个维度,分别对第一内容对象打分;以及确定装置,用于根据所述至少一个维度中各个维度的分值,确定与第一内容对象相似的第二内容对象。

可选地,打分装置包括:接收装置,用于接收专家针对至少一个维度分别对第一内容对象打分的打分结果;以及/或者分析装置,用于对第一内容对象进行内涵分析,以便对第一内容对象打分。

可选地,预测装置将第一内容对象的外延信息、第二内容对象的外延信息以及第二内容对象的用户响应历史数据输入经过训练的预测模型,得到期望的预测结果。

根据本公开的第三个方面,提供了一种对象预测方法,包括:基于第一对象的内涵信息确定与第一对象相似的第二对象;以及基于第一对象的外延信息、第二对象的外延信息以及第二对象的用户响应历史数据,对第一对象的用户响应进行预测。

根据本公开的第四个方面,提供了一种游戏预测方法,包括:基于第一游戏的内涵信息确定与第一游戏相似的第二游戏;以及基于第一游戏的外延信息、第二游戏的外延信息以及第二游戏的用户响应历史数据,对第一游戏的用户响应进行预测。

根据本公开的第五个方面,提供了一种线下活动预测方法,包括:基于第一线下活动的内涵信息确定与第一线下活动相似的第二线下活动;以及基于第一线下活动的外延信息、第二线下活动的外延信息以及第二线下活动的用户响应历史数据,对第一线下活动的用户响应进行预测。

根据本公开的第六个方面,提供了一种知识产权衍生内容预测方法,包括:基于第一知识产权的内涵信息确定与第一知识产权相似的第二知识产权;以及基于第一知识产权的衍生内容的外延信息、第二知识产权的衍生内容的外延信息以及第二知识产权的衍生内容的用户响应历史数据,对第一知识产权的衍生内容的用户响应进行预测。

根据本公开的第七个方面,提供了一种内容对象推荐方法,包括:基于用户画像信息和/或用户历史行为信息,确定用户的内容对象内涵相关偏好信息;以及基于内容对象的内涵相关预测结果和用户的内容对象内涵相关偏好信息,向用户推荐内容对象或内容对象列表。

根据本公开的第八个方面,提供了一种内容对象推荐方法,包括:向具有不同的内容对象内涵偏好的第一用户和第二用户分别推荐内容对象或内容对象列表,其中,推荐给第一用户的内容对象和推荐给第二用户的内容对象在内涵方面不同。

根据本公开的第九个方面,提供了一种计算设备,包括:处理器;以及存储器,其上存储有可执行代码,当可执行代码被处理器执行时,使处理器执行如上述第一、三至八方面所述的方法。

根据本公开的第十个方面,提供了一种非暂时性机器可读存储介质,其上存储有可执行代码,当可执行代码被电子设备的处理器执行时,使处理器执行如上述第一、三至八方面所述的方法。

由此,实现了一种能够结合内容对象的内容质量方面的信息来进行预测的内容对象预测方案。

另外,本公开首次提出了基于内涵确定对标的预测方法,将节目内涵巧妙地融合进算法模型中,实现了小样本学习。

在一些实施例中,当由专家选取对标内容对象时,实现了预测领域的人机融合智能。人机融合智能是人类智能与机器智能有机融合的一种智能形式,实现算法能力与专家经验相结合。

本公开的内容对象预测方法在多种场景中具有广泛的通用性和强大的生命力。

附图说明

通过结合附图对本公开示例性实施方式进行更详细的描述,本公开的上述以及其它目的、特征和优势将变得更加明显,其中,在本公开示例性实施方式中,相同的参考标号通常代表相同部件。

图1是根据本公开的内容对象预测方法的示意性流程图。

图2是根据本公开的内容对象预测装置的示意性框图。

图3是根据本公开的示例中根据内容对象内涵确定对标内容对象的示意图。

图4是根据本公开的实施例可用于确定对标内容对象的方法的示意性流程图。

图5是根据本公开的实施例的对标装置的示意性框图。

图6是根据本公开的实施例的打分装置的示意性框图。

图7是根据本公开的实施例的预测模型示例的示意图。

图8示出了根据本公开的内容对象推荐方法的示意性流程图。

图9示出了根据本发明一实施例可用于实现上述内容对象预测方法的计算设备的结构示意图。

具体实施方式

下面将参照附图更详细地描述本公开的优选实施方式。虽然附图中显示了本公开的优选实施方式,然而应该理解,可以以各种形式实现本公开而不应被这里阐述的实施方式所限制。相反,提供这些实施方式是为了使本公开更加透彻和完整,并且能够将本公开的范围完整地传达给本领域的技术人员。

现有的使用机器算法来对待预测内容对象的外延进行分析的方案存在一些缺点。例如,特别是在影视剧领域,存在以下缺点:

-节目内涵难以量化、难以与流量挂钩。

-算法对训练样本数量有较高要求,然而可用训练样本较少,可用的样本量往往只有几百条,属于典型的小样本学习场景(FSL,Few-Shot Learning)。

-无法融入专家经验。算法技术人员与策划、营销、推广等事务专家各自为战,提高模型能力时没有用到专家经验。

-预测结果的可解释性差。

本公开通过对标的方式引入了与内容质量相关的内容对象内涵,将内涵与外延结合到一起,提出了一种基于CBR(Case-Based Reasoning,基于案例的推理)的内涵对标的预测方案。使用该预测方案,可以很好地解决现有技术中存在的上述问题。

CBR,即基于案例的推理,是一个起源于认知科学的问题求解范例。它模仿人类的问题求解行为:从以往经验中找到相似的案例,从中得到答案或启发。适用于难以将领域规则形式化且有案例可用的场景。

本方案中利用CBR的框架,将节目的内涵与外延有机结合起来。

首先,挑选对标,相当于CBR中的案例检索,可以由专家或机器依据对内涵的判断来完成。

然后,计算预测,相当于CBR中的解法修改,可以通过使用算法或模型对外延进行分析来完成。

内涵是指与内容质量有关的要素。例如,内容分类、内容题材、内容节奏、情节张力、人物表现、人物关系、男女主角配对感、角色间关系复杂度等。

外延是指内容质量以外的要素。例如,主创人员(导演、演员、编剧等)、制作公司、相关知识产权(IP)等。在例如影视创作领域,IP例如可以是一个故事,一种形象,一件艺术品,一种流行文化,等等。更多地是指适合二次或多次改编开发的影视文学、游戏动漫等。

对标是指CBR中的相似案例,是与被预测事物(内容对象)相似的已知事物。例如,电视剧《重生》的对标是《白夜追凶》,电影《红海行动》的对标是《战狼》,聚划算的对标是拼多多。

在本公开中,可以将被预测事物称为“第一内容对象”,而将其相似事物或对标称为“第二内容对象”。这里的“第一”、“第二”仅用于区分表述,而没有先后主次的含义。

下面,参考附图详细描述根据本公开的内容对象预测方案。

图1是根据本公开的内容对象预测方法的示意性流程图。

图2是根据本公开的内容对象预测装置的示意性框图。如图2所示,内容对象预测装置10可以是包括对标装置100和预测装置200。图2所示的内容对象预测装置10可以用来执行图1所示的内容对象预测方法。

首先,选取对标内容对象。对标内容对象的选取可以由专家根据经验或机器通过判断内涵来完成。

如图1所示,在步骤S100,例如可以通过上述对标装置100,基于第一内容对象的内涵信息确定与第一内容对象相似的第二内容对象,也即对标内容对象。

内涵信息包括与内容对象的内容质量有关的信息。

内涵信息例如可以包括下述至少一个维度:内容分类、内容题材、内容节奏、情节张力、人物表现、人物关系、男女主角配对(CP)感、角色间关系复杂度等。

应当理解,内涵信息不限于此列表。任何与内容对象的内容质量有关的信息皆可以作为内涵信息。对应于不同类型的内容对象,内涵信息的维度也可以有所不同。

图3是影视作品预测示例中根据内容对象内涵确定对标内容对象的示意图。

如图3所示,对于第一内容对象(待预测影视作品)的内涵,可以从多个对标维度来进行理解或分析。图3中示出了内容节奏(对于例如小说、影视作品等内容对象,内容节奏可以为故事节奏;对于例如音乐音频、音乐视频等内容对象,内容节奏可以为音乐节奏)、情节张力、任务表现等对标维度。

对于每个对标维度,可能确定出若干个对标节目,即在这个对标维度上与第一内容对象(待预测影视作品)相似的节目(或作品)。例如,图3中示出在故事节奏维度上找到对标节目有节目1、节目2等;在情节张力维度上找到对标节目有节目3、节目4等;在情节张力维度上找到对标节目有节目5、节目6等。

这里,可以针对内涵信息的多个维度中(至少一个维度)的各个维度,分别确定就该维度的内涵信息而言与第一内容对象相似的第二内容对象,如图3所示。应当明白,这里不需要针对多个维度中的每个维度都确定第二内容对象。

也可以结合内涵信息的多个维度中的至少两个维度,确定就该至少两个维度的内涵信息的结合而言,与第一内容对象相似的第二内容对象。

也可以综合内涵信息的所有维度,确定与第一内容对象相似的第二内容对象。

下面参考图4至6进一步详细描述对标内容对象的选择方法。

图4是根据本公开的实施例可用于确定对标内容对象的方法的示意性流程图。

图5是根据本公开的实施例的对标装置的示意性框图。如图5所示,对标装置100可以包括打分装置110和确定装置120。图5所示的对标装置100可以用来执行图4所示的对标内容对象确定方法。

如图4所示,在步骤S110,例如可以通过上述打分装置110,针对内涵信息的多个维度中的各个维度,分别对第一内容对象打分。应当明白,这里不需要针对多个维度中的每个维度进行打分。

例如,就影视作品内容对象而言,可以就故事节奏、情节张力、人物表现等多个维度的内涵信息分别第一内容对象打分。

图6是根据本公开的实施例的打分装置110的示意性框图。如图6所示,打分装置110可以包括接收装置112和/或分析装置114。

由专家来进行判断打分时,可以由专家针对剧本或成片采用相应的行业经验来打分。可以向专家提供打分界面,以便专家针对第一内容对象从各个维度分别打分。然后,例如可以通过接收装置112来接收专家针对多个维度分别对第一内容对象打分的打分结果。

通过机器算法或模型来进行判断打分时,例如可以通过分析装置114,对第一内容对象进行内涵分析,以便对第一内容对象打分。

例如,可以针对剧本或成片采用NLP(自然语言处理)或CV(计算机视觉)算法来打分。

更一般地,在内容对象是内容数据(如文字作品、音频作品、视频作品等)的情况下,可以对第一内容对象的文本进行自然语言处理;对第一内容对象的音频进行音频分析处理;对第一内容对象的视频或图像进行计算机视觉分析处理。由此,通过相应内涵分析处理,来对第一内容对象进行打分。

这里,文本可以包括文字作品的段落或全文;音频作品的歌词等;视频作品附带的文本或通过语音识别得到的对白文本、旁白文本、解说词等。

音频可以包括音频作品的音频或视频作品附带的音频。

返回图4,在步骤S120,例如可以通过上述确定装置120,根据各个维度的分值,确定与所述第一内容对象相似的第二内容对象。

可以预先从内涵信息的多个维度分别对已知的多个第二内容对象进行打分。

这样,可以在各个维度上分别找出与第一内容对象分数相近的若干个已知内容对象,例如已经上线的、与被预测节目分数最相近的若干个节目,作为本维度的第二内容对象,即对标内容对象。

上面参考图4至6描述了基于打分分值来确定对标内容对象的示例方案。其中,可以基于例如分数差确定各个维度上的相似度,分数差越小,则相似度越大。

应当理解,也可以采用各种其它方法来确定在各个维度上分别与第一内容对象相似的第二内容对象。

在各个维度上,可以选择相似度最大的一个或多个内容对象作为第二内容对象,或者也可以选择相似度大于预设阈值的一个或多个内容对象为第二内容对象。

另外,基于第一内容对象的内涵信息确定的与第一内容对象相似的内容对象的数量可以较多。可以将所确定的相似内容对象提供给工作人员,例如相关领域的专家,供其筛选。然后,可以接收筛选指令。响应于筛选指令,从所确定的多个相似内容对象中选择至少一个第二内容对象。

在确定了对标内容对象之后,可以进一步执行计算预测。例如可以使用机器学习算法,通过比较外延的可量化维度,进行精准计算,得到准确的预测结果。

返回图1,在步骤S200,例如可以通过上述预测装置200,基于第一内容对象的外延信息、第二内容对象的外延信息以及第二内容对象的用户响应历史数据,对第一内容对象的用户响应进行预测。

外延信息可以包括内容对象的内容质量以外的信息。

外延信息例如可以包括下述至少一个维度:主创人员、制作公司、相关知识产权(IP)。主创人员例如可以包括导演、演员、编剧等。

应当理解,外延信息不限于此列表。任何与内容对象的内容质量有关的信息皆可以作为内涵信息。对应于不同类型的内容对象,内涵信息的维度也可以有所不同。

可以通过检索、查询等方式,获取第一内容对象(待预测内容对象)和所确定的各个第二内容对象(对标内容对象)的各维度外延数据。

同时,还可以获取各个第二内容对象(对标内容对象)的用户响应历史数据。一般地,用户响应可以是某种统计数据。

用户响应可以包括下述至少一个维度:呈现数据、点击数据、播放数据、声量、成交数据、成交价格(例如股票成交价格)、成交总额、收益、用户评价等。

例如,对于影视作品内容对象,用户响应可以包括播放数据,例如一段时间内的播放次数或从头算起的总播放次数等;还可以包括用户评价,例如评分等。

作为预测依据的第二内容对象用户响应历史数据和作为预测目标的第一内容对象用户响应可以属于相同的维度,也可以属于不同的维度。

可以输入第二内容对象的一个或多个维度的用户响应历史数据,作为预测依据。也可以一次预测第一内容对象的一个或多个维度的用户响应。换言之,作为预测依据的第二内容对象的用户响应历史数据可以包括与作为预测目标的第一内容对象的用户响应属于相同和/或不同维度的用户响应历史数据。

另外,用户响应,不论是作为预测依据的第二内容对象用户响应历史数据,还是包括作为预测目标的第一内容对象用户响应,都还可以与用户信息相关联。这样,可以针对不同的用户或不同类型的用户,分别进行内容对象预测。

可以将第一内容对象的外延信息、第二内容对象的外延信息以及第二内容对象的用户响应历史数据输入经过训练的预测模型,得到期望的预测结果。

这里,第二内容对象(对标内容对象)的使用方式可以有多种。

例如,可以将多个第二内容对象中的每个第二内容对象的外延信息和用户响应历史数据分别与所述第一内容对象的外延信息一起输入所述预测模型,得到对应于该第二内容对象的部分预测结果。即,每个对标内容对象得到一个预测结果。然后,结合所述多个第二内容对象分别对应的部分预测结果,得到期望的预测结果。

或者,也可以将多个第二内容对象的外延信息和用户响应历史数据与所述第一内容对象的外延信息一起输入所述预测模型,得到期望的预测结果。即,将所有对标内容对象的各维度外延信息都输入预测模型,让预测模型自动学习并给出期望的预测结果。

或者,作为简化方案,第二内容对象(对标内容对象)也可以只选一个。通过综合内涵信息的各个维度来选取这一个第二内容对象。然后,基于这一个第二内容对象(对标内容对象)的外延信息和用户响应历史数据来获得第一内容对象的用户响应的预测结果。

预测结果可以是第一内容对象的一个或多个维度的用户响应预测数据。例如影视作品内容对象的预测播放数据等。

预测模型可以是基于深度神经网络(DNN)和/或多任务学习(MTL)的机器模型。应当明白,预测模型不限于这种结构。

例如可以通过机器学习算法学习历史数据来得到经过训练的预测模型。

图7示出了本公开的预测方案可以使用的预测模型的一个示例。该预测模型采用DNN+MTL结构。

如图7所示,该预测模型示例用于对影视节目作品内容对象进行预测。该预测模型的输入可以包括对标节目(即第二内容对象)的流量,例如播放数据,作为用户响应历史数据;以及待预测影视节目(即第一内容对象)和对标节目(即第二内容对象)的各个维度的外延信息,例如导演、演员等。

DNN的隐藏层例如可以有14层,每层例如可以有100个节点。应当明白,本公开的方案中可以采用的DNN的隐藏层和节点数量不限于此。

由于采用了MTL技术,可以输出多个维度的预测结果。如图7所示,输出的预测结果例如可以包括站内流量、全网声量等。

上文中详细描述了根据本公开的内容对象预测方案。

通过调整内容对象的内涵信息的维度、外延信息的维度以及用户响应的维度,本公开的内容对象预测方案可以具有广泛的应用场景,通用性强,商业化前景很好。

例如,在影视剧预测方面,本公开的内容对象预测方案可以用于新发布影视剧的流量预测、播前定级等。还可以应用到平台采制播全流程的流量、会员收入、广告收入等预测中。

而且,本公开的内容对象预测方案非常适用于艺术与技术相结合的文娱行业。因此,也能应用到其它典型的文娱场景,例如小说/视频推荐冷启动、电影票房预测等。

另外,除了文娱行业,其他行业同样有很多类似场景:其中专家经验和机器智能相互合作效果更好,比如股价分析、GMV(Gross Merchandise Volume,即(例如一定时间段内的)成交总额)等方面的预估等。这些领域也可以采用本公开的内容对象预测方案。这里,股价、GMV等也都可以视为大量用户对相应内容对象的响应结果。

与现有人工预估的方案相比,机器模型具有能够自主归纳并做精准的定量计算的优势,能够克服人工预估全面性、精准性不足的问题。

与现有机器外延分析算法相比,本公开通过对标的方式引入了内容对象内涵,解决了前文中提到的现有技术方案中存在的多个问题。

对标内容对象(例如影视剧领域的对标剧)的引入,解决了内涵难以量化、难以与流量等统计数据挂钩的问题。

通过对标的方式引入内涵,使得机器学习算法可以专注于外延。在样本量不变的情况下,可以取得更好的预测效果,很好地实现了小样本学习(FSL)。

在确定内涵维度时,可以听取专家的领域知识。可以让专家选取对标内容对象(例如对标剧),从而更直接地引入了专家经验。

找历史案例(对标内容对象)的方式符合人的思维方式,对标内容对象(例如对标剧)的概念容易被策划、营销、推广等事务工作人员理解,克服了可解释性差的问题。

另外,在根据本公开的预测方案中,通过对标的方式引入内涵,并与外延解耦。因此,可以独立优化对内涵和外延两方面的判断。

而且,内涵既可以由机器判断,也可以由专家判断。

由机器判断的情况下,为机器判断内涵的能力提供了落地点。

由专家判断的情况,实现了人机融合智能,为融合技术能力和专家经验提供了一个通用方案。例如,在人机电视剧流量预测实验中,通过实现人机融合智能,使得R2准确率能够提高10%左右。

根据本公开的内容对象预测方案,除了对于待预测内容对象的整体用户响应表现情况,例如流量、总收益等进行预测,还可以对不同用户或不同类型的用户针对待预测内容对象的用户响应进行预测。此时,如上文所述,对标内容对象(第二内容对象)的用户响应历史数据还可以与用户信息相关联,以用于与用户信息相关联的预测。

这样,采用根据本公开的内容对象预测方案,还可以实现一种内容对象推荐方法。

在该内容对象推荐方法中,可以向具有不同的内容对象内涵偏好的第一用户和第二用户分别推荐不同的内容对象或内容对象列表。推荐给第一用户的内容对象和推荐给第二用户的内容对象可以在内涵方面不同。

图8示出了根据本公开的一种内容对象推荐方法的示意性流程图。

在步骤S810,可以基于用户画像信息和/或用户历史行为信息,确定用户的内容对象内涵相关偏好信息。

在步骤S820,可以基于内容对象的内涵相关预测结果和用户的内容对象内涵相关偏好信息,判断该用户是否可能对该内容对象感兴趣。通过对多个内容对象进行预测,可以确定用户可能感兴趣的内容对象,从而向用户推荐内容对象或内容对象列表。

或者,也可以不需要在步骤S810中明确地确定出用户的内容对象内涵相关偏好信息。可以在预测模型中直接输入用户画像信息和/或用户历史行为信息和内容对象的内涵相关预测结果,直接确定用户可能感兴趣的内容对象,从而向用户推荐内容对象或内容对象列表。

或者,也可以通过拓展例如图7所示的预测模型得到内容对象推荐模型,在其输入中增加当前用户的用户画像信息和/或用户历史行为信息,由此,该内容对象推荐模型可以输出针对该用户的预测结果,即是否向该用户推荐该待预测内容对象。通过对多个待预测内容对象进行预测判断,确定向该用户推荐的内容对象。

在上文中,以内容对象为例对根据本公开的方法进行了描述。应当理解,本公开的预测方法和推荐方法可以适用于各种对象,特别是具有内涵和外延两方面信息的对象。

因此,在一些实施例中,可以提供一种对象预测方法。基于第一对象的内涵信息确定与第一对象相似的第二对象。基于第一对象的外延信息、第二对象的外延信息以及第二对象的用户响应历史数据,对第一对象的用户响应进行预测。

在一些实施例中,预测或推荐的对象例如可以是游戏。

由此,可以提供一种游戏预测方法。基于第一游戏的内涵信息确定与第一游戏相似的第二游戏;基于第一游戏的外延信息、第二游戏的外延信息以及第二游戏的用户响应历史数据,对第一游戏的用户响应进行预测。

游戏的内涵例如可以包括游戏分类、游戏题材、游戏任务角色、游戏故事情节等。游戏的外延例如可以包括游戏主创公司、相关知识产权(IP)等。

在一些实施例中,预测或推荐的对象例如可以是线下活动,例如各种形式的综艺活动、综艺节目、团队活动等。

由此,可以提供一种线下活动预测方法。基于第一线下活动的内涵信息确定与第一线下活动相似的第二线下活动。基于第一线下活动的外延信息、第二线下活动的外延信息以及第二线下活动的用户响应历史数据,对第一线下活动的用户响应进行预测。

线下活动的内涵例如可以包括:活动分类、活动性质、活动任务设置、活动情节设置、活动人物关系等等。线下活动的外延例如可以包括线下活动的设计单位、相关知识产权(IP)等。

在一些实施例中,预测或推荐的对象例如可以是知识产权衍生内容,基于某个知识产权(IP)衍生出的各种类型的内容。例如,基于三国演义这个IP衍生出的游戏、电影、活动等。

由此,可以提供一种知识产权衍生内容预测方法。基于第一知识产权的内涵信息确定与第一知识产权相似的第二知识产权。基于第一知识产权的衍生内容的外延信息、第二知识产权的衍生内容的外延信息以及第二知识产权的衍生内容的用户响应历史数据,对第一知识产权的衍生内容的用户响应进行预测。

图9示出了根据本发明一实施例可用于实现上述内容对象预测方法的计算设备的结构示意图。

参见图9,计算设备900包括存储器910和处理器920。

处理器920可以是一个多核的处理器,也可以包含多个处理器。在一些实施例中,处理器920可以包含一个通用的主处理器以及一个或多个特殊的协处理器,例如图形处理器(GPU)、数字信号处理器(DSP)等等。在一些实施例中,处理器920可以使用定制的电路实现,例如特定用途集成电路(ASIC,Application Specific Integrated Circuit)或者现场可编程逻辑门阵列(FPGA,Field Programmable Gate Arrays)。

存储器910可以包括各种类型的存储单元,例如系统内存、只读存储器(ROM),和永久存储装置。其中,ROM可以存储处理器920或者计算机的其他模块需要的静态数据或者指令。永久存储装置可以是可读写的存储装置。永久存储装置可以是即使计算机断电后也不会失去存储的指令和数据的非易失性存储设备。在一些实施方式中,永久性存储装置采用大容量存储装置(例如磁或光盘、闪存)作为永久存储装置。另外一些实施方式中,永久性存储装置可以是可移除的存储设备(例如软盘、光驱)。系统内存可以是可读写存储设备或者易失性可读写存储设备,例如动态随机访问内存。系统内存可以存储一些或者所有处理器在运行时需要的指令和数据。此外,存储器910可以包括任意计算机可读存储媒介的组合,包括各种类型的半导体存储芯片(DRAM,SRAM,SDRAM,闪存,可编程只读存储器),磁盘和/或光盘也可以采用。在一些实施方式中,存储器910可以包括可读和/或写的可移除的存储设备,例如激光唱片(CD)、只读数字多功能光盘(例如DVD-ROM,双层DVD-ROM)、只读蓝光光盘、超密度光盘、闪存卡(例如SD卡、min SD卡、Micro-SD卡等等)、磁性软盘等等。计算机可读存储媒介不包含载波和通过无线或有线传输的瞬间电子信号。

存储器910上存储有可执行代码,当可执行代码被处理器920处理时,可以使处理器920执行上文述及的内容对象预测方法。

上文中已经参考附图详细描述了根据本发明的内容对象预测和推荐方案。

此外,根据本发明的方法还可以实现为一种计算机程序或计算机程序产品,该计算机程序或计算机程序产品包括用于执行本发明的上述方法中限定的上述各步骤的计算机程序代码指令。

或者,本发明还可以实施为一种非暂时性机器可读存储介质(或计算机可读存储介质、或机器可读存储介质),其上存储有可执行代码(或计算机程序、或计算机指令代码),当所述可执行代码(或计算机程序、或计算机指令代码)被电子设备(或计算设备、服务器等)的处理器执行时,使所述处理器执行根据本发明的上述方法的各个步骤。

本领域技术人员还将明白的是,结合这里的公开所描述的各种示例性逻辑块、模块、电路和算法步骤可以被实现为电子硬件、计算机软件或两者的组合。

附图中的流程图和框图显示了根据本发明的多个实施例的系统和方法的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标记的功能也可以以不同于附图中所标记的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。

以上已经描述了本发明的各实施例,上述说明是示例性的,并非穷尽性的,并且也不限于所披露的各实施例。在不偏离所说明的各实施例的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。本文中所用术语的选择,旨在最好地解释各实施例的原理、实际应用或对市场中的技术的改进,或者使本技术领域的其它普通技术人员能理解本文披露的各实施例。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号