首页> 中国专利> 使用贝叶斯推理来预测匹配图中的评审决策

使用贝叶斯推理来预测匹配图中的评审决策

摘要

实现方式公开了用于使用贝叶斯推理来预测匹配图中的评审决策的方法和系统。一种方法包括:识别要被处理的当前媒体项目;处理标记媒体项目以识别包括类似于当前媒体项目的片段之一的至少一个相应片段的标记媒体项目;对于当前媒体项目的片段中的每一个,基于与相应的标记媒体项目相关联的属性来生成指示与当前媒体项目的对应片段相关联的特定属性的片段预测值,每一个标记媒体项目包括类似于该对应片段的相应片段;基于当前媒体项目的片段中的每一个的所生成的片段预测值来计算当前媒体项目的媒体项目预测值;以及使得当前媒体项目基于该计算的媒体项目预测值来被处理。

著录项

  • 公开/公告号CN113272800A

    专利类型发明专利

  • 公开/公告日2021-08-17

    原文格式PDF

  • 申请/专利权人 谷歌有限责任公司;

    申请/专利号CN201980087180.2

  • 申请日2019-02-19

  • 分类号G06F16/635(20060101);

  • 代理机构11219 中原信达知识产权代理有限责任公司;

  • 代理人邓聪惠;周亚荣

  • 地址 美国加利福尼亚州

  • 入库时间 2023-06-19 12:14:58

说明书

技术领域

本公开的各方面和实现方式涉及预测评审决策,并且特别是预测媒体项目的评审决策。

背景技术

诸如视频项目、音频项目等的媒体项目可以被上传到媒体项目平台。可以基于媒体项目的内容类型、媒体项目的适当性、媒体项目的质量等来对媒体项目标记。

发明内容

以下内容是本公开的简要总结以便提供本公开的一些方面的基本理解。此总结并不是本公开的广泛概述。它既不意图识别本公开的关键或重要元素,也不描绘本公开的特定实现方式的任何范围或权利要求的任何范围。其唯一目的是以简化形式呈现本公开的一些概念,作为稍后呈现的更详细描述的序言。

本公开的各方面自动地确定媒体项目的属性。可以使用贝叶斯推理来预测匹配图中媒体项目的属性。

在本公开的一方面,一种方法可以包括识别要被处理的当前媒体项目,以及处理多个标记的媒体项目以识别包括类似于当前媒体项目的多个片段之一的至少一个相应片段的标记媒体项目。该方法可以还包括,对于当前媒体项目的多个片段中的每一个,基于与相应的标记媒体项目相关联的属性,生成指示与当前媒体项目的对应片段相关联的特定属性的片段预测值,每一个标记媒体项目包括类似于当前媒体项目的对应片段的相应片段。该方法可以还包括基于当前媒体项目的多个片段中的每一个的所生成的片段预测值来计算当前媒体项目的媒体项目预测值,以及使得当前媒体项目基于所计算的媒体项目预测值被处理。

标记媒体项目中的每一个可以被指派相应的标签;以及当前媒体项目的多个片段中的每一个可以至少部分地匹配标记媒体项目的一个或多个片段。为当前媒体项目的多个片段中的每一个生成对应片段的片段预测值可以基于多个参数,所述多个参数包含对应片段的长度、当前媒体项目的长度或相应的标记媒体项目的长度中的至少一个,每一个标记媒体项目包括类似于当前媒体项目的对应片段的相应片段。该方法可以还包含:确定当前媒体项目的第一片段匹配第一标记媒体项目的第一对应片段;确定当前媒体项目的第二片段匹配第二标记媒体项目的第二对应片段;确定第一片段是第二片段的子片段,其中第二片段包含第一片段和第三片段,其中生成多个片段中的每一个的片段预测值包含:基于第一标记媒体项目的第一相应标签和第二标记媒体项目的第二相应标签来生成指示第一片段的第一标签的第一片段预测值;以及基于第二标记媒体项目的第二相应标签来生成指示第三片段的第二标签的第二片段预测值,其中计算媒体项目预测值是基于该生成的第一片段预测值和该生成的第二片段预测值。使得当前媒体项目被处理可以包含以下各项中的一个:响应于所计算的媒体项目预测值满足第一阈值条件,使得当前媒体项目经由媒体项目平台的播放被阻止;响应于所计算的媒体项目预测值满足第二阈值条件,使得当前媒体项目经由媒体项目平台的播放被允许;以及响应于所计算的媒体项目预测值满足第三阈值条件,使得当前媒体项目被评审以生成指示当前媒体项目经由媒体项目平台的播放是否被允许的标签。多个片段中的每一个的片段预测值是基于多个参数和与所述多个参数中的一个或多者相关联的一个或多个权重来生成的。该方法可以还包含基于当前媒体项目的生成的标签来调整一个或多个权重。一个或多个权重的调整包含:基于调谐输入和用于调谐输入的目标调谐输出,训练机器学习模型以提供经调整的一个或多个权重;对于当前媒体项目的多个片段中的每一个,调谐输入包含对应片段的长度、当前媒体项目的长度以及相应的标记媒体项目的长度,每一相应的标记媒体项目包括类似于当前媒体项目的对应片段的相应片段;以及用于调谐输入的调谐目标输出包含用于当前媒体项目的生成的标签。

将理解,各方面可以以任何方便的形式实现。例如,各方面可以通过适当的计算机程序来实现,该计算机程序可以承载在适当的载体介质上,该载体介质可以是有形载体介质(例如磁盘)或无形载体介质(例如通信信号)。各方面也可以使用合适的装置来实现,该装置可以采取运行被布置成实现本发明的计算机程序的可编程计算机的形式。各方面可以被组合,使得在一个方面的上下文中描述的特征可以在另一方面实现。

附图说明

在附图中,通过示例而非限制的方式示出了本公开。

图1是示出根据本公开的实现方式的示例性系统架构的框图。

图2是根据本公开的实现方式的为机器学习模型创建调谐数据的示例性调谐集生成器。

图3A-D是示出根据本公开的实现方式的预测媒体项目的评审决策的示例性方法的流程图。

图4A-B是示出根据本公开的实现方式的预测媒体项目的评审决策的表。

图5是示出根据本公开的实现方式的计算机系统的一个实现方式的框图。

具体实现方式

本公开的各方面和实现方式涉及使用贝叶斯推理来自动地确定媒体项目的属性,例如预测匹配图中的评审决策。服务器设备可以接收由用户设备上传的媒体项目。服务器设备可以使得媒体项目可由这些或其他用户设备经由媒体项目平台来播放。响应于用户将媒体项目(例如,在播放期间)标示为具有某一类型的内容,服务器设备可以提交媒体项目以供评审(例如,手动评审)。在评审期间,用户(例如,媒体项目平台的管理员)可以执行媒体项目的播放,并可以对媒体项目进行标记。基于来自评审的标签,服务器可以使媒体项目与标签相关联。标签可以指示媒体项目具有不适当的内容类型、侵犯权利、具有技术问题、具有评级、适合于广告等。

服务器设备可以基于媒体项目的标签,针对媒体项目执行不同的动作。例如,可以防止播放被标记为包含不适当的内容类型(例如,具有“负面评审”标签)的媒体项目。可替代地,可以允许播放被标记为不包含不适当的内容类型(例如,具有“正面评审”标签)的媒体项目。在另一示例中,基于媒体项目的标签,可以在基于标签的媒体项目的播放期间包括广告。在又一示例中,可以向上传了被标记为具有技术问题的媒体项目的用户设备传输消息。

新上传的媒体项目可以至少部分地匹配被标记的媒体项目。通常,每一新上传的媒体项目通常被标示、提交给手动评审,并基于手动评审被标记(例如,不管媒体项目是否与被标记的媒体项目匹配)。通常,评审至少部分匹配已标记媒体项目的第一媒体项目可能需要与评审至少部分不匹配已标记媒体项目的第二媒体项目相同量的时间和资源(例如,处理器开销、带宽、功耗、可用的人类评审员等)。在允许媒体项目可用于播放之前评审媒体项目可能需要很长时间,并且可能需要峰值的所需资源(例如,高处理器开销、功耗和带宽)。在评审媒体项目之前允许媒体项目可用于播放可能会允许播放包括问题和不适当内容的媒体项目。不正确地对媒体项目进行标记可能需要时间和资源来校正。

本公开的各方面通过自动地确定媒体项目的属性来解决上述和其他挑战(例如,使用贝叶斯推理来预测匹配图中的评审决策)。处理设备可以识别要处理的当前媒体项目(例如,新上传的媒体项目),并且可以识别标记媒体项目(例如,先前被评审的媒体项目)以寻找包括与当前媒体项目的片段之一类似的至少一个相应片段的标记媒体项目(例如,可以创建匹配图,该匹配图包括匹配当前媒体项目的至少一部分的标记媒体项目)。对于当前媒体项目的片段中的每一个(例如,类似于标记媒体项目的至少一部分的片段),处理设备可以生成指示与当前媒体项目的对应片段相关联的特定属性的片段预测值(例如,基于与具有类似于当前媒体项目的对应片段的相应片段的标记媒体项目相关联的属性,基于匹配图)。处理设备可以基于当前媒体项目的片段中的每一个的所生成的片段预测值来计算媒体项目预测值,并且可以使得当前媒体项目基于所计算的媒体项目预测值被处理。例如,基于媒体项目预测值,可以允许或阻止经由媒体项目平台的当前媒体项目的播放,或者可以使当前媒体项目被评审以生成用于当前媒体项目的标签,该标签指示是否允许播放当前媒体项目。

如本文所公开,自动生成媒体项目的属性(例如,预测评审决策)是有利的,因为它改善了用户体验并提供了技术优势。许多新上传的媒体项目可以具有类似于标记(例如,先前评审的)媒体项目的片段。通过执行初始处理以选择媒体项目用于进一步处理,可以更有效地执行向媒体项目指派属性,并且可以需要更少的媒体项目进行进一步处理。因此,与执行相同的过程对任何媒体项目进行标记相比,基于所计算的媒体项目预测值(例如,基于至少部分地匹配新上传的媒体项目的标记媒体项目)来处理新上传的媒体项目可以减少处理器开销、所需带宽和能耗,而不管媒体项目是否至少部分地匹配先前的标记媒体项目。基于所计算的媒体项目预测值允许或阻止播放新上传的媒体项目可以允许更快地处理媒体项目,并且因此相比于提供所有新上传的媒体项目用于播放以及仅在用户标示了媒体项目并且随后的手动评审对媒体项目标记之后阻止播放,可以提供更好的用户体验。为上传的媒体项目生成媒体项目预测值可能对上传媒体项目的用户有利,并且对媒体项目平台的用户有利。例如,响应于生成指示技术问题的媒体项目预测值,可以向上传媒体项目的用户传输基于媒体项目预测值的指示,以提醒用户该媒体项目具有技术问题(例如,建议修改媒体项目)。在另一示例中,响应于生成媒体项目的媒体项目预测值,媒体项目可以被处理,使得媒体项目被标记(例如,适龄性、类别等)以改善媒体项目平台的用户的搜索结果和建议。

图1示出根据本公开的实现方式的示例性系统架构100。系统架构100包括媒体项目服务器110、用户设备120、预测服务器130、内容所有者设备140、网络150和数据存储160。预测服务器130可以是预测系统105的一部分。

媒体项目服务器110可以包括一个或多个计算设备(诸如机架式服务器、路由器计算机、服务器计算机、个人计算机、大型计算机、膝上型计算机、平板计算机、台式计算机等)、数据存储(例如,硬盘、存储器、数据库等)、网络、软件组件和/或硬件组件。媒体项目服务器110可以用于向用户提供对媒体项目112(例如,已被标记的媒体项目(“标记媒体项目”114)、当前正在经历标记过程的媒体项目(“当前媒体项目”116)等)的访问。媒体项目服务器110可以向用户提供媒体项目112(例如,用户可以响应于请求或购买媒体项目112来选择媒体项目112并从媒体项目服务器110下载媒体项目112)。媒体项目服务器110可以是媒体项目平台(例如,提供内容托管服务的内容托管平台)的一部分,其可以允许用户消费、开发、上传、下载、评级、标示、共享、搜索、赞成(“喜欢”)、不喜欢和/或评论媒体项目112。媒体项目平台还可以包括网站(例如,网页)或应用后端软件,其可以用于向用户提供对媒体项目112的访问。

媒体项目服务器110可以托管内容,诸如媒体项目112。媒体项目112可以是用户选择的数字内容、用户可用的数字内容、用户开发的数字内容、用户上传的数字内容、内容所有者开发的数字内容、内容所有者上传的数字内容、媒体项目服务器110提供的数字内容等。媒体项目112的示例包括但不限于视频项目(例如,数字视频、数字电影等)、音频项目(例如,数字音乐、数字有声书等)、广告、随时间切换幻灯片的幻灯片显示、随时间滚动的文本、随时间变化的图等。

媒体项目112可以经由用户设备120上的web浏览器或者经由可以经由应用商店安装在用户设备120上的移动应用程序(“应用”)来消费。web浏览器或移动应用可以允许用户执行一个或多个搜索(例如,针对解释性信息、针对其他媒体项目112等)。如本文所使用,“应用程序”、“移动应用程序”、“智能电视应用程序”、“桌面应用程序”、“软件应用程序”、“数字内容”、“内容”、“内容项目”、“媒体”、“媒体项目”、“视频项目”、“音频项目”、“联系人邀请”、“游戏”和“广告”可以包括电子文件,该电子文件可以使用被配置成向实体呈现媒体项目112的软件、固件或硬件来执行或加载。在一个实现方式中,媒体项目平台可以使用数据存储160来存储媒体项目112。媒体项目112可以被呈现给用户设备120的用户或者由用户设备120的用户从媒体项目服务器110(例如,诸如内容托管平台的媒体项目平台)下载。媒体项目112可以经由媒体项目平台所提供的嵌入式媒体播放器(以及其他组件)来播放,或者存储在本地。媒体项目平台可以是例如应用程序分发平台、内容托管平台或社交网络平台,并且可以用于向用户提供对媒体项目112的访问或者向用户提供媒体项目112。例如,媒体项目平台可以允许用户消费、标示、上传、搜索、赞成(“喜欢”)、不喜欢和/或评论媒体项目112。媒体项目服务器110可以是媒体项目平台的一部分,可以是独立的系统,或者是不同平台的一部分。

网络150可以是向用户设备120和内容所有者设备140提供对媒体项目服务器110、预测服务器130和其他公开可用计算设备的访问的公共网络。网络150可以包括一个或多个广域网(WAN)、局域网(LAN)、有线网络(例如,以太网网络)、无线网络(例如,802.11网络或Wi-Fi网络)、蜂窝式网络(例如,长期演进(LTE)网络)、路由器、集线器、交换机、服务器计算机和/或其组合。

数据存储160可以是存储器(例如,随机存取存储器)、驱动器(例如,硬盘驱动器、闪存驱动器)、数据库系统或能够存储数据的另一类型的组件或设备。数据存储160可以包括多个存储组件(例如,多个驱动器或多个数据库),这些存储组件可以跨越多个计算设备(例如,多个服务器计算机)。在一些实现方式中,数据存储160可以存储与媒体项目、标签164或预测值166(例如,片段预测值168、媒体项目预测值169)相关联的信息162。标记媒体项目114中的每一个可以具有对应的标签164。标记媒体项目114中的每一个可能已被标示(例如,由用户在播放期间,经由用图像输入和标签输出训练的机器学习模型)。媒体项目112中的每一个可以具有对应的信息162(例如,总长度、每一片段的长度、媒体项目识别符等)。

用户设备120和内容所有者设备140可以包括计算设备,诸如个人计算机(PC)、膝上型计算机、移动电话、智能电话、平板计算机、上网本计算机、网络连接电视机(“智能电视”)、网络连接媒体播放器(例如,蓝光播放器)、机顶盒、电视盒子(OTT)流设备、操作箱等。

每一个用户设备120可以包括允许用户执行媒体项目112的播放和标示媒体项目112的操作系统。媒体项目112可以经由媒体查看器或web浏览器来呈现。web浏览器可以访问、检索、呈现和/或导览由web服务器服务的内容(例如,诸如超文本标记语言(HTML)页面的网页、数字媒体项目、文本对话、通知等)。嵌入式媒体播放器(例如,

用户设备120可以包括播放组件124、标示组件126和数据存储122中的一个或多个。在一些实现方式中,播放组件124或标示组件126中的一个或多个可以由在用户设备120上执行的web浏览器或应用程序(例如,移动应用程序、桌面应用程序)来提供。

数据存储122可以是存储器(例如,随机存取存储器)、驱动器(例如,硬盘驱动器、闪存驱动器)、数据库系统或能够存储数据的另一类型的组件或设备。数据存储122可以包括多个存储组件(例如,多个驱动器或多个数据库),这些存储组件可以跨越多个计算设备(例如,多个服务器计算机)。数据存储122可以包括媒体项目高速缓存123和标示高速缓存125。

播放组件124可以经由用户设备120提供媒体项目112的播放。媒体项目112的播放可以响应于播放组件124接收请求播放媒体项目112的用户输入(经由通过用户设备显示的图形用户界面(GUI))并将该请求传输到媒体项目服务器110。在一些实现方式中,媒体项目服务器110可以将媒体项目112流传输到用户设备120。在一些实现方式中,媒体项目服务器110可以将媒体项目112传输到用户设备120。播放组件124可以将媒体项目112存储在媒体项目高速缓存123中用于在稍后时间点播放(例如,无论与网络150的连接性如何,随后播放)。

标示组件126可以接收用户输入(例如,经由GUI,在媒体项目112的播放期间)以标示媒体项目112。媒体项目112可以被标示为一个或多个类型的内容。用户输入可以指示该内容的类型(例如,通过从列表中选择内容的类型)。基于用户输入,标示组件126可以将媒体项目112标示为具有不适当的内容类型(例如,包括一个或多个性内容、暴力或令人厌恶的内容、仇恨或虐待内容、有害的危险行为、虐待儿童、宣扬恐怖主义、垃圾邮件或误导等)、侵犯权利、具有技术问题(例如,字幕问题等)、具有评级(例如,适龄性评级等)、适合于广告等。标示组件126可以向预测系统105、预测服务器130、数据存储160等一个或多个传输媒体项目112已被标示的指示。

响应于被标示,媒体项目112可以被标记(例如,通过手动评审)以生成标记媒体项目114。与标记媒体项目114相关联的信息162以及标签164可以与标记媒体项目114一起存储在数据存储160中。可替代地,标记媒体项目114可以存储在单独的数据存储中,并且经由媒体项目识别符与信息162和标签164相关联。

内容所有者设备140可以包括传输组件144、接收组件146、修改组件148和数据存储142。

数据存储142可以是存储器(例如,随机存取存储器)、驱动器(例如,硬盘驱动器、闪存驱动器)、数据库系统或能够存储数据的另一类型的组件或设备。数据存储142可以包括多个存储组件(例如,多个驱动器或多个数据库),这些存储组件可以跨越多个计算设备(例如,多个服务器计算机)。数据存储142可以包括媒体项目高速缓存143。

传输组件144可以接收由对应于内容所有者设备140的内容所有者创建、修改、上传或关联的媒体项目112。传输组件144可以将媒体项目112存储在媒体项目高速缓存143中。传输组件144可以向媒体项目服务器110传输(例如,上传)媒体项目112(例如,响应于内容所有者输入以上传媒体项目112)。

接收组件146可以从预测服务器130接收基于媒体项目预测值169(例如,由预测管理器132生成)的指示。接收组件146可以将该指示存储在数据存储142中。

修改组件148可以基于该基于媒体项目预测值169的指示来修改媒体项目112。例如,响应于基于媒体项预测值169的指示,其指示媒体项目112的内容不适当或具有技术问题(例如,字幕中的错误等),修改组件148可以使得媒体项目112的内容被修改(例如,移除不适当的内容,修复技术问题)。在一些实现方式中,为了使得内容被修改,修改组件148可以经由GUI向内容所有者提供如何修改内容的指示或推荐。在一些实现方式中,为了使得内容被修改,修改组件148可以自动地修改内容(例如,修复技术问题,移除不适当的内容等)。

预测服务器130可以经由网络150耦合到用户设备120和内容所有者设备140,有助于预测媒体项目112的评审决策。在一个实现方式中,预测服务器130可以是媒体项目平台的一部分(例如,媒体项目服务器110和预测服务器130可以是同一媒体项目平台的一部分)。在另一实现方式中,预测服务器130可以是独立的平台,包括一个或多个计算设备,诸如机架式服务器、路由器计算机、服务器计算机、个人计算机、大型计算机、膝上型计算机、平板计算机、台式计算机等,并且可以提供可以由媒体项目平台和/或各种其他平台(例如,社交网络平台、在线新闻平台、消息传递平台、视频会议平台、在线会议平台等)使用的评审决策预测服务。

预测服务器130可以包括预测管理器132。根据本公开的一些方面,预测管理器132可以识别要处理的当前媒体项目116(例如,新上传的媒体项目)(例如,基于例如标示组件126提供的指示在没有用户输入的情况下自动评估),并且可以处理标记媒体项目114以找到包括类似于当前媒体项目的片段之一的至少一个相应片段的标记媒体项目114(例如,生成标记媒体项目114的匹配图)。对于当前媒体项目116的片段中的每一个(例如,至少部分地匹配标记媒体项目114),预测管理器132可以生成指示与当前媒体项目116的对应片段相关联的特定属性的片段预测值168(例如,基于与教导包括类似于当前媒体项目116的对应片段的相应片段的相应标记媒体项目114相关联的属性,基于匹配图)。预测管理器132可以基于当前媒体项目116的片段中的每一个的所生成片段预测值168来计算当前媒体项目116的媒体项目预测值169,并且可以基于所计算的媒体项目预测值169来处理当前媒体项目116。在一些实现方式中,预测管理器(例如,经由训练的机器学习模型190,没有训练的机器学习模型190)可以使用贝叶斯推理来预测匹配图中的评审决策(例如,媒体项目预测值169)(例如,基于至少部分匹配当前媒体项目116的标记媒体项目114,基于图4A的表400A等)。

响应于媒体项目预测值169(例如,指示当前媒体项目116具有不适当的内容或具有技术问题),预测管理器132可以使得当前媒体项目116被阻止可用于经由媒体项目平台播放。预测管理器132可以基于媒体预测值169向媒体项目平台(或任何其他平台)或直接向内容所有者设备140传输指示,指示当前媒体项目116的确定属性。内容所有者设备140可以接收指示(例如,来自媒体项目平台或来自预测管理器132),使得当前媒体项目116基于该指示被修改,并且重新上传修改的当前媒体项目(例如,传向媒体项目服务器110、预测服务器130或媒体项目平台)。

在一些实现方式中,预测管理器132可以使用训练的机器学习模型190来确定媒体项目预测值169。预测系统105可以包括预测服务器130、服务器机器170或服务器机器180中的一个或多个。服务器机器170-180可以是一个或多个计算设备(诸如机架式服务器、路由器计算机、服务器计算机、个人计算机、大型计算机、膝上型计算机、平板计算机、台式计算机等)、数据存储(例如,硬盘、存储器、数据库等)、网络、软件组件或硬件组件。

服务器机器170包括调谐集生成器171,其能够生成调谐数据(例如,一组调谐输入和一组目标输出)以训练机器学习模型。服务器机器180包括调谐引擎181,其能够使用来自调谐集生成器171的调谐数据来训练机器学习模型190。机器学习模型190可以使用本文描述的(参见图2和图3C)调谐输入210和目标输出220(例如,目标调谐输出)来训练。然后可以使用训练的机器学习模型190来确定媒体项目预测值169。机器学习模型190可以指代由调谐引擎181使用包括调谐输入和对应目标输出(相应调谐输入的正确答案)的调谐数据创建的模型工件。可以在调谐数据中找到将调谐输入映射到目标输出的模式(正确答案),并且提供捕捉这些模式的机器学习模型190。机器学习模型190可以包括参数191(例如,k、f、g、配置参数、超参数等),这些参数可以基于为其确定了媒体项目预测值169的当前媒体项目116的后续标记来调谐(例如,可以调整相关联的权重)。在一些实现方式中,参数191包括k、f或g中的一个或多个,如下文描述。在一些实现方式中,参数包括当前媒体项目116的对应片段的长度、当前媒体项目116的长度或相应的标记媒体项目114的长度中的至少一个(例如,每一个都包括类似于当前媒体项目116的对应片段的相应片段)。

预测管理器132可以确定与当前媒体项目116相关联的信息(例如,当前媒体项目116的长度、当前媒体项目116的类似于标记媒体项目114的相应片段的片段的长度)以及与标记媒体项目114相关联的信息(例如,标记媒体项目114的长度),并且向训练的机器学习模型190提供该信息。训练的机器学习模型190可以产生输出,并且预测管理器132可以根据训练的机器学习模型的输出来确定媒体项目预测值169。例如,预测管理器132可以从训练的机器学习模型190的输出中提取媒体项目预测值169,并且可以从输出中提取置信数据,该置信数据指示当前媒体项目116包含由媒体项目预测值169指示的内容类型的置信水平(例如,媒体项目预测值169准确预测手动评审决策的置信水平)。

在实现方式中,置信数据可以包括或指示当前媒体项目116具有特定属性(例如,包含内容类型)的置信水平。在一个示例中,置信水平是介于0和1之间的实数,其中0指示不相信当前媒体项目116具有特定类型的内容,1表示绝对相信当前媒体项目116具有特定类型的内容。

同样如上所述,出于说明而非限制的目的,本公开的各方面描述了使用与媒体项目112相关联的信息162来训练机器学习模型190和使用训练的机器学习模型190。在其他实现方式中,启发式模型或基于规则的模型用于确定当前媒体项目116的媒体项目预测值169。可以注意到,参照图2的调谐输入210描述的任何信息可以被监控或者以其他方式用于启发式或基于规则的模型中。

应注意在一些其他实现方式中,服务器机器170、服务器机器180、预测服务器130或媒体项目服务器110的功能可以由较少数量的机器提供。例如,在一些实现方式中,服务器机器170和180可以集成到单个机器中,而在一些其他实现方式中,服务器机器170、服务器机器180和预测服务器130可以集成到单个机器中。另外,在一些实现方式中,服务器机器170、服务器机器180和预测服务器130中的一个或多个可以集成到媒体项目服务器110中。

一般来说,如果合适,在一个实现方式中描述为由媒体项目服务器110、服务器机器170、服务器机器180或预测服务器130执行的功能也可以在其他实现方式中在用户设备120上执行。例如,媒体项目服务器110可以将媒体项目112流传输到用户设备120,并且可以接收指示媒体项目112的标示的用户输入。

一般来说,如果合适,在一个实现方式中描述为在用户设备120上执行的功能也可以在其他实现方式中由媒体项目服务器110或预测服务器130执行。例如,媒体项目服务器110可以将媒体项目112流传输到用户设备120,并且可以接收媒体项目112的标示。

另外,属于特定部件的功能性可以由一起操作的不同或多个部件执行。媒体项服务器110、服务器机器170、服务器机器180或预测服务器130也可以作为通过适当的应用程序编程接口(API)提供给其他系统或设备的服务来访问,且因此不限于在网站和应用程序中使用。

在本公开的实现方式中,“用户”可以被表示为单个个体。然而,本公开的其他实现方式包括是由一组用户和/或自动源控制的实体的“用户”。例如,在社交网络中联合为社区的一组个体用户可以被视为“用户”。在另一示例中,自动消费者可以是应用程序分发平台的自动摄取管道。

尽管根据媒体项目服务器110、预测服务器130和媒体项目平台来论述本公开的实现方式,但实现方式通常也可以应用于提供内容和用户之间的连接的任何类型的平台。

除了以上描述之外,可以向用户提供允许用户选择是否以及何时本文描述的系统、程序或特征能够收集用户信息(例如,关于用户的社交网络、社交行为或活动、职业、用户偏好或用户当前位置的信息),以及是否从服务器(例如,媒体项目服务器110或预测服务器130)向用户发送内容或通信的控件。另外,某些数据可以在存储或使用之前以一种或多种方式处理,以便消除个人身份信息。例如,可以处理用户的身份,使得不能为用户确定个人身份信息,或者可以在获得位置信息的地方概括用户的地理位置(诸如城市、邮政编码或州级),使得不能确定用户的特定位置。因此,用户可以控制收集关于用户的什么信息、如何使用信息以及向用户提供什么信息。

图2是根据本公开的实现方式的使用信息为机器学习模型创建调谐数据的示例性调谐集生成器。系统200展示调谐集生成器171、调谐输入210和目标输出220(例如,目标调谐输出)。如参照图1所描述,系统200可以包括与系统100类似的组件。参照图1的系统100描述的组件可以用于帮助描述图2的系统200。

在实现方式中,调谐集生成器171生成包括一个或多个调谐输入210和一个或多个目标输出220的调谐数据。调谐数据还可以包括将调谐输入210映射到目标输出220的映射数据。调谐输入210也可以被称作“特征”、“属性”或“信息”在一些实现方式中,调谐集生成器171可以在调谐集中提供调谐数据,并将该调谐集提供给调谐引擎181,其中该调谐集用于训练机器学习模型190。可以进一步参照图3C来描述生成调谐集的一些实现方式。

在一个实现方式中,调谐输入210可以包括与当前媒体项目116和一个或多个标记媒体项目114相关联的信息162,该标记媒体项目114包括类似于当前媒体项目116的片段之一的至少一个相应片段。对于当前媒体项目116,信息162可以包括当前媒体项目116的片段214A的长度212A、当前媒体项目116的片段214B的长度212B等(下文的片段214的长度212)和当前媒体项目116的长度216。对于每一个标记媒体项目114,信息162可以包括标记媒体项目114的长度218。

在实现方式中,目标输出220可以包括当前媒体项目116的所生成的标签164。在一些实现方式中,所生成的标签164可能已通过当前媒体项目116的手动评审生成。在一些实现方式中,所生成的标签164可能已通过当前媒体项目116的自动评审生成。

在一些实现方式中,继生成调谐集并使用该调谐集训练机器学习模型190之后,机器学习模型190可以使用当前媒体项目116的所生成的标签164被进一步训练(例如,用于调谐集的附加数据)或调整(例如,参数191的调整权重)。

图3A-D描绘了根据本公开的实现方式的预测媒体项目的评审决策的方法300、320、340和360的说明性示例的流程图。方法300、320、340和360是从预测系统105(例如,服务器机器170、服务器机器180或预测服务器130中的一个或多个)(例如,和/或媒体项目平台或媒体项目服务器110)的角度来看的示例性方法。方法300、320、340和360可以通过可以包括硬件(例如,电路、专用逻辑)、软件(诸如在通用计算机系统或专用机器上运行)或两者的组合的处理设备来执行。方法300、320、340和360以及它们个别功能、例程、子例程或操作中的每一个可以由执行该方法的计算机设备的一个或多个处理器执行。在特定实现方式中,方法300、320、340和360中的每一个可以由单个处理线程执行。可替代地,方法300、320、340和360中的每一个可以由两个或更多个处理线程来执行,每一线程执行该方法的一个或多个个别功能、例程、子例程或操作。

为了解释简单,本公开的方法被描绘和描述为一系列动作。然而,根据本公开的动作可以以各种顺序和/或同时发生,且与本文未呈现和描述的其他动作一起发生。此外,可能不需要所有示出的动作来实现根据所公开主题的方法。另外,本领域的技术人员将理解和了解到,这些方法可以替代地经由状态图或事件表示为一系列相关的状态。另外,应了解,本说明书中公开的方法能够存储在制品上,以便于将此类方法运输和转移到计算设备。本文使用的术语“制品”旨在包括可从任何计算机可读设备或存储介质访问的计算机程序。例如,非暂时性机器可读存储介质可以存储指令,该指令在被执行时使得处理设备(例如,预测系统105、媒体项目服务器110、用户设备120、预测服务器130、内容所有者设备140、服务器机器170、服务器机器180、媒体项目平台等)执行包括其中所公开的方法的操作。在另一示例中,系统包括用以存储指令的存储器和可通信地耦合到存储器的处理设备,该处理设备执行指令以执行其中公开的方法。在一个实现方式中,方法300、320、340和360可以由图1的预测系统105执行。

参考图3A,方法300可以由预测服务器130的一个或多个处理设备执行,用于预测媒体项目的评审决策。方法300可以由在预测服务器130上的一个或多个处理设备上执行的应用程序或后台线程来执行。在一些实现方式中,方法300的一个或多个部分可以由预测系统105、媒体项目服务器110、预测服务器130(例如,预测管理器132)或媒体项目平台中的一个或多个执行。

在块302,处理设备识别要被处理的当前媒体项目116。例如,当前媒体项目116可能已由内容所有者设备140上传,以可用于经由媒体项目平台播放。在一些实现方式中,当前媒体项目116先前已被评审(例如,与标签164相关联),并且当前媒体项目116被识别为经历进一步处理(例如,经由方法300)以更新或确认标签164。在一些实现方式中,媒体项目116已被标示(例如,在播放期间由用户设备120,由用图像和标签164训练的机器学习模型),并且当前媒体项目116被识别为经历进一步的处理(例如,经由方法300)。在一些实现方式中,当前媒体项目116是要被处理的媒体项目队列中的下一个媒体项目。

在块304,处理设备处理标记媒体项目114以识别包括类似于(例如,匹配,大体上相同)当前媒体项目116的片段之一的至少一个相应片段的标记媒体项目。例如,当前媒体项目116的帧可以与标记媒体项目114的帧进行比较(例如,当前媒体项目116的帧与标记媒体项目114的帧的索引进行比较)。处理设备可以确定标记媒体项目114的第一片段和当前媒体项目116的第二片段是类似的(例如,匹配,大体上类似),尽管片段之一具有边界或框架,和/或被倒置,和/或被加速或减速,和/或具有静态,和/或具有不同的质量等。处理设备可以确定当前媒体项目116的帧或音频片段的至少一部分匹配标记媒体项目114的帧或音频片段的至少一部分。处理设备可以识别当前媒体项目116的片段,其中每一个片段至少部分地匹配标记媒体项目114的一个或多个片段。处理设备可以将当前媒体项目116(V)划分成片段(S)(例如,V=S

在块306,对于当前媒体项目116的每一片段,处理设备基于与相应的标记媒体项目114相关联的属性,生成指示与当前媒体项目116的对应片段相关联的特定属性的片段预测值168。处理设备可以组合正面预测(例如,该片段类似于具有“正面评审”标签的一个或多个标记媒体项目)和负面预测(例如,该片段也类似于具有“负面评审”标签的一个或多个标记媒体项目)。确定片段类似于具有“正面评审”标签(标记为“好”)的一个或多个标记媒体项目和具有“负面评审”标签(标记为“坏”)的一个或多个媒体项目可以被称作确定该片段的匹配图。贝叶斯推理可以用于预测匹配图(例如,具有类似于标记媒体项目114的相应片段的一个或多个片段)中的当前媒体项目116的评审决策(例如,基于片段预测值168的媒体项目预测值169)。

对于媒体项目(V),可以使用以下值(例如,基于图4A的表400A):

这些值(例如,通过贝叶斯公式)可以通过以下等式连接:

该等式可通过使用表400A中的值来验证:

20/21=24/100*20/24*100/21

方法300可以基于标记媒体项目114(例如,被表示为事件E的先前评审员决策)的标签164(事件E)来预测媒体项目预测值169(例如,预测媒体项目应具有“正面评审”标签还是“负面评审”标签)。如果媒体项目包含不相交的片段S

仅当媒体项目112的每个片段不包含内容类型时,媒体项目112才被标记为不包含内容类型(例如,仅当媒体项目112的每个部分都具有“正面评审”标签时,媒体项目112才具有“正面评审”标签)。如果没有证据,该等式也成立:

其中

被标记为包含内容类型(例如,具有“负面评审”标签)的标记媒体项目116可以称作媒体项目A,并且被标记为不包含内容类型(例如,具有“正面评审”标签)的标记媒体项目116可以称作媒体项目O。

当前媒体项目116(V)的片段(S)可以类似于(例如,匹配)已被标记为包含内容类型(例如,V和A都包含S)的标记媒体项目114(A)。

其中f是常数因子

响应于标记媒体项目114被标记为不包含内容类型(例如,具有“正面评审”标签),标记媒体项目114的所有片段也不包含内容类型(例如,也具有“正面评审”标签)。对于长媒体项目112,评审员不可能考虑所有媒体项目112(例如,在没有指示评审员应考虑所有媒体项目112的信号的情况下)。

其中

常数g可以特定于标记媒体项目(O)。基于类似于被标记为包含内容类型的标记媒体项目114的片段,片段(S)不包含内容类型的概率(x)(例如,x是基于“负面评审”标签的情况下S应具有“正面评审”标签的概率)可以由以下等式表示:

基于类似于被标记为不包含内容类型的标记媒体项目114的片段,片段(S)包含内容类型的概率(y)(例如,y是基于“正面评审”标签的情况下S应具有“负面评审”标签的概率)可以由以下等式表示:

这些概率可以基于图4B的表400B来组合。有两条独立的证据,并且有四种可能性,其中两种(如表400B的阴影单元格)可能被排除。

片段(S)不包含内容类型的所得概率(例如,具有与标签164相关联的特定属性,S应具有“正面评审”标签的所得概率)可以由以下等式示出:

如果预测相同(即,如果x=1-y),则等式简化为x

在没有类似于被标记为不包含内容类型的标记媒体项目114的片段(S)的情况下(例如,在没有“正面评审”标签的情况下),片段(S)包含内容类型(例如,应具有“负面评审”标签)的假设的先验概率可以是一半(例如,

在一些实现方式中,对于每一片段Si,具有评审

其中

(y中的因子1/2来自于它是中性的将“正面评审”标签和“负面评审”标签组合在一起)

并且使

如果没有评审,这就简化为k|S

在块308,处理设备基于当前媒体项目116的每一片段的所生成的片段预测值168来计算当前媒体项目116的媒体项目预测值169(例如,组合概率)。片段预测值168可以通过以下等式组合成整个当前媒体项目116的媒体项目预测值169:

在一些实现方式中,媒体项目预测值169可以指示当前媒体项目116不包含内容或属性的类型的概率(例如,应具有“正面评审”标签的概率)。例如,媒体项目预测值169可以指示当前媒体项目116有90%的概率不包含内容或属性的类型。在一些实现方式中,片段预测值168和媒体项目预测值169可以是指示包含内容或属性类型的相对概率的得分。例如,第一当前媒体项目的第一媒体项目预测值可以指示较大的最终得分,并且第二当前媒体项目的第二媒体项目预测值可以指示较小的最终得分。相对较大的最终得分指示第一当前媒体项目比第二当前媒体项目更有可能包含该内容类型。在一些实现方式中,片段预测值168被相乘在一起以计算媒体项目预测值169。在一些实现方式中,片段预测值168使用一个或多个其他操作(例如,代替乘法,结合乘法等)来组合。在一些实现方式中,片段预测值168经由一个或多个操作(例如,乘法等)与当前媒体项目116的先前预测值(例如,由当前媒体项目116的先前评审所生成的概率或得分)组合。

在示例中,在块304,处理设备可以确定当前媒体项目116的第一片段(例如,0-15秒)匹配第一标记媒体项目114A的第一对应片段,当前媒体项目116的第二片段(例如,0-30秒)匹配第二标记媒体项目114B的第二对应片段,并且第一片段是第二片段的子片段。当前媒体项目116的第二片段可以包括当前媒体项目116的第一片段和第三片段。在块306,处理设备可以基于第一标记媒体114A项目的第一相应标签164A和第二标记媒体项目114B的第二相应标签164B来处理第一片段(例如,生成指示第一片段的第一标签的第一片段预测值)。在块306,处理设备可以基于第二标记媒体项目114B的第二相应标签164B来处理第二片段(例如,生成指示第一片段的第二标签的第二片段预测值)。在块308,处理设备可以基于所生成的第一片段预测值168和所生成的第二片段预测值168来计算媒体项目预测值169。

在块310,处理设备使得当前媒体项目116基于媒体项目预测值169被处理。例如,处理设备可以向媒体项目平台提供媒体项目预测值169(或关于媒体项目预测值169的信息),以启动当前媒体项目116的处理。可替代地,处理设备自身可以基于媒体项目预测值169来执行当前媒体项目116的处理。在一些实现方式中,当前媒体项目116的处理包括基于媒体项目预测值169对当前媒体项目116应用策略(例如,阻止播放、应用播放、发送以供评审等)。在一些实现方式中,由图3B示出基于媒体项目预测值169的当前媒体项目116的处理。在一些实现方式中,处理设备可以使得一个或多个媒体项目(例如,广告、插页式媒体项目)与当前媒体项目116的播放相关联(例如,使得附加媒体项目的播放结合当前媒体项目116的播放)。在一些实现方式中,处理设备可以基于媒体项目预测值169,使得指示被传输到与当前媒体项目116相关联的内容所有者设备140(例如,指示关于当前媒体项目116的问题等)。在一些实现方式中,处理设备可以基于媒体项目预测值169来修改或使得当前媒体项目116被修改。在一些实现方式中,处理设备基于媒体项目预测值169使标签164与当前媒体项目116相关联。

在一些实现方式中,处理设备可以发送当前媒体项目116用于评审(例如,手动评审),并且可以接收一个或多个评审决策(例如,手动评审决策)。处理设备可以基于评审决策来调谐k、f

参考图3B,方法320可以由预测系统105的一个或多个处理设备和/或媒体项目平台执行,用于预测评审决策。可以基于媒体项目预测值169使用方法320来处理当前媒体项目116。在一些实现方式中,图3A的块310包括方法320。方法320可以由在预测系统105的一个或多个处理设备和/或媒体项目平台上执行的应用程序或后台线程来执行。如本文所述,阈值条件可以是阈值媒体项目预测值、概率、得分、置信水平等中的一个或多个。例如,第一阈值条件可以是99%或更大的媒体项目预测值。在一些实现方式中,阈值条件可以是阈值媒体项目预测值、概率、得分、置信水平等中的一个或多个的组合。例如,第一阈值条件可以满足第一媒体项目预测值和阈值置信水平。

在块322,处理设备确定所计算的媒体项目预测值169是否满足第一阈值条件。响应于所计算的媒体项目预测值169满足第一阈值条件,流程继续到块324。响应于所计算的媒体项目预测值169不满足第一阈值条件,流程继续到块326。

在块324,处理设备阻止当前媒体项目116经由媒体项目平台的播放。例如,如果媒体项目预测值169满足当前媒体项目116包含内容类型(例如,不适当的、具有技术问题、侵犯内容所有者权利等)的第一概率(例如,处于或超过99%的概率),则当前媒体项目116可能被媒体项目平台阻止。在一些实现方式中,可以将内容类型的指示(例如,不适当的、技术问题、侵权等)传输到上传当前媒体项目116的内容所有者设备140。内容所有者设备可以修改(例如,或取代)当前媒体项目116,并上传修改后的(或新的)媒体项目112。

在块326,处理设备确定所计算的媒体项目预测值168是否满足第二阈值条件。响应于所计算的媒体项目预测值168满足第二阈值条件,流程继续到块328。响应于所计算的媒体项目预测值168不满足第二阈值条件,流程继续到块330。

在块328,处理设备允许媒体项目经由媒体项目平台的播放。例如,如果媒体项目预测值169满足当前媒体项目116包含内容类型(例如,不适当的、具有技术问题、侵犯内容所有者权利等)的第二概率(例如,小于或等于50%的概率),则可以允许当前媒体项目116的播放(例如,当前媒体项目116可以经由媒体项目平台被访问用于播放)。在一些实现方式中,可以将允许经由媒体项目平台播放当前媒体项目116的指示传输到上传当前媒体项目116的内容所有者设备140。

在块330,处理设备确定所计算的媒体项目预测值169是否满足第三阈值条件。响应于所计算的媒体项目预测值169满足第三阈值条件,流程继续到块332。响应于所计算的媒体项目预测值169不满足第三阈值条件,流程结束。

在块332,处理设备使得当前媒体项目116被评审,以生成指示是否允许经由媒体项目平台播放的标签164。在一些实现方式中,第三阈值条件介于第一和第二阈值条件之间(例如,比第一阈值条件低的概率和比第二阈值条件高的概率,例如50-99%的概率)。处理设备可以使得当前媒体项目116被手动地评审。

在块334,处理设备接收用于当前媒体项目116的所生成标签164。处理设备可以接收所生成的标签164,该标签是由响应于媒体项目预测值169满足第三阈值条件而手动评审当前媒体项目116的用户(例如,媒体项目平台的管理员)生成的。

在一些实现方式中,在块336,处理设备基于所生成的标签164来调整权重(例如,模型190的参数191的权重),用于生成片段预测值168(例如,重新调谐训练的机器学习模型190)。

在块338,处理设备确定所生成的标签164是否指示允许播放。响应于指示允许播放的所生成的标签164,流程继续到块328。响应于指示不允许播放的所生成的标签164,流程继续到块324。

参考图3C,方法340可以由预测系统105的一个或多个处理设备执行,用于预测评审决策。根据本公开的实现方式,预测系统105可以使用方法340来训练机器学习模型。在一个实现方式中,方法340的一些或所有操作可以由图1的系统100的一个或多个组件执行。在其他实现方式中,方法340的一个或多个操作可以通过参照图1-2所述的服务器机器170的调谐集生成器171来执行。

方法340生成用于机器学习模型的调谐数据。在一些实现方式中,在块342,实现方法300的处理逻辑将数据集(例如,调谐集)T初始化为空集。

在块344,处理逻辑生成调谐输入,该调谐输入对于当前媒体项目116的每一片段214包括对应片段214的长度212、当前媒体项目116的长度216和相应的标记媒体项目114的长度218(例如,具有与当前媒体项目116的片段类似的片段)。

在块346,处理逻辑生成用于调谐输入中的一个或多个的目标输出。目标输出可以包括当前媒体项目116的标签164。在一些实现方式中,标签164可以在图3B的块334处接收。

在块348,处理逻辑可选地生成指示输入/输出映射的映射数据(例如,与映射到当前媒体项目116的标签164的当前媒体项目116相关联的信息162)。输入/输出映射(或映射数据)可以指代调谐输入(例如,本文所述的一个或多个调谐输入)、调谐输入的目标输出(例如,其中目标输出识别用户取消相应传输的偏好的指示)、以及调谐输入与目标输出之间的关联。

在块350,处理逻辑将映射数据添加到在块342初始化的数据集T。

在块352,基于调谐集T是否足以训练机器学习模型190,处理逻辑进行分支。如果是,执行进行到块354,否则,执行继续回到块344。应注意,在一些实现方式中,调谐集T的充分性可以仅仅基于调谐集中输入/输出映射的数量来确定,而在一些其他实现方式中,除了输入/输出映射的数量之外,或者代替输入/输出映射的数量,可以基于一个或多个其他准则(例如,调谐示例的多样性的度量、准确性等)来确定调谐集T的充分性。

在块354,处理逻辑提供调谐集T来训练机器学习模型190。在一个实现方式中,将调谐集T提供给服务器机器180的调谐引擎181,以执行模型190的训练或重新训练。在一些实现方式中,模型的训练或重新训练包括调整模型190的参数191的权重(参见图3B的块336)。在块354之后,机器学习模型190可以基于调谐集T被训练或重新训练,并且训练的机器学习模型190可以被实现(例如,通过预测管理器132)以预测当前媒体项目116的评审决策。

参考图3D,方法360可以由预测系统105的一个或多个处理设备执行,用于预测评审决策。方法360可以用以预测评审决策。方法360可以由在预测系统105的一个或多个处理设备(例如,预测管理器132)上执行的应用程序或后台线程来执行。

在块362,对于当前媒体项目116的每一片段214,处理设备向训练的机器学习模型190提供对应片段214的长度212、当前媒体项目116的长度216和相应的标记媒体项目114的长度218。训练的机器学习模型190可以通过图3C的方法340来训练。训练的机器学习模型190可以执行图3A方法的块306-308中的一个或多个。例如,训练的机器学习模型可以基于块362中提供的调谐输入和参数191来确定片段预测值168。在一些实现方式中,训练的机器学习模型可以处理片段预测值168(例如,使片段预测值168相乘,组合片段预测值168),以生成媒体项目预测值169。

在块344,处理设备可以从训练的机器学习模型190获得一个或多个输出。在块346,处理设备可以基于一个或多个输出来确定用于当前媒体项目116的媒体项目预测值169。在一些实现方式中,处理设备可以从一个或多个输出提取媒体项目预测值169将对应于(例如,匹配)所生成的标签164(例如,响应于当前媒体项目116的手动评审而接收的标签164)的置信水平。

图4A-B描绘了根据本公开的实现方式的与预测媒体项目112的评审决策相关联的表400。如本文所使用的,术语“正面评审”(例如,被评定为良好、实际良好、良好评审等)和“负面评审”(被评定为坏的、实际上坏的、不良评审)可以指示标签164或媒体项目112的属性。在一些实现方式中,“负面评审”可以是指示媒体项目112包含某一类型的内容或属性(例如,不适当的、具有技术问题、侵犯他人权利等)的标签,并且“正面评审”可以是指示不存在该类型的内容或属性的标签。在一些实现方式中,媒体项目112可以同时与多个标签相关联。例如,媒体项目112的第一标签可以指示适龄性评级(例如,青少年及以上),媒体项目112的第二标签可以指示媒体项目112适合于特定的广告,媒体项目112的第三标签可以指示特定的技术问题(例如,字幕问题)等。标签可以指示特定类型的内容不适当的(例如,包括一个或多个性内容、暴力或令人厌恶的内容、仇恨或虐待内容、有害的危险行为、虐待儿童、宣扬恐怖主义、垃圾邮件或误导等)、侵犯权利、具有技术问题(例如,字幕问题等)、具有评级(例如,适龄性评级等)、适合于广告等。

图4A描绘根据本公开的实现方式的与媒体项目112(例如,标记媒体项目114)的标签164相关联的表400A。媒体项目112可能已被手动评审以被指派标签164。如表400A中所描绘的,手动评审导致标签164指示媒体项目112的正面评审的概率为79%和媒体项目112的负面评审的概率为21%。正面评审可以指示媒体项目不包含不适当的内容或不具有技术问题。负面评审可以指示媒体项目包含不适当的内容或具有技术问题。尽管本文使用了术语“正面评审”和“负面评审”以及术语“内容类型”,但应理解,本公开适用于媒体项目112的任何类型的标签。

手动评审可以是部分准确的。例如,在手动评审期间,可以评审媒体项目112的一个或多个部分,并且可以不评审媒体项目112的一个或多个其他部分(例如,抽查媒体项目112的部分,略读媒体项目112等)。不同的用户可以提供用于同一媒体项目112的不同标签。例如,对于挑逗性舞蹈的标签,第一用户可以认为媒体项目112中的舞蹈不够挑逗,不值得获得负面评审标签,并且第二用户可以认为媒体项目112中的舞蹈足够挑逗,值得获得负面评审标签。

实际准确性可以由管理员(例如,执行初始手动评审的用户的主管)的手动评审来确定。如表400A中所描绘,实际值导致标签164指示媒体项目112的正面评审的概率为76%(例如,实际上是正面的,管理员将指派正面评审标签),以及媒体项目112的负面评审的概率为24%(例如,实际上是负面的,管理员将指派负面评审标签)。来自表400A的值可以用于计算媒体项目预测值169。

表400A中的实际百分比可以用实际数据(可用时)代替。表400A中的值可以随着分布的变化而定期地更新。表400A中的值可能具有近期性偏向(例如,媒体项目112的较新评审可能比媒体项目112的不太新的评审权重更大)。

图4B描绘根据本公开的实现方式的示出预测媒体项目112的评审决策的表400B。

如本文论述,可以使用等式来计算片段预测值168。当前媒体项目116的第一片段214A可以是类似于具有“正面评审”标签的第一标记媒体项目114A的对应第一片段,并且当前媒体项目116的第二片段214B可以是类似于具有“负面评审”标签的第二标记媒体项目114B的对应第二片段。基于类似于具有“正面评审”标签(例如,来自良好评审的良好)的标记媒体项目114A,当前媒体项目116的片段具有“正面评审”标签的概率可以由第一等式表示:

x*(1-y)

基于类似于具有“正面评审”标签(例如,来自良好评审的良好)的标记媒体项目114A,当前媒体项目116的片段具有“负面评审”标签的概率可以由第二等式表示:

(1-x)*y

片段预测值168可以基于图3A的块306中描述的第一和第二等式来计算。

图5是示出根据本公开的实现方式的计算机系统的一个实现方式的框图。在特定实现方式中,计算机系统500可以连接(例如,经由网络,诸如局域网(LAN)、内联网、外联网或因特网)到其他计算机系统。计算机系统500可以在客户端-服务器环境中以服务器或客户端计算机的身份操作,或者在对等型或分布式网络环境中作为对等计算机操作。计算机系统500可以由个人计算机(PC)、平板型PC、机顶盒(STB)、个人数字助理(PDA)、蜂窝式电话、web设备、服务器、网络路由器、交换机或网桥或能够执行指定该设备要采取的动作的一组指令(顺序的或以其他方式)的任何设备来提供。此外,术语“计算机”应包括单独或共同执行一组(或多组)指令以执行本文描述的任一种或多种方法的任何计算机集合。

在另一方面,计算机系统500可以包括处理设备502、易失性存储器504(例如,随机存取存储器(RAM))、非易失性存储器506(例如,只读存储器(ROM)或电可擦除可编程ROM(EEPROM))和数据存储设备516,它们可以经由总线508相互通信。

处理设备502可以由一个或多个处理器提供,诸如通用处理器(诸如,例如,复杂指令集计算(CISC)微处理器、精简指令集计算(RISC)微处理器、超长指令字(VLIW)微处理器、实现其他类型的指令集的微处理器、或实现组合类型的指令集的微处理器)或专用处理器(诸如,例如,专用集成电路(ASIC)、现场可编程门阵列(FPGA)、数字信号处理器(DSP)或网络处理器)。

计算机系统500可以还包括网络接口设备522。计算机系统500还可以包括视频显示单元510(例如,LCD)、字母数字输入设备512(例如,键盘)、光标控制设备514(例如,鼠标)和信号生成设备520。

在一些实现方式中,数据存储设备516可以包括非暂时性计算机可读存储介质524,其上可以存储对本文描述的任何一个或多个方法或功能进行编码的指令526,包括对图1的预测管理器132进行编码并用于实现方法300、320、340或360中的一个或多个的指令。

指令526也可以在由计算机系统500执行期间完全或部分地驻留在易失性存储器504和/或处理设备502内,因此,易失性存储器504和处理设备502也可以构成机器可读存储介质。

虽然计算机可读存储介质524在说明性示例中被展示为单个介质,但术语“计算机可读存储介质”应包括存储一组或多组可执行指令的单个介质或多个介质(例如,集中式或分布式数据库,和/或相关联的高速缓存和服务器)。术语“计算机可读存储介质”还应包括任何有形介质,该介质能够存储或编码一组指令用于由计算机执行,以使得该计算机执行本文描述的方法中的任一个或多个。术语“计算机可读存储介质”应包括,但不限于,固态存储器、光学介质和磁性介质。

本文描述的方法、组件和特征可以由离散硬件组件来实现,或者可以集成在诸如ASICS、FPGA、DSP或类似设备的其他硬件组件的功能性中。另外,方法、组件和特征可以由硬件设备内的固件模块或功能电路来实现。此外,方法、组件和特征可以在硬件设备和计算机程序组件的任何组合中实现,或者在计算机程序中实现。

除非特别说明,否则诸如“识别”、“处理”、“生成”、“计算”、“处理”、“确定”、“防止”、“允许”、“使得”、“调整”、“训练”、“调谐”等术语指的是由计算机系统执行或实现的动作和过程,该计算机系统将计算机系统寄存器和存储器内表示为物理(电子)量的数据操纵和变换成类似地表示为计算机系统存储器或寄存器或其他此类信息存储、传输或显示设备内的物理量的其他数据。此外,如本文所使用的术语“第一”、“第二”、“第三”、“第四”等是指用于区分不同元件的标签,并且根据它们的数字名称可能没有序数意义。

本文描述的示例还涉及用于执行本文描述的方法的装置。该装置可以被专门构造用于执行本文描述的方法,或者它可以包括由存储在计算机系统中的计算机程序选择性编程的通用计算机系统。此类计算机程序可以存储在计算机可读有形存储介质中。

本文描述的方法和说明性示例并不固有地与任何特定的计算机或其他装置相关。根据本文描述的教示,可以使用各种通用系统,或者可以证明构造更专用的装置来执行方法300、320、340和360和/或它们各自的功能、例程、子例程或操作是方便的。在以上的描述中阐述了各种这些系统的结构的示例。

以上描述旨在是说明性而非限制性的。尽管已参考具体的说明性示例和实现方式描述了本公开,但是将认识到,本公开不限于所述的示例和实现方式。本公开的范围应当参考以下权利要求以及权利要求所授权的等同物的全部范围来确定。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号