首页> 中国专利> 内容生态指数分割阈值的确定方法、装置、设备和介质

内容生态指数分割阈值的确定方法、装置、设备和介质

摘要

本发明实施例公开了一种内容生态指数分割阈值的确定方法、装置、设备和介质。该方法包括:获取目标时间段内每个目标品类按照预设周期统计的各内容生态指数以及与内容生态指数分别匹配的至少一种关系指数;根据各个目标品类的内容生态指数确定内容生态指数分割初始阈值;根据内容生态指数分割初始阈值对每个目标品类的每个内容生态指数进行分类标记,并根据内容生态指数和至少一种关系指数对每个目标品类的每个内容生态指数进行聚类标记;如果分类标记结果与聚类标记结果的匹配率低于预设阈值,则对内容生态指数分割初始阈值进行优化,以得到内容生态指数分割目标阈值。上述技术方案提高了内容生态指数分割阈值的精准性。

著录项

  • 公开/公告号CN113032628A

    专利类型发明专利

  • 公开/公告日2021-06-25

    原文格式PDF

  • 申请/专利权人 广州虎牙科技有限公司;

    申请/专利号CN202110358072.3

  • 发明设计人 李雪雪;

    申请日2021-04-01

  • 分类号G06F16/75(20190101);G06F16/78(20190101);

  • 代理机构11332 北京品源专利代理有限公司;

  • 代理人孟金喆

  • 地址 511400 广东省广州市番禺区钟村街(汉溪商业中心)泽溪街13号1301

  • 入库时间 2023-06-19 11:35:49

说明书

技术领域

本发明实施例涉及数据处理技术领域,尤其涉及一种内容生态指数分割阈值的确定方法、装置、设备和介质。

背景技术

内容生态指数,以品类粒度为最小的研究对象,通过刻画品类生态的多样性来反映其内容健康度。以直播业务为例,品类生态的多样性可以体现在品类不同价值的主播离散度。其中,内容生态指数越大表明内容生态越健康。

通常,可以使用内容生态指数分割阈值来标识内容生态指数知否表明内容生态健康。因此,如何提高内容生态指数分割阈值的精准性是亟待解决的问题。

发明内容

本发明实施例提供一种内容生态指数分割阈值的确定方法、装置、设备和介质,以提高内容生态指数分割阈值的精准性。

第一方面,本发明实施例提供了一种内容生态指数分割阈值的确定方法,包括:

获取目标时间段内每个目标品类按照预设周期统计的各内容生态指数以及与所述内容生态指数分别匹配的至少一种关系指数;其中,所述内容生态指数和所述关系指数用于指示品类质量;

根据各个目标品类的内容生态指数确定内容生态指数分割初始阈值;

根据所述内容生态指数分割初始阈值,对每个目标品类的每个内容生态指数进行分类标记,并根据所述内容生态指数和匹配的所述至少一种关系指数,对每个目标品类的每个内容生态指数进行聚类标记;

如果分类标记结果与聚类标记结果的匹配率低于预设阈值,则对所述内容生态指数分割初始阈值进行优化,以得到内容生态指数分割目标阈值。

第二方面,本发明实施例还提供了一种内容生态指数分割阈值的确定装置,包括:

指数获取模块,用于获取目标时间段内每个目标品类按照预设周期统计的各内容生态指数以及与所述内容生态指数分别匹配的至少一种关系指数;其中,所述内容生态指数和所述关系指数用于指示品类质量;

分割阈值确定模块,用于根据各个目标品类的内容生态指数确定内容生态指数分割初始阈值;

指数标记模块,用于根据所述内容生态指数分割初始阈值,对每个目标品类的每个内容生态指数进行分类标记,并根据所述内容生态指数和匹配的所述至少一种关系指数,对每个目标品类的每个内容生态指数进行聚类标记;

分割阈值优化模块,用于如果分类标记结果与聚类标记结果的匹配率低于预设阈值,则对所述内容生态指数分割初始阈值进行优化,以得到内容生态指数分割目标阈值。

第三方面,本发明实施例还提供了一种计算机设备,所述计算机设备包括:

一个或多个处理器;

存储器,用于存储一个或多个程序,

当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现任意实施例所述的内容生态指数分割阈值的确定方法。

第四方面,本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现任意实施例所述的内容生态指数分割阈值的确定方法。

在本发明实施例提供的技术方案中,在根据获取到的内容生态指数确定内容生态指数分割初始阈值之后,根据由内容生态指数分割初始阈值确定的分类标记以及由内容生态指数和关系指数确定的聚类标记,判断内容生态指数分割初始阈值的合理性,据此对内容生态指数分割初始阈值进行优化,以提高内容生态指数分割阈值的精准性。在上述技术方案中,采用逆向思维根据由内容生态指数分割阈值确定的分类标记结果以及相应的聚类结果来判断生态指数分割阈值的合理性,能够避免正向给出生态指数分割阈值比较主观的问题,以此使最终得到的内容生态指数分割目标阈值能够将好坏内容生态的品类清晰地分割开。

附图说明

图1是本发明实施例一提供的一种内容生态指数分割阈值的确定方法的流程图;

图2是本发明实施例二提供的一种内容生态指数分割阈值的确定方法的流程图;

图3是本发明实施例三提供的一种内容生态指数分割阈值的确定方法的流程图;

图4是本发明实施例四提供的一种内容生态指数分割阈值的确定装置的模块结构示意图;

图5是本发明实施例五提供的一种计算机设备的结构示意图。

具体实施方式

下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于述,附图中仅示出了与本发明相关的部分而非全部结构。

在更加详细地讨论示例性实施例之前应当提到的是,一些示例性实施例被描述成作为流程图描绘的处理或方法。虽然流程图将各项操作(或步骤)描述成顺序的处理,但是其中的许多操作可以被并行地、并发地或者同时实施。此外,各项操作的顺序可以被重新安排。当其操作完成时所述处理可以被终止,但是还可以具有未包括在附图中的附加步骤。所述处理可以对应于方法、函数、规程、子例程、子程序等等。

实施例一

图1是本发明实施例一提供的一种内容生态指数分割阈值的确定方法的流程图,本实施例可适用于确定内容生态指数分割阈值以用于对各品类内容生态进行评价的情况,例如可以是确定内容生态指数分割阈值用于对各直播业务品类内容生态进行评价的情况,该方法可以由本发明任意实施例提供的内容生态指数分割阈值的确定装置来执行,该装置可由硬件和/或软件组成,并一般可集成在计算机设备。

如图1所示,本实施例提供的内容生态指数分割阈值的确定方法,包括以下步骤:

S110、获取目标时间段内每个目标品类按照预设周期统计的各内容生态指数以及与所述内容生态指数分别匹配的至少一种关系指数。

目标时间段,指的是与确定内容生态指数分割初始阈值的预设时间区间对应的任意时间段。假设,预设时间区间可以是半年区间,则目标时间段可以是与半年区间对应的任意时间段,例如可以是与半年区间对应的上半年时间段或者下半年时间段。

品类,是与业务领域相关的,以直播领域为例,品类可以指的是直播间,例如可以是游戏类直播间、娱乐类直播间等。其中,每个游戏直播间、每个娱乐直播间都可以称之为一个品类。

在本实施例中,目标品类可以是指任意一种品类,也可以是指对业务涉及的所有品类进行筛选后得到的任意一种品类,例如可以是内容生态指数(如月度内容生态指数)大于预设值(例如1)的任意一种品类。

其中,所述内容生态指数和所述关系指数用于指示品类质量,也即都是用于指示品类质量优劣的指数。内容生态指数,通过刻画品类生态的多样性来反映其内容健康度,内容生态指数越大表明内容生态越健康;关系指数,通过刻画品类的其他方面来反映品类质量,例如可以是通过刻画用户留存率来反映品类质量(或平台质量)等。在本实施例中,关系指数的类型可以是一个或多个,可以是反映品类质量的不同方面,也可以是反映品类质量的同一方面的不同表现形式。

可选的,内容生态指数和关系指数都是通过预设的模型根据相关数据分析确定的,本实施例对内容生态指数和关系指数的生成方式不作具体限定。

预设周期,指的是生成内容生态指数的周期,例如可以是月度周期,也即每月统计一次各品类的内容生态指数。相应的,针对每个品类的每个内容生态指数,均存在匹配的至少一种关系指数。以月度内容生态指数为例,对应存在匹配的至少一种关系指数,如月日均关系指数等。

若目标时间段为与半年区间对应的时间段,预设周期为月度周期,则一般情况下针对每个目标品类可以获取到六个内容生态指数,每个内容生态指数均对应于至少一种关系指数。

S120、根据各个目标品类的内容生态指数确定内容生态指数分割初始阈值。

针对获取到的各个目标品类的各个内容生态指数,确定一个内容生态指数分割初始阈值,用于对每个目标品类的每个内容生态指数进行分类标记,区分内容生态的好坏。

例如,针对获取到的各个目标品类的各个内容生态指数,可以将根据正态分布的阈值原理确定的阈值作为内容生态指数分割初始阈值。

作为一种可选的实施方式,可以将根据各个目标品类的内容生态指数确定内容生态指数分割初始阈值,具体为:

确定各个目标品类的内容生态指数中的最大生态指数和最小生态指数;将处于所述最大生态指数和所述最小生态指数之间且使生态指数类间距方差值最大的生态指数作为所述内容生态指数分割初始阈值。

其中,最大生态指数和最小生态指数分别指的是获取到的各个目标品类的各个内容生态指数中最大的一个内容生态指数和最小的一个内容生态指数。

在本实施例中,可以将利用OTSU(大律法)算法的思想确定出的一个阈值作为内容生态指数分割初始阈值。

假设存在内容生态指数分割初始阈值将获取到的各个目标品类的各个内容生态指数分为两类,第一类中的内容生态指数小于内容生态指数分割初始阈值,第二类的内容生态指数大于内容生态指数分割初始阈值。设这两类中的内容生态指数的均值为m1、m2,获取到的各个目标品类的各个内容生态指数的均值(也即全部内容生态指数的均值)为mG,同时设内容生态指数被分为第一类和第二类的概率分别为p1、p2,因此得出:

p1*m1+p2*m2=mG (1)

p1+p2=1 (2)

根据方差的概念,生态指数类间距方差的表达式为:

σ

将式(1)代入式(3),可得:

σ

按照预设步长遍历最大生态指数r和最小生态指数s之间的生态指数,找出一个使式(4)的值最大化的内容生态指数t,作为内容生态指数分割初始阈值。

其中,

需要指出的是,式(4)还可以进一步变形,首先,内容生态指数t的累加均值m和全部内容生态指数的均值mG分别为:

结合式(6)可以得出:

m1=1/p1*m (10)

m2=1/p2*(mG-m) (11)

将式(10)、(11)代入式(4),得到生态指数类间距方差的另一种表达式为:

因此,按照预设步长遍历最大生态指数r和最小生态指数s之间的生态指数,根据式(5)、(8)、(9)找出一个使式(12)的值最大化的内容生态指数t,即为内容生态指数分割初始阈值。

S130、根据所述内容生态指数分割初始阈值,对每个目标品类的每个内容生态指数进行分类标记,并根据所述内容生态指数和匹配的所述至少一种关系指数,对每个目标品类的每个内容生态指数进行聚类标记。

首先,针对获取到的每个目标品类的每个内容生态指数,根据内容生态指数分割初始阈值对其进行分类标记。其中,若内容生态指数小于内容生态指数分割初始阈值,则其分类标记可以为第一类(内容生态较差),例如使用“0”进行标记;若内容生态指数大于内容生态指数分割初始阈值,则其分类标记可以为第二类(内容生态较好),例如使用“1”进行标记。

其次,针对获取到的每个目标品类的每个内容生态指数,根据内容生态指数和匹配的至少一种关系指数,对其进行聚类标记。其中,在对内容生态指数键聚类标记时,不仅依据内容生态指数值,还依据对其匹配的一种或多种关系指数,综合确定内容生态指数的聚类标记。

在对内容生态指数键聚类标记时,聚类算法不同,聚类的数量也不同。其中,根据聚类算法的差异,可以分别确定与相应聚类算法相适应的聚类标记与分类标记之间的匹配关系,以便于后续对分类标记和聚类标记进行对比。

需要指出的是,分类标记和聚类标记的统计周期均是上述提到的预设周期。

作为一种可选的实施方式,根据所述内容生态指数和匹配的所述至少一种关系指数,对每个目标品类的每个内容生态指数进行聚类标记,可以具体为:

使用所述内容生态指数和与所述内容生态指数匹配的至少一种关系指数构建按照预设周期统计的多维指数向量;利用层次聚类算法对各个所述多维指数向量进行二聚类,并根据聚类结果为每个内容生态指数进行聚类标记。

针对获取到的每个目标品类的每个内容生态指数,将该内容生态指数和与其匹配的至少一种关系指数构建多维指数向量。假设获取的与内容生态指数匹配的关系指数的类型只有一种,则可以使用该内容生态指数和与其匹配的关系指数构建二维指数向量。进一步的,若预设周期为月度周期,则构建的为月度二维指数向量,进而聚类标记也为月度聚类标记。

然后,可以利用层次聚类算法对构建的各个多维指数向量进行二聚类处理,得到两个聚类,此时也可以称之为第一类(内容生态较差)和第二类(内容生态较好),并对两个聚类内内容生态指数分别进行聚类标记,例如也利用“0”和“1”分别标识第一类聚类标记和第二类聚类标记。

其中,在利用层次聚类算法得到的两个聚类之后,至于哪个聚类是第一类,哪个聚类是第二类,可以依据聚类中包括的特殊品类来确定。例如,某个目标品类(例如内容生态指数最高的目标品类)明显属于内容生态较好的第二类,则可以将其所在的聚类确定为第二类。

S140、如果分类标记结果与聚类标记结果的匹配率低于预设阈值,则对所述内容生态指数分割初始阈值进行优化,以得到内容生态指数分割目标阈值。

将每个目标品类的每个内容生态指数的分类标记结果和聚类标记结果进行对比,如果匹配率低于预设阈值(如85%),则确定需要对内容生态指数分割初始阈值进行优化。

其中,可以通过控制匹配率最大化的方式来不断优化内容生态指数分割初始阈值,一般匹配率需要控制在85%以上。

如果分类标记结果与聚类标记结果的匹配率大于等于预设阈值,则可以将此时的内容生态指数分割初始阈值作为内容生态指数分割目标阈值。

值得指出的是,由于确定的内容生态指数分割初始阈值是与目标时间段匹配的,所以统计的分类标记结果与聚类标记结果的匹配率可以也是目标时间段内的。

进一步的,还可以对连续的多个目标时间段内的内容生态指数的分类标记结果和聚类标记结果进行对比,确定在连续的多个目标时间段内的匹配率,如果匹配率低于预设阈值,则对所述连续的多个目标时间段内的内容生态指数分割初始阈值进行优化,直至相应的匹配率大于等于预设阈值。此时,可以将连续的多个目标时间段内的内容生态指数分割初始阈值分别对应作为内容生态指数分割目标阈值。

在本发明实施例提供的技术方案中,在根据获取到的内容生态指数确定内容生态指数分割初始阈值之后,根据由内容生态指数分割初始阈值确定的分类标记以及由内容生态指数和关系指数确定的聚类标记,判断内容生态指数分割初始阈值的合理性,据此对内容生态指数分割初始阈值进行优化,以提高内容生态指数分割阈值的精准性。在上述技术方案中,采用逆向思维根据由内容生态指数分割阈值确定的分类标记结果以及相应的聚类结果来判断生态指数分割阈值的合理性,能够避免正向给出生态指数分割阈值比较主观的问题,以此使最终得到的内容生态指数分割目标阈值能够将好坏内容生态的品类清晰地分割开。

实施例二

图2是本发明实施例二提供的一种内容生态指数分割阈值的确定方法的流程图,本实施例在上述实施例的基础上进行具体化,其中,在得到内容生态指数分割目标阈值之后,还可以包括:

利用轮廓系数对所述内容生态指数分割目标阈值进行检验,以确定所述内容生态指数分割目标阈值的分割效果。

如图2所示,本实施例提供的内容生态指数分割阈值的确定方法,包括以下步骤:

S210、获取目标时间段内每个目标品类按照预设周期统计的各内容生态指数以及与所述内容生态指数分别匹配的至少一种关系指数。

S220、根据各个目标品类的内容生态指数确定内容生态指数分割初始阈值。

S230、根据所述内容生态指数分割初始阈值,对每个目标品类的每个内容生态指数进行分类标记,并根据所述内容生态指数和匹配的所述至少一种关系指数,对每个目标品类的每个内容生态指数进行聚类标记。

S240、如果分类标记结果与聚类标记结果的匹配率低于预设阈值,则对所述内容生态指数分割初始阈值进行优化,以得到内容生态指数分割目标阈值。

作为一种可选的实施方式,可以将对所述内容生态指数分割初始阈值进行优化具体为:对获取的目标时间段内每个目标品类按照预设周期统计的各内容生态指数以及与所述内容生态指数分别匹配的至少一种关系指数进行筛选;根据筛选后的各个目标品类的内容生态指数重新确定内容生态指数分割初始阈值。

在本实施方式中,若分类标记结果与聚类标记结果的匹配率低于预设阈值,则可以对当前确定内容生态指数分割初始阈值的由各个目标品类的各内容生态指数以及与所述内容生态指数分别匹配的至少一种关系指数构成的指数源数据进行调整,删减部分数据后再根据修改后的指数源数据重新确定内容生态指数分割初始阈值。其中,可以在指数源数据中删除一些不可靠的内容生态指数以及与其匹配的至少一种关系指数,也可以在指数源数据中直接删除一些非重要的目标品类。

进一步的,对获取的目标时间段内每个目标品类按照预设周期统计的各内容生态指数以及与所述内容生态指数分别匹配的至少一种关系指数进行筛选,可以具体为:

根据获取的目标时间段内每个目标品类按照预设周期统计的各内容生态指数以及与所述内容生态指数分别匹配的至少一种关系指数,在所述各个目标品类中确定待剔除品类;在获取的目标时间段内每个目标品类按照预设周期统计的各内容生态指数以及与所述内容生态指数分别匹配的至少一种关系指数中,剔除各个所述待剔除品类的内容生态指数及关系指数。

待剔除品类,指的是在调整由各个目标品类的各内容生态指数以及与所述内容生态指数分别匹配的至少一种关系指数构成的指数源数据时需要剔除的目标品类。

可选的,如果目标时间段内某个目标品类的内容生态指数和/或与内容生态指数匹配的关系指数不完整,则可以将该目标品类作为待剔除品类。例如,目标时间段为与半年区间对应的时间段,目标品类的内容生态指数是按照月度周期统计的,则目标品类在目标时间段内的月度内容生态指数应该为六个,若小于六个,则可以确定目标品类的内容生态指数不完整,将该目标品类作为待剔除品类。再例如,假设获取的关系指数的类型为多种,若与内容生态指数匹配的关系指数只有一种,则也可确定目标品类与内容生态指数匹配的关系指数不完整,将该目标品类作为待剔除品类。

可选的,如果连续多个目标时间段内某个目标品类的内容生态指数和/或与内容生态指数匹配的关系指数不完整,则可以将该目标品类作为待剔除品类。例如,针对连续的多个目标时间段进行内容生态指数分割阈值分析,则可以判断在这连续的多个目标时间段内是否存在内容生态指数和/或与内容生态指数匹配的关系指数不完整的目标品类,若存在,则可以将其作为待剔除品类。

在确定待剔除品类之后,则可以在当前为了确定内容生态指数分割初始阈值而获取的目标时间段内每个目标品类的各内容生态指数以及与所述内容生态指数分别匹配的至少一种关系指数中,将与待剔除品类相关的内容生态指数及关系指数剔除,进而可以在指数剔除后重新获取目标时间段内每个目标品类的各内容生态指数以及与所述内容生态指数分别匹配的至少一种关系指数中,执行S210-S240的操作,以得到内容生态指数分割目标阈值。

在本实施方式中,通过调整为了执行内容生态指数分割阈值的确定方法而获取的指数源数据,提高了指数源数据的数据质量,据此确定的内容生态指数分割阈值的精准性也会提高。

作为另一种可选的实施方式,在利用OTSU算法的思想确定内容生态指数分割初始阈值时,对所述内容生态指数分割初始阈值进行优化,可以具体为:

确定各个目标品类的内容生态指数中的最大生态指数和最小生态指数;对所述最大生态指数和最小生态指数进行扰动,得到生态指数扰动上界和生态指数扰动下界;将处于所述生态指数扰动上界和所述生态指数扰动下界之间且使生态指数类间距方差值最大的生态指数重新作为所述内容生态指数分割初始阈值。

对内容生态指数分割初始阈值进行优化时,也可以对在利用OTSU算法的思想确定内容生态指数分割初始阈值时所遍历的内容生态指数区间进行扰动,加大生态指数区间,也即对各个目标品类的内容生态指数中的最大生态指数和最小生态指数进行扰动,增加最大生态指数(原生态指数上界)得到生态指数扰动上界,减小最小生态指数(原生态指数下界)得到生态指数扰动下界。

其中,在对最大生态指数和最小生态指数进行扰动时,可以根据预设步长确定扰动幅度,例如扰动幅度为预设步长的n倍。

进而,按照预设步长遍历生态指数扰动上界和生态指数扰动下界之间的生态指数,找到使生态指数类间距方差值最大的生态指数重新作为所述内容生态指数分割初始阈值,继续执行S230-S240的操作,以得到内容生态指数分割目标阈值。

在本实施方式中,通过对在利用OTSU算法的思想确定内容生态指数分割初始阈值时所遍历的内容生态指数区间进行区间范围扰动,扩大了用于确定内容生态指数分割初始阈值的内容生态指数遍历范围,使所有目标品类的内容生态指数可能被分类标记为同一类,能够避免必将内容生态指数分类标记为两类的主观误区,以此进一步提高了内容生态指数分割阈值的精准性。

S250、利用轮廓系数对所述内容生态指数分割目标阈值进行检验,以确定所述内容生态指数分割目标阈值的分割效果。

在得到内容生态指数分割目标阈值之后,可以利用轮廓系数(SilhouetteCoefficient)对内容生态指数分割目标阈值的分隔效果进行检验。

其中,轮廓系数是聚类效果好坏的一种评价方式。在本实施例中,输入各目标品类的各内容生态指数以及根据内容生态指数分割目标阈值确定的相应分类标记,即可计算得到轮廓系数。如果计算得到的轮廓系数大于0,则表明内容生态指数分割目标阈值的分割效果是合理的。当轮廓系数越接近于,则表明内容生态指数分割目标阈值的分割效果越好。

本实施例未尽详细解释之处请参见前述实施例,在此不再赘述。

上述技术方案中,使用轮廓系数对内容生态指数分割目标阈值进行检验,进一步采用逆向思维对内容生态指数分割目标阈值的分割效果进行评估,以此保证了内容生态指数分割目标阈值用于分辨品类内容生态好坏的有效性。

实施例三

图3是本发明实施例三提供的一种内容生态指数分割阈值的确定方法的流程图。本实施例在前述实施例的基础上提供了一种具体的实施方式。

如图3所示,本实施例提供的内容生态指数分割阈值的确定方法,包括以下步骤:

S310、获取目标时间段内每个目标品类的各月度内容生态指数以及月日均关系指数。

其中,目标时间可以是与半年区间对应的时间段,如2019.01-2019.06。

可选的,目标品类的各月度内容生态指数大于1。

S320、确定各个目标品类的月度内容生态指数中的最大生态指数和最小生态指数。

S330、将处于最大生态指数和最小生态指数之间且使生态指数类间距方差值最大的生态指数作为内容生态指数分割初始阈值。

S340、根据内容生态指数分割初始阈值,对每个目标品类的每个月度内容生态指数进行分类标记。

S350、使用月度内容生态指数和月日均关系指数构建月度二维指数向量,利用层次聚类算法对各个月度二维指数向量进行二聚类,并根据聚类结果为每个月度内容生态指数进行聚类标记。

S360、如果分类标记结果与聚类标记结果的匹配率低于预设阈值,则对所述内容生态指数分割初始阈值进行优化,以得到内容生态指数分割目标阈值。

可选的,在对所述内容生态指数分割初始阈值进行优化时,根据获取的目标时间段内每个目标品类各月度内容生态指数以及月日均关系指数,在所述各个目标品类中确定待剔除品类;在获取的目标时间段内每个目标品类各月度内容生态指数以及月日均关系指数中,剔除各个所述待剔除品类的月内容生态指数及关系指数;根据筛选后的各个目标品类的月度内容生态指数重新确定内容生态指数分割初始阈值。

其中,待剔除品类可以是在目标时间段内月度内容生态指数不完整的目标品类;待剔除品类可以是在连续多个目标时间段内月度内容生态指数不完整的目标品类。例如,连续多个目标时间段可以是2019.01-2019.06、2019.07-2019.12、2020.01-2020.06、2020.07-2020.12。

可选的,在对所述内容生态指数分割初始阈值进行优化时,确定各个目标品类的月度内容生态指数中的最大生态指数和最小生态指数;对所述最大生态指数和最小生态指数进行扰动,得到生态指数扰动上界和生态指数扰动下界;将处于所述生态指数扰动上界和所述生态指数扰动下界之间且使生态指数类间距方差值最大的月度生态指数重新作为所述内容生态指数分割初始阈值。

在本步骤中,统计的分类标记结果与聚类标记结果的匹配率可以是目标时间段内的,也可以是连续的多个目标时间段内的。通过控制频率最大化的方式对内容生态指数分割初始阈值进行优化,直至得到使分类标记结果与聚类标记结果的匹配率大于预设阈值(如85%)的内容生态指数分割初始阈值,并将其作为内容生态指数分割目标阈值。

S370、利用轮廓系数对所述内容生态指数分割目标阈值进行检验,以确定所述内容生态指数分割目标阈值的分割效果。

本实施例未尽详细解释之处请参见前述实施例,在此不再赘述。

上述技术方案中,首先通过正向思维确定出内容生态指数分割阈值,然后采用逆向思维根据由内容生态指数分割阈值确定的分类标记结果以及相应的聚类结果对内容生态指数分割阈值进行评估及检验,能够避免正向给出生态指数分割阈值比较主观的问题,以保证内容生态指数分割阈值用于分辨品类内容生态好坏的准确性及有效性。

实施例四

图4是本发明实施例四提供的一种内容生态指数分割阈值的确定装置的模块结构示意图,本实施例可适用于确定内容生态指数分割阈值以用于对各品类内容生态进行评价的情况,例如可以是确定内容生态指数分割阈值用于对各直播业务品类内容生态进行评价的情况,该装置可以采用软件和/或硬件的方式实现,并一般可集成在计算机设备中。

如图4所示,该装置具体包括:指数获取模块410、分割阈值确定模块420、指数标记模块430和分割阈值优化模块440。其中,

指数获取模块410,用于获取目标时间段内每个目标品类按照预设周期统计的各内容生态指数以及与所述内容生态指数分别匹配的至少一种关系指数;其中,所述内容生态指数和所述关系指数用于指示品类质量;

分割阈值确定模块420,用于根据各个目标品类的内容生态指数确定内容生态指数分割初始阈值;

指数标记模块430,用于根据所述内容生态指数分割初始阈值,对每个目标品类的每个内容生态指数进行分类标记,并根据所述内容生态指数和匹配的所述至少一种关系指数,对每个目标品类的每个内容生态指数进行聚类标记;

分割阈值优化模块440,用于如果分类标记结果与聚类标记结果的匹配率低于预设阈值,则对所述内容生态指数分割初始阈值进行优化,以得到内容生态指数分割目标阈值。

在本发明实施例提供的技术方案中,在根据获取到的内容生态指数确定内容生态指数分割初始阈值之后,根据由内容生态指数分割初始阈值确定的分类标记以及由内容生态指数和关系指数确定的聚类标记,判断内容生态指数分割初始阈值的合理性,据此对内容生态指数分割初始阈值进行优化,以提高内容生态指数分割阈值的精准性。在上述技术方案中,采用逆向思维根据由内容生态指数分割阈值确定的分类标记结果以及相应的聚类结果来判断生态指数分割阈值的合理性,能够避免正向给出生态指数分割阈值比较主观的问题,以此使最终得到的内容生态指数分割目标阈值能够将好坏内容生态的品类清晰地分割开。

可选的,上述装置还包括:分割阈值检测模块,用于在得到内容生态指数分割目标阈值之后,利用轮廓系数对所述内容生态指数分割目标阈值进行检验,以确定所述内容生态指数分割目标阈值的分割效果。

可选的,分割阈值确定模块420,具体用于确定各个目标品类的内容生态指数中的最大生态指数和最小生态指数;将处于所述最大生态指数和所述最小生态指数之间且使生态指数类间距方差值最大的生态指数作为所述内容生态指数分割初始阈值。

可选的,指数标记模块430,具体用于使用所述内容生态指数和与所述内容生态指数匹配的至少一种关系指数构建按照预设周期统计的多维指数向量;利用层次聚类算法对各个所述多维指数向量进行二聚类,并根据聚类结果为每个内容生态指数进行聚类标记。

作为一种可选的实施方式,分割阈值优化模块440,具体用于对获取的目标时间段内每个目标品类按照预设周期统计的各内容生态指数以及与所述内容生态指数分别匹配的至少一种关系指数进行筛选;根据筛选后的各个目标品类的内容生态指数重新确定内容生态指数分割初始阈值。

进一步的,分割阈值优化模块440,具体用于根据获取的目标时间段内每个目标品类按照预设周期统计的各内容生态指数以及与所述内容生态指数分别匹配的至少一种关系指数,在所述各个目标品类中确定待剔除品类;在获取的目标时间段内每个目标品类按照预设周期统计的各内容生态指数以及与所述内容生态指数分别匹配的至少一种关系指数中,剔除各个所述待剔除品类的内容生态指数及关系指数。

作为另一种可选的实施方式,分割阈值优化模块440,具体用于确定各个目标品类的内容生态指数中的最大生态指数和最小生态指数;对所述最大生态指数和最小生态指数进行扰动,得到生态指数扰动上界和生态指数扰动下界;将处于所述生态指数扰动上界和所述生态指数扰动下界之间且使生态指数类间距方差值最大的生态指数重新作为所述内容生态指数分割初始阈值。

本发明实施例所提供的内容生态指数分割阈值的确定装置可执行本发明任意实施例所提供的内容生态指数分割阈值的确定方法,具备执行方法相应的功能模块和有益效果。

实施例五

图5是本发明实施例五提供的一种计算机设备的结构示意图,如图5所示,该计算机设备包括处理器50、存储器51、输入装置52和输出装置53;计算机设备中处理器50的数量可以是一个或多个,图5中以一个处理器50为例;计算机设备中的处理器50、存储器51、输入装置52和输出装置53可以通过总线或其他方式连接,图5中以通过总线连接为例。

存储器51作为一种计算机可读存储介质,可用于存储软件程序、计算机可执行程序以及模块,如本发明实施例中的内容生态指数分割阈值的确定方法对应的程序指令/模块(例如,图4中内容生态指数分割阈值的确定装置中的指数获取模块410、分割阈值确定模块420、指数标记模块430和分割阈值优化模块440)。处理器50通过运行存储在存储器51中的软件程序、指令以及模块,从而执行计算机设备的各种功能应用以及数据处理,即实现上述的内容生态指数分割阈值的确定方法。

存储器51可主要包括存储程序区和存储数据表区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序;存储数据表区可存储根据计算机设备的使用所创建的数据等。此外,存储器51可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实例中,存储器51可进一步包括相对于处理器50远程设置的存储器,这些远程存储器可以通过网络连接至计算机设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

输入装置52可用于接收输入的数字或字符信息,以及产生与计算机设备的用户设置以及功能控制有关的键信号输入。输出装置53可包括显示屏等显示设备。

实施例六

本发明实施例六还提供一种存储有计算机程序的计算机可读存储介质,计算机程序在由计算机处理器执行时用于执行一种内容生态指数分割阈值的确定方法,该方法包括:

获取目标时间段内每个目标品类按照预设周期统计的各内容生态指数以及与所述内容生态指数分别匹配的至少一种关系指数;其中,所述内容生态指数和所述关系指数用于指示品类质量;

根据各个目标品类的内容生态指数确定内容生态指数分割初始阈值;

根据所述内容生态指数分割初始阈值,对每个目标品类的每个内容生态指数进行分类标记,并根据所述内容生态指数和匹配的所述至少一种关系指数,对每个目标品类的每个内容生态指数进行聚类标记;

如果分类标记结果与聚类标记结果的匹配率低于预设阈值,则对所述内容生态指数分割初始阈值进行优化,以得到内容生态指数分割目标阈值。

当然,本发明实施例所提供的存储有计算机程序的计算机可读存储介质,其计算机程序不限于如上的方法操作,还可以执行本发明任意实施例所提供的内容生态指数分割阈值的确定方法中的相关操作。

通过以上关于实施方式的描述,所属领域的技术人员可以清楚地了解到,本发明可借助软件及必需的通用硬件来实现,当然也可以通过硬件实现,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如计算机的软盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(RandomAccess Memory,RAM)、闪存(FLASH)、硬盘或光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例的方法。

值得注意的是,上述内容生态指数分割阈值的确定装置的实施例中,所包括的各个单元和模块只是按照功能逻辑进行划分的,但并不局限于上述的划分,只要能够实现相应的功能即可;另外,各功能单元的具体名称也只是为了便于相互区分,并不用于限制本发明的保护范围。

注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号