首页> 中国专利> 一种文章实时排名方法、装置、终端及存储介质

一种文章实时排名方法、装置、终端及存储介质

摘要

本发明公开一种文章实时排名方法,包括以下步骤:获取用户对每个文章的实时投票数;计算赞成票占投票数的比例,得到每个文章的好评率;根据预设的规则通过投票数计算好评率的置信区间;比较每个文章的置信区间的下限值大小,并按照大小顺序对相应的文章进行实时排名。本发明提供的文章实时排名方法,通过首先计算赞成票占总票数的好评率,然后根据总票数的数量来计算好评率的置信区间,通过置信区间的下限值来进行多个文章的实时排名。从而使得文章的好评率能够针对样本数量进行修正,提升了文章实时排名的合理性。

著录项

  • 公开/公告号CN113051411A

    专利类型发明专利

  • 公开/公告日2021-06-29

    原文格式PDF

  • 申请/专利权人 深圳市华球通网络有限公司;

    申请/专利号CN202110156231.1

  • 发明设计人 任涛;

    申请日2021-02-04

  • 分类号G06F16/38(20190101);G06F16/9538(20190101);

  • 代理机构44611 深圳市广诺专利代理事务所(普通合伙);

  • 代理人祝晶

  • 地址 518000 广东省深圳市龙华区龙华街道玉翠社区清泉北路合发投资大厦1302

  • 入库时间 2023-06-19 11:39:06

说明书

【技术领域】

本发明涉及互联网技术领域,尤其涉及一种文章实时排名方法、装置、终端及存储介质。

【背景技术】

在现阶段的互联网中,每时每刻都充斥着大量的信息发布与流转,这其中,如何保留有价值、有热度的文章则成为了各个论坛管理需要解决的问题。例如,在某论坛中,设置一个热度榜,将某个时间段的最热门或者最有话题度的文章进行实时展示,便于更多的人参与讨论。因此,如何根据用户的投票(例如点赞/点踩等)来确定每个文章的评分进而对文章进行合理化的排名是个值得探讨的问题。

现有的排名方式中,有的是采用赞成票与反对票的差值来进行排名,但是这样对于总票数高但赞成票与反对票接近的辩论性高的文章来说,得分会很低进而排名很低;还有的是按照赞成票占总票数的比例来进行排名,但是这样对于总票数很低的文章来说,单个投票所占的权重太大,不符合正常的排名逻辑。

鉴于此,实有必要提供一种文章实时排名方法、装置、终端及存储介质以克服上述缺陷。

【发明内容】

本发明的目的是提供一种文章实时排名方法、装置、终端及存储介质,旨在改善现有的论坛中文章实时排名的处理逻辑不够合理的问题。

为了实现上述目的,本发明第一方面提供一种文章实时排名方法,包括以下步骤:

获取用户对每个文章的实时投票数;其中,所述投票数包括赞成票与反对票;

计算所述赞成票占投票数的比例,得到所述每个文章的好评率;

根据预设的规则通过所述投票数计算所述好评率的置信区间;

比较所述每个文章的所述置信区间的下限值大小,并按照大小顺序对相应的文章进行实时排名。

在一个优选实施方式中,所述根据预设的规则通过所述投票数计算所述好评率的置信区间步骤中包括以下步骤:

通过预设的区间计算公式计算所述置信区间;区间计算公式如下:

其中,n为投票数,P为好评率,z为预设的置信水平的统计量。

在一个优选实施方式中,还包括步骤:

获取所述每个文章的发表时间与当前时间;

计算所述每个文章的发表时长;

根据所述发表时长通过预设的规则对所述置信区间进行衰减因子赋值,获得新的置信区间。

本发明还提供一种文章实时排名装置,包括:

投票数获取模块,用于获取用户对每个文章的实时投票数;其中,所述投票数包括赞成票与反对票;

好评率计算模块,用于计算所述赞成票占投票数的比例,得到所述每个文章的好评率;

区间计算模块,用于根据预设的规则通过所述投票数计算所述好评率的置信区间;

排名比较模块,用于比较所述每个文章的所述置信区间的下限值大小,并按照大小顺序对相应的文章进行实时排名。

在一个优选实施方式中,所述区间计算模块还包括:

区间计算单元,用于通过预设的区间计算公式计算所述置信区间;区间计算公式如下:

其中,n为投票数,P为好评率,z为预设的置信水平的统计量。

在一个优选实施方式中,还包括:

时间获取模块,用于获取所述每个文章的发表时间与当前时间;

时长计算模块,用于计算所述每个文章的发表时长;

因子赋值模块,用于根据所述发表时长通过预设的规则对所述置信区间进行衰减因子赋值,获得新的置信区间。

本发明第三方面提供了一种终端,所述终端包括存储器、处理器以及存储在所述存储器并可在所述处理器上运行的文章实时排名程序,所述文章实时排名程序被所述处理器执行时实现如上述实施方式中任一项所述的文章实时排名方法的各个步骤。

本发明第四方面提供了一种计算机可读存储介质,所述计算机可读存储介质存储有文章实时排名程序,所述文章实时排名程序被处理器执行时实现如上述实施方式任一项所述的文章实时排名方法的各个步骤。

本发明提供的文章实时排名方法,通过首先计算赞成票占总票数的好评率,然后根据总票数的数量来计算好评率的置信区间,通过置信区间的下限值来进行多个文章的实时排名。对于好评率接近的文章来说,当总票数大时,则置信区间较窄,下限值会比较大;如果总票数小,则置信区间较宽,下限值比较小,从而使得文章的好评率能够针对样本数量进行修正,提升了文章实时排名的合理性。

【附图说明】

为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。

图1为本发明提供的文章实时排名方法的流程图;

图2为图1所示文章实时排名方法中另一实施例的流程图;

图3为本发明提供的文章实时排名装置的框架图;

图4为图3所示文章实时排名装置中另一实施例的框架图。

【具体实施方式】

为了使本发明的目的、技术方案和有益技术效果更加清晰明白,以下结合附图和具体实施方式,对本发明进行进一步详细说明。应当理解的是,本说明书中描述的具体实施方式仅仅是为了解释本发明,并不是为了限定本发明。

还应当理解,在此本发明说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本发明。如在本发明说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。

还应当进一步理解,在本发明说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。

在本发明的实施例中,第一方面提供一种文章实时排名方法,用于对于论坛、商城等互联网社区的文章进行热度或者好评率的排名,从而筛选出有讨论价值的文章,促进互联网社区的有序发展。其中,文章包括但不限于互联网社区的讨论帖、回答内容、商品等可由参与用户进行投票的事物。

如图1所示,文章实时排名方法包括以下步骤S11-S14。

步骤S11,获取用户对每个文章的实时投票数;其中,投票数包括赞成票与反对票。

在本步骤中,当一篇文章发表在论坛时,同步启动所有用户对于该文章的投票机制(例如点赞/点踩、好评/差评、赞成/反对等),然后实时或者每隔较短时间获取该文章的投票数,并进行统计。其中,每个用户的投票都是独立事件,且投票时只有两个选择。

步骤S12,计算赞成票占投票数的比例,得到每个文章的好评率。

具体的,投票数为赞成票加上反对票,从而通过计算赞成票在总的投票数中的比例,来确定文章的好评率。举例来说,如果投票总人数为n,其中赞成票为k,那么赞成票的比例p就等于k/n。

步骤S13,根据预设的规则通过投票数计算好评率的置信区间。

需要说明的是,好评率p越大,就代表这个文章的好评比例越高,越应该排在前面。但是,好评率p的可信性,取决于有多少人投票,如果样本太小,则好评率p的可信度就不高。因此,可通过计算出好评率的置信区间。置信区间是指由样本统计量所构造的总体参数的估计区间。在统计学中,一个概率样本的置信区间(Confidence interval)是对这个样本的某个总体参数的区间估计,即展现的是这个参数的真实值有一定概率落在测量结果的周围的程度。通常而言,置信水平可取95%,当然也可根据具体的需要进行相应的调整。

具体的,通过预设的区间计算公式计算置信区间;区间计算公式如下:

其中,n为投票数,P为好评率,z为预设的置信水平的统计量。能够理解的是,z为一个常数,可通过查表或同级软件包得到。一般情况下,在95%置信水平下,z统计量的值为1.96。

可以看到,当n的值足够大时,这个下限值会趋向100%;如果n非常小(投票人很少),这个下限值会很小,从而起到了降低"赞成票比例"的作用,使得该文章的得分变小、排名下降。

当然,在其他实施例中,对于投票数较大的文章,还可以采用正太区间进行计算,来得到某一置信水平下的好评率p的置信区间。

步骤S14,比较每个文章的置信区间的下限值大小,并按照大小顺序对相应的文章进行实时排名。具体的,通过对置信区间的下限值大小进行比较,从而来对每个文章进行实时排名,从而将好评率高且可信度高的文章尽可能的提高排名名次,促进互联网社区的有序发展。

进一步的,在一个实施例中,如图2所示,本方法还包括步骤S15-S17。

步骤S15,获取每个文章的发表时间与当前时间。即,当某个文章发表之后,会定时的统计该文章的发表时间,便于后续的根据文章的新旧程度赋予不同的权重,进而使得新文章有机会与旧文章进行竞争,获得更靠前的排名,促进互联网社区新旧文章的更新换代。

步骤S16,计算每个文章的发表时长。其中,文章的发表时长即为当前时间减去发表时间。当然,在实际的计算过程中,可采用多个单位时间段的处理方式,当计算多出的时长并未超出某一单位时间段时,则还是按照上一时间段的时长来进行统计,从而降低计算量。

步骤S17,根据发表时长通过预设的规则对置信区间进行衰减因子赋值,获得新的置信区间。

在本步骤中,可设置多个时间区间,每个时间区间设置相应的衰减因子。例如,按照天数进行时间区间划分,1-3天的衰减因子为0.9,4-7天的衰减因子为0.7,8-15天的衰减因子为0.3等,从而按照发表时长对置信区间进行相应的修正,促进社区新旧文章的更新换代。

综上所述,本发明提供的文章实时排名方法,通过首先计算赞成票占总票数的好评率,然后根据总票数的数量来计算好评率的置信区间,通过置信区间的下限值来进行多个文章的实时排名。对于好评率接近的文章来说,当总票数大时,则置信区间较窄,下限值会比较大;如果总票数小,则置信区间较宽,下限值比较小,从而使得文章的好评率能够针对样本数量进行修正,提升了文章实时排名的合理性。

本发明还提供一种文章实时排名装置100,用于对于论坛、商城等互联网社区的文章进行热度或者好评率的排名,从而筛选出有讨论价值的文章,促进互联网社区的有序发展。需要说明的是,文章实时排名装置100的实现原理及实施方式与上述的文章实时排名方法相一致,故以下不再赘述。

如图3所示,文章实时排名装置100包括:

投票数获取模块10,用于获取用户对每个文章的实时投票数;其中,投票数包括赞成票与反对票;

好评率计算模块20,用于计算赞成票占投票数的比例,得到每个文章的好评率;

区间计算模块30,用于根据预设的规则通过投票数计算好评率的置信区间;

排名比较模块40,用于比较每个文章的置信区间的下限值大小,并按照大小顺序对相应的文章进行实时排名。

进一步的,区间计算模块30还包括:

区间计算单元,用于通过预设的区间计算公式计算置信区间;区间计算公式如下:

其中,n为投票数,P为好评率,z为预设的置信水平的统计量。

进一步的,在一个实施例中,如图4所示,文章实时排名装置100还包括:

时间获取模块50,用于获取每个文章的发表时间与当前时间;

时长计算模块60,用于计算每个文章的发表时长;

因子赋值模块70,用于根据发表时长通过预设的规则对置信区间进行衰减因子赋值,获得新的置信区间。

本发明第三方面提供了一种终端(图中未示出),终端包括存储器、处理器以及存储在存储器并可在处理器上运行的文章实时排名程序,文章实时排名程序被处理器执行时实现如上述实施方式中任一项所述的文章实时排名方法的各个步骤。

本发明第四方面提供了一种计算机可读存储介质(图中未示出),计算机可读存储介质存储有文章实时排名程序,文章实时排名程序被处理器执行时实现如上述实施方式任一项所述的文章实时排名方法的各个步骤。

所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本申请的保护范围。上述系统中单元、模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。

在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。

本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及方法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。

在本发明所提供的实施例中,应该理解到,所揭露的系统或装置/终端设备和方法,可以通过其它的方式实现。例如,以上所描述的系统或装置/终端设备实施例仅仅是示意性的,例如,所述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口,装置或单元的间接耦合或通讯连接,可以是电性,机械或其它的形式。

另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。

本发明并不仅仅限于说明书和实施方式中所描述,因此对于熟悉领域的人员而言可容易地实现另外的优点和修改,故在不背离权利要求及等同范围所限定的一般概念的精神和范围的情况下,本发明并不限于特定的细节、代表性的设备和这里示出与描述的图示示例。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号