首页> 中国专利> 一种文章审核方法及其相关设备

一种文章审核方法及其相关设备

摘要

本申请实施例公开了一种文章审核方法,本申请实施例方法包括:获取用户上传的目标文章及用户为目标文章选择的预设标签;使用训练完成的机器学习系统对目标文章进行处理,获得目标文章所对应的目标标签,判断所述目标标签与所述预设标签是否一致;根据判断结果发布所述目标文章。本申请实施例具有以下优点:本方案在获取到用户为目标文章选择的标签后使用机器学习系统对文章进行处理,并基于机器学习系统处理得到的结果与用户预先选择的标签之间的关系发布该文章,使得文章发布不仅依赖于用户所设置的预设标签,进而避免由用户所选择的标签不准确,所导致的文章分类错误,提高文章的阅读体验。

著录项

  • 公开/公告号CN113836443A

    专利类型发明专利

  • 公开/公告日2021-12-24

    原文格式PDF

  • 申请/专利权人 土巴兔集团股份有限公司;

    申请/专利号CN202111145679.X

  • 发明设计人 王国彬;牟锟伦;卢铄波;原帅;

    申请日2021-09-28

  • 分类号G06F16/9536(20190101);G06K9/62(20060101);G06N20/00(20190101);G06Q50/00(20120101);

  • 代理机构44615 广东普罗米修律师事务所;

  • 代理人晏凯洁

  • 地址 518000 广东省深圳市南山区西丽街道西丽社区兴科一街万科云城一期七栋A座3501研发用房

  • 入库时间 2023-06-19 13:49:36

说明书

技术领域

本申请属于计算机技术领域,尤其涉及一种文章审核方法及其相关设备。

背景技术

一篇文章如果想在网络媒体上发布时,往往需要确定这篇文章的分类,并基于文章的类别信息发表在网络媒体的相应版面,以便用户可以直接通过不同的版面得到自己所需要的信息,提高用户的信息获取效率。

现有技术中用户发布一篇文章时,为保证文章及时通过审核并被其他公众所获取,往往需要自己设置文章所对应的标签,标签即表示文章所属的分类,当网络媒体运营者接收到该文章时可依据标签直接发布至相应的版面。

然而这一文章发布方式由用户所选择的标签可能不够准确,容易导致文章分类错误,影响文章阅读体验。

发明内容

本发明的目的在于提供一种文章审核方法旨在解决现有的文章可能出现分类错误,影响文章阅读体验问题。本申请实施例第一方面提供了一种文章审核方法,包括:

获取用户上传的目标文章及所述用户为所述目标文章选择的预设标签;

使用训练完成的机器学习系统对所述目标文章进行处理,获得所述目标文章所对应的目标标签,所述训练完成的机器学习系统为依据多篇历史文章及所述历史文章对应的标签训练获得;

判断所述目标标签与所述预设标签是否一致;

根据判断结果发布所述目标文章。

基于本申请实施例第一方面提供的文章审核方法,可选的,所述根据判断结果发布所述目标文章,包括:

若所述目标标签与所述预设标签一致,则依据所述目标标签发布所述目标文章;

若所述目标标签与所述预设标签不一致,则将所述目标文章转为人工审核,并依据所述人工审核的审核结果发布所述目标文章。

基于本申请实施例第一方面提供的文章审核方法,可选的,所述依据所述目标标签发布所述目标文章,包括:

确定所述目标标签对应的热度;

依据所述热度发布所述目标文章。

基于本申请实施例第一方面提供的文章审核方法,可选的,所述根据判断结果发布所述目标文章之后,所述方法还包括:

调整所述目标文章对应的标签。

基于本申请实施例第一方面提供的文章审核方法,可选的,所述获取用户上传的目标文章及所述用户为所述目标文章选择的预设标签,之前,所述方法还包括:

验证所述用户的身份信息。

基于本申请实施例第一方面提供的文章审核方法,可选的,所述预设标签包括:室内材料、室外材料、家用电器中的一种或多种。

本申请实施例第二方面提供了一种文章审核设备,包括:

获取单元,所述获取单元用于获取用户上传的目标文章及所述用户为所述目标文章选择的预设标签;

处理单元,所述处理单元用于使用训练完成的机器学习系统对所述目标文章进行处理,获得所述目标文章所对应的目标标签;

判断单元,所述判断单元用于判断所述目标标签与所述预设标签是否一致;

发布单元,所述发布单元用于根据判断结果发布所述目标文章。

基于本申请实施例第二方面提供的文章审核设备,可选的,所述发布单元具体用于:

若所述目标标签与所述预设标签一致,则依据所述目标标签发布所述目标文章;

若所述目标标签与所述预设标签不一致,则将所述目标文章转为人工审核,并依据所述人工审核的审核结果发布所述目标文章。

基于本申请实施例第二方面提供的文章审核设备,可选的,所述发布单元具体用于:

确定所述目标标签对应的热度;

依据所述热度发布所述目标文章。

基于本申请实施例第二方面提供的文章审核设备,可选的,所述发布单元还用于:

调整所述目标文章对应的标签。

基于本申请实施例第二方面提供的文章审核设备,可选的,所述获取单元还用于验证所述用户的身份信息。

基于本申请实施例第二方面提供的文章审核设备,可选的,所述预设标签包括:室内材料、室外材料、家用电器中的一种或多种。

本申请实施例第三方面提供了一种文章审核设备,包括:

中央处理器,存储器,输入输出接口,有线或无线网络接口以及电源;

所述存储器为短暂存储存储器或持久存储存储器;

所述中央处理器配置为与所述存储器通信,在所述设备上执行所述存储器中的指令操作以执行本申请实施例第一方面中任意一项所述的方法。

本申请实施例第四方面提供了一种计算机可读存储介质,包括指令,当所述指令在计算机上运行时,使得计算机执行如本申请实施例第一方面中任意一项所述的方法。

本申请实施例第五方面提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行如本申请实施例第一方面中任意一项所述的方法。

从以上技术方案可以看出,本申请实施例具有以下优点:本方案提供了一种文章审核方法,包括:获取用户上传的目标文章及所述用户为所述目标文章选择的预设标签;使用训练完成的机器学习系统对所述目标文章进行处理,获得所述目标文章所对应的目标标签,所述训练完成的机器学习系统为依据多篇历史文章及所述历史文章对应的标签训练获得。判断所述目标标签与所述预设标签是否一致;根据判断结果发布所述目标文章。本方案在获取到用户为目标文章选择的标签后使用机器学习系统对文章进行处理,并基于机器学习系统处理得到的结果与用户预先选择的标签之间的关系发布该文章,使得文章发布不仅依赖于用户所设置的预设标签,进而避免由用户所选择的标签不准确,所导致的文章分类错误,提高文章的阅读体验。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。

图1为本申请所提供的文章审核方法实施例的一个流程示意图;

图2为本申请所提供的文章审核方法实施例的另一个流程示意图;

图3为本申请所提供的文章审核设备实施例的一个结构示意图;

图4为本申请所提供的文章审核设备实施例的另一个结构示意图。

具体实施方式

为了使本技术领域的人员更好地理解本申请方案,下面对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。

本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的实施例能够以除了在这里图示或描述的内容以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

一篇文章如果想在网络媒体上发布时,往往需要确定这篇文章的分类,并基于文章的类别信息发表在网络媒体的相应版面,以便用户可以直接通过不同的版面得到自己所需要的信息,提高用户的信息获取效率。现有技术中用户发布一篇文章时,为保证文章及时通过审核并被其他公众所获取,往往需要自己设置文章所对应的标签,标签即表示文章所属的分类,当网络媒体运营者接收到该文章时可依据标签直接发布至相应的版面。然而这一文章发布方式由用户所选择的标签可能不够准确,容易导致文章分类错误,影响文章阅读体验。

为解决上述问题,本申请提供了一种新的文章审核方法,具体的,请参阅图1,本申请所提供的文章审核方法的一个实施例包括:步骤101-步骤104。

101、获取用户上传的目标文章及所述用户为所述目标文章选择的预设标签。

具体的,本方案可应用于某些架设于服务器上的网络媒体或文章分享网站等,此类网站可架设于本地服务器或云服务器上,网站系统可由java+mysql+vue等技术搭建而成,具体可依据实际情况而定,此处不做限定。使用相应网站时可通过特定界面上传用户所希望分享的文章,一般的此类文章分享网站会对用户所分享的文章进行分类,以便于其他用户通过文章分享网站下的相应分类查询得到自己希望浏览的内容,如对于所有文章可分类为新闻、小说、杂谈等分类,在新闻分类下还可细分为国际新闻、国外新闻等类别,以便于用户基于自身的文章浏览需求进入相应界面进行浏览,具体的分类方式可依据实际情况而定,此处不做限定。

用户所上传的文章即为目标文章,在目标文章上传时为提高文章的发布效率,用户可在上传时为该目标文章选择相应的预设标签,如用户选择发布一篇用于介绍大理石材料的文章,则用户可以相应选择该文章所对应的预设标签为“装修建材”标签,具体的,在设置预设标签时可在网站系统所提供的标签栏中选择,也可自行填入预设标签,预设标签设置方式可依据实际情况而定,此处不做限定。用户将相应的目标文章及预设标签上传至网站系统后,即可执行下一步骤。

102、使用训练完成的机器学习系统对目标文章进行处理,获得目标文章所对应的目标标签。

具体的,使用训练完成的机器学习系统对所述目标文章进行处理,获得所述目标文章所对应的目标标签,所述训练完成的机器学习系统为依据多篇历史文章及所述历史文章对应的标签训练获得。

机器学习系统可为有固定结构的神经网络模型,用于检测所输入的装修案例与历史装修案例之间的相似度,神经网络(neural networks,NN)是由大量的、简单的处理单元(称为神经元)广泛地互相连接而形成的复杂网络系统,它反映了人脑功能的许多基本特征,是一个高度复杂的非线性动力学习系统。对神经网络模型进行训练,以使得训练完成的神经网络模型可以提取出目标文章所对应的标签,具体的可使用历史文章及各个历史文章所对应的标签进行训练进而获得训练完成的机器学习系统,具体的机器学习系统的训练过程可参照现有技术,具体此处不做赘述。基于训练完成的机器学习系统对目标文章进行处理,进而得到该文章对应的目标标签。

103、判断所述目标标签与所述预设标签是否一致。

具体的,判断所述目标标签与所述预设标签是否一致,即判断基于机器学习系统处理所获得的目标标签与用户预先选择的预设标签之间的关系,若二者一致,则说明用户选择的预设标签较为准确,可依据目标标签或预设标签所设置对应的分类进行发布,若目标标签与预设标签不一致,则说明机器学习系统处理的结果或用户预先设置的预设标签二者中某一标签存在错误,需要进行进一步处理。

104、根据判断结果发布所述目标文章。

具体的,根据判断结果发布所述目标文章。如对于基于机器学习系统处理所获得的目标标签与用户预先选择的预设标签二者一致的情况,则可以直接依据目标标签或预设标签所设置对应的分类进行发布,具体的,对于此类情况可确定目标标签所属的文章分类并进行发布,如提取得到的标签为“装修建材”的情况下,则可在文章分享网站下的“装修栏目”发布该目标文章。可以理解的是,在确定目标文章的发布类别后,还可基于目标文章所对应的标签确定其在该分类下的排序,如该目标文章具有的某个标签为热点标签,则确定目标文章在该分类下的排序较高,具体的发布方式可依据实际情况而定,此处不做限定。

若基于机器学习系统处理所获得的目标标签与用户预先选择的预设标签二者不一致的情况,则说明机器学习系统处理的结果或用户预先设置的预设标签二者中某一标签存在错误,需要进行进一步处理。具体的,进一步处理的方式可为采用人工审核的方式对该目标文章进行审核,也可以机器学习系统处理的结果为准发布目标文章,具体的进一步处理的方式可依据实际情况而定,此处不做限定。

从以上技术方案可以看出,本申请实施例具有以下优点:本方案提供了一种文章审核方法,包括:获取用户上传的目标文章及所述用户为所述目标文章选择的预设标签;使用训练完成的机器学习系统对所述目标文章进行处理,获得所述目标文章所对应的目标标签,所述训练完成的机器学习系统为依据多篇历史文章及所述历史文章对应的标签训练获得。判断所述目标标签与所述预设标签是否一致;根据判断结果发布所述目标文章。本方案在获取到用户为目标文章选择的标签后使用机器学习系统对文章进行处理,并基于机器学习系统处理得到的结果与用户预先选择的标签之间的关系发布该文章,使得文章发布不仅依赖于用户所设置的预设标签,进而避免由用户所选择的标签不准确,所导致的文章分类错误,提高文章的阅读体验。

基于上述图1对应的实施例,可选的,本申请还提供了一种可以选择实施的更为详细的实施例,请参阅图2,本申请文章审核方法的一个实施例包括:步骤201-步骤210。

201、验证所述用户的身份信息。

具体的,在发布文章前,可验证用户的身份信息,验证用户是否具有发布文章的权限,如可设置具有特定身份的用户才具有发布文章的权限,在用户发布文章前,则需要对用户的身份信息进行验证,验证用户是否符合特定身份要求。具体的,验证方式可依据实际情况而定,此处不做限定。

202、获取用户上传的目标文章及所述用户为所述目标文章选择的预设标签。

203、使用训练完成的机器学习系统对目标文章进行处理,获得目标文章所对应的目标标签。

204、判断所述目标标签与所述预设标签是否一致。

具体的,上述步骤202至步骤204与前述图1对应实施例中步骤101至步骤103类似,具体此处不做赘述。若目标标签与所述预设标签一致,则执行步骤205,确定所述目标标签对应的热度,若目标标签与所述预设标签不一致,则执行步骤207,将所述目标文章转为人工审核,并依据所述人工审核的审核结果发布所述目标文章。

205、确定所述目标标签对应的热度。

具体的,在目标标签与预设标签一致的情况下,则确定目标文章所对应的目标标签的热度,对于不同的标签可以预先设置不同的热度信息,热度依据网站系统前一段时间的用户活动数据而定,具体的,具有某一标签的文章类别的点击率较高,则可相应设置该标签具有较高热度,对于点击率较低的文章所对应的标签则设置较低热度,具体热度设置方式可依据实际情况而定此处不做限定。

206、依据所述热度发布所述目标文章。

具体的,依据所述热度发布所述目标文章。如提取得到的标签为“装修建材”的情况下,则可在文章分享网站下的“装修栏目”发布该目标文章。在此分类下,若目标文章搜对应的目标标签的热度较高,则设置该文章在“装修栏目”下的排序较高,以便其他用户可以及时获取热点内容,提高用户体验。

207、将所述目标文章转为人工审核,并依据所述人工审核的审核结果发布所述目标文章。

具体的,对于目标标签与所述预设标签不一致,则将所述目标文章转为人工审核,并依据所述人工审核的审核结果发布所述目标文章。人工审核具有较高的准确性,人工审核过程完成后可以得出人工确定的该目标文章所对应的标签,人工确定得到的标签可能与目标标签或预设标签中的任意一个一致,或与二者都不一致,具体依据实际情况而定。人工确定出目标文章所对应的标签后即可依据所确定标签发布该目标文章,具体的文章发布过程可参照步骤205至步骤206类似,具体此处不做赘述。

208、调整所述目标文章对应的标签。

具体的,本步骤在目标文章发布后执行,在目标文章发布后,可能存在用户所选择预设标签与基于机器学习系统所得到的目标标签都存在错误的情况,此时文章已被发布,因此可以人工手动调整目标文章对应的标签,并相应调整文章发布策略,即相应调整文章所属的分类,具体可依据实际情况而定,此处不做限定。

从以上技术方案可以看出,本申请实施例具有以下优点:本方案提供了一种文章审核方法,包括:获取用户上传的目标文章及所述用户为所述目标文章选择的预设标签;使用训练完成的机器学习系统对所述目标文章进行处理,获得所述目标文章所对应的目标标签,所述训练完成的机器学习系统为依据多篇历史文章及所述历史文章对应的标签训练获得。判断所述目标标签与所述预设标签是否一致;根据判断结果发布所述目标文章。本方案在获取到用户为目标文章选择的标签后使用机器学习系统对文章进行处理,并基于机器学习系统处理得到的结果与用户预先选择的标签之间的关系发布该文章,使得文章发布不仅依赖于用户所设置的预设标签,进而避免由用户所选择的标签不准确,所导致的文章分类错误,提高文章的阅读体验。

上述内容对本申请提供的文章审核方法进行了描述,下面对本申请提供的文章审核设备进行描述,请参照图3,本申请提供的文章审核设备的一个实施例包括:

获取单元301,所述获取单元用于获取用户上传的目标文章及所述用户为所述目标文章选择的预设标签;

处理单元302,所述处理单元用于使用训练完成的机器学习系统对所述目标文章进行处理,获得所述目标文章所对应的目标标签;

判断单元303,所述判断单元用于判断所述目标标签与所述预设标签是否一致;

发布单元304,所述发布单元用于根据判断结果发布所述目标文章。

可选的,所述发布单元304具体用于:

若所述目标标签与所述预设标签一致,则依据所述目标标签发布所述目标文章;

若所述目标标签与所述预设标签不一致,则将所述目标文章转为人工审核,并依据所述人工审核的审核结果发布所述目标文章。

可选的,所述发布单元304具体用于:

确定所述目标标签对应的热度;

依据所述热度发布所述目标文章。

可选的,所述发布单元304还用于:

调整所述目标文章对应的标签。

可选的,所述获取单元301还用于验证所述用户的身份信息。

可选的,所述预设标签包括:室内材料、室外材料、家用电器中的一种或多种。

本实施例中,文章审核设备中各单元所执行的流程与前述图1或图2所对应的实施例中描述的方法流程类似,此处不再赘述。

从以上技术方案可以看出,本申请实施例具有以下优点:本方案提供了一种文章审核设备,包括:获取单元301,所述获取单元用于获取用户上传的目标文章及所述用户为所述目标文章选择的预设标签;处理单元302,所述处理单元用于使用训练完成的机器学习系统对所述目标文章进行处理,获得所述目标文章所对应的目标标签;判断单元303,所述判断单元用于判断所述目标标签与所述预设标签是否一致;发布单元304,所述发布单元用于根据判断结果发布所述目标文章。本方案在获取到用户为目标文章选择的标签后使用机器学习系统对文章进行处理,并基于机器学习系统处理得到的结果与用户预先选择的标签之间的关系发布该文章,使得文章发布不仅依赖于用户所设置的预设标签,进而避免由用户所选择的标签不准确,所导致的文章分类错误,提高文章的阅读体验。

图4是本申请实施例提供的一种文章审核设备的结构示意图,该文章审核设备400可以包括一个或一个以上中央处理器(central processing units,CPU)401和存储器405,该存储器405中存储有一个或一个以上的应用程序或数据。

本实施例中,中央处理器401中的具体功能模块划分可以与前述图4中所描述的各单元的功能模块划分方式类似,此处不再赘述。

其中,存储器405可以是易失性存储或持久存储。存储在存储器405的程序可以包括一个或一个以上模块,每个模块可以包括对服务器中的一系列指令操作。更进一步地,中央处理器401可以设置为与存储器405通信,在服务器400上执行存储器405中的一系列指令操作。

文章审核设备400还可以包括一个或一个以上电源402,一个或一个以上有线或无线网络接口403,一个或一个以上输入输出接口404,和/或,一个或一个以上操作系统,例如Windows ServerTM,Mac OS XTM,UnixTM,LinuxTM,FreeBSDTM等。

该中央处理器401可以执行前述图1所示实施例中文章审核方法所执行的操作,具体此处不再赘述。

本申请实施例还提供了一种计算机存储介质,该计算机存储介质用于储存为上述文章审核方法所用的计算机软件指令,其包括用于执行为文章审核方法所设计的程序。

该文章审核方法可以如前述图1或图2中所描述的文章审核方法。

本申请实施例还提供了一种计算机程序产品,该计算机程序产品包括计算机软件指令,该计算机软件指令可通过处理器进行加载来实现上述图1图2中任意一项的文章审核方法的流程。

在本申请所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,电路的等效变换,单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。

以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换或改进等,均应包含在本发明的保护范围之内。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号