公开/公告号CN112559679A
专利类型发明专利
公开/公告日2021-03-26
原文格式PDF
申请/专利权人 北京易标智科技有限公司;
申请/专利号CN202011308025.X
申请日2020-11-19
分类号G06F16/33(20190101);G06F16/332(20190101);G06F16/35(20190101);G06F16/953(20190101);G06Q50/18(20120101);
代理机构11619 北京辰权知识产权代理有限公司;
代理人刘广达
地址 100089 北京市海淀区地锦路7号院14号楼三层301(C-157)
入库时间 2023-06-19 10:24:22
技术领域
本发明涉及新媒体技术领域,特别涉及一种政法新媒体传播力的检测方法、装置、设备及存储介质。
背景技术
近几年来,随着互联网技术以及5G技术的迅猛发展,各种媒体传播渠道不断涌现,如微信公众号、微博、抖音、今日头条等新媒体,相比传统媒体,新媒体的传播更加侧重与受众的互动,如点赞、评论、转发等。
而在当前的政法领域里,衡量和评价媒体宣传部门还是以传统媒体的衡量标准为主,如发文数量、阅读量等,传统方法的数据来源以各部门上报为主,数据的实时性和客观性存在很大的问题,而且针对新媒体更强调互动性的特点,没有具体的量化指标,因此,传统媒体的传播力指标体系已经无法用于衡量新媒体的传播力。
发明内容
本公开实施例提供了一种政法新媒体传播力的检测方法、装置、设备及存储介质。为了对披露的实施例的一些方面有一个基本的理解,下面给出了简单的概括。该概括部分不是泛泛评述,也不是要确定关键/重要组成元素或描绘这些实施例的保护范围。其唯一目的是用简单的形式呈现一些概念,以此作为后面的详细说明的序言。
第一方面,本公开实施例提供了一种政法新媒体传播力的检测方法,包括:
获取待检测政府部门的新媒体数据;
将新媒体数据输入预先训练的政法新闻分类模型,得到政法新媒体数据;
根据政法新媒体数据计算政法新媒体的传播力。
在一个实施例中,获取待检测政府部门的新媒体数据之后,还包括:
对新媒体数据的文本进行分词处理以及向量化处理,得到向量化后的文本数据;
采用TF-IDF算法抽取向量化后的文本数据中的关键词。
在一个实施例中,将新媒体数据输入预先训练的政法新闻分类模型之前,还包括:
获取已标注的政法领域新闻语料库;
对新闻语料库中的文本数据进行分词处理以及向量化处理,得到向量化后的文本数据;
采用TF-IDF算法抽取向量化后的文本数据的关键词;
根据关键词训练政法新闻分类模型。
在一个实施例中,根据政法新媒体数据计算政法新媒体的传播力,包括:
根据新媒体数据中的发布数、阅读数、影响力、点赞数、粉丝数、评论数以及政法相关数计算政法新媒体的传播力。
在一个实施例中,根据政法新闻分类模型获取的政法新媒体的文章数量得到政法相关数。
在一个实施例中,计算影响力,包括:
获取政法新媒体数据中待计算的文章以及预设时间段内采集的所有新闻文章;
计算待计算的文章与采集的所有新闻文章的相似度;
将相似度大于预设阈值的新闻文章加入相似文章列表;
根据相似文章列表中的文章数量得到影响力数值。
第二方面,本公开实施例提供了一种政法新媒体传播力的检测装置,包括:
获取模块,用于获取待检测政府部门的新媒体数据;
分类模块,用于将新媒体数据输入预先训练的政法新闻分类模型,得到政法新媒体数据;
计算模块,用于根据政法新媒体数据计算政法新媒体的传播力。
第三方面,本公开实施例提供了一种政法新媒体传播力的检测设备,其特征在于,包括处理器和存储有程序指令的存储器,处理器被配置为在执行程序指令时,执行上述实施例提供的政法新媒体传播力的检测方法。
第四方面,本公开实施例提供了一种计算机可读介质,其特征在于,其上存储有计算机可读指令,计算机可读指令可被处理器执行以实现上述实施例提供的一种政法新媒体传播力的检测方法。
本公开实施例提供的技术方案可以包括以下有益效果:
根据本公开实施例提供的政法新媒体传播力的检测方法,采集多个新媒体渠道发布的稿件及受众行为数据等客观数据,量化分析数据,对政府部门的新媒体传播力进行检测,大大提高了检测结果的实时性、准确性以及客观性。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本发明。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。
图1是根据一示例性实施例示出的一种政法新媒体传播力的检测方法的流程示意图;
图2是根据一示例性实施例示出的一种训练政法新闻分类模型方法的流程示意图;
图3是根据一示例性实施例示出的一种政法新闻分类模型运行方法的流程示意图;
图4是根据一示例性实施例示出的一种影响力计算方法的流程示意图;
图5是根据一示例性实施例示出的一种政法新媒体传播力的检测装置的结构示意图;
图6是根据一示例性实施例示出的一种政法新媒体传播力的检测设备的结构示意图;
图7是根据一示例性实施例示出的一种计算机存储介质的示意图。
具体实施方式
为了能够更加详尽地了解本公开实施例的特点与技术内容,下面结合附图对本公开实施例的实现进行详细阐述,所附附图仅供参考说明之用,并非用来限定本公开实施例。在以下的技术描述中,为方便解释起见,通过多个细节以提供对所披露实施例的充分理解。然而,在没有这些细节的情况下,一个或一个以上实施例仍然可以实施。在其它情况下,为简化附图,熟知的结构和装置可以简化展示。
下面将结合附图1-附图4,对本申请实施例提供的政法新媒体传播力的检测方法进行详细介绍。
参见图1,该方法具体包括以下步骤。
S101获取待检测政府部门的新媒体数据。
在一个示例性场景中,需要检测政府某部门的新媒体传播力,首先获取该部门在预设时间段内已发布的新媒体数据。例如,获取该部门在一个月内已发布的新媒体数据。
其中,新媒体数据可以包括微信数据、微博数据、抖音数据、今日头条数据等媒体数据。
S102将新媒体数据输入预先训练的政法新闻分类模型,得到政法新媒体数据。
在一种可能的实现方式中,获取到的新媒体数据可能不是与政法相关的新媒体数据,因此,首先将获取到的新媒体数据输入预先训练的政法新闻分类模型,得到与政法领域相关的新媒体数据。
具体地,对获取到的新媒体数据的文本进行分词处理以及向量化处理,得到向量化后的文本数据,采用TF-IDF算法计算每个词的逆文档频率,根据逆文档频率抽取向量化后的文本数据中的关键词,并将关键词输入预先训练的政法新闻分类模型,得到与政法领域相关的媒体数据。
图3是根据一示例性实施例示出的一种政法新闻分类模型运行方法的流程示意图,如图3所示,首先加载训练好的政法新闻分类模型,然后获取文本数据,对文本进行分词处理以及向量化处理,得到向量化后的文本数据,采用TF-IDF算法抽取向量化后的文本数据中的关键词,将关键词输入分类模型进行分类,得到与政法领域相关的新媒体数据,并保存分类结果。
在一个示例性场景中,将新媒体数据输入预先训练的政法新闻分类模型之前,还包括训练政法新闻分类模型。
具体地,获取已标注的政法领域新闻语料库,在一种可能的实现方式中,利用爬虫技术从微信公众号、今日头条等新媒体平台抓取了政法类相关语料,经过格式处理、去重等预处理操作后得到43774篇文章,将这些文章进行人工标注,得到涉政类1875篇,公安类6647篇,检察类8404篇,法院类8720篇,司法类8021篇,政法类7301篇,其他类2806篇。
对新闻语料库中的文本数据进行分词处理以及向量化处理,得到向量化后的文本数据,采用TF-IDF算法抽取向量化后的文本数据的关键词,根据关键词训练政法新闻分类模型。
图2是根据一示例性实施例示出的一种训练政法新闻分类模型方法的流程示意图,如图2所示,首先获取训练文本数据,也就是标注好的政法新闻语料库,然后对语料库中的文本进行分词处理、向量化处理,采用TF-IDF算法抽取向量化后的文本数据的关键词,根据关键词训练政法新闻分类模型,并利用验证集验证,若分类模型满足要求,则停止训练,保存训练好的分类模型。
根据该步骤,可以获得与政法领域相关的新媒体数据。
S103根据政法新媒体数据计算政法新媒体的传播力。
为了适应新媒体的形式特点,本公开实施例根据新媒体数据中的发布数、阅读数、影响力、点赞数、粉丝数、评论数以及政法相关数计算政法新媒体的传播力。
在一种可能的实现方式中,新媒体数据可以包括微信数据、微博数据、抖音数据、今日头条数据。
其中,微信数据包括文章发布数、发布次数、平均阅读数、最高阅读数、影响力、平均点赞数、最高点赞数、政法相关数。微博数据包括微博发布数、原创微博数、粉丝数、转发数、评论数、平均点赞数、最高点赞数。抖音数据包括发布数、粉丝数、评论数、分享数、平均点赞数、最高点赞数。今日头条数据包括发布数、粉丝数、阅读数、评论数、平均点赞数、最高点赞数、政法相关数。
通常,用户会在微信和今日头条上发表文章,为了获取发表的与政法领域相关的文章的个数,因此设立了政法相关数。在一种可能的实现方式中,根据政法新闻分类模型获取的与政法领域相关的文章数量就是政法相关数。
例如,公安部门可以根据分类模型获取与公安相关的稿件,检察院可以根据分类模型获取与检察院相关的稿件,法院可以获取与法院相关的稿件。
通常,微信文章和头条文章没有转发量,还有一些文章没有标注来源,为了得知政府部门发出的某篇文章的影响力,需要计算出该篇文章的转发量。
图4是计算文章影响力的示意图,如图4所示,计算文章的影响力包括:获取政法新媒体数据中待计算的文章以及预设时间段内采集的所有新闻文章,对获取到的文章进行预处理,包括利用自然语言处理技术对获取的文章进行分词,进行特征词抽取,形成文本的特征参数,然后计算待计算的文章与采集的网络上所有的新闻文章的相似度,将相似度大于预设阈值的网络新闻文章加入相似文章列表,根据相似文章列表中的文章数量得到影响力数值。根据该步骤,可以获取到网络上流传的与政府部门发出的文章相似的文章,进而得到政府部门发出的文章的转发量,也就是政府部门发出的文章的影响力。
进一步地,根据上述政法新媒体数据,计算新媒体的传播力。在一种可能的实现方式中,分别计算出微信传播力、微博传播力、抖音传播力以及今日头条传播力,根据预设的微信传播力、微博传播力、抖音传播力以及今日头条传播力的权重计算出政法新媒体的传播力。
具体地,微信传播力N
其中,N
其中,权重的选取满足规范化条件:
微博传播力N
N
其中,权重的选取满足规范化条件:
抖音传播力N
其中,N
其中,权重的选取满足规范化条件:
今日头条传播力N
其中,N
其中,权重的选取满足规范化条件:
得到微信传播力、微博传播力、抖音传播力、今日头条传播力之后,根据预设的权重计算该政府部门的新媒体数据传播力NCI:
NCI=w
同样,权重也满足归一化条件:
本领域技术人员可自行设置各个传播渠道的权重,本公开实施例不做具体限制。根据该步骤,可以计算出待检测政府部门的新媒体传播力。若需对多个部门的新媒体传播力进行排序,可依据该方法分别计算出各个部门的新媒体传播力。
根据本公开实施例提供的政法新媒体传播力的检测方法,采集多个新媒体渠道发布的稿件及受众行为数据等客观数据,对政府部门的新媒体传播力进行检测,大大提高了检测结果的实时性、准确性以及客观性。
本公开实施例还提供一种政法新媒体传播力的检测装置,该装置用于执行上述实施例的政法新媒体传播力的检测方法,如图5所示,该装置包括:
获取模块501,用于获取待检测政府部门的新媒体数据;
分类模块502,用于将新媒体数据输入预先训练的政法新闻分类模型,得到政法新媒体数据;
计算模块503,用于根据政法新媒体数据计算所述政法新媒体的传播力。
需要说明的是,上述实施例提供的政法新媒体传播力的检测装置在执行政法新媒体传播力的检测方法时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将设备的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的政法新媒体传播力的检测装置与政法新媒体传播力的检测方法实施例属于同一构思,其体现实现过程详见方法实施例,这里不再赘述。
第三方面,本公开实施例还提供一种与前述实施例所提供的政法新媒体传播力的检测方法对应的电子设备,以执行上述政法新媒体传播力的检测方法。
请参考图6,其示出了本申请的一些实施例所提供的一种电子设备的示意图。如图6所示,电子设备包括:处理器600,存储器601,总线602和通信接口603,处理器600、通信接口603和存储器601通过总线602连接;存储器601中存储有可在处理器600上运行的计算机程序,处理器600运行计算机程序时执行本申请前述任一实施例所提供的政法新媒体传播力的检测方法。
其中,存储器601可能包含高速随机存取存储器(RAM:Random Access Memory),也可能还包括非不稳定的存储器(non-volatile memory),例如至少一个磁盘存储器。通过至少一个通信接口603(可以是有线或者无线)实现该系统网元与至少一个其他网元之间的通信连接,可以使用互联网、广域网、本地网、城域网等。
总线602可以是ISA总线、PCI总线或EISA总线等。总线可以分为地址总线、数据总线、控制总线等。其中,存储器601用于存储程序,处理器600在接收到执行指令后,执行程序,前述本申请实施例任一实施方式揭示的政法新媒体传播力的检测方法可以应用于处理器600中,或者由处理器600实现。
处理器600可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器600中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器600可以是通用处理器,包括中央处理器(Central Processing Unit,简称CPU)、网络处理器(Network Processor,简称NP)等;还可以是数字信号处理器(DSP)、专用集成电路(ASIC)、现成可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本申请实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器601,处理器600读取存储器601中的信息,结合其硬件完成上述方法的步骤。
本申请实施例提供的电子设备与本申请实施例提供的政法新媒体传播力的检测方法出于相同的发明构思,具有与其采用、运行或实现的方法相同的有益效果。
第四方面,本申请实施例还提供一种与前述实施例所提供的政法新媒体传播力的检测方法对应的计算机可读存储介质,请参考图7,其示出的计算机可读存储介质为光盘700,其上存储有计算机程序(即程序产品),计算机程序在被处理器运行时,会执行前述任意实施例所提供的政法新媒体传播力的检测方法。
需要说明的是,计算机可读存储介质的例子还可以包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他光学、磁性存储介质,在此不再一一赘述。
本申请的上述实施例提供的计算机可读存储介质与本申请实施例提供的政法新媒体传播力的检测方法出于相同的发明构思,具有与其存储的应用程序所采用、运行或实现的方法相同的有益效果。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。
机译: 用于检测可再充电电池的内部信息的检测方法,用于检测可再充电电池的内部信息的检测设备,应用了所述检测方法的设备,包括所述检测设备的设备以及其中存储了所述检测方法的软件程序的存储介质。储存的
机译: 边缘检测方法,装置和程序,存储介质以及帧检测方法,装置和程序,存储介质
机译: 活性检测方法和装置,电子设备,存储介质和相关系统使用活性检测方法