公开/公告号CN112711691A
专利类型发明专利
公开/公告日2021-04-27
原文格式PDF
申请/专利权人 深圳市网联安瑞网络科技有限公司;
申请/专利号CN202110025513.8
申请日2021-01-08
分类号G06F16/951(20190101);G06F16/9536(20190101);G06Q50/00(20120101);
代理机构44331 深圳壹舟知识产权代理事务所(普通合伙);
代理人寇闯
地址 518000 广东省深圳市福田区华富街道新田社区深南大道1006号深圳国际创新中心(福田科技广场)D栋七层
入库时间 2023-06-19 10:46:31
技术领域
本发明涉及网络数据信息处理技术领域,尤其涉及一种网络舆情引导效果数据信息处理方法、系统、终端及介质。
背景技术
针对具体事件的舆情引导效果评估在舆情引导和舆情分析等任务中具有重要的作用。传统的效果评估方法包括:社交网络仿真法、舆情威胁态势评估法。社交网络仿真法首先获取与真实物理世界相对应的网络拓扑结构,然后利用网络中心势对网络舆论引导中常见的引导方法进行定量分析。舆情威胁态势评估法首先通过设计指标体系来刻画针对某个事件的网络舆论威胁态势,然后通过引导前后舆论威胁态势的变化来评估引导效果。
通过上述分析,现有技术存在的问题及缺陷为:
(1)利用引导体附近的舆情威胁态势变化情况来评估引导效果,通过舆情态势评估指标体系刻画威胁态势变化情况,但是舆情态势评估指标往往过于简单,分析深度不够,无法准确的、全方位的刻画威胁态势变化情况。
(2)当前方法不支持对具体引导个体在舆情态势变化所起到的具体作用进行分析,因此无法确定是否某个引导主体在舆情引导中发挥了重要作用,从而会导致评估结果不准确,因素考虑不全等问题。
解决以上问题及缺陷的难度为:
(1)如何建立了更加全面的、丰富的网络舆情威胁态势评估指标体系,解决了现有效果评估指标体系分析深度不够、舆论威胁态势变化情况刻画不准确的问题。
(2)如何构建针对事件的传播路径图,并基于传播图构建引导体影响力评估指标体系,以解决现有效果评估技术无法分析引导个体在引导中所发挥的具体作用的问题。
解决以上问题及缺陷的意义为:
本方案创新性地建立更全面的四级网络舆情态势评估指标体系,用以提取更加准确的事件网络舆论威胁态势。并提取事件的传播图特征,基于传播图建立引导体影响力评估指标体系,以用来分析每个引导体在改变舆情态势的过程中是否发挥了重要的作用。本方案提出的方法不仅可以对宏观舆论威胁态势进行评估,而且支持对单个事件主体,较传统方法,极大的提高了精确度。
发明内容
为克服相关技术中存在的问题,本发明公开实施例提供了网络舆情引导效果数据信息处理方法、系统、终端及介质。具体涉及一种基于多维事件特征的网络舆情引导效果数据信息处理方法,本发明目的在于解决怎样建立更加全面,精确的宏观舆情态势评估指标体系,并量化评估引导个体在舆情态势变化中所起到的具体作用。
所述技术方案如下:
根据本发明公开实施例的第一方面,提供一种基于多维事件特征的网络舆情引导效果数据信息处理系统,应用于数据信息处理终端,所述基于多维事件特征的网络舆情引导效果数据信息处理系统包括:
网络舆情态势评估指标体系构建模块,用于建立网络舆情态势评估指标体系、确定各指标计算方法,并计算随着时间变化的网络威胁指数曲线;
事件传播路径图和引导体影响力评估指标体系构建模块,用于建立事件的传播路径图和引导体影响力评估指标体系,构建各指标计算方法,计算引导体在舆情发展过程中的影响力;
引导效果评估数据信息处理模块,用于利用事件的网络舆论态势特征和传播图特征进行引导效果数据信息的评估。
优选地,所述网络舆情态势评估指标体系构建模块包括:
建立网络态势评估指标体系模块,用于构建网络舆论威胁指数评估四级指标体系;
计算随着时间变化的网络威胁指数曲线模块,用于通过网络爬虫技术爬取针对某个事件在微博平台上的相关原帖、转发贴和评论贴。
所述事件传播路径图和引导体影响力评估指标体系构建模块包括:
建立事件的传播路径图和引导体影响力评估指标体系模块,用于根据显式转发关系、评论关系和隐式转发关系构建事件的完整传播路径图,根据传播路径图建立帖子影响力评估指标体系,
各指标计算模块,用于点赞数目、评论数目、转发数目、评论支持比例、转发支持比例、帖子的PageRank值的计算;
计算引导体在舆情发展过程中的影响力模块2-3,用于对每个需要评估影响力的引导贴,利用设计的指标体系和指标计算方法得到帖子的影响力。
根据本发明公开实施例的第二方面,提供一种基于多维事件特征的网络舆情引导效果数据信息处理方法,应用于数据信息处理终端,所述基于多维事件特征的网络舆情引导效果数据信息处理方法包括:
通过建立的多级网络舆情态势评估指标体系,用以提取事件的宏观舆情特征;并提取事件的传播图特征,基于传播图建立引导体影响力评估指标体系,用于分析每个引导体在改变舆情态势的过程中发挥的具体作用。
根据本发明公开实施例的第三方面,提供一种数据信息处理终端,所述数据信息处理终端包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行所述基于多维事件特征的网络舆情引导效果数据信息处理方法。
根据本发明公开实施例的第四方面,提供一种接收用户输入程序存储介质,所存储的计算机程序使电子设备执行执行所述基于多维事件特征的网络舆情引导效果数据信息处理方法。
本发明公开的实施提供的技术方案可以包括以下有益效果:
本发明可对具体引导个体的网络舆情引导效果进行全方位、多角度精准评估。本发明建立全面的四级网络舆情态势评估指标体系,并提取事件的传播图特征,基于传播图建立引导体影响力评估指标体系。不仅可以计算引导个体引导时刻附近网络舆情威胁态势的变化,而且可用来分析每个引导体在改变舆情态势的过程中发挥的具体作用。
传统方法舆情态势评估指标往往考虑不全面,而且无法对具体引导个体对舆情态势变化所起到的具体作用进行分析,本技术方案使之成为可能。
结合实验或试验数据和现有技术对比得到的效果和优点:
现有技术仅仅支持对事件主体引导时刻附近的网络舆情态势进行分析,无法得出具体引导个体起到的作用。通过建立传播图,并建立帖子影响力指标体系可得到每个帖子的影响力,并可筛选出重点账号,较传统方法大大提高了评估精度。
当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。
图1是本发明实施例提供的基于多维事件特征的网络舆情引导效果数据信息处理方法流程图。
图2是本发明实施例提供的基于多维事件特征的网络舆情引导效果数据信息处理方法技术路线框架示意图。
图2中:·表示引导主体的帖子;ο表示帖子;
图3是本发明实施例提供的基于多维事件特征的网络舆情引导效果数据信息处理系统示意图。
图3中:1、网络舆情态势评估指标体系构建模块;1-1、建立网络态势评估指标体系模块;1-2、计算随着时间变化的网络威胁指数曲线模块;2、事件传播路径图和引导体影响力评估指标体系构建模块;2-1、建立事件的传播路径图和引导体影响力评估指标体系模块;2-2、各指标计算模块;2-3、计算引导体在舆情发展过程中的影响力模块;3、引导效果评估数据信息处理模块。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
本发明建立全面的四级网络舆情态势评估指标体系,用以提取事件的宏观舆情特征。并提取事件的传播图特征,基于传播图建立引导体影响力评估指标体系,以用来分析每个引导体在改变舆情态势的过程中发挥的具体作用。
本发明公开实施例所提供的基于多维事件特征的网络舆情引导效果数据信息处理方法中,模型的输入为一个舆情事件的所有相关帖子数据,包括原创贴、转发贴和评论贴。帖子的字段包括:发贴内容、发帖时间、发帖用户id等等。
如图1所示,包括:
S101,建立网络舆情态势评估指标体系、确定各指标计算方法,并计算随着时间变化的网络威胁指数曲线。
S102,建立事件的传播路径图和引导体影响力评估指标体系,设计各指标计算方法,计算引导体在舆情发展过程中的影响力。
S103,利用事件的网络舆论态势特征和传播图特征进行引导效果评估。
具体描述如下:
步骤S101具体包括:
(1)建立网络态势评估指标体系:为了评估网络舆情态势,构建网络舆论威胁指数评估四级指标体系。一级指标为网络威胁指数,二级指标包括:话题倾度、话题危度、话题热度和话题生长度。三级指标包括:倾向分布度、突变度、敏感度、重要度、发帖热度、活跃度、频度、扩散度和飙升度。四级指标包括发帖倾向分布、评论倾向分布、转载倾向分布、话题账户活跃度、重点人物活跃度、评论频率和转发频率。并确定底层指标计算方法如下:
发帖倾向分布=∑(当日话题正面发帖量占比-当日话题负面发帖量占比)*平台权重;
发帖账户倾向分布=∑(当日话题正面发帖账户占比-当日话题负面发帖账户占比)*平台权重;
评论倾向分布=∑(当日话题正面评论占比-当日话题负面评论占比)*平台权重;
转载倾向分布=∑(当日话题正面转载占比-当日话题负面转载占比)*平台权重;
累加符号是针对平台进行累加,平台可以包括Facebook和Twitter等社交平台,也可以包括境内外媒体、组织平台。
敏感度=∑(包含敏感词话题帖子数量/话题帖子数量)*平台权重;
重要度=∑(包含关键词话题帖子数量/话题帖子数量)*平台权重;
累加符号是针对平台进行累加,平台可以包括Facebook和Twitter等社交平台,也可以包括境内外媒体、组织平台。敏感词可以通过目前的开源中文敏感词库获得,关键词可以通过事件主体自定义得到。
发帖热度=∑(当日话题帖子(新闻)数量/近一周话题帖子(新闻)平均数)*平台权重;
活跃度=∑(话题相关的当日活跃账户(重点人物)总量/话题账户(重点人物)总量)*平台权重;
频度=∑(当日话题帖子转发数(评论数)-前日话题帖子转发数(评论数))*平台权重;
累加符号是针对平台进行累加,平台可以包括Facebook和Twitter等社交平台,也可以包括境内外媒体、组织平台。
频度=∑(set(i)∩set(j))/(set(i)+set(j))*平台权重;
飙升度=∑g(tn)-g(tn-1)*平台权重;
最后利用AHP法确定指标各级权重,得到网络舆情威胁指数。
(2)计算随着时间变化的网络威胁指数曲线:通过网络爬虫技术爬取针对某个事件在微博平台上的相关原帖、转发贴和评论贴。根据需要评估的引导时刻,划分事件时间切片,统计每个事件切片内的数据。基于每个时间切片内的事件,利用建立的指标体系计算每个时间片内的网络威胁指数。
步骤S102具体包括:
(1)建立事件的传播路径图和引导体影响力评估指标体系:根据显式转发关系、评论关系和隐式转发关系构建事件的完整传播路径图,根据传播路径图建立帖子影响力评估指标体系,指标体系如图2所示,一级指标是帖子影响力,二级指标包括影响广度和影响程度,影响广度下的三级指标包括:点赞数目、评论数目和转发次数。影响程度下的三级指标包括:评论支持比例、转发支持比例、PageRank值。
(2)设计各指标计算方法:
(2.1)点赞数目:从现有数据字段中直接获取针对引导帖子的点赞数目;
(2.2)评论数目:从现有数据字段中直接获取针对引导帖子的评论数目;
(2.3)转发数目:从现有数据字段中直接获取针对引导帖子的转发次数;
(2.4)评论支持比例:找到与引导帖子相关的评论帖子,利用情感分析算法计算评论帖子中对引导帖子的支持比例。
(2.5)转发支持比例:找到与引导帖子相关的转发贴,利用情感分析算法计算转发帖子中对引导帖子的支持比例。
(2.6)帖子的PageRank值:根据传播路径图,利用PageRank算法计算帖子在传播网络中的重要程度。
并利用设计的加权综合方法得到每个帖子的影响力,以用来评估每个引导体对网情变化所起到的作用。
(3)计算引导体在舆情发展过程中的影响力:对每个需要评估影响力的引导贴,利用设计的指标体系和指标计算方法得到帖子的影响力。
步骤S103综合利用舆情事件的多维度特征进行引导效果评估包括:
利用计算得到的网络舆论威胁指数I_1和I_2之间的差距和引导帖子与附近相关帖子的影响力来综合评判引导体的网络舆情引导效果。
在本发明中,图2是本发明实施例提供的基于多维事件特征的网络舆情引导效果数据信息处理方法技术路线框架示意。图2中:·表示引导主体的帖子;ο表示帖子;
本发明提供的技术方案可在基于网络舆论威胁指数的引导效果评估上应用。
图3是本发明实施例提供的基于多维事件特征的网络舆情引导效果数据信息处理系统。包括:
网络舆情态势评估指标体系构建模块1,用于建立网络舆情态势评估指标体系、确定各指标计算方法,并计算随着时间变化的网络威胁指数曲线。
事件传播路径图和引导体影响力评估指标体系构建模块2,用于建立事件的传播路径图和引导体影响力评估指标体系,设计各指标计算方法,计算引导体在舆情发展过程中的影响力。
引导效果评估数据信息处理模块3,用于利用事件的网络舆论态势特征和传播图特征进行引导效果评估。
所述网络舆情态势评估指标体系构建模块1包括:
建立网络态势评估指标体系模块1-1,用于构建网络舆论威胁指数评估四级指标体系。一级指标为网络威胁指数,二级指标包括:话题倾度、话题危度、话题热度和话题生长度。三级指标包括:倾向分布度、突变度、敏感度、重要度、发帖热度、活跃度、频度、扩散度和飙升度。四级指标包括发帖倾向分布、评论倾向分布、转载倾向分布、话题账户活跃度、重点人物活跃度、评论频率和转发频率。
计算随着时间变化的网络威胁指数曲线模块1-2,用于通过网络爬虫技术爬取针对某个事件在微博平台上的相关原帖、转发贴和评论贴。根据需要评估的引导时刻,划分事件时间切片,统计每个事件切片内的数据。基于每个时间切片内的事件,利用建立的指标体系计算每个时间片内的网络威胁指数。
事件传播路径图和引导体影响力评估指标体系构建模块2具体包括:
建立事件的传播路径图和引导体影响力评估指标体系模块2-1,用于根据显式转发关系、评论关系和隐式转发关系构建事件的完整传播路径图,根据传播路径图建立帖子影响力评估指标体系,指标体系如图2所示,一级指标是帖子影响力,二级指标包括影响广度和影响程度,影响广度下的三级指标包括:点赞数目、评论数目和转发次数。影响程度下的三级指标包括:评论支持比例、转发支持比例、PageRank值。
各指标计算模块2-2,用于点赞数目、评论数目、转发数目、评论支持比例、转发支持比例、帖子的PageRank值的计算。
计算引导体在舆情发展过程中的影响力模块2-3,用于对每个需要评估影响力的引导贴,利用设计的指标体系和指标计算方法得到帖子的影响力。
本领域技术人员在考虑说明书及实践这里公开的公开后,将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由所附的权利要求指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围应由所附的权利要求来限制。
机译: 用于在网络中处理数字数据的效果的方法,系统,效果服务器,用户终端,在其有效处理程序中记录的介质的记录介质,以及在有效服务器和用户终端中处理过程中的记录介质的记录介质
机译: COPY管理系统,存储客户终端信息处理程序中的计算机可读存储介质,存储管理服务器信息处理程序中的计算机可读存储介质,客户机终端信息处理程序,信息处理服务器管理程序客户终端的方法,信息处理方法和管理服务器的信息处理方法
机译: 广告效果测量系统,结算方系统,信息终端,广告效果测量方法,程序和记录介质