公开/公告号CN112685621A
专利类型发明专利
公开/公告日2021-04-20
原文格式PDF
申请/专利权人 深圳市网联安瑞网络科技有限公司;
申请/专利号CN202110012915.4
申请日2021-01-06
分类号G06F16/951(20190101);G06F16/953(20190101);G06F16/9536(20190101);G06Q50/00(20120101);
代理机构44331 深圳壹舟知识产权代理事务所(普通合伙);
代理人寇闯
地址 518000 广东省深圳市福田区华富街道新田社区深南大道1006号深圳国际创新中心(福田科技广场)D栋七层
入库时间 2023-06-19 10:41:48
技术领域
本发明公开涉及网络空间认知技术领域,尤其涉及一种融合舆情风向跟踪及民情预测的网络舆情检测系统与方法。
背景技术
目前关于舆情的定义网络舆情是以互联网为传播平台、以新媒体为传播媒介、以现实事件为基础处对象,以汇聚不同个体外在意见所形成的群体性思想倾向,并不断与现实事件发生有利或者有害的互相影响。
随着互联网的飞速发展,互联网新闻媒体具备了互动性强、开放度高、信息量大等特点,成为了当今网络舆情传播核心媒介。现有网络舆情的研究主要以社交平台与新闻媒体等网站为基础,针对特定主题,挖掘热点事件,并跟踪事件发展的趋势,情感倾向、相关人物、机构、传播路径等,为用户提供情报支撑,帮助其第一时间发现热点事件,并提供处置建议。
现有网络舆情监测系统主要存在以下几个方面的问题:
(1)现有网络舆情监测体系主要是从时间维度出发,发现实时相关的热点议题,但是无法从地域、持分者、国际等多角度监测网络舆情整体的情况,分析维度单一,分析深度不够。
(2)已有的网络舆情监测技术偏向于对已有事件的发现与跟踪,并未考虑民情民意的预测,导致舆情监测仅仅停留在简单的分析层面,无法对计划性事件、未知事件等未来情况进行预测,对舆情研判缺乏有力支撑。
(3)舆情监测的需求时动态变化的,现有舆情分析方法针对特定舆情监测对象分析挖掘维度相对固化,无法实现舆情分析内容的自定义组合,无法满足自动生成情报服务,辅助用户决策。
解决上述技术问题的难度在于:
(1)整体舆情监测体系构建困难,舆情分析维度从时间角度出发简单,但是深入分析深度不够,整体舆情维度扩展困难;
(2)现有舆情预测预警体系不完善,对计划性事件与未知事件的预测预警困难,无法有效支撑舆情研判。
(3)舆情监测是动态变化的,面向不同对象提供不同的舆情信息服务是比较困难的。
解决上述技术问题的意义在于:
(1)通过构建整体舆情监测体系,从多维度分析舆情,提升整体舆情监测分析的深度与广度;
(2)通过加入民情民意预测,通过快速发现和预警危机,提升用户进行事前精准研判的质效,辅助决策。
发明内容
为克服相关技术中存在的问题:
(1)从时间、地域、持分者、国际四个维度进行议题的分维度获取与自动发现,解决了现有舆情分析维度单一、分析深度不够的问题。
(2)将计划性事件、未知事件、火爆议题等民情民意预测加入网络舆情分析体系中,解决了现有舆情分析技术无法为舆情研判提供支撑的问题。
(3)将现有议题及事件的分析维度进行细粒度拆分,实现分析维度的模块化,不同模块之间自由组合,提供自定义的议题采集与分析工具,自动生成情报服务,支撑业务系统,辅助用户决策,解决了网络舆情监测需求动态变化,而现有舆情分析方法无法高效满足的问题。
本发明公开实施例提供了一种融合舆情风向跟踪及民情预测的网络舆情检测系统与方法。所述技术方案如下:
该融合舆情风向跟踪及民情预测的网络舆情检测系统包括:
多源数据采集单元,针对特定舆情监测范围(如关键词、公司名称、或者特定板块、地区名称等),比如某地区、某公司,进行多源异构数据的实时采集与汇聚;
数据治理及服务单元,对汇聚后的数据进行治理、融合、关联,并基于知识图谱构建人物、组织全息关联模型,数据通过服务的方式提供给上层舆情业务;
民情预测单元,用于火爆议题预测、计划性事件预测、未知事件预测的数据分析处理;
舆情风向监测单元,对整体网络舆情的跟踪及预测。
议题专区单元,用于对分时议题、持分者议题、地域议题、国际议题、议题专题数据进行分析处理;
舆情预警单元,在民情预测分析的基础上,设置预警的风险值,当议题、人物、事件风险值查过阈值石,进行议题、事件、人物维度的预警;
舆情工具单元,支撑用户动态化的舆情分析。
在一个实施例中,所述舆情风向监测单元包括:
舆情风向评价指标模块,用于定义整体网络舆情风向为正面还是负面的评价指标;
舆情风向动态跟踪模块,用于在舆情风向评价指标基础上,动态跟踪网络舆情的变化情况,并基于历史数据预测舆情下一步的整体走势;
网民舆情监测模块,用于对不同派别或者团体的网民整体的网络舆情情感进行趋势跟踪;
重点人物监测模块,用于重点人物进行网络行为的监测与动态跟踪。
在一个实施例中,所述议题专区单元包括:
分时议题模块,用于基于时间维度对监测范围内所有的社交平台和新闻媒体上的热点议题进行处理;按照时间范围获取社交平台和新闻媒的数据,依据新闻浏览量、报道次数、社交平台的关注、转发及点赞等情况,分析热点议题,并可按照不同时间段进行热点议题展示。
持分者议题模块,用于从不同派别或者立场的团体在社交媒体、现实社会中所关注的主要议题进行处理;首先提取不同派别或者立场团体的相关新闻及社交平台言论,当一个类别言论或者新闻超过10条以后,自动将相似言论进行合并,并按照合并结果进行议题展示。
地域议题模块,用于在监测区域内,不同范围的地区所关注的主要议题,以物理地区为角度划分;选择某地区,将该地区按照街道最小粒度进行划分,基于关键词提取该街道的相关数据,并对数据进行自动聚类,形成各个街道所关注的议题。
国际议题模块,用于不同国家所关于特定区域所关注的议题进行处理;对各个国家人物的社交平台及新闻内体数据进行提取,然后按照国家进行其关注的议题排序。
议题专题模块,用于对专题事件或者议题的全维度的分析挖掘。支持通过输入关键词、或者聚类后的议题进行议题发展趋势统计,社交平台、新闻媒体的情感分析,重点人物言论分析等。
在一个实施例中,民意预测单元包括:
火爆议题预测模块,用于预测出不同类型的议题走势,预测最有可能火爆的议题;
示威行动预测模块,用于对未来计划肯定会发生的事件,预测事件的爆发规模、危险程度,可能引发的异常情况;
计划性事件预测模块,用于对不在计划之内的事件进行提前预测,预测事件可能发生的区域、规模及危险程度;
未知事件预测模块,用于结合火爆议题、计划性事件、未知事件预测结果,预测示威行动发生的可能、规模及地点。
在一个实施例中,舆情工具单元包括:
定向舆情数据爬取工具,支撑用户自定义爬取的内容及网站,实现数据的实时爬取;
舆情研判报告自动生成工具,提供舆情分析维度自定义,实现数据自动分析,生成情报分析报告。
本发明的另一目的在于提供一种实现所述融合舆情风向跟踪及民情预测的网络舆情检测系统的方法,该融合舆情风向跟踪及民情预测的网络舆情检测方法包括:
步骤一、分时议题分析;从当日、近一周、近一月三个维度展示热点议题及其发展趋势;
步骤二、地域议题分析;支持通过区域筛选,展示每个地区的议题数量、分类及发展趋势等;
步骤三、持分者议题分析;按照不同派别展示每个派别关注的议题及议题的热度。
步骤四、国际议题分析;按照不同国家展示,每个国家对特定区域关注的议题。
步骤五、民意预测;对计划性事件、未知事件、火爆议题进行预测,展示预测结果及危险程度。
步骤六、预警。基于设定风险阈值,对民情民意进行预警。
在一个实施例中,所述分时议题分析包括如下步骤:
步骤一、按照时间范围获取社交平台和新闻媒的数据,依据新闻浏览量、报道次数、社交平台的关注、转发及点赞等情况,构建事件特征矩阵,采用聚类方法,自动发现热点事件,分析热点的分时议题;
步骤二、计算分时议题的热词;
步骤三、对议题的内容进行关联挖掘,获取地域、国际及持分者的相关动作;
步骤四、将分时议题按照炒作议题、网民关注议题及市民关注议题进行分析;
步骤五、从炒作议题的热度、关注度及时间三个维度分析议题的发展趋势;
步骤六、计算炒作议题的热度及关注度,并自动提取议题名称,并将议题按照热度及关注度排序;
步骤七、从网民关注议题的热度、关注度、时间维度分析议题发展趋势;
步骤八、计算网民关注议题的热度及关注度,并自动提取议题名称,并将议题按照让热度及关注度排序;
步骤九、从市民关注议题的热度、关注度、时间维度分析议题发展趋势;
步骤十、计算市民关注议题的热度及关注度,并自动提取议题名称,并将议题按照让热度及关注度排序。
在一个实施例中,所述地域议题分析包括如下步骤:
步骤一、获取不同区域的计划性议题;
步骤二、自动提取相关地区的社交平台和新闻媒体的数据;
步骤三、结合上述议题数据,自动按照分区对数据进行议题聚类;
步骤四、聚类后形成各个分区的议题,分析每个区按照热度对议题进行排序,并跟踪议题的发展趋势;
步骤五、对议题的内容进行关联挖掘,获取地域、国际及持分者的关注的议题和动作;
步骤六、采用文本分类的方法自动将议题划分为:政治、经济、民生及社区类别;
步骤七、统计分区的不同议题类别的数据量,并在地图上进行可视化展示。
在一个实施例中,所述国际议题分析包括如下步骤:
步骤一、采用关键词,提取国际对特定区域的数据;
步骤二、对数据自动聚类,挖掘国际关注的特定区域的议题;
步骤三、对议题的内容进行关联挖掘,获取地域、国际及持分者的相关动作;
步骤四、分析国际关注的特定区域议题在不同平台的情感倾向;
步骤五、按照国际议题类型对议题进行自动分析,并分析不同国家关注特定区域的议题;
步骤六、统计网络民众与国际关注议题的关注度和讨论度。
在一个实施例中,所述持分者议题分析包括如下步骤:
步骤一、提取不同持分者关于特定区域的社交媒体数据;;
步骤二、自动依据不同持分者的类型对数据进行议题聚类;
步骤三、基于聚类结果得到不同持分者关注的特定区域的议题,并分析网民对这些议题的关注度和讨论度;
步骤四、对不同持分者关注的议题发展趋势进行统计与动态跟踪;
步骤五、对比不同持分者关注的议题类别,并进行关注度与热度对比;
所述民意预测分析包括如下步骤:
步骤一、建立历史事件库、计划性事件库及未知事件预测特征库;
步骤二、提取网络相关数据,分析历史数据的特征及计划性事件的特征;
步骤三、基于预测算法,预测计划性事件的发展趋势;
步骤四、评估计划性事件的风险等级,超出一定风险等级进行舆情预警;
步骤五、构建未知事件预测模型,预测未来可能发生的事件,评估未知事件的风险等级,超出一定风险等级进行舆情预警;
步骤六、研究历史火爆议题的演化规律,构建火爆议题预测模型;
步骤七、基于各类议题,自动预测可能火爆的议题,评估议题的风险等级,超出一定风险等级进行舆情预警。
本发明公开的实施例提供的技术方案可以包括以下有益效果:
本发明将时间、地域、持分者、国际四个维度引入舆情监测体系,实现了纵深化监测,满足不同用户对舆情的监测需求;将计划性事件、未知事件、火爆议题等民情民意预测方法引入网络舆情分析技术,并提供自定义的议题采集工具、模块化的分析工具,自动生成情报服务,补充了现有网络舆情监测体系与技术的不足,为舆情研判提供支撑,高效满足动态变化的网络舆情监测需求。
当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。
图1是本发明提供的融合舆情风向跟踪及民情预测的网络舆情检测系统图。
图2是本发明提供的分时议题分析流程图。
图3是本发明提供的地域议题分析流程图。
图4是本发明提供的国际议题分析流程图。
图5是本发明提供的持分者议题分析流程图。
图6是本发明提供的民意预测分析流程图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图对本发明的具体实施方式做详细的说明。在下面的描述中阐述了很多具体细节以便于充分理解本发明。但是本发明能够以很多不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本发明内涵的情况下做类似改进,因此本发明不受下面公开的具体实施的限制。
需要说明的是,当元件被称为“固定于”另一个元件,它可以直接在另一个元件上或者也可以存在居中的元件。当一个元件被认为是“连接”另一个元件,它可以是直接连接到另一个元件或者可能同时存在居中元件。本发明所使用的术语“垂直的”、“水平的”、“左”、“右”以及类似的表述只是为了说明的目的,并不表示是唯一的实施方式。
除非另有定义,本发明所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。本发明中在本发明的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本发明。本发明所使用的术语“及/或”包括一个或多个相关的所列项目的任意的和所有的组合。
融合舆情风向跟踪及民情预测的网络舆情检测系统主要包括多源数据采集、数据治理及服务、民情预测、舆情风向监测、议题专区、舆情预警、舆情工具这几个方面:
(1)多源数据采集主要是针对特定舆情监测范围,进行多源异构数据的实时采集与汇聚;
(2)数据治理及服务对汇聚后的数据进行治理、融合、关联,并基于知识图谱进行建模,将数据通过服务的方式提供给上层舆情业务;
(3)舆情风向监测主要是对整体网络舆情的跟踪及预测,主要包括舆情风向评价指标、舆情风向动态跟踪、网民舆情监测及重点人物监测。
A:舆情风向评价指标主要定义整体网络舆情风向为正面还是负面的评价指标;
B:舆情风向动态跟踪在舆情风向评价指标基础上,动态跟踪网络舆情的变化情况,并基于历史数据预测舆情下一步的整体走势;
C:网民舆情监测是对不同派别或者团体的网民整体的网络舆情情感进行趋势跟踪;
D:重点人物监测是对特定范围重点人物进行网络行为的监测与动态跟踪。
(4)议题专区主要包括分时议题、持分者议题、地域议题、国际议题与议题专题五个方面:
A:分时议题是基于时间维度对监测范围内所有的社交平台和新闻媒体上的热点议题;
B:持分者议题是从不同派别或者立场的团体在社交媒体、现实社会中所关注的主要议题;
C:地域议题是指监测区域内,不同范围的地区所关注的主要议题,以物理地区为角度划分;
D:国际议题是指不同国家所关于特定区域所关注的议题。
E:议题专题是对专题事件或者议题的全维度的分析挖掘。
(5)民意预测主要是从火爆议题预测、示威行动预测、计划性事件预测及未知事件预测四个维度。
A:火爆议题预测是预测出不同类型的议题走势,预测最有可能火爆的议题;
B:计划性事件预测是未来计划肯定会发生的事件,预测事件的爆发规模、危险程度,可能引发的异常情况;
C:未知事件预测是对不在计划之内的事件进行提前预测,预测事件可能发生的区域、规模及危险程度等;
D:示威行动预测是结合火爆议题、计划性事件、未知事件预测结果,考虑其他各种社会、政治等因素,预测示威行动发生的可能、规模及地点等。
(6)舆情预警是在民情预测分析的基础上,基于议题、人物、事件等风险值进行议题、事件、人物等维度的预警。
(7)舆情工具是支撑用户动态化的舆情分析需求,主要包括定向舆情数据爬取工具、舆情研判报告自动生成工具。
A:定向舆情爬取工具是支撑用户自定义爬取的内容及网站,实现数据的实时爬取;
B:舆情研判报告自动生成工具主要是提供舆情分析维度自定义,实现数据自动分析,生成情报分析报告。
具体流程与方法
融合舆情风向跟踪及民情预测的网络舆情检测系统的主要流程包括分时议题分析、地域议题分析、持分者议题分析、国际议题分析、民意预测及预警流程。
分时议题分析流程
分时议题分析流程如下:
1.基于热点事件自动发现算法,分析热点的分时议题;
2.计算分时议题的热词;
3.对议题的内容进行关联挖掘,获取地域、国际及持分者的相关动作;
4.将分时议题按照炒作议题、网民关注议题及市民关注议题进行分析;
5.从炒作议题的热度、关注度及时间三个维度分析议题的发展趋势;
6.计算炒作议题的热度及关注度,并自动提取议题名称,并将议题按照热度及关注度排序。
7.从网民关注议题的热度、关注度、时间维度分析议题发展趋势;
8.计算网民关注议题的热度及关注度,并自动提取议题名称,并将议题按照让热度及关注度排序;
9.从市民关注议题的热度、关注度、时间维度分析议题发展趋势;
10.计算市民关注议题的热度及关注度,并自动提取议题名称,并将议题按照让热度及关注度排序。
地域议题分析流程如下:
1.获取不同区域的计划性议题;
2.自动提取相关地区的社交平台和新闻媒体的数据;
3.结合1和2的议题数据,自动按照分区对数据进行议题聚类;
4.聚类后形成各个分区的议题,分析每个区按照热度对议题进行排序,并跟踪议题的发展趋势;
5.对议题的内容进行关联挖掘,获取地域、国际及持分者的相关动作;
6.基于自然语言处理的算法自动将议题划分为政治、经济、民生及社区等类别;
7.统计分区的不同议题类别的数据量,并在地图上进行可视化展示。
国际议题分析流程如下:
1.提取国际对特定区域相关的数据;
2.对数据自动聚类,挖掘国际关注的特定区域的议题;
3.对议题的内容进行关联挖掘,获取地域、国际及持分者的相关动作;
4.分析国际关注的特定区域议题在不同平台的情感倾向;
5.按照国际议题类型对议题进行自动分析,并分析不同国家关注特定区域的议题;
6.统计网络民众与国际关注议题的关注度和讨论度。
持分者议题分析主要流程如下:
1.提取不同持分者关于特定区域的社交媒体数据;;
2.自动依据不同持分者的类型对数据进行议题聚类;
3.基于聚类结果得到不同持分者关注的特定区域的议题,并分析网民对这些议题的关注度和讨论度;
4.对不同持分者关注的议题发展趋势进行统计与动态跟踪;
5.对比不同持分者关注的议题类别,并进行关注度与热度对比。
民意预测分析主要流程如下:
1.建立历史事件库、计划性事件库及未知事件预测特征库;
2.提取网络相关数据,分析历史数据的特征及计划性事件的特征;
3.基于预测算法,预测计划性事件的发展趋势;
4.评估计划性事件的风险等级,超出一定风险等级进行舆情预警;
5.构建未知事件预测模型,预测未来可能发生的事件,评估未知事件的风险等级,超出一定风险等级进行舆情预警;
6.研究历史火爆议题的演化规律,构建火爆议题预测模型;
7.基于各类议题,自动预测可能火爆的议题,,评估议题的风险等级,超出一定风险等级进行舆情预警。
本领域技术人员在考虑说明书及实践这里公开的公开后,将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由所附的权利要求指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围应由所附的权利要求来限制。
机译: 车载设备,活动身体运动控制设备,风信息预测器,风向传递方法,活动身体运动控制方法,风信息预测方法,风向传递程序,活动身体运动控制程序和风信息预测
机译: 判断不必要风向的方法和装置以及风向跟踪方法和系统
机译: 判断不必要风向的方法和装置以及风向跟踪方法和系统