首页> 中国专利> 网络社会事件预测方法、系统、终端、计算机设备及介质

网络社会事件预测方法、系统、终端、计算机设备及介质

摘要

本发明公开一种网络社会事件预测方法、系统、终端、计算机设备及介质,涉及网络信息处理技术领域。对读取的文本类、图片类、视频类、音频类数据进行处理后与原始数据进行存储;综合原始数据和处理完的数据进行信息可靠谱判断,对可靠信息数据进行萃取操作,综合预测模型结果判断事件发生的可能性;读取预测结果,判断事件预警等级,并将预警结果进行实时推送。本发明生成的预警信息针对预测结果进行了预警级别划分,能够方便直观为决策提供依据。本发明能预测将要发生的社会事件,可以提前进行应急响应和计划部署,减少不必要的损失,具有极大的社会经济和民生效益。

著录项

  • 公开/公告号CN112765485A

    专利类型发明专利

  • 公开/公告日2021-05-07

    原文格式PDF

  • 申请/专利权人 深圳市网联安瑞网络科技有限公司;

    申请/专利号CN202110065011.8

  • 申请日2021-01-18

  • 分类号G06F16/9536(20190101);G06F16/25(20190101);G06F16/2458(20190101);G06F16/435(20190101);G06F40/211(20200101);G06F40/30(20200101);G06N20/00(20190101);G06Q10/06(20120101);G06Q50/00(20120101);G06Q50/26(20120101);G08B7/06(20060101);G08B21/18(20060101);G08B25/10(20060101);G06K9/20(20060101);G06K9/00(20060101);

  • 代理机构44331 深圳壹舟知识产权代理事务所(普通合伙);

  • 代理人寇闯

  • 地址 518000 广东省深圳市福田区华富街道新田社区深南大道1006号深圳国际创新中心(福田科技广场)D栋七层

  • 入库时间 2023-06-19 10:54:12

说明书

技术领域

本发明涉及网络信息处理技术领域,尤其公开一种网络社会事件预测方法、系统、终端、计算机设备及介质。

背景技术

目前,现有技术公开事件检测技术、事件抽取技术、事件融合技术。

事件检测技术又称事件发现技术,指从海量数据中识别事件的线索信号,提取与事件有关的候选数据。事件检测技术主要可分为两类:一是回溯事件检测,从新的文档中识别出已知类型的事件;二是新型事件检测,从在线数据流中实时发现新事件。两类事件检测任务都需要在海量数据中识别典型或潜在的事件线索信号,通过设置事件触发词或基于文本特征等方法过滤出事件相关的数据,并对事件候选数据进行划分。

事件抽取技术指从松散的非结构化信息中抽取事件要素信息并生成精细的结构化事件数据的技术。事件抽取的主要任务包括三方面:一是文本理解,事件的描述文本经过句法成分分析能分割成包括独立语义的文本单元,理解文本单元的语义角色;二是事件解析,识别一则事件数据包括哪些要素单元,如实体、关系、时间、地理信息以及涉事人数、事件类型等属性信息,可由人工设定,也可根据文本理解结果自动生成;三是要素填充,按照要素单元的填充要求,将文本单元转换成符合规范的属性值。后两方面也可以构成事件要素抽取问题,根据学习方法分类,可分为基于规则匹配的方法以及基于机器学习的有监督、无监督和弱监督事件抽取方法。

事件融合技术指结合事件的上下文环境以及要素特征,合并指代同一个现实事件的事件数据,提高事件数据质量,并能将具有逻辑关联的事件数据表示为关联图谱等富语义数据,优化或扩展事件数据的表达空间的技术。

现有技术主要关注从海量非结构数据中检测出新发生的事件,从中抽取结构化知识信息,批量生成结构化事件数据,存入事件库中。这些技术能够有效提高对已发生事件进行查询、匹配、关联、分析的能力;通过构建事件库能够对历史事件数据进行结构化,提升数据质量,便于进一步分析,但这些技术目前针对的数据源主要为新闻报道类数据,只能记录、处理、分析已发生事件,无法对尚未开展的事件进行预测预警。

通过上述分析,现有技术存在的问题及缺陷为:

(1)现有技术分析只能针对文本类数据且数据源多数为新闻报道类,不能用于互联网收集的海量异构开源信息,包括图像、视频等多模态信息;

(2)现有技术主要是针对已发生事件进行的数据识别、抽取、结构化、存储、融合等工作,较少针对未发生的事件进行预测,获取未发生事件的时间、地点、参与者等事件详情属性;

(3)现有技术未考虑互联网虚假信息影响,不能对收集到的信息进行深度识别和鉴伪。

解决以上问题及缺陷的难度为:

(1)需要具备针对海量多源异构数据进行分析的能力,能够有效提取视频、音频、图片等数据中的有效信息,并进行进一步分析。

(2)需要能够对准确区分已发生事件与计划性事件,并针对事件属性进行准确抽取,获取时间、地点、参与者等结构化数据。

(3)需要构建一套方法,能够基于已知事件信息,准确的判断事件风险度,并在此基础上进行事件预测预警。

解决以上问题及缺陷的意义为:

(1)能够具备针对海量多源异构数据进行分析的能力,对视频、图片、音频等数据格式中潜藏的价值进行挖掘,拓展信息获取渠道。

(2)实现已发生事件数据与未发生事件数据的划分,才能进行进一步的事件预测;通过对事件属性进行准确抽取,能够极大提升数据的易用性,保障预测的准确性。

(3)准确判断事件的风险度,能够极大提升事件预测预警的实际应用价值,可根据不同事件风险度制定具有针对性的应对策略,有助于实现及时应对与准确决策。

发明内容

为克服相关技术中存在的问题,本发明公开实施例提供了一种网络社会事件预测方法、系统、终端、计算机设备及介质。所述技术方案如下:

根据本发明公开实施例的第一方面,提供一种网络社会事件预测方法,应用于信息数据处理终端,包括:

对读取的文本类数据使用现有自然语言处理相关算法进行事件检测、事件抽取处理;

对读取的图片类数据进行OCR识别处理,转化为文本类数据;

对读取的视频类数据抽取视频关键帧图片,进行图片类数据处理;

对读取的音频类数据进行文字转写处理,转化成文本类数据;

将处理完的文本类数据、图片类数据、视频类数据、音频类数据与读取的原始数据进行存储;

综合原始数据和处理完的文本类数据、图片类数据、视频类数据、音频类数据进行可靠信息判断,获取可靠信息数据。可靠信息的判断主要可分为两个步骤:一是对数据源进行筛选,通过历史数据进行比对分析,筛选数据内容与分析目标一致度较高,且数据质量相对较好,具有较高可信度的数据源;二是通过关键词匹配、文本特征匹配等方式对已获取数据进行筛选,获取可靠度较高的数据。在可靠信息数据获取完成后,将可靠信息数据存入对应数据库,以便后续进一步分析调用;

读取可靠信息数据,对可靠信息数据中的事件时间、地点等信息进行萃取操作,事件要素的抽取可通过规则匹配或基于机器学习构建命名实体识别模型等方式来实现。规则匹配只通过上下文约束等方式,提取所需文本信息,具有较为广泛的适用性,但需人工进行规则的整编制定;基于机器学习的事件要素抽取可进一步细分为,有监督学习和无监督学习,基于无监督学习构建事件要素抽取模型,虽然能节省进行数据标注所耗费的大量时间,但由于缺乏先验知识,准确度相对较差,一般情况不推荐使用;

构建事件预测模型,结合抽取的事件要素数据及事件网络传播广度及反馈状况,综合判断事件发生的可能性;

通过事件的时间、地点、参与者、规模等信息,综合判断事件的风险度,确定事件预警等级,并将预警结果进行实时推送。

优选地,所述读取原始数据以及对文本、图片、视频、音频分类进行预处理前,需进行:

系统初始化,初始化数据库数据结构;

从互联网新闻、博客、社交媒体平台上搜集海量异构的信息,对文本、图片、视频、音频分类进行存储。

所述对信息可靠谱进行判断中,应优先对数据源进行筛选,通过历史数据进行比对分析,筛选数据内容与分析目标一致度较高,且数据质量相对较好,具有较高可信度的数据源;在此基础上,可通过关键词匹配、文本特征匹配等方式对已获取数据进行进一步筛选,获取可靠度较高的数据,并保存至可靠信息数据库中。

所述预警级别为高危、中危、低危预警,或为红色、橙色、黄色、蓝色预警。

所述将预警结果进行实时推送包括:以系统网页弹框、告警声音、手机APP安全方式发布预警信息。

根据本发明公开实施例的第二方面,提供一种网络社会事件预测系统,应用于信息数据处理终端,所述网络社会事件预测系统包括:

开源信息获取模块,用于从全球范围内的新闻、博客、社交媒体网站获取海量开源异构信息,包括文本、图像、音频、视频;

多模态信息预处理模块,用于对获取到的海量开源异构信息进行预处理,包括但不限于事件检测、事件抽取文本预处理,图片OCR识别,音视频识别;

多模态虚假信息检测模块,用于综合开源信息获取模块得到的原始数据和多模态信息预处理模块得到的结构化信息,对信息可靠性进行判断;

预测模型与结果生成模块,包括系统预设的预测模型,以及用户自定义或开发的预测模型扩展插件,用于生成相应的事件预测结果,事件预测结果信息包括但不限于事件发生的事件、地点、参与者、规模事件详情信息;

预警级别生成与推送模块,用于对生成的事件预测信息进一步进行预警级别的判定,根据需要生成包括但不限于高危、中危、低危3级预警,或者红色、橙色、黄色、蓝色4级预警,并且以系统网页弹框、告警声音、手机APP安全通知方式发布预警信息;

存储模块,用于对上述各模块产生的原始数据、中间过程数据、处理结果数据进行存储;

展示模块,用于提供上述各模块的UI展示,还用于查看相关模块的功能、数据、状态。

根据本发明公开实施例的第三方面,提供一种信息数据处理终端,所述信息数据处理终端用于实施所述网络社会事件预测方法。

根据本发明公开实施例的第四方面,提供一种手机APP终端,所述手机APP终端与网络社会事件预测系统联通,对所述网络社会事件预测系实时推送的预警结果进行展示。

根据本发明公开实施例的第五方面,提供一种计算机设备,所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行如下步骤:

从全球范围内的新闻、博客、社交媒体网站获取海量开源异构信息,包括文本、图像、音频、视频;

对获取到的海量开源异构信息进行预处理,包括但不限于事件检测、事件抽取文本预处理,图片OCR识别,音视频识别;

综合得到的原始数据和多模态信息预处理模块得到的结构化信息,对信息可靠性进行判断;

生成相应的事件预测结果,事件预测结果信息包括但不限于事件发生的事件、地点、参与者、规模事件详情信息;

对生成的事件预测信息进一步进行预警级别的判定及预警结果的推送。

根据本发明公开实施例的第六方面,提供一种接收用户输入程序存储介质,所存储的计算机程序使电子设备执行所述网络社会事件预测方法。

本发明公开的实施例提供的技术方案可以包括以下有益效果:

现有技术大都是从非结构化数据中检测已经发生的事件,本发明是对未来将要发生的社会事件进行预测,能够在事件未发生前进行分析预判,防患于未然,具有更高的应用价值及社会效益,能够为相关部门决策提供有效支撑;

现有技术主要是对文本信息进行事件检测和事件抽取,本发明综合利用文本、图像、视频等多模态信息,进行社会事件预测,实现了对多源数据类型的支持,拓展了数据来源渠道,能够更为深入的挖掘数据中潜藏的价值;

本发明基于虚假信息检测技术,能够对信息进行深度识别和鉴伪;

本发明生成的预警信息针对预测结果进行了预警级别划分,能够方便直观为决策提供依据。

本发明能预测将要发生的社会事件,可以提前进行应急响应和计划部署,减少不必要的损失,具有极大的社会经济和民生效益。

结合实验或试验数据和现有技术对比得到的效果和优点:

(1)能够具备针对海量多源异构数据进行分析的能力,对视频、图片、音频等数据格式中潜藏的价值进行挖掘,拓展了信息获取渠道。

(2)能够准确判断事件的风险度划分事件预警等级,极大提升了事件预测预警的实际应用价值,可根据不同事件风险度制定具有针对性的应对策略,有助于实现及时应对与准确决策。

当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。

图1是本发明实施例提供的网络社会事件预测系统示意图。

图2是本发明实施例提供的网络社会事件预测方法流程图。

图3是本发明实施例提供的网络社会事件预测方法运行流程图。

具体实施方式

这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。

如图1所示,本发明公开实施例所提供的网络社会事件预测系统包括开源信息获取模块、多模态信息预处理模块、多模态虚假信息检测模块、预测模型与结果生成模块、预警级别生成与推送模块、存储模块、展示模块。

开源信息获取模块负责从全球范围内的新闻、博客、社交媒体等网站获取海量开源异构信息,包括文本、图像、音频、视频等。

多模态信息预处理模块对获取到的海量开源异构信息进行预处理,包括但不限于事件检测、事件抽取等文本预处理,图片OCR识别,音视频识别等,目的是生成结构化的事件相关信息,以便后续模块处理。

多模态虚假信息检测模块综合开源信息获取模块得到的原始数据和多模态信息预处理模块得到的结构化信息,对信息可靠性进行判断。

预测模型与结果生成模块包括系统预设的预测模型,以及用户自定义或开发的预测模型扩展插件,能够生成相应的事件预测结果,事件预测结果信息包括但不限于事件发生的事件、地点、参与者、规模等事件详情信息。

预警级别生成与推送模块对生成的事件预测信息进一步进行预警级别的判定,根据需要生成包括但不限于高危、中危、低危3级预警,或者红色、橙色、黄色、蓝色4级预警,并且以系统网页弹框、告警声音、手机APP安全通知等方式发布预警信息,通知系统用户或责任人进行紧急处置,以避免风险进一步扩大。

存储模块主要是对上述各模块产生的原始数据、中间过程数据、处理结果数据等进行存储。

展示模块提供上述各模块的UI展示,以便直观快捷查看相关模块的功能、数据、状态。

系统工作原理图如图2所示,列出了各模块所涉及的技术。各模块之间的连接关系为:各模块与存储模块、展示模块都有连接,以便存储各模块的输入、输出,以及对各模块的处理过程和结果进行UI界面直观展示。开源信息获取模块的输出作为多模态信息预处理模块的输入;多模态信息预处理模块对文本、图像、视频、语音等多模态信息进行处理,输出结构化或半结构化的元数据信息;多模态虚假信息检测模块所需的源数据(原始数据)和元数据信息(预处理后的结构化或半结构化数据)来自于开源信息获取模块、多模态信息预处理模块;多模态虚假信息检测模块输出可信的结构化事件信息,作为预测模型与结果生成模块的输入;预测模型与结果生成模块的输出为事件预计将要发生的时间、地点等属性信息;预警级别生成与推送模块读取事件属性信息,采用指标体系等方法计算出事件预警的级别,然后输出预警消息,如附图2中最右侧的消息示例框所示。

图2是本发明实施例提供的网络社会事件预测方法包括下列步骤:

(1)系统初始化,各模块初始化数据库等数据结构;

(2)开源信息获取模块从互联网新闻、博客、社交媒体等平台上搜集海量异构的信息,对文本、图片、视频、音频等分类存储到存储模块中;

(3)多模态信息预处理模块从存储模块中读取原始数据,对文本、图片、视频、音频等分类分别进行预处理,对文本类数据使用自然语言处理算法进行事件检测、事件抽取,对图片类数据进行OCR识别,然后转化为文本类数据处理,对视频类数据抽取视频关键帧图片,然后进行图片类数据处理,对音频类数据进行文字转写,转化成文本类数据处理,处理完的数据跟原始数据的元数据信息一并进行存储,保存到存储模块当中;

(4)多模态虚假信息检测模块综合原始数据和元数据信息,对信息可靠谱进行判断,设定一个阈值,超过这个阈值认为信息可信,采纳该信息,并保存至存储模块当中的可靠信息数据库中;

(5)预测模型与结果生成模块从存储模块中读取可靠信息数据,对可靠信息数据中的事件时间、地点等信息进行萃取操作,综合预测模型结果判断事件发生的可能性;

(6)预警级别生成与推送模块首先读取预测结果,综合预测结果中的事件、地点、参与者、规模等信息,判断事件预警等级,并将预警结果进行实时推送。

图3是本发明实施例提供的网络社会事件预测方法运行流程图。

本领域技术人员在考虑说明书及实践这里公开的公开后,将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由所附的权利要求指出。

应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围应由所附的权利要求来限制。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号