首页> 中文学位 >基于差异度的网络事件群演化趋势建模方法研究
【6h】

基于差异度的网络事件群演化趋势建模方法研究

代理获取

目录

声明

摘要

第一章 绪论

1.1 研究背景及意义

1.2 国内外研究现状

1.3 本文的主要工作

1.4 本文结构安排

2.1 信息采集

2.1.1 网络爬虫

2.1.2 内容抽取

2.2 信息预处理

2.2.1 中文分词技术

2.2.2 分词、词性标注

2.3 事件的语义指纹

2.4 热点事件发现相关技术

2.4.2 TF-IDF权重计算方法

2.4.3 文本的相似度计算

2.4.4 文本聚类

2.5 本章小结

第三章 基于差异度的网络事件群热度演化趋势建模

3.1 引言

3.2 网络事件群热度演化的整体框架

3.3 基于相似度的曲线差异度计算方法

3.3.1 曲线的差异度计算

3.3.2 事件群演化曲线的生成

3.4 实验结果分析

3.4.1 评价指标与对比方法

3.4.2 实验结果与对比分析

3.5 本章小结

第四章 网络事件群演化管理系统

4.1 系统简介

4.2 系统的开发平台

4.3 系统数据库设计

4.4 系统功能模块

4.4.1 系统登陆模块

4.4.2 事件群列表模块

4.4.3 事件群演化图及事件列表模块

4.4.4 事件演化图及事件新闻模块

4.4.5 事件群综合分析模块

4.5 本章小结

5.1 总结

5.2 展望

参考文献

攻读硕士学位阶段参与的科研项目

致谢

展开▼

摘要

在当今信息时代的大背景下,人们获取信息的方式越来越多样化,随着网络技术的不断发展,互联网成为了人们获取信息的重要方式之一。网络事件传播具有快捷、互动和开放性,在事件发展周期里,民众的高度关注产生的舆论可以导致社会恐慌或对社会和谐构成负面影响,所以,近年来,党和国家对网络舆情的研究与监管也开始高度重视。
  当前的网络事件热度研究方法主要是采用文本处理的方法对新闻网站或社交论坛、贴吧上的信息进行归类,从而对单个事件进行热度分析。但是在如今的信息化时代下,事件与事件间的关联是普遍存在的,事件通过共同主体、主题或情绪等共性因素相互联系,可以认为具有相同或相似事件原型的多个事件可构成一个事件群,它们会因为相同或相似事件的发生而被强化和突出。因此,本文的目标是对网络热点事件群的热度演化进行研究,分析相关联事件间的演化趋势关系,找到事件群的演化趋势结果,当发生类似事件时我们可以通过事件群的演化趋势判断事件的演化趋势,从而为后续的舆情预测与预警提供理论和实践基础,通过分析事件群的演化也可以为人类行为动力学的研究者提供一些借鉴。
  根据已有的研究背景和相关技术,本文主要做了以下两部分工作:
  (1)本文第一部分首先在网络上爬取热点事件群新闻文本,经过信息预处理后用事件的语义指纹来表示单个事件,分别计算单个事件随时间的热度演化。
  然后将多个关联事件的演化图投影到同一时间轴空间中并根据提出的基于事件相似度的曲线差异度计算方法,不断更新矩阵中心,最小化目标函数以求找到差异度最小的事件群的演化曲线。
  最后将本文得出结果与算术平均和事件相似度加权平均得出的结果进行对比,发现本文得出的结果F值明显优于其他两个,证明本文提出的基于事件相似度的差异度计算方法是有效的,所以本文提出的方法得出的事件群演化曲线更能反映各个事件统一的发展特性。
  (2)本文第二部分结合了当前最新的web开发相关技术实现了网络事件群演化管理系统,分别介绍了信息采集、信息预处理、事件群分析、图表展示以及系统管理等模块的功能和实现。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号