首页> 中文学位 >基于社交媒体网络的事件检测
【6h】

基于社交媒体网络的事件检测

代理获取

目录

声明

摘要

第一章 绪论

1.1 研究背景

1.2 研究意义

1.3 研究现状

1.4 论文的组织结构

第二章 相关工作

2.1 基于社交网络的事件检测

2.1.1 非特定事件检测

2.1.2 特定事件检测

2.2 基于跨媒体的事件检测

2.3 主题模型

2.4 总结

第三章 基于社交媒体的新闻事件检测与信息增强

3.1 整体框架

3.2 数据采集模块

3.3 自然语言处理

3.3.1 分词

3.3.2 去除停用词

3.3.3 取词根

3.3.4 词性标注

3.3.5 词条标准化

3.3.6 命名实体

3.4 特征属性提取

3.4.1 关键词

3.4.2 社会化标签

3.4.3 时间标签

3.4.4 TF-IDF特征

3.5 向量空间模型

3.6 新闻事件检测模块

3.6.1 文本余弦相似度

3.6.2 时间相似度

3.6.3 地理位置相似度

3.6.4 社会化标签Jaccard相似度

3.7 算法简介

3.7.1 K-means算法

3.7.2 DBSCAN算法

3.8 有监督算法

3.8.1 支持向量机

3.9 事件类摘要

3.10 事件信息增强

3.11 总结

第四章 实验及结果

4.1 数据集

4.1.1 新闻数据集

4.1.2 Twitter数据集

4.2 数据结构

4.3 预定义事件检测

4.4 事件检测及信息扩展模块

4.5 总结

第五章 总结和展望

参考文献

发表论文和参加科研情况说明

致谢

展开▼

摘要

当今世界正在见证一个大数据和信息爆炸时代,每天由不同信息源产生的以不同模态呈现的海量新闻报道、社交媒体信息等。当代的新闻消息,不仅仅通过新闻网站、报纸、广播等传统媒体进行报道,也利用丰富多变的社交媒体网络平台(像微博、Twitter、Facebook、Instagram等)进行广泛地传播,快速成为人们谈论的话题。在传统的自然语言处理领域,可以通过提取新闻网站中报道信息,检测新闻事件。但处于以社交媒体为主导的互联网时代中,从单一的官方新闻媒体了解事件的官方信息,更需要从社交媒体网络中了解相关事件下大众,以及事件相关的内容信息。
  在本文中,我们将以社交媒体为代表的新媒体和以新闻报道为代表的传统媒体相结合,利用快捷、有效、受众广泛的社交媒体信息对检测到的新闻媒体的事件进行分析,提出一种基于社交媒体网络的新闻事件检测与信息增强方法。本文所提框架共包括三部分:数据采集模块、事件检测初始化模块、已检测事件信息增强模块。大规模的抓取了新加坡范围内Twitter数据和新闻数据,构建数据集,运用自然语言处理技术对文本进行预处理,并提取新闻文本中的多种特征属性,提出了结合共享时间、共享关键字、共享社交化标签的事件类摘要的方法,对Twitter数据集进行查询,而后滤除与事件无关的冗余数据,用具有地理标签的相关Twitter数据对已检测的新闻事件进行信息增强,并在地图上对已检测事件相关Tweets增强数据进行展示。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号