声明
摘要
第一章 绪论
1.1 研究背景
1.2 研究意义
1.3 研究现状
1.4 论文的组织结构
第二章 相关工作
2.1 基于社交网络的事件检测
2.1.1 非特定事件检测
2.1.2 特定事件检测
2.2 基于跨媒体的事件检测
2.3 主题模型
2.4 总结
第三章 基于社交媒体的新闻事件检测与信息增强
3.1 整体框架
3.2 数据采集模块
3.3 自然语言处理
3.3.1 分词
3.3.2 去除停用词
3.3.3 取词根
3.3.4 词性标注
3.3.5 词条标准化
3.3.6 命名实体
3.4 特征属性提取
3.4.1 关键词
3.4.2 社会化标签
3.4.3 时间标签
3.4.4 TF-IDF特征
3.5 向量空间模型
3.6 新闻事件检测模块
3.6.1 文本余弦相似度
3.6.2 时间相似度
3.6.3 地理位置相似度
3.6.4 社会化标签Jaccard相似度
3.7 算法简介
3.7.1 K-means算法
3.7.2 DBSCAN算法
3.8 有监督算法
3.8.1 支持向量机
3.9 事件类摘要
3.10 事件信息增强
3.11 总结
第四章 实验及结果
4.1 数据集
4.1.1 新闻数据集
4.1.2 Twitter数据集
4.2 数据结构
4.3 预定义事件检测
4.4 事件检测及信息扩展模块
4.5 总结
第五章 总结和展望
参考文献
发表论文和参加科研情况说明
致谢