声明
摘要
第1章 引言
1.1 研究背景和意义
1.2 国内外研究现状
1.3 研究内容
1.4 论文结构
第2章 相关概念及技术概述
2.1 文档表示模型
2.1.1 向量空间模型
2.1.2 统计语言模型
2.2 主题模型
2.2.1 LSI模型
2.2.2 PLSI模型
2.2.3 LDA模型
2.3 贝叶斯文本分类
2.3.1 朴素贝叶斯方法
2.3.2 PG贝叶斯方法
2.4 社区发现
2.4.1 社区模块度
2.4.2 鲁汶算法
2.5 图核
2.5.1 邻居哈希图核
2.6 本章小结
第3章 基于主题模型和贝叶斯方法的静态事件检测
3.1 任务概述
3.2 Topic-Bayesian文本分类算法
3.2.1 主题信息获取
3.2.2 基于主题表述的文档分类
3.3 实验结果分析与评估
3.3.1 数据描述
3.3.2 参数设置
3.3.3 实验结果及评估
3.4 本章小结
第4章 基于社区发现和图核计算的动态事件检测
4.1 任务概述
4.2 事件词的动态选取
4.2.1 事件词选取指标定义
4.2.2 事件词动态选取算法
4.3 基于社区发现的动态事件检测
4.3.1 事件社区发现
4.3.2 事件微博选取
4.4 基于图核计算的动态事件追踪
4.4.1 基于主题语义的比特数组标签编码方案
4.4.2 基于邻居哈希图核的动态事件社区匹配
4.5 实验结果与评估
4.5.1 实验数据集分析
4.5.2 实验过程及参数设置
4.5.3 实验结果及评估
4.6 本章小结
第5章 总结及展望
参考文献
致谢
攻读硕士学位期间公开发表的论文