封面
声明
中文摘要
英文摘要
目录
1 绪论
1.1 研究的背景及意义
1.2 研究的现状
1.3 论文的主要工作
1.4 论文的组织结构
2 基于近邻传播的大规模数据流聚类
2.1 方法概述
2.2 详细步骤说明
2.3 本章小结
3 基于APMStream的微博话题检测与跟踪
3.1 微博数据清洗
3.2 基于微博之间的关系的重要程度度量
3.3 综合内容相似度和属性相似度的微博距离计算
3.4 微博话题检测跟踪和排序
3.5 本章小结
4 APMStream方法在Apache Storm上的实现
4.1 APMStream方法实现
4.2 微博数据流模拟模块
4.3 微博清理和分词模块
4.4 微博距离计算模块
4.5 基于分布式流处理和动态阻尼系数的AP算法实现模块
4.6 本章小结
5 实验分析
5.1 实验环境与数据
5.2 AP2D算法实验分析
5.3 APMStream方法实验分析
5.4 微博话题检测跟踪和排序实验分析
5.5 本章小结
6 总结与展望
6.1 论文总结
6.2 未来展望
致谢
参考文献