声明
1 绪论
1.1 研究背景
1.2 国内外研究现状
1.3 本文主要内容和组织结构
2 相关技术
2.1 话题追踪相关技术
2.1.1 话题追踪基本概念
2.1.2 话题追踪基本实现思想
2.2 传统分类算法介绍
2.2.1 kNN分类
2.2.2 决策树分类
2.2.3 朴素贝叶斯分类
2.3 N-Gram语言模型
2.3.1 N-Gram语言模型语言单元切分法
2.3.2 基于N-Gram语言模型的文本表示
2.4 Hadoop平台概述
2.4.1 HDFS文件系统
2.4.2 MapReduce计算模型
2.5 小结
3 基于朴素贝叶斯分类的并行自适应话题追踪算法PATT-NB
3.1 基于朴素贝叶斯分类的话题追踪
3.2 自适应话题追踪系统
3.3 话题模型更新策略
3.4 PATT-NB算法设计
3.4.1 PATT-NB算法的训练阶段
3.4.2 PATT-NB算法的验证阶段
3.4.3 PATT-NB算法的测试阶段
3.5 实验结果与分析
3.5.1 度量标准
3.5.2 实验和结果
3.6 小结
4 基于N-Gram的并行话题追踪算法PTT-Gram
4.1 基于N-Gram语言模型的话题追踪
4.2 PTT-Gram算法设计
4.2.1 训练阶段
4.2.2 测试阶段
4.3 实验结果与分析
4.4 小结
5 基于N-Gram的并行自适应话题追踪算法PATT-Gram
5.1 背景及意义
5.2 PATT-Gram算法设计
5.2.1 算法的验证阶段
5.2.2 算法的测试阶段
5.3 实验结果与分析
5.4 小结
6 总结与展望
参考文献
致谢
攻读硕士期间发表的论文
攻读硕士期间参与的会议
附录一表目录
附录二图目录
版权声明