文摘
英文文摘
声明
第1章绪论
1.1研究背景
1.2国内外研究现状
1.3本文研究内容
1.4研究意义
1.5本文的章节安排
第2章文本聚类相关理论
2.1文本聚类的定义
2.2文本聚类的过程
2.3文本预处理
2.4文本相似度的计算
2.5文本的表示模型
2.5.1向量空间模型
2.5.2布尔逻辑模型
2.5.3基于2度频繁词序列的模型
本章小结
第3章几种常用聚类算法的允析与比较
3.1聚类算法的分类
3.2基于频繁词的文本聚类算法
3.3基于频繁词集合的层次文本聚类算法FIHC
3.4基于频繁词序列的文本聚类算法
第4章基于2度频繁词序列的文本聚类算法
4.1文本聚类的要求
4.2基于频繁词的序列文本聚类算法存在的问题
4.3算法的相关定义
4.4本文核心算法
4.4.1频繁词序列挖掘
4.4.2初始聚类的构建
4.4.3关于2度频繁词序列的验证
4.4.4算法的流程图
4.4.5算法的过程描述
本章小结
第5章算法的实验评估
5.1实验数据集
5.2实验的评估标准
5.2.1传统文本聚类算法的评估标准
5.2.2聚类算法性能评估
5.3挖掘频繁词序列的实验评估
5.4 F-测度与纯度的分析
本章小结
总结与展望
参考文献
致谢
攻读硕士学位期间完成的论文及参加的科研项目