文摘
英文文摘
声明
第1章引言
1.1研究背景
1.2国内外研究现状
1.3本文工作
1.4论文组织结构
第2章传统聚类方法概述
2.1聚类概述
2.2划分方法
2.2.1传统划分方法
2.2.2大型数据集的划分方法
2.3层次方法
2.3.1 BIRCH方法
2.3.2 CURE方法
2.3.3其他层次方法
2.4其他聚类方法
2.4.1基于密度的方法
2.4.2基于网格的方法
2.4.3基于模型的方法
第3章基于术语簇和关联规则文档聚类方法的相关知识
3.1术语簇
3.1.1平均互信息
3.1.2聚丛法
3.1.3术语权重
3.2文档形式化描述
3.2.1文档矢量空间模型
3.2.2文档相似度
3.3关联规则挖掘
3.3.1关联规则概述
3.3.2 APRIORI算法
3.4聚类评价指标
3.4.1类间差异度
3.4.2类内相似度
第4章基于术语簇和关联规则的文档聚类方法
4.1文档分词及预处理
4.2构造术语簇
4.3文档形式化描述
4.3.1术语权重
4.3.2文档与术语簇关联度
4.3.3文档矢量空间模型
4.3.4文档相似度
4.4挖掘初始聚类
4.4.1 DHP算法
4.4.2关联规则挖掘
4.5聚类分析和处理
4.5.1文档聚类评价及处理
4.5.2文档相似度改进
第5章实验过程及结果分析
5.1文档测试集
5.2聚类处理过程
5.3聚类结果分析
第6章总结与展望
参考文献
攻读硕士学位期间发表论文情况
致谢