文摘
英文文摘
第1章前言
1.1背景介绍
1.2本文的工作
1.3本文的组织
第2章文档聚类基本知识及在信息检索中应用
2.1引言
2.2信息检索基本原理
2.2.1信息检索过程
2.2.2信息检索技术
2.2.3信息检索模型
2.2.4信息检索评估指标
2.3信息过载
2.4文档聚类
2.4.1文档聚类的应用背景和体系结构
2.4.2文档聚类方法
2.4.3文档聚类评估指标
2.5本章小结
第3章XML文档及其文档对象模型树(DOM)
3.1引言
3.2 XML文档
3.2.1 XML语言
3.2.2 XML文档
3.2.3 XML文档对象树(DOM)
3.2.4 XML编辑距离
3.2.5 XML查询
3.3本章小结
第4章文档相似度计算方法
4.1引言
4.2传统计算相似度方法
4.2.1 Set/Bag模型
4.2.2基于向量的相似度计算
4.2.3广义向量空间模型(GVSM)
4.2.4“距离”相似度计算
4.3本章小结
第5章基于树路径模型的文档结构相似度
5.1引言
5.2树路径模型
5.2.1文档描述
5.2.2树路径模型
5.3改进后的树路径模型
5.3.1路径相似度计算
5.3.2路径匹配
5.3.3相似度计算
5.3.4时间复杂度分析
5.4实验结果与性能分析
5.5本章小结
第6章总结与展望
6.1工作总结
6.2未来工作
参考文献
致谢
攻读学位期间发表的主要学术论文目录
山东大学;