文摘
英文文摘
声明
第一章绪论
第一节课题研究背景
第二节XML数据挖掘的发展现状
第三节主要研究工作及论文组织结构
第二章XML数据挖掘的相关研究
第一节XML概述
第二节XML数据挖掘
2.2.1数据挖掘概述
2.2.2 XML数据挖掘进展
第三章XML文档的元素层次表达式模型
第一节XML文档结构模型的相关研究
3.1.1树型结构模型
3.1.2频繁路径模型
第二节元素层次表达式模型
第三节元素层次表达式模型的简化
第四节构建XML文档的元素层次表达式模型
3.4.1解析XML文档
3.4.2构建元素层次表达式模型
3.4.3精简元素层次表达式模型
第四章基于元素层次表达式模型的XML文档相似度计算
第一节XML文档相似度计算的相关研究
4.1.1基于树型结构模型的相似度计算——树编辑距离
4.1.2基于频繁路径模型的相似度计算——PBClustering
第二节基于层次表达式模型的相似度计算方法
4.2.1元素相似度计算
4.2.2元素层次表达式的相似度计算
4.2.3元素关系相似度计算
4.2.4元素层次表达式模型的相似度计算
第五章聚类与实验结果分析
第一节K-中心点算法
第二节实验结果分析
5.2.1程序流程
5.2.2实验环境
5.2.3构建元素层次表达式模型的时间分析
5.2.4相似度计算分析
5.2.5聚类结果分析
第六章总结与展望
第一节全文总结
第二节展望
参考文献
致谢
个人简历
南开大学;