声明
摘要
第1章 绪论
1.1 研究背景及意义
1.1.1 不确定性数据的产生
1.1.2 XML表示不确定性数据的优势
1.1.3 研究背景和意义
1.2 国内外研究现状
1.2.1 XML聚类技术研究现状
1.2.2 XML索引技术研究现状
1.2.3 XML查询技术研究现状
1.3 研究内容
1.4 论文结构
第2章 XML文档和其他相关技术分析
2.1 概率XML文档
2.2 语义相似度计算工具JWS
2.3 聚类分析
2.3.1 样本距离
2.3.2 样本相似度系数
2.3.3 常用聚类方法
2.4 本章小结
第3章 基于DTD的XML文档聚类方法WSDTD
3.1 通过DTD文档生成DTD树
3.2 DTD树之间的相似度
3.2.1 DTD标签语义相似度计算
3.2.2 DTD树结构相似度计算
3.2.3 根据内容相似度和结构相似度进行聚类
3.3 本章小结
第4章 概率XML文档查询
4.1 DTD文档编码
4.2 概率XML文档编码
4.3 pTwigList算法
4.3.1 pTwigList-Construct算法
4.3.2 pTwigList-Enumerate算法
4.3.3 应用pTwigList算法进行查询
4.4 本章小结
第5章 实验结果分析
5.1 数据预处理
5.2 算法效率度量标准
5.3 仿真实验内容及结果分析
5.4 本章小结
结论
参考文献
攻读硕士学位期间发表的论文和取得的科研成果
致谢
哈尔滨工程大学;