首页> 中文学位 >基于LSPX模型的XML结构相似度计算与快速聚类
【6h】

基于LSPX模型的XML结构相似度计算与快速聚类

代理获取

目录

文摘

英文文摘

声明

第一章 绪论

第一节 研究背景与研究意义

第二节 XML数据挖掘与XML信息检索的发展现状

1.2.1 XML数据挖掘的发展现状

1.2.2 XML信息检索的发展现状

第三节 主要研究工作与论文的组织结构

第二章 XML数据挖掘与XML信息检索的相关研究

第一节 XML概述

第二节 XML数据挖掘

2.2.1 数据挖掘概述

2.2.2 XML数据挖掘进展

第三节 XML信息检索

本章小结

第三章 XML数据的LSPX模型

第一节 XML数据结构模型的相关研究

3.1.1 XML的树形结构模型

3.1.2 频繁路径表示模型

第二节 XML数据的LSPX模型

本章小结

第四章 基于LSPX模型的相似度计算

第一节 树编辑距离与基于频繁路径的相似度计算

4.1.1 树编辑距离

4.1.2 基于频繁路径模型的相似度计算

第二节 基于LSPX模型的相似度计算

4.2.1 基本结构相似度计算

4.2.2 融合语义信息后的结构相似度计算

本章小结

第五章 聚类算法与实验结果分析

第一节 基于LSPX模型的快速聚类算法

第二节 实验设计与结果分析

5.2.1 实验环境与实验设计

5.2.2 模型构建与聚类操作的时间分析

5.2.3 聚类结果评价

本章小结

第六章 总结与展望

第一节 全文总结

第二节 展望

参考文献

致谢

个人简历

展开▼

摘要

当今的信息时代,信息交互愈加频繁,XML已经成为信息表示和数据交换的标准。随着大量XML信息的出现,XML数据的处理也逐渐成为人们关注的焦点,由此衍生出XML数据处理的两大研究方向,XML数据挖掘与XML信息检索。在XML数据挖掘中,XML数据的结构聚类仍然是当前的主要研究任务,而在XML信息检索中,一个亟待解决的焦点问题是结构模糊查询与匹配。
   虽然XML数据结构聚类与XML信息检索有着各自的研究内容和不同的实现目标,但是它们却都依赖于共同的研究基础,即良好的XML数据结构表示模型、基于模型的相似度计算,以及对XML数据结构的快速聚类等等。论文针对该基础问题进行研究与探讨,在总结和分析现有的XML数据表示模型和相似度计算方法的基础上,提出了一种新的XML数据结构表示模型——LSPX模型,并定义了其上的相似度计算方法,最后给出了一种快速的增量式聚类算法。
   LSPX模型简洁、完整地表示了XML数据的结构信息。基于该模型的相似度计算,不仅很好地结合了语义信息,使计算结果更加准确;还将计算的粒度有效地扩展到聚类级别,省去了传统的“逐对”计算方式所导致的时间消耗,极大地缩短了整个聚类过程。基于LSPX模型的增量式聚类算法,在保证聚类结果质量的基础上,大大地提高了XML数据结构聚类的速度。实验结果表明,LSPX模型构造迅速,且基于该模型的聚类算法真正做到了XML数据结构聚类的快速、有效、实用。这些都为XML数据的后续处理和研究工作打下了良好而坚实的基础。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号