基于LSPX模型的XML结构相似度计算与快速聚类

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

当今的信息时代，信息交互愈加频繁，XML已经成为信息表示和数据交换的标准。随着大量XML信息的出现，XML数据的处理也逐渐成为人们关注的焦点，由此衍生出XML数据处理的两大研究方向，XML数据挖掘与XML信息检索。在XML数据挖掘中，XML数据的结构聚类仍然是当前的主要研究任务，而在XML信息检索中，一个亟待解决的焦点问题是结构模糊查询与匹配。
　　虽然XML数据结构聚类与XML信息检索有着各自的研究内容和不同的实现目标，但是它们却都依赖于共同的研究基础，即良好的XML数据结构表示模型、基于模型的相似度计算，以及对XML数据结构的快速聚类等等。论文针对该基础问题进行研究与探讨，在总结和分析现有的XML数据表示模型和相似度计算方法的基础上，提出了一种新的XML数据结构表示模型——LSPX模型，并定义了其上的相似度计算方法，最后给出了一种快速的增量式聚类算法。
　　 LSPX模型简洁、完整地表示了XML数据的结构信息。基于该模型的相似度计算，不仅很好地结合了语义信息，使计算结果更加准确；还将计算的粒度有效地扩展到聚类级别，省去了传统的“逐对”计算方式所导致的时间消耗，极大地缩短了整个聚类过程。基于LSPX模型的增量式聚类算法，在保证聚类结果质量的基础上，大大地提高了XML数据结构聚类的速度。实验结果表明，LSPX模型构造迅速，且基于该模型的聚类算法真正做到了XML数据结构聚类的快速、有效、实用。这些都为XML数据的后续处理和研究工作打下了良好而坚实的基础。

著录项

作者
刘众奇;
展开▼
作者单位

南开大学;

展开▼
授予单位南开大学;
学科计算机软件与理论
授予学位硕士
导师姓名袁晓洁;
年度 2009
页码
总页数
原文格式 PDF
正文语种中文
中图分类 TP311.131;
关键词
XML数据挖掘; XML信息检索; LSPX模型; 增量式聚类算法;

相似文献

中文文献
外文文献
专利

1. 基于内容与结构语义相融合的XML检索结果聚类 [J] . 钟敏娟 . 情报学报 . 2012,第005期
2. 基于聚类技术的XML文件代表性结构获取 [J] . 卓月明 . 吉首大学学报（自然科学版） . 2011,第006期
3. 基于簇核心的XML结构聚类方法 [J] . 张翀 ,唐九阳 ,肖卫东 . 计算机研究与发展 . 2011,第011期
4. 基于频繁变化结构的时序XML 文档聚类方法 [J] . 罗梓恒 ,李巍 ,孙涛 . 计算机工程 . 2010,第021期
5. 基于冰冻结构的XML文档聚类研究 [J] . 李巍 ,孙涛 ,叶苑苑 . 吉林大学学报（信息科学版） . 2009,第006期
6. 一种基于频繁路径特征的XML文档结构聚类算法改进实现 [C] . 姚俊杰 ,崔斌 . 第二十四届中国数据库学术会议 . 2007
7. 基于结构向量空间和树路径模型的XML文档聚类技术研究 [A] . 朱春磊 . 2008

基于LSPX模型的XML结构相似度计算与快速聚类

目录

摘要

著录项

相似文献

相关主题

期刊订阅