一种针对重复标签的XML文档索引结构及查询算法

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

XML（eXtensible Markup Language）作为Internet上数据表示和数据交换事实上的标准，已经得到了快速普及和广泛应用。如何对XML文档进行有效地查询也就成为如今XML研究领域的一个重要的研究课题，而在查询中引入索引方案无疑是一种行之有效的方法。近年来，针对不同的XML应用，人们已经提出了不同的索引结构，如DataGuide，1-Index，F&B和XR-Tree等，这些索引结构能够满足不同特定环境下的需求。
　　XML文档的查询通常被转化为两个结点列表之间的包含关系或文档位置关系的结构连接操作。根据XML文档结构的特点，这些列表中有些结点是能够事先判断出它们是并不参与连接操作的，因此可以先在XML文档的结构索引上进行过滤，从而减少需要处理的元素数量以提高查询算法的整体性能。已有的工作表明，可以通过在各种结构索引上执行过滤来提高查询效率。
　　本文针对XML文档树中重复标签高频出现的现象，给出一种可以高效处理这种重复标签结构的索引存储结构RS-Index，在查询算法中利用索引信息，能够快速过滤与查询无关的元素，以达到提高查询效率的目的。
　　本文的主要工作是:
　　(1)提出了一种针对重复标签的XML文档的索引结构RS-Index，并给出了相应的索引结构形成算法。
　　(2)在RS-Index的索引结构上提出了相应的过滤算法。并以该过滤算法为基础，给出了一种新的查询算法，快速找到满足查询条件的元素序列。
　　(3)构建了一个实验系统，在系统中实现了本文提出的索引结构、过滤算法和查询算法。
　　(4)把本文提出的RS-Index索引结构与其他相似的索引结构在通用的数据集上进行了较为全面的比较。
　　实验数据表明，使用该索引结构及其查询算法，对于具有大量重复标签的XML文档，可以提高查询效率。

著录项

作者
郭金妮;
展开▼
作者单位

山西大学;

展开▼
授予单位山西大学;
学科计算机应用技术
授予学位硕士
导师姓名陶世群;
年度 2008
页码
总页数
原文格式 PDF
正文语种中文
中图分类 TP311.13;
关键词
XML文档; 索引结构; 查询算法; 复标签;

相似文献

中文文献
外文文献
专利

1. 一种支持动态XML文档上关键字查询的索引结构 [J] . 缪丰羽 ,林宏康 . 计算机技术与发展 . 2012,第006期
2. 一种具有多模态索引结构的XML查询算法 [J] . 李环 ,衡星辰 ,覃征 . 小型微型计算机系统 . 2008,第005期
3. 一种基于关键字的XML文档查询算法 [J] . 李素清 ,陶世群 . 计算机工程与应用 . 2012,第005期
4. 一种基于XML文档聚类的XML近似查询算法 [J] . 郭俊文 ,衡星辰 ,邵利平 . 计算机工程 . 2006,第015期
5. 一种基于自适应结构概要的有向标签图子图匹配查询算法 [J] . 张海威 ,解晓芳 ,段媛媛 . 计算机学报 . 2017,第1期
6. 一种检验Active XML文档树模式查询可满足性算法 [C] . . 第二十五届中国数据库学术会议(NDBC2008) . 2008
7. 一种基于关系数据库的XML文档存储和查询的方法 [A] . 段洪秀 . 2006

一种针对重复标签的XML文档索引结构及查询算法

目录

摘要

著录项

相似文献

相关主题

期刊订阅