首页> 中文学位 >XML文档查询技术研究及在数字图书馆中的应用
【6h】

XML文档查询技术研究及在数字图书馆中的应用

代理获取

目录

文摘

英文文摘

声明

1.绪论

1.1本文的研究背景和意义

1.2国内外研究现状

1.3本文的研究内容和组织结构

2.XML和数字图书馆基础知识

2.1 XML基础知识

2.2数字图书馆基础知识

2.3本章小结

3.XML文档索引

3.1现有的XML文档索引及其不足

3.2一种改进的基于LI-MOON编码XML索引技术

3.3本章小结

4.基于XML文档的查询技术研究

4.1传统XML文档查询处理方法简介

4.2基于新索引的XML文档查询处理方法

4.3实验结果及分析

4.4本章小结

5.MarcXchange文档查询技术

5.1 MarcXchange文档与数字图书馆

5.2 MarcXchange文档结构索引

5.3基于MarcXchange文档的查询研究

5.4实验及分析

5.5本章小结

结 语

参考文献

附录

后记

展开▼

摘要

XML(eXtensibleMarkupLanguage)已成为因特网上的数据存储、交换和表示的标准。随着XML应用的普及,越来越多的数据以XML的形式存储和交换,对XML文档中的数据进行查询的要求也就越来越高。为充分利用XML的特点开展查询,本文详细研究了XML查询改进技术。MarcXchange文档是一种应用在数字化图书馆领域里的XML文档类型,可以作为通用的数据交换格式在Web环境下共享。为更好地促进数字图书馆建设,本文还详细研究了MarcXchange文档的索引和查询技术。 本文的主要贡献有: 1.提出了一种改进的基于LI—MOON编码的XML索引,当我们对XML编码后的索引文档进行B+树结构化处理后,能大大减少索引文档的大小,因而能有效提高查询速度。 2.针对Stack—Tree—Desc算法没有利用索引改善连接效率,浏览了一些不必要的节点浪费了资源,影响了查询速度。本文提出了一种新的连接算法,通过B+树查找定位,来跳过祖先和后裔列表不必要的元素以提高查询速度。 3.本文提出了一种基于MarcXchange文档的结构索引方法-Marc_index,该索引方法根据MarcXchange文档的特点采用LI—MOON编码方式,有效地实现了对文档树中任意两个结点之间祖先/后裔关系和双亲/孩子关系的检测。该索引另外的创新之处还在于有效结合B+树和倒排索引这两种方法,从而综合两者的优点,克服双方的缺陷以提高查询效率。最后,本文还提出了一个基于Marc_index索引的查询处理算法。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号