首页> 中文学位 >基于查询语义的XML关键字查询算法的研究
【6h】

基于查询语义的XML关键字查询算法的研究

代理获取

摘要

随着信息技术的迅猛发展,人们可以通过互联网从世界各地接收和发送信息,而信息交换过程中的一个突出问题就是数据格式的异构性,这将极大地阻碍对信息进行有效地使用。XML的出现正是针对这一问题而提出的解决方案。随着计算机和网络技术的不断发展,XML技术的应用也将不断扩展。该技术不仅可以用于银行之间进行数据交换、证券公司对其上市公司相关的数据进行统计、图书馆对其馆藏书目进行查询检索、企事业单位对其文件档案进行管理,还可用于电子商务、搜索引擎软件、自动智能翻译等领域。在不久的将来,XML数据的规模将可能达到或者超过各种关系数据库中的数据规模,从而成为继关系数据之后新的主流数据形式。如何有效管理XML数据自然成为寻找突破口的数据库界的热点研究问题。
   根据查询模式的不同,当前XML查询技术可以归为两大类:XML结构化查询和XML关键字查询。XML结构化查询要求用户掌握相关的XML文档查询语言和被查询文档的组织结构,这在实际中将给用户带来巨大的负担,将难以被大多数用户所接受。XML关键字查询的最大优点是其简单性,用户无须掌握复杂的查询语言,也无须了解任何数据的具体组织方式即可轻松提交查询。
   本文对XML关键字查询的基础知识做了比较详细的介绍,包括XML文档结构、主流编码方案、XML关键字查询模式和XML文档的解析方法等。文中对目前主流的XML关键字查询算法做了详细的分析,由于目前大多数算法还是基于LCA概念或其改进的概念,在以满足这些语义概念的最紧致片段作为查询结果的算法中,以SLCA作为返回结果的算法最为成熟、性能也最好。本文重点分析了以SLCA作为返回结果的Stack算法,ILE和SE算法、LISA算法,并详细介绍了基于SLCA节点作为返回结果的查询算法的优缺点。针对SLCA语义的缺点,本文提出了两种改进算法,并通过实验证明本文提出的算法在查询准确率方面具有优势。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号