首页> 中文学位 >基于通用关系模式的XML数据存储模型研究
【6h】

基于通用关系模式的XML数据存储模型研究

代理获取

摘要

随着Web 应用之间的XML数据交换数量的不断增长,如何在数据库中可靠和有效地存储XML文档以及XML和数据库之间的数据交换技术将变得越来越重要。关系数据库具有成熟的索引、存储、查询技术,将XML数据存储到关系数据库中将极具意义。但是,XML数据复杂的层次结构和关系数据库扁平的表达结构之间的不匹配,使得在存储过程中出现了很多复杂的问题。从上述应用背景出发,本文分析了目前国内外XML数据存储相关技术及其优缺点,研究了相关的理论和技术。其中特别对于层次结构的两种存储方式进行了对比分析。其中邻接列表模型(Adjacency List Model)数据存储方式很直观,但是由于其在处理层次关系中通常要“递归”调用,所以效率较低;另外一种嵌套集合模型(Nested Sets Model)为每个结点分配了两个整数坐标,通过比较这些坐标比较就能够得出结点的层次关系,它不再把层次结点看成点与线了,而是实际是用一个个嵌套容器来表述数据,当然嵌套容器的边界就是两个整数坐标,所以本文基于嵌套集合模型提出了一种基于模型映射的通用的关系存储模型,在该模型下能够将所有的XML文档结构无损地存储到一种通用的关系模型中,该模型被称为通用的XML 关系型存储模型(General XML RelationalModel)简称(GXRM)。XML 获得广泛应用的关键是XML数据资源的查询与检索,查询处理的关键技术是转换规则的建立,即如何将查询XML的路径表达式通过某一种规则转换成基于关系数据库的SQL 查询语言。在本文中介绍了基于GXRM 模型的抽取查询模式以及选择模查询模式的查询转换方案,其中选择模式选取Xpath 表达式来描述。抽取查询模式方案中将XML的结点符号分为若干类型,然后对于每个结点构造出其应有的类型的符号,最后再将结点合并即为所有的需要重构的文档内容。对于选择模查询模式首先利用Xpath图将Xpath 表达式解析成有结构的形式,从而使其能够更好地被识别。然后,再基于Xpath图给出查询转换规则算法,进而生成查询代码。最后,本文介绍了基于该模型以及查询算法的通用XML 关系存储模型中间件设计方案,其功能模块包含文档解析器、XML 转换器、查询解析器、SQL 生成器、XML文档生成器。通过实验并且分析了在各个查询场景下实验数据的正确性以及性能情况后表明,该中间件能够使XML数据在关系模式中有效存储,并且能正确反映测试结果,在处理常用Xpath 轴关系(父亲/儿子关系、祖先/后代关系)以及常用谓词操作(属性谓词、位置谓词、结点值谓词)中可以满足查询性能要求。

著录项

  • 作者

    周平平;

  • 作者单位

    上海交通大学;

  • 授予单位 上海交通大学;
  • 学科 软件工程
  • 授予学位 硕士
  • 导师姓名 姚天昉,包自更;
  • 年度 2009
  • 页码
  • 总页数
  • 原文格式 PDF
  • 正文语种 中文
  • 中图分类 TP311.131;
  • 关键词

    XML; 数据交换; 关系数据库; 存储模型;

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号