首页> 中文学位 >支持查询的XML数据压缩方法研究
【6h】

支持查询的XML数据压缩方法研究

代理获取

目录

文摘

英文文摘

第一章 绪论

1.1 研究背景及意义

1.2 国内外研究现状

1.3 主要研究内容

1.4 论文的组织结构

第二章 XML相关理论与数据压缩技术

2.1 XML简介

2.1.1 XML数据

2.1.2 DTD与Schema

2.1.3 XML解析方法

2.2 XML数据模型

2.3 XML数据的存储

2.4 XML数据的查询

2.5 结点编码方案

2.6 数据压缩技术

2.7 本章小结

第三章 基于结构标记树的XML可查询压缩方法

3.1 结构标记树SST

3.1.1 SST的定义

3.1.2 SST的构建

3.1.3 SST算法

3.2 SSTQC的体系结构

3.2.1 SSTQC的结构

3.2.2 SSTQC的流程

3.3 数据压缩

3.3.1 数据压缩处理

3.3.2 数据解压缩处理

3.4 查询处理

3.5 实现的关键技术

3.5.1 SAX解析

3.5.2 hash编码

3.6 实验及性能测试

3.6.1 实验环境及数据

3.6.2 性能参数

3.6.3 实验结果及分析

3.7 本章小结

第四章 支持复杂查询的XML数据压缩方法

4.1 Twig查询

4.1.1 基本概念

4.1.2 查询处理分析

4.2 TXQC的体系结构

4.3 结构树的构建

4.4 前缀编码

4.5 数据压缩

4.5.1 数据压缩处理

4.5.2 数据解压缩处理

4.6 TXQC的查询处理

4.7 实验及性能测试

4.7.1 实验环境及数据

4.7.2 实验结果及分析

4.8 本章小结

结论

参考文献

攻读硕士学位期间取得的学术成果

致谢

展开▼

摘要

随着互联网技术的迅猛发展,XML已逐渐成为数据表达和交换的新标准,越来越多的Web数据通过XML文档形式呈现。XML以其半结构化、自描述性、易于交换和可扩展性等特点在很多行业得到广泛的应用。但是,XML的这些特点也使其存在大量的数据冗余,模式和数据混杂导致模式信息在数据中存在大量重复,极大地增加了数据存储、交换和处理的代价,严重阻碍了XML数据库更深入、更广泛的应用。
   XML数据压缩技术成为提高XML数据管理的一种有效途径。当然,压缩XML文档不是最终目的,如果通过完全解压缩实现对压缩数据的查询处理操作,必然会造成系统的负担,因此支持查询的XML数据压缩成为发展的必然。
   本文主要研究支持查询的XML数据压缩技术,针对已有XML压缩方法的缺点和不足,提出了两种支持查询的XML数据压缩方法。
   针对XML文档存在的重复结构和重复数据问题,通过去除XML数据中的重复路径,简化XML数据的结构,本文提出结构标记树的概念和详细算法。建立了一种基于结构标记树的可查询XML数据压缩方法SSTQC(a Structure Sign Tree based QueryableCompressor),对XML,数据进行压缩和组织查询。SSTQC一次扫描XML文档,拥有出色的压缩性能和较好的查询效率。
   针对大多数XML压缩方法不能很好地支持Twig查询的问题,本文提出一种能够支持Twig查询的XML数据压缩算法TXQC(a Twig query-supported XMI,QueryableCompressor)。利用前缀编码的良好特性,根据XML数据的树型结构采用模式匹配的方法来获取Twig查询结果。相对于其它的XML数据压缩方法,在处理XML复杂路径查询时,TXQC的查询策略更加高效。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号