首页> 中文学位 >数据仓库中基于位图索引查询优化的研究
【6h】

数据仓库中基于位图索引查询优化的研究

代理获取

目录

文摘

英文文摘

1 绪论

1.1 研究课题背景及意义

1.2 国内外研究现状

1.3 本文结构安排

2 数据仓库基础及常用索引技术

2.1 数据仓库概述

2.1.1 数据仓库的概念

2.1.2 操作数据库系统与数据仓库的区别

2.2 数据仓库的多维数据模型

2.2.1 星型模型

2.2.2 雪花模型

2.3 数据仓库的常用索引

2.3.1 B-树索引

2.3.2 R一树索引

2.3.3 位图索引

3 基于权值排序的查询优化算法

3.1 bin位图索引

3.2 基于bin位图索引的一维查询

3.3 基于bin位图索引的多维查询

3.3.1 基于bin位图索引多维查询算法

3.3.2 基于权值排序优化算法

3.4 实验结果与分析

3.4.1 实验数据

3.4.2 实验设计及结果分析

4 基于动态预扫描的查询优化算法

4.1 范围编码的bin位图索引

4.2 基于范围编码bin位图索引的一维查询

4.3 基于范围编码bin位图索引的多维查询

4.3.1 预扫描算法

4.3.2 基于排序的预扫描优化算法

4.3.3 基于动态预扫描的优化算法

4.4 实验结果与分析

4.4.1 实验数据

4.4.2 实验设计及结果分析

5 总结与展望

5.1 本文总结

5.2 展望

参考文献

个人简历 在学期间发表的学术论文与研究成果

个人简历

攻读硕士学位期间发表的学术论文

致谢

展开▼

摘要

索引是数据仓库查询优化的重要技术,主要包括树形索引和位图索引。其中位图索引因为其结构简单,并且硬件支持二进制位运算效率很高,被广泛应用在数据仓库中。在属性的基数(该属性可能的取值数)低的情况下,位图索引已经被证明是十分高效的。但在基数比较高的情况下,位图索引需要占用大量的存储空间。位图索引往往被认为只有在属性基数较低情况下才适合使用。
   为了克服这个难题,现今研究者们已经提出了很多方法,包括编码,压缩,bin。其中bin位图索引可以有效的降低高基数时位图占用的空间。这种索引不像简单位图索引那样建立在每一个不同的属性值上,而是建立在一个个的属性范围上。但它同时也带来了另一个难题,就是候选检查。候选检查往往占用大部分的查询时间。
   采用传统多维查询算法,对各属性进行查询的顺序不同,可能对总候选检查数目产生重大影响。本文给出两个定理,证明了影响排序的两个因素。并据此提出一种基于权值排序算法,通过在执行查询前对各属性查询进行排序,使总的候选检查的数目尽可能少。理论分析和实验表明,此排序算法可以明显减少总候选检查数目,优化了传统多维查询算法。
   但是排序的传统多维查询算法并不能减少查询的第一维所需的候选检查数目,实验表明第一维所需的候选检查数目往往占总候选检查数目的大部。通过预扫描(推迟候选检查)可以有效解决这个问题,但是进行预扫描需要额外的花费,即要扫描更多的索引,这个代价是不能忽视的。考虑到预扫描一定维数后,继续预扫描将不会明显的减少总的候选检查数目,本文在排序的基础上提出动态预扫描算法,目标是在预扫描属性数目和总的候选检查数目中找出一个合理的平衡点,以提高查询效率。理论分析和实验结果表明,动态预扫描算法取得了良好的效果。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号