首页> 中文学位 >基于GPU的复杂SQL查询优化方法研究
【6h】

基于GPU的复杂SQL查询优化方法研究

代理获取

目录

封面

中文摘要

英文摘要

目录

第1章 绪 论

1.1 研究背景和意义

1.2 国内外相关研究工作综述

1.3 本文的主要研究内容

1.4 本文的组织结构

第2章 数据库查询基础知识

2.1 列式数据库

2.2 数据库查询的基本概念

2.3 数据库查询优化技术概述

2.4本章小结

第3章 物理存储和压缩模型

3.1 物理存储模型

3.2 基于GPU的差值压缩算法

3.3 实验结果与分析

3.4本章小结

第4章 基于GPU的复杂SQL查询算法

4.1 SQL语句解析

4.2 SQL范围查询的并行化实现

4.3 SQL分组查询的并行化实现

4.4流水线调度模型

4.5实验结果与分析

4.7本章小结

结论

参考文献

附录

声明

致谢

个人简历

展开▼

摘要

随着信息技术的发展,数据库中数据存储规模越来越大,呈现出数据量大、数据类型多、价值密度低的特点。在这个背景下,数据库的查询操作从传统的单一维度简单查询扩展为多维度的复杂查询。复杂查询作为数据库系统分析数据的重要手段,在实际分析处理数据过程中扮演着重要角色。通过查询请求,企业决策人员能快速获得自己最关注的信息。利用传统的数据库分析手段对海量数据进行提取、存储、分析得到实时结果变得越来越困难,也制约了企业管理者的决策。
  为了提高大规模数据下多维复杂查询的速度,本文结合了图形处理器并行计算能力和列存储数据库的存储特点,提出了适用于并行查询的列式存储模型以及GPU并行加速查询的策略。本文的主要研究内容如下:
  (1)研究数据库复杂查询的相关理论和GPU并行计算模型,并总结出传统数据库查询优化技术。重点分析了不同数据库的存储策略和压缩算法;
  (2)提出一种基于稀疏索引的物理存储模型,模型在列存储的基础上采用分段划分的策略,同时根据GPU特点采用差值压缩算法进行数据压缩处理,并结合GPU高并行计算能力实现对数据的并行压缩;
  (3)提出一种基于GPU的复杂查询并行执行算法:结合GPU查询原语操作实现对复杂查询的优化。其中重点实现了对范围查询和分组查询的优化,提出了对分组查询结果合并的策略。提出利用流水线调度策略解决实验中存在IO时间过长的问题,一定程度上加快了查询响应的速度;
  (4)通过实验证明了利用 GPU加速压缩算法和查询加速算法的优越性:将本文提出的查询模型和传统数据库采用美国交易处理效能委员会提出TPC-H测试数据集进行对比分析,证明了本文查询模型在大规模数据集下相比于现有GPU数据库取得5-8倍的加速比。

著录项

  • 作者

    宋金荣;

  • 作者单位

    哈尔滨工业大学;

  • 授予单位 哈尔滨工业大学;
  • 学科 计算机科学与技术
  • 授予学位 硕士
  • 导师姓名 叶允明;
  • 年度 2013
  • 页码
  • 总页数
  • 原文格式 PDF
  • 正文语种 中文
  • 中图分类 TP311.13;
  • 关键词

    复杂查询; 并行计算; 数据库; GPU模型; 存储策略;

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号