适用于范围查询的列存储数据桶划分算法

李晔锋; 乐嘉锦; 王梅

首页> 中文期刊> 《计算机研究与发展》 >适用于范围查询的列存储数据桶划分算法

适用于范围查询的列存储数据桶划分算法

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

范围查询是数据库中一项重要的操作.列存储数据库中,能否有效查找一个范围内的属性值,获取对应的行号集合,将极大影响元组重构的效率.与树型结构相比,Hash表对数据的精确查找具有更高的效率,但是范围查找的效率比较低.针对这种情况,提出了一种改进的可用于范围查询的数据桶划分算法.为了能够更好地对算法进行描述,首先提出了可用于范围查询的Hash存储模型(ranged Hash,RH),并给出了桶的值域和序列化的定义.其次针对列存储等“读优先”特性,在RH模型的基础上,提出一种改进的桶划分算法.该算法生成可序列化的哈希函数把属性值划分到桶中,能够同时提高属性值的范围查询效率和存储效率.最后,通过实验结果验证算法的有效性.%Range query is significant to databases. In a column-store database, using range queries on attribute values to obtain the resulting row-id set, would affect the performance of tuple reconstruction. Compared with tree structure, Hash tables are more effective in exact queries but less effective in range queries. With this situation, a bucket partition algorithm for range queries is proposed. Firstly, In order to give a good introduction to the algorithm, a Hash storage model used for range queries (ranged hash, RH) is proposed, along with the definition of the bucket range and the serialization. Then, according to the "read-optimized" feature of column store databases, an improved bucket partition algorithm used for range queries is proposed based on the RH model. The algorithm could generate serializable Hash functions to partition attribute values into buckets, and could improve not only the efficiency of range queries but also the storage efficiency. Finally, the experimental results prove the efficiency of the algorithm.

著录项

来源
《计算机研究与发展》 |2013年第3期|594-601|共8页
作者
李晔锋; 乐嘉锦; 王梅;
展开▼
作者单位

东华大学计算机科学与技术学院上海201620;

展开▼
原文格式 PDF
正文语种 chi
中图分类程序设计;
关键词
列存储; 范围查询; Hash表; 可序列化; 桶划分;

相似文献

中文文献
外文文献
专利

1. HashMap优化及其在列存储数据库查询中的应用 [J] . 母红芬 ,李征 ,霍卫平 . 计算机科学与探索 . 2016,第009期
2. 列存储数据查询中的连接策略优化方法 [J] . 孙莉 ,李静 ,刘国华 . 计算机研究与发展 . 2013,第008期
3. 列存储数据仓库查询执行中重用缓冲区调度算法 [J] . 张琦 ,王梅 ,乐嘉锦 . 计算机研究与发展 . 2011,第010期
4. 列存储数据仓库中启发式查询优化机制 [J] . 严秋玲 ,孙莉 ,王梅 . 计算机学报 . 2011,第010期
5. 列存储数据查询中的连接策略选择方法 [J] . 李静 ,孙莉 ,王梅 . 计算机科学与探索 . 2010,第009期
6. HashMap优化及其在列存储数据库查询中的应用 [C] . MU Hongfen ,母红芬 ,LI Zheng . 第32届中国数据库学术会议 . 2015
7. 列存储数据仓库中的查询重写关键技术的研究与实现 [A] . 严秋玲 . 2012

适用于范围查询的列存储数据桶划分算法

摘要

著录项

相似文献

相关主题

期刊订阅