首页> 中文会议>2008年全国高性能计算机学术年会 >大规模数据密集型系统中的去重查询优化

大规模数据密集型系统中的去重查询优化

摘要

在大规模数据密集型系统中,海量数据分布存储在多节点,给去重查询提出了新的挑战。本文针对去重查询中可能出现的不同情况,提出了一种有效地数据分布策略和并行处理方法:即散列和直方图相结合的数据分布策略,以及异步式并行查询引擎,对多节点的去重查询进行优化。异步式并行查询引擎充分发掘了海量数据处理中流水级的并行,消除了多节点同步等待的开销,能够尽早地返回用户结果,降低去重查询的响应时间。在真实系统DBroker上的实验表明,数据分布策略能极大地改善相关属性的去重查询性能,而异步式并行查询引擎能够充分发掘并行性,对不相关属性的去重查询具有明显的性能提升。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号