首页> 中文期刊> 《计算机与现代化 》 >数据倾斜情况下基于MapReduce模型的连接算法研究

数据倾斜情况下基于MapReduce模型的连接算法研究

             

摘要

基于MapReduce的连接算法的研究是海量数据研究领域的一个重要内容,但都集中在数据分布均匀的情况下进行算法优化,而在实际应用中数据分布往往是不均匀的.本文基于此背景,提出一种适合在数据严重倾斜时使用基于Ma-pReduce编程模型的连接算法Skew Control Join,算法通过采样获取数据集的整体分布,通过全局分区将数据集进行分割,使倾斜数据的处理平均分配到所有的Reduce任务上.实验表明在数据倾斜时,本文提出的算法具有良好的性能,达到研究目标.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号