首页> 中文期刊>西安电子科技大学学报(自然科学版) >一种适用于Hadoop MapReduce环境的数据预取方法

一种适用于Hadoop MapReduce环境的数据预取方法

     

摘要

Due to the data dependency and the special task execution mode in MapReduce environments, reduce tasks always cause massive remote data access delay and unnecessary resource competition,which degrades the system performance.To solve the performance problem,we propose a pre-fetching method based on pre-scheduling.The method hides the remote data access delay by pre-fetching,and controls the resource competition by adjusting resource allocation of reduce tasks.The method is implemented in Hadoop-0.20.2.The experimental results show that the method improves the system performance by more than 10%,compared with default Hadoop MapReduce and Hadoop Online Prototype.%为解决由Reduce任务引起的远程数据访问延时和资源竞争导致的系统性能问题,提出了一种基于预调度的数据预取方法.该方法通过预取数据来隐藏由 Reduce 任务引起的远程数据访问延时,通过控制与Reduce任务相关的资源分配来减少由其引起的资源竞争.此方法已在 Hadoop-0.20.2中实现.实验结果表明,与缺省的 Hadoop MapReduce及 Hadoop Online Prototype相比,该方法可将系统性能提高10%以上.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号