...
【24h】

MapReduce における Shuffle の性能解析

机译:MapReduce における Shuffle の性能解析

获取原文
获取原文并翻译 | 示例
           

摘要

本研究では MapReduce におけるshuffle の性能に関して,ネットワーク I/O とディスク I/O の 2 つの観点から詳細な解析を行う.解析対象として現在一般に幅広く用いられている in-memory MapReduce 処理系であるApache Spark を採用し,Spark 1.6.2 の提供する 2 種類の shuffle 実装(Sort-based Shuffle,Hash-based Shuffle)に関して性能検証及び比較を行う.検証の結果,ネットワーク I/O に関しては 2 つの shuffle 実装の間で大きな差は見られず,ディスク I/O に関しては Hash-based Shuffle の方が頻繁にディスクへのアクセスを行っているものの,最終的な実行時間に関しては Hash-based Shuffle の方が Sort-based Shuffle に対して有利になるという結果となった.

著录项

获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号