首页> 中文期刊> 《智能计算机与应用 》 >面向DNS日志的MapReduce性能优化技术研究

面向DNS日志的MapReduce性能优化技术研究

             

摘要

DNS日志是互联网中重要的访问日志,数量巨大且承载着大量信息,需要借助大数据技术进行处理和分析.现网DNS日志数据量大,且数据倾斜现象严重,对MapReduce的性能有较为严重的影响.基于上述问题,采用小文件合并方法优化分片,缓解Map端的数据倾斜问题,并实现动态设置分片大小,提高MapReduce作业执行效率.该方法有效均衡了Map任务的负载,从而提高了数据倾斜情况下的MapReduce作业的执行效率和资源利用率.实验表明,使用该方法可以有效缩短MapReduce作业的执行时间.

著录项

  • 来源
    《智能计算机与应用 》 |2018年第2期|73-77|共5页
  • 作者单位

    中国科学院 信息工程研究所,北京100093;

    中国科学院大学 网络空间安全学院, 北京100049;

    中国科学院 信息工程研究所,北京100093;

    中国科学院大学 网络空间安全学院, 北京100049;

    中国科学院 信息工程研究所,北京100093;

    中国科学院大学 网络空间安全学院, 北京100049;

    中国科学院 信息工程研究所,北京100093;

    中国科学院大学 网络空间安全学院, 北京100049;

    中国科学院 信息工程研究所,北京100093;

    中国科学院大学 网络空间安全学院, 北京100049;

  • 原文格式 PDF
  • 正文语种 chi
  • 中图分类 计算机网络 ;
  • 关键词

    DNS日志; 数据倾斜; MapReduce ; 性能优化 ;

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号