首页> 中国专利> 基于内存的MapReduce引擎数据处理方法和装置

基于内存的MapReduce引擎数据处理方法和装置

摘要

本发明揭示了一种基于内存的MapReduce引擎数据处理方法和装置,其中方法包括:将每个分区的Map输出结果数据进行粒度切割,并将切割后的粒度进行排序;将每个分区切割后的粒度进行多批次shuffle,并将各批次的数据依次进行拷贝、合并和reduce的流水线式数据处理,将reduce进程处理的数据控制在内存中。本发明通过纯软件方式对MapReduce的reduce进程进行流水线化设计,极大地减少了IO的访问与延迟;还可以根据可用内存的多少来调节并发批次的数目,从而提高了mapreduce引擎的吞吐量与整体性能,实测结果是原来的1.6倍‑2倍以上。

著录项

  • 公开/公告号CN106648451B

    专利类型发明专利

  • 公开/公告日2020-09-08

    原文格式PDF

  • 申请/专利权人 深圳前海信息技术有限公司;

    申请/专利号CN201610305911.4

  • 申请日2016-05-10

  • 分类号G06F3/06(20060101);G06F16/182(20190101);

  • 代理机构44343 深圳市明日今典知识产权代理事务所(普通合伙);

  • 代理人王杰辉

  • 地址 518000 广东省深圳市前海深港合作区前湾一路鲤鱼门街一号前海深港合作区管理局综合办公楼A栋201室(入驻深圳市前海商务秘书有限公司)

  • 入库时间 2022-08-23 11:12:51

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号