首页> 外国专利> Large-scale data processing in a distributed and parallel processing enviornment

Large-scale data processing in a distributed and parallel processing enviornment

机译:分布式并行处理环境中的大规模数据处理

摘要

A large-scale data processing system and method includes one or more application-independent map modules configured to read input data and to apply at least one application-specific map operation to the input data to produce intermediate data values, wherein the map operation is automatically parallelized across multiple processors in the parallel processing environment. A plurality of intermediate data structures are used to store the intermediate data values. One or more application-independent reduce modules are configured to retrieve the intermediate data values and to apply at least one application-specific reduce operation to the intermediate data values to provide output data.
机译:一种大规模数据处理系统和方法,包括一个或多个与应用程序无关的映射模块,该模块被配置为读取输入数据并将至少一个特定于应用程序的映射操作应用于输入数据以产生中间数据值,其中该映射操作是自动进行的在并行处理环境中跨多个处理器并行化。多个中间数据结构用于存储中间数据值。一个或多个与应用程序无关的归约模块被配置为检索中间数据值并将至少一个特定于应用程序的归约运算应用于中间数据值以提供输出数据。

著录项

  • 公开/公告号US7756919B1

    专利类型

  • 公开/公告日2010-07-13

    原文格式PDF

  • 申请/专利权人 JEFFREY DEAN;SANJAY GHEMAWAT;

    申请/专利号US20040871245

  • 发明设计人 JEFFREY DEAN;SANJAY GHEMAWAT;

    申请日2004-06-18

  • 分类号G06F15/16;

  • 国家 US

  • 入库时间 2022-08-21 18:51:36

相似文献

  • 专利
  • 外文文献
  • 中文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号