首页> 外文OA文献 >Comparison Study between MapReduce (MR) and Parallel Data Management Systems (DBMs) in Large Scale Data Analysis
【2h】

Comparison Study between MapReduce (MR) and Parallel Data Management Systems (DBMs) in Large Scale Data Analysis

机译:大规模数据分析中MapReduce(MR)与并行数据管理系统(DBM)之间的比较研究

代理获取
本网站仅为用户提供外文OA文献查询和代理获取服务,本网站没有原文。下单后我们将采用程序或人工为您竭诚获取高质量的原文,但由于OA文献来源多样且变更频繁,仍可能出现获取不到、文献不完整或与标题不符等情况,如果获取不到我们将提供退款服务。请知悉。

摘要

As the quantity of structured and unstructured data increases, data processingexperts have turned to systems that analyze data using many computers in parallel.This study looks at two systems designed for these needs: MapReduce and paralleldatabases. In the MapReduce programming model, users express their problem interms of a map function and a reduce function. Parallel databases organize data as asystem of tables representing entities and relationships between them. Previouscomparison studies have focused on performance, concluding that these twosystems are complimentary. Parallel databases scored high on performance andMapReduce scored high on flexibility in handling unstructured data. Both systemsoffer a querying language: Pig Latin for MapReduce systems and SQL for paralleldatabases. This study compares the operations, query structure and support foruser defined functions in these languages. The findings offer data processingexperts insights into how data organization and querying structure affects dataanalysis.
机译:随着结构化和非结构化数据量的增加,数据处理专家已转向使用多个并行计算机分析数据的系统。本研究着眼于满足这些需求而设计的两个系统:MapReduce和并行数据库。在MapReduce编程模型中,用户通过map函数和reduce函数来表达他们的问题。并行数据库将数据组织为代表实体及其之间关系的表系统。以前的比较研究集中在性能上,认为这两个系统是互补的。并行数据库在处理非结构化数据方面的性能得分很高,而MapReduce在灵活性方面的得分很高。两种系统都提供查询语言:Pig Latin用于MapReduce系统,而SQL用于并行数据库。本研究比较了这些语言的操作,查询结构和对用户定义功能的支持。这些发现为数据处理专家提供了有关数据组织和查询结构如何影响数据分析的见解。

著录项

  • 作者

    Mchome Miriam Lawrence;

  • 作者单位
  • 年度 2011
  • 总页数
  • 原文格式 PDF
  • 正文语种
  • 中图分类

相似文献

  • 外文文献
  • 中文文献
  • 专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号