首页> 外文学位 >An Efficient Foundation for Big Data Processing on Modern Clusters.
【24h】

An Efficient Foundation for Big Data Processing on Modern Clusters.

机译:现代集群上大数据处理的高效基础。

获取原文
获取原文并翻译 | 示例

摘要

In recent years, the world has seen an explosion in the amount of data being generated. Google proposed the MapReduce framework to allow programmers easily process massive amounts of data in parallel using a cluster of shared-nothing commodity machines. What started out as a tool for human efficiency subsequently began to be used as an intermediate representation for queries compiled from higher-level declarative languages. In this thesis, we present an alternate software stack for building scalable Big Data systems. We specifically focus on two parts of the stack. Hyracks is a new partitioned-parallel runtime layer that provides an efficient, generalized model for executing data-processing jobs on a cluster of commodity machines. Algebricks is a compiler framework that helps to build high-level declarative language compilers for parallel processing on top of Hyracks.
机译:近年来,全世界看到的数据量激增。谷歌提出了MapReduce框架,该框架允许程序员使用无共享商品的集群轻松地并行处理大量数据。最初作为提高人类效率的工具,后来开始用作从高级声明性语言编译的查询的中间表示。在本文中,我们提出了用于构建可伸缩大数据系统的备用软件堆栈。我们特别关注堆栈的两个部分。 Hyracks是一个新的分区并行运行时层,它提供了一种高效的通用模型,用于在商用机器集群上执行数据处理作业。 Algebricks是一个编译器框架,可帮助构建高级声明式语言编译器以在Hyracks上进行并行处理。

著录项

  • 作者

    Borkar, Vinayak.;

  • 作者单位

    University of California, Irvine.;

  • 授予单位 University of California, Irvine.;
  • 学科 Computer science.
  • 学位 Ph.D.
  • 年度 2016
  • 页码 119 p.
  • 总页数 119
  • 原文格式 PDF
  • 正文语种 eng
  • 中图分类
  • 关键词

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号