首页> 外文期刊>Journal of supercomputing >Atrak: a MapReduce-based data warehouse for big data
【24h】

Atrak: a MapReduce-based data warehouse for big data

机译:Atrak:基于MapReduce的大数据数据仓库

获取原文
获取原文并翻译 | 示例
       

摘要

As warehouse data volumes expand, single-node solutions can no longer analyze the immense volume of data. Therefore, it is necessary to use shared nothing architectures such as MapReduce. Inter-node data segmentation in MapReduce creates node connectivity issues, network congestion, improper use of node memory capacity and inefficient processing power. In addition, it is not possible to change dimensions and measures without changing previously stored data and big dimension management. In this paper, a method called Atrak is proposed, which uses a unified data format to make Mapper nodes independent to solve the data management problem mentioned earlier. The proposed method can be applied to star schema data warehouse models with distributive measures. Atrak increases query execution speed by employing node independence and the proper use of MapReduce. The proposed method was compared to established methods such as Hive, Spark-SQL, HadoopDB and Flink. Simulation results confirm improved query execution speed of the proposed method. Using data unification in MapReduce can be used in other fields, such as data mining and graph processing.
机译:随着仓库数据量的扩展,单节点解决方案不再能够分析庞大的数据量。因此,有必要使用诸如MapReduce之类的无共享架构。 MapReduce中的节点间数据分段会导致节点连接性问题,网络拥塞,节点内存容量使用不当以及处理能力低下。另外,如果不更改先前存储的数据和大尺寸管理,则无法更改尺寸和度量。本文提出了一种称为Atrak的方法,该方法使用统一的数据格式使Mapper节点独立,以解决前面提到的数据管理问题。所提出的方法可以应用于具有分布度量的星型模式数据仓库模型。 Atrak通过使用节点独立性和正确使用MapReduce来提高查询执行速度。将该方法与已建立的方法(例如Hive,Spark-SQL,HadoopDB和Flink)进行了比较。仿真结果证实了该方法提高了查询执行速度。在MapReduce中使用数据统一可用于其他领域,例如数据挖掘和图形处理。

著录项

  • 来源
    《Journal of supercomputing》 |2017年第10期|4596-4610|共15页
  • 作者单位

    Coll Intersect, Adv Informat Syst Res Grp Informat & Commun Techn, Res Ctr, 5 Saeedialley,Enghelab St, Tehran 1599616313, Iran;

    Coll Intersect, Adv Informat Syst Res Grp Informat & Commun Techn, Res Ctr, 5 Saeedialley,Enghelab St, Tehran 1599616313, Iran;

  • 收录信息 美国《科学引文索引》(SCI);美国《工程索引》(EI);
  • 原文格式 PDF
  • 正文语种 eng
  • 中图分类
  • 关键词

    Big data; MapReduce; Data warehouse; Data locality;

    机译:大数据;MapReduce;数据仓库;数据局部性;

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号