首页> 外文会议>International Conference on Applied System Innovation >Resilient distributed computing platforms for big data analysis using Spark and Hadoop
【24h】

Resilient distributed computing platforms for big data analysis using Spark and Hadoop

机译:使用Spark和Hadoop的大数据分析的弹性分布式计算平台

获取原文

摘要

This paper introduces the integration of three platforms using Apache Hive, Cloudera Impala and BDAS Spark SQL which enables to support SQL-like queries in big data environment. In order to fast respond to user's query for big data processing, the optimized system can automatically select the appropriate platform to best perform a query. In addition, the rapid data retrieval from the in-memory cache or in-disk cache has achieved for the repeated SQL command. The proposed approach improves the efficiency of data retrieval significantly.
机译:本文介绍了使用Apache Hive,Cloudera Impala和BDAS Spark SQL的三个平台的集成,这使得能够支持大数据环境中的SQL样查询。为了快速响应用户对大数据处理的查询,优化的系统可以自动选择适当的平台以最好执行查询。此外,对于重复的SQL命令,已经实现了来自内存中缓存或磁盘中缓存的快速数据检索。所提出的方法显着提高了数据检索的效率。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号