首页> 外文会议>2016 International Conference on Applied System Innovation >Resilient distributed computing platforms for big data analysis using Spark and Hadoop
【24h】

Resilient distributed computing platforms for big data analysis using Spark and Hadoop

机译:弹性分布式计算平台,可使用Spark和Hadoop进行大数据分析

获取原文
获取原文并翻译 | 示例

摘要

This paper introduces the integration of three platforms using Apache Hive, Cloudera Impala and BDAS Spark SQL which enables to support SQL-like queries in big data environment. In order to fast respond to user's query for big data processing, the optimized system can automatically select the appropriate platform to best perform a query. In addition, the rapid data retrieval from the in-memory cache or in-disk cache has achieved for the repeated SQL command. The proposed approach improves the efficiency of data retrieval significantly.
机译:本文介绍了使用Apache Hive,Cloudera Impala和BDAS Spark SQL的三个平台的集成,该平台能够在大数据环境中支持类似SQL的查询。为了快速响应用户对大数据处理的查询,优化后的系统可以自动选择合适的平台以最佳地执行查询。此外,对于重复的SQL命令,已经从内存缓存或磁盘缓存中快速检索数据。所提出的方法大大提高了数据检索的效率。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号