首页> 外文OA文献 >Performance characterization of in-memory data analytics on a modern cloud server
【2h】

Performance characterization of in-memory data analytics on a modern cloud server

机译:现代云服务器上内存数据分析的性能表征

代理获取
本网站仅为用户提供外文OA文献查询和代理获取服务,本网站没有原文。下单后我们将采用程序或人工为您竭诚获取高质量的原文,但由于OA文献来源多样且变更频繁,仍可能出现获取不到、文献不完整或与标题不符等情况,如果获取不到我们将提供退款服务。请知悉。

摘要

In last decade, data analytics have rapidly progressed from traditional disk-based processing to modern in-memory processing. However, little effort has been devoted at enhancing performance at micro-architecture level. This paper characterizes the performance of in-memory data analytics using Apache Spark framework. We use a single node NUMA machine and identify the bottlenecks hampering the scalability of workloads. We also quantify the inefficiencies at micro-architecture level for various data analysis workloads. Through empirical evaluation, we show that spark workloads do not scale linearly beyond twelve threads, due to work time inflation and thread level load imbalance. Further, at the micro-architecture level, we observe memory bound latency to be the major cause of work time inflation.
机译:在过去的十年中,数据分析已从传统的基于磁盘的处理迅速发展为现代的内存处理。但是,在增强微体系结构级别的性能方面所做的工作很少。本文描述了使用Apache Spark框架进行内存数据分析的性能。我们使用单节点NUMA计算机,并确定阻碍工作负载可伸缩性的瓶颈。我们还对各种数据分析工作量在微体系结构级别的低效率进行了量化。通过经验评估,我们发现由于工作时间膨胀和线程级负载不平衡,火花工作负载不会线性扩展到十二个线程以上。此外,在微架构级别,我们观察到内存绑定延迟是工作时间膨胀的主要原因。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号