基于Hadoop、Spark及Flink大规模数据分析的性能评价

代明竹; 高嵩峰

首页> 中文期刊> 《中国电子科学研究院学报》 >基于Hadoop、Spark及Flink大规模数据分析的性能评价

基于Hadoop、Spark及Flink大规模数据分析的性能评价

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

针对目前缺少大型数据分析框架间的横向比较问题,使用有代表性的大数据工作负载,对Hadoop、Spark和Flink进行性能和可扩展性等因素的比较评价.此外,通过调整工作负载的一些主要参数,例如HDFS块大小、输入数据大小、互连网络或线程配置等,描述了这些框架的行为模式特征.实验结果分析表明,对于非排序的基准测试程序,使用Spark或Flink替代Hadoop,分别带来平均77％和70％执行时间的降低.整体上,Spark的性能结果最好;而Flink通过使用的显式迭代程序,极大提高了迭代算法的性能.

著录项

来源
《中国电子科学研究院学报》 |2018年第2期|149-155|共7页
作者
代明竹; 高嵩峰;
展开▼
作者单位

北京建筑大学,北京 100044;

北京建筑大学,北京 100044;

展开▼
原文格式 PDF
正文语种 chi
中图分类 TP311.13;TP311.52;
关键词
大数据; 分析框架; 基准测试程序; 模型;

相似文献

中文文献
外文文献
专利

1. 基于Hadoop、Storm、Samza、Spark及Flink大数据处理框架的比较研究 [J] . 赵娟 ,程国钟 . 信息系统工程 . 2017,第006期
2. 基于Hadoop和Spark的可扩展性化工类大数据分析系统设计 [J] . 尹旭熙 . 粘接 . 2021,第006期
3. 基于Flink大数据分析的电力资产全寿命周期管理平台研究 [J] . 胡晓明 . 电子制作 . 2022,第3期
4. 基于Linux平台下的Hadoop和Spark集群搭建研究 [J] . 林皓月 ,段华琼 . 电脑知识与技术 . 2020,第023期
5. 基于Hadoop平台的Spark快数据推荐算法解析——以其在图书推荐系统中的应用为例 [J] . 吴荣 ,段宏涛 . 数字技术与应用 . 2020,第006期
6. 如何基于Alluxio提升Spark和Hadoop HDFS的数据访问性能与系统稳定性 [C] . 顾荣 . 2017中国数据库技术大会 . 2018
7. 基于Flink的大规模水文传感器数据异常检测系统的研究与应用 [A] . 刘子豪 . 2020

基于Hadoop、Spark及Flink大规模数据分析的性能评价

摘要

著录项

相似文献

相关主题

期刊订阅