面向大数据处理框架的JVM优化技术综述

汪钇丞; 曾鸿斌; 许利杰; 王伟; 魏峻; 黄涛

首页> 中文期刊> 《软件学报》 >面向大数据处理框架的JVM优化技术综述

面向大数据处理框架的JVM优化技术综述

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

当前,以Hadoop、Spark为代表的大数据处理框架,已经在学术界和工业界被广泛应用于大规模数据的处理和分析.这些大数据处理框架采用分布式架构,使用Java、Scala等面向对象语言编写,在集群节点上以Java虚拟机(JVM)为运行时环境执行计算任务,因此依赖JVM的自动内存管理机制来分配和回收数据对象.然而,当前的JVM并不是针对大数据处理框架的计算特征设计的,在实际运行大数据应用时经常出现垃圾回收(GC)时间长、数据对象序列化和反序列化开销大等问题.在一些大数据场景下,JVM的垃圾回收耗时甚至超过应用整体运行时间的50%,已经成为大数据处理框架的性能瓶颈和优化热点.对近年来相关领域的研究成果进行了系统性综述:(1)总结了大数据应用在JVM中运行时性能下降的原因;(2)总结了现有面向大数据处理框架的JVM优化技术,对相关优化技术进行了层次划分,并分析比较了各种方法的优化效果、适用范围、使用负担等优缺点;(3)探讨了JVM未来的优化方向,有助于进一步提升大数据处理框架的性能.

著录项

来源
《软件学报》 |2023年第1期|463-488|共26页
作者
汪钇丞; 曾鸿斌; 许利杰; 王伟; 魏峻; 黄涛;
展开▼
作者单位

计算机科学国家重点实验室(中国科学院软件研究所);

中国科学院大学;

中科南京软件技术研究院;

展开▼
原文格式 PDF
正文语种 chi
中图分类操作系统;
关键词
大数据系统; JAVA虚拟机; 分布式系统; 自动内存管理;

相似文献

中文文献
外文文献
专利

1. 面向大数据处理的基于Spark的异质内存编程框架 [J] . 王晨曦 ,吕方 ,崔慧敏 . 计算机研究与发展 . 2018,第002期
2. 面向大数据处理的数据流编程模型和工具综述 [J] . 邹骁锋 ,阳王东 ,容学成 . 大数据 . 2020,第003期
3. 面向大数据处理的数据流编程模型和工具综述 [J] . 邹骁锋 ,阳王东 ,容学成 . 大数据 . 2020,第003期
4. 《大数据处理框架技术》课程思政设计与实践 [J] . 刘海 ,彭云峰 ,贾伟峰 . 电脑知识与技术:学术版 . 2022,第12期
5. 基于Spark大数据处理框架的逆时偏移成像技术研究 [J] . 蒋楠 . 石油物探 . 2020,第4期
6. 面向智慧城市的大数据处理技术研究与实现 [C] . GU Jia-yue ,顾佳跃 ,ZHAO Xiao-jing . 中国计算机用户协会网络应用分会2014年第十八届网络新技术与应用年会 . 2014
7. 面向无人驾驶的边缘流式大数据处理框架设计与实现 [A] . 赵航 . 2020

面向大数据处理框架的JVM优化技术综述

摘要

著录项

相似文献

相关主题

期刊订阅