基于Spark分布式ETL在海量后勤数据的应用

张野; 姚文明

首页> 中文期刊> 《信息技术》 >基于Spark分布式ETL在海量后勤数据的应用

基于Spark分布式ETL在海量后勤数据的应用

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

cqvip:在处理某大型企业的海量后勤大数据时,传统的基于MapReduce的ETL技术在数据提取、转换过程中,因为频繁进行磁盘读取的原因,存在数据处理效率不足的问题。考虑到Spark是基于内存操作的计算引擎,不依赖于磁盘操作,对数据的提取、转换效率的提升有一定帮助,因此文中采用了基于Spark的分布式ETL技术来处理这些海量数据,并通过实验进行效率比较。

著录项

来源
《信息技术》 |2019年第12期|165-168|共4页
作者
张野; 姚文明;
展开▼
作者单位

华北计算技术研究所北京100083;

展开▼
原文格式 PDF
正文语种 chi
中图分类信息处理（信息加工）;
关键词
大数据; Spark; ETL; 分布式;

相似文献

中文文献
外文文献
专利

1. 基于SQL 2005 SSIS技术的分布式海量数据ETL系统 [J] . 张永涛 . 电信技术 . 2011,第007期
2. 基于分布式数据仓库技术的ETL系统的研究与应用 [J] . 花海洋 ,李一凡 ,赵怀慈 . 微计算机信息 . 2006,第030期
3. 基于分布式数据仓库技术的ETL系统的研究与应用 [J] . 花海洋 ,李一凡 ,赵怀慈 . 微计算机信息 . 2006,第10X期
4. 基于Spark平台的海量AIS数据k-means算法聚类分析 [J] . 初秀民 ,林宏 ,王志远 . 交通科技 . 2021,第003期
5. 基于Spark SQL的海量数据实时分类查询算法的研究 [J] . 胡晶 . 黄河科技学院学报 . 2021,第005期
6. 基于分布式云计算技术在电信行业中进行海量数据运营的探讨 [C] . 唐辉 ,乔志勇 ,黄瑾 . 2012广东通信青年论坛 . 2012
7. 基于Spark的分布式ETL研究与应用 [A] . 解书亮 . 2017

基于Spark分布式ETL在海量后勤数据的应用

摘要

著录项

相似文献

相关主题

期刊订阅