基于Spark的分布式大数据分析算法研究

宋泊东; 张立臣; 江其洲

首页> 中文期刊> 《计算机应用与软件》 >基于Spark的分布式大数据分析算法研究

基于Spark的分布式大数据分析算法研究

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

随着大数据时代的到来,数据计算的实时性和数据量面临许多挑战.为了满足庞大的数据量和大数据高速处理的要求,研究将Apache作为一种集成的资源管理系统.采用Apache Storm、Apache Spice及SARKRDD处理大型分布式实时数据流,使用Apache Kafka作为消息中间件来支持异步消息的通信.设计一种支持并行运算规则的分布式大数据分析处理算法.实验结果表明:该算法可有效降低海量数据的分析速度,且支持系统内各子系统间的异构信息沟通与数据存储,足以满足高频交易市场的短期趋势预测需求.在高频、大数据处理系统中具有较高的应用价值.

著录项

来源
《计算机应用与软件》 |2019年第1期|39-44|共6页
作者
宋泊东; 张立臣; 江其洲;
展开▼
作者单位

广东工业大学计算机学院广东广州510006;

广东工业大学计算机学院广东广州510006;

广东工业大学计算机学院广东广州510006;

展开▼
原文格式 PDF
正文语种 chi
中图分类计算技术、计算机技术;
关键词
Apache Kafka; 分布式; Spark RDD; n层; 实时数据流;

相似文献

中文文献
外文文献
专利

1. 基于Spark的分布式健康大数据分析系统设计与实现 [J] . 吴磊 ,欧阳赫明 . 软件导刊 . 2020,第007期
2. 基于Spark的分布式大数据分析建模系统的设计与实现 [J] . 徐时芳 ,罗晓宾 ,陈阳华 . 现代电子技术 . 2018,第020期
3. 基于Hadoop和Spark的可扩展性化工类大数据分析系统设计 [J] . 尹旭熙 . 粘接 . 2021,第006期
4. 基于Spark的舆情情感大数据分析集成方法 [J] . 戴宏亮 ,钟国金 ,游志铭 . 计算机科学 . 2021,第009期
5. 基于深度学习和Spark计算的移动大数据分析算法 [J] . 丁晓梅 ,汪静 ,赵丽红 . 长沙大学学报 . 2020,第005期
6. 基于Spark技术的网络大数据分析平台搭建与应用 [C] . 詹义 ,方媛 ,陈彦名 . 中国移动通信集团设计院第20届新技术论坛 . 2014
7. 基于Spark平台的分布式物流配送优化算法研究 [A] . 刘艺 . 2020

基于Spark的分布式大数据分析算法研究

摘要

著录项

相似文献

相关主题

期刊订阅