基于Spark的大数据应用开发支持环境研究开发

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

随着大数据技术的快速发展，大数据在各领域的应用日益增多，规模不断扩大。大数据应用支持系统开发的需求日益强烈。
　　为了满足这个需求，我们进行了基于Spark的大数据应用开发支持环境的研究开发，其宗旨是以Spark生态环境为基础，提供相关大数据应用软件开发工具，支持用户便捷、高效的使用Spark大数据环境计算资源进行各种大数据应用运行，并方便地管理用户计算程序和各种文档。
　　在研究开发工作中，我们研究了Spark并行计算引擎的运行原理、Spark生态系统的核心技术，提出了基于Spark的大数据应用开发支持环境体系结构、软件架构和网络架构。基于IBM服务器、UbuntuLinux操作系统、Spark1.5.2软件，进行了物理集群搭建、Spark及其开发工具部署，搭建了基于Spark的大数据平台。在此基础上，依托Linux/Eclipse/Tomcat/Mysq1平台，综合运用Java、Javascript、HTML、Ajax、CSS语言，开发了一套基于Spark的大数据应用开发支持环境。该环境包括门户网站、Spark集群的封装和调用、基于Spark的并行程序开发、部署、运行监视、结果存储、分析和图形化展示、用户反馈等模块；集成了Spark生态系统，包括常用的大数据处理软件。
　　为了实现用户应用程序部署至Spark集群，我们提出了一种基于负载权值的动态权值随机算法，根据Spark集群各节点的CPU、内存等资源和实际负载量等因素，确定用户程序的部署方式，使得用户程序任务在Spark集群服务器的分配平衡、高效，集群的各种资源得以充分利用。
　　目前，基于Spark的大数据应用开发支持环境已经完成测试，并在陕西省网络计算与安全技术重点实验室实际运行。
　　本文详细介绍了上述研究开发工作，包括理论研究、系统分析、设计、编码、测试、部署过程。最后给出了基于Spark的大数据应用开发支持环境的典型运行界面。

著录项

作者
吴冕冠;
展开▼
作者单位

西安理工大学;

展开▼
授予单位西安理工大学;
学科计算机系统结构
授予学位硕士
导师姓名张璟;
年度 2016
页码
总页数
原文格式 PDF
正文语种中文
中图分类 TP311.13;
关键词
大数据; 应用开发; Spark生态系统; IBM服务器; 并行程序;

相似文献

中文文献
外文文献
专利

1. 基于大数据下的Spark快速大数据分析 [J] . 林海 ,王强 ,李英震 . 现代工业经济和信息化 . 2019,第010期
2. 基于HDFS+Spark的时空大数据存储与处理——以智慧无锡时空大数据为例 [J] . 贾旖旎 ,周新民 ,曹芳 . 软件 . 2019,第011期
3. 基于Hadoop和Spark的可扩展性化工类大数据分析系统设计 [J] . 尹旭熙 . 粘接 . 2021,第006期
4. 基于Spark框架的电力大数据服务技术 [J] . 孙煜华 ,李情 ,张梦清 . 信息技术 . 2021,第005期
5. 基于Apache Spark的配电网大数据预处理技术研究 [J] . 徐宁 ,王艳芹 ,董祯 . 华北电力大学学报(自然科学版) . 2021,第002期
6. 基于Spark的医疗大数据处理模型研究与设计 [C] . GE Xiao-wei ,葛晓伟 ,LI Yu-shen . 中华医学会第二十四次全国医学信息学术会议 . 2018
7. 基于大数据的铁路供电EMIS系统及其Android应用开发 [A] . 李道明 . 2016

基于Spark的大数据应用开发支持环境研究开发

目录

摘要

著录项

相似文献

相关主题

期刊订阅