首页> 中文学位 >Hadoop平台快速部署及性能优化技术研究与实现
【6h】

Hadoop平台快速部署及性能优化技术研究与实现

代理获取

目录

声明

插图索引

表格索引

缩略语对照表

第一章 绪论

1.1研究背景以及意义

1.2国内外研究现状

1.3本文研究内容

1.4本文内容结构

第二章 Hadoop平台部署与优化相关技术

2.1平台虚拟化

2.2容器技术Docker

2.3服务发现Consul

2.4分布式计算平台Hadoop

2.5 Swarm集群

2.6本章小结

第三章 Hadoop平台快速部署方案的分析与设计

3.1 Hadoop平台部署面临的问题分析

3.2 Hadoop平台快速部署方案设计

3.3 Dockerfile模块的分析与设计

3.4服务发现模块的分析与设计

3.5自动化构建模块的分析与设计

3.6快速部署方案流程分析

3.7本章小结

第四章 Hadoop平台性能优化方案的分析与设计

4.1当前Hadoop平台优化方案的概述

4.2 Hadoop平台性能优化方案的设计

4.3总体架构的分析与设计

4.4集群网络插件的分析与设计

4.5自动化构建模块的的分析与设计

4.6本章小结

第五章 Hadoop平台性能优化方案的实现

5.1 Swarm集群的设计与实现

5.2基于容器的Hadoop分布式集群的实现

5.3 Dockerfile的设计与实现

5.4基于Swarm的Hadoop集群系统的配置参数调优

5.5容器集群的可视化监控模块的设计与实现

5.6本章小结

第六章 系统测试

6.1快速部署方案测试

6.2性能优化方案网络性能测试

6.3性能优化系统的测试

6.4本章小结

第七章 总结与展望

7.1总结

7.2展望

参考文献

致谢

作者简介

展开▼

摘要

Hadoop凭借其在分布式集群方面的优势,给大数据存储和计算提供了一种高效的解决方案。作为重要的大数据分布式处理平台,Hadoop需要较高的效率和优异的性能,然而,其集群的安装和部署却有一定的局限性,如配置文件多,配置节点数量大,部署过程涉及一系列纷繁复杂的知识等,动辄让分布式集群的部署以失败告终。此外,集群不能够有效地动态分配资源,为了合理利用Hadoop Yarn的资源,队列间经常会互相抢占计算资源,造成重要任务阻塞。因此,对Hadoop平台部署及性能优化的研究是非常必要且有意义的。
  针对以上问题,目前Hadoop平台的快速部署和自动伸缩主要是基于传统的虚拟机技术(VM)。传统的虚拟化技术对于物理主机的资源利用率无法达到真实物理主机的水平,在资源利用率和启动速度以及性能上有较大的开销,存在难以灵活快速配置文件,自动化创建以及部署服务的问题。
  本文就Hadoop平台传统的虚拟化技术进行了研究,提出了基于容器虚拟化技术的Hadoop平台部署和优化方案。主要研究工作包括:
  (1)针对传统虚拟机资源利用率低,启动速度慢以及性能开销大的弊端,提出Hadoop平台快速部署方案,并对其进行设计实现。该方案基于容器的轻量级底层虚拟化方法,通过前期构建Dockerfile和自动化构建脚本,应用serf进行节点管理,并以dnsmasq作为轻量级的DNS服务器,重点解决和优化容器间网络通信与文件共享两大关键问题,从而达到提高Hadoop集群部署的效率,增强其可用性的目的。
  (2)针对目前主机资源利用率低,部署和扩展复杂,资源隔离无法动态调整以及无法快速响应业务等问题,提出了Yarn on Swarm集群架构方案。该方案采用Swarm实现底层资源调度,每个Docker容器中运行一个NodeManager,资源分配精确到内存大小和CPU核数,通过修改容器个数达到动态改变Yarn资源情况,达到动态地按需伸缩服务,通过更细粒度的资源分配,使其更合理利用Hadoop Yarn的资源。
  (3)设计实现 Hadoop平台性能优化系统。首先针对集群部署存在的网络通信关键问题,采取自主开发扁平化网络插件,让所有的容器网络都在大二层上联通;其次,针对难以灵活快速配置文件,自动化创建和部署服务的问题,通过设计Dockerfile和自动化脚本,设计实现基于 Shipyard的容器资源可视化界面以及设计实现基于Jekins的自动化构建和持续集成模块,极大地提高了对集群的监管效率。
  本文通过对Hadoop平台快速部署和性能优化技术的研究,设计实现了基于容器虚拟化技术的集群方案,凭借容器在底层轻量级的虚拟化方式,集群两层资源调度带来的细粒度资源划分以及系统对容器集群和Hadoop集群友好高效的可视化监控界面等优势,通过对系统功能及性能的测试,验证了论文设计实现的方案在快速部署,自动伸缩和资源优化上面的可行性及高效性。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号