大数据平台分布式计算资源自动部署研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

21世纪我们迎来了全新时代——大数据时代，数据被人们誉为了“金矿”。大数据推动了云计算的蓬勃发展，云计算已成为了一种新的商业模式，在工业界，学术界和社会中受到越来越多人的关注与重视。“云”为全球用户提供固定或移动的新的维度，以基础设施即服务（IaaS），平台即服务（PaaS）和软件即服务（SaaS）的形式提供计算资源，这些类型的资源在基于因特网的环境中按使用量付费或者以订阅方式按需提供。
　　由于使用资源的不确定性，对于搭建在云平台上集群和应用来说，决定它的资源容量大小是一把双刃剑，这可能会导致供应不足或者过度供应。针对云资源租户而言，资源的需求过多，将会导致其资源的浪费、花费过高；而针对云服务商而言，过多的提供资源给租户，将会导致自己整体资源使用率偏低。因此，云计算中的资源调度问题被认为与非确定性多项式（NP）优化问题一样困难。
　　为了提高资源的利用率，本文从集群内部和集群规模两个层次展开研究工作。
　　(1)首先对Hadoop原理架构及MapReduce计算框架和HDFS文件系统两个核心模块进行了详细的研究，然后分析了Hadoop系统中支持的三种调度算法，发现目前的算法存在不足。本文采用自学习的方式去调度资源，提出特征加权朴素贝叶斯调度算法，实验结果表明在运行WordCount作业时，使用特征加权的朴素贝叶斯调度算法比使用Hadoop默认的调度算法所需时间少，资源的利用率更高。
　　(2) Hadoop集群整体资源供应不足和过度供应分别会导致资源的饱和和资源的浪费。结合云平台OpenStack和大数据工具Hadoop设计了一个动态调整集群规模的系统，整个系统将由监控、调度、虚拟机管理三个模块组成。在调度部分定时器调整只能应对一些比较周期性和稳定的工作负载情况，而阈值调整虽然可以处理几乎所有的情况，但存在资源提供延迟问题，本文提出基于SVM的时间序列工作负载预测算法，而预测结果的准确度对决策有着至关重要的影响。因此，使用SVM算法和ARMA算法对工作负载的时间序列进行建模预测，实验结果显示在增长型和无规则型两种工作负载的模型下，SVM模型的预测结果都比ARMA模型结果更加准确。

著录项

作者
李辉;
展开▼
作者单位

电子科技大学;

展开▼
授予单位电子科技大学;
学科计算机应用技术
授予学位硕士
导师姓名文勇刚;
年度 2017
页码
总页数
原文格式 PDF
正文语种中文
中图分类 TP311.131;
关键词
云计算; 资源调度; 朴素贝叶斯分类; 集群规模调整; 大数据平台;

相似文献

中文文献
外文文献
专利

1. 面向云计算的分布式应用自动部署框架 [J] . 李超 ,花磊 ,宋云奎 . 计算机技术与发展 . 2018,第006期
2. 分布式系统自动部署中的组件依赖配置 [J] . 武少波 ,苏浩 . 信息技术 . 2016,第007期
3. 分布式网络测量的测量节点自动部署优化算法 [J] . 荣自瞻 ,金跃辉 ,崔毅东 . 高技术通讯 . 2014,第011期
4. 分布式存储系统在通信运营商云计算资源池的应用研究 [J] . 黄根华 ,钟声伟 . 通讯世界 . 2017,第016期
5. 基于IFC标准的建筑信息模型分布式大数据平台存储技术研究 [J] . 陈远 ,胡航 ,岳石花 . 计算机应用与软件 . 2019,第002期
6. 基于移动Agent分布式计算资源整合与分配 [C] . 王崇海 ,嵇晓 ,侯浚 . 第21届中国过程控制会议 . 2010
7. 大数据平台分布式存储资源自动部署研究 [A] . 张磊 . 2017

大数据平台分布式计算资源自动部署研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅