面向MapReduce任务的云数据中心网络资源协同优化

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

MapReduce作为大数据处理最重要的计算模型之一，由于其易于编程、具有良好的扩展性和高容错性的优点，已被广泛应用于各个领域，如信息技术、数据挖掘、人工智能、数学计算等。MapReduce应用的网络传输阶段需要占用云数据中心大量的网络带宽，这些数据传输产生了大量的网络负载，不仅会造成网络拥塞，还会给应用自身的性能带来损害。如何使不同的应用在保证自身服务质量的前提下共享网络资源，避免带宽竞争和网络拥塞，降低作业完成时间，是云数据中心亟待解决的问题。
　　现有的针对面向 MapReduce任务的云数据中心网络资源优化研究存在以下问题：在网络层，缺少有效的流量识别机制，忽略了应用和数据流自身的属性和对网络的特殊需求；此外，当前的流调度策略没有考虑coflow之间的依赖关系，这严重降低了流调度对降低作业完成时间的有效性。在应用层，现有的任务放置和调度方法无法针对实时的网络状态和节点容量做出合理的优化。因此，本文自底向上地从网络层和应用层解决面向MapReduce任务的云数据中心网络资源的共享问题。主要工作如下：
　　（1）实现了一种基于 OpenFlow协议的流标记和识别机制，通过网络过滤器更改Ipv4数据包头的Tos字段来区分标记不同应用的数据流。
　　（2）研究了在任务截止时间约束条件下的相互依赖的coflow调度问题，构造了一个最小化作业平均完成时间的优化问题，并相应地提出了两层调度算法。通过优先满足瓶颈时间段和瓶颈链路的带宽分配实现在作业层面的调度；采用优先级调度和加权平均调度算法来保证coflow之间不同的依赖性，实现作业内部coflow的调度。
　　（3）综合考虑了传输数据量、实时带宽容量、传输距离和节点计算资源容量对任务完成时间的影响，进一步提出了通过放置Reduce任务来减少Shuffle阶段传输代价的优化模型。
　　模拟实验结果表明，本文提出的两层调度算法比传统的最短作业优先方法减少了约18%的作业平均完成时间，在有截止时间限制的条件下，提升作业完成率21%。最小传输代价任务放置策略相比平均放置算法和本地化放置算法实现了更加合理的任务放置比例，达到了对面向MapReduce任务的云数据中心网络资源的优化目的。

著录项

作者
刘洋;
展开▼
作者单位

大连理工大学;

展开▼
授予单位大连理工大学;
学科计算机软件与理论
授予学位硕士
导师姓名李克秋;
年度 2017
页码
总页数
原文格式 PDF
正文语种中文
中图分类 TP393.07;
关键词
MapReduce任务; 流标记; 大数据处理; 云数据中心; 网络资源; 协同优化;

相似文献

中文文献
外文文献
专利

1. 云数据中心面向实时任务的节能调度算法 [J] . 鲍文燕 ,张银娟 ,李晨 . 南京师范大学学报（工程技术版） . 2016,第003期
2. 面向任务服务质量的网络资源需求预测算法 [J] . 刘林 ,张东 . 舰船电子工程 . 2019,第011期
3. 面向任务的网络资源动态协同结构建模 [J] . 尹峻松1 ,张新强1 ,陆荧2 . 指挥信息系统与技术 . 2015,第003期
4. 面向任务的网络资源动态协同结构建模 [J] . 尹峻松 ,张新强 ,陆荧 . 指挥信息系统与技术 . 2015,第003期
5. 多任务空地武器多目标协同优化任务规划算法研究 [J] . 陈宇 ,张公平 ,宋韬 . 航空兵器 . 2021,第002期
6. 一种电力云数据中心的任务调度策略 [C] . WANG Dewen ,王德文 ,LIU Yang . 中国电机工程学会电力系统自动化专业委员会三届三次会议暨2013年学术交流会 . 2013
7. 面向迭代型作业的MapReduce任务调度策略研究 [A] . 王聪 . 2015

面向MapReduce任务的云数据中心网络资源协同优化

目录

摘要

著录项

相似文献

相关主题

期刊订阅