基于多核CPU的任务级数据处理研究及其在集群平台下的性能测试

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

随着计算机网络和信息化技术的发展，人们每天要处理的信息正在以惊人的速度增加，尤其是像Google这样的提供全球网页分析和处理的互联网公司，它每天要通过GoogleMapReduce对数以P级的网页，音频和视频进行处理。Google在数据处理方面的成功促使Apache社区开发了开源版的HadoopMapReduce。开源版本用Java语言实现，它用HDFS将集群的主要实体NameNode,SecondName-Node和DataNode连接起来，NameNode是集群的管理者，它上面运行JobTracker主控程序;SecondNameNode是NameNode的backup服务器；DataNode是hadoop集群中用TaskTracker真正处理数据的计算机，当DataNode是多核计算机，且分配的数据量小于是64M时，DataNode的多核优势将不复存在，它只能利用其中一个核心的计算机，其它核心则处idle状态。为了处理这种状况，本文提出了一种任务级MapReduce模型，用它来代替传统的线程级MapReduce。
　　本文在分析了Hadoop运行机制以及制约因素的基础上，搭建了Hadoop集群运算平台，并对集群容易出现的故障给出了相应的解决方案。详细分析了线程级MapReduce的运作机制，然后在集群上通过对比实验提出了线程级MapReduce在处理小块数据时的局限性。
　　本文将intel用c++语言开发的TBB并行库与HadoopMapReduce结合起来形成了任务级的MapReduce，并通过在集群上求PI的几组实验，证实了任务级MapReduce在小块数据处理方面的优势。
　　本文还通过实验的方式综合对比了这两种级别的MapReduce的性能，并提出了核心总数，数据规模与性能之间的关系。

著录项

作者
张铁军;
展开▼
作者单位

重庆大学;

展开▼
授予单位重庆大学;
学科软件工程
授予学位硕士
导师姓名陈蜀宇;
年度 2011
页码
总页数
原文格式 PDF
正文语种中文
中图分类 TP274.2;
关键词
多核CPU; 任务级数据处理; 集群平台; 性能测试;

相似文献

中文文献
外文文献
专利

1. 多核CPU/GPU平台下的集合求交算法 [J] . 王怀超 ,赵雷 . 计算机工程 . 2013,第004期
2. 多核CPU-GPU异构平台下并行Agent仿真负载均衡方法 [J] . 王维平 ,余文广 ,侯洪涛 . 系统工程与电子技术 . 2012,第011期
3. 在集群多核CPU环境下的等高线并行提取方法 [J] . 王宗跃 ,马洪超 ,徐宏根 . 计算机工程与应用 . 2010,第017期
4. 多核平台下分区操作系统的安全关键任务调度方法 [J] . 朱怡安 ,黄林林 ,李联 . 计算机工程 . 2017,第012期
5. 多核平台下考虑能耗的实时任务分派与调度研究 [J] . 黄阳阳 . 智能计算机与应用 . 2015,第004期
6. 多核平台下并行任务的虚拟机调度算法研究 [C] . CHEN Hui-Xing ,陈慧星 ,SHI Lin . 2012全国高性能计算学术年会 . 2012
7. 基于GPU/多核CPU平台下并行计算的实时超分辨和立体视图生成 [A] . 孙增增 . 2014

基于多核CPU的任务级数据处理研究及其在集群平台下的性能测试

目录

摘要

著录项

相似文献

相关主题

期刊订阅