基于MapReduce模型的GPU编程优化机制研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

随着图形处理器（GPU）体系结构的发展和计算能力的不断提高，GPU在通用计算领域的计算密集型应用上被广泛使用，以弥补 CPU计算能力不足的弱点。现有基于CUDA的GPU编程方式比较繁琐，往往需要开发人员对程序进行十分耗时的手动性能调优过程。为了降低GPU的编程复杂度，分布式计算领域的MapReduce编程模型被应用到GPU平台上。但是，现有基于GPU平台的MapReduce实现方案存在线程同步开销较大，共享内存利用率不高的问题，当处理数据量增大时，性能急剧下降。
　　结合GPU体系结构的特点，提出并实现了基于MapReduce模型的GPU编程优化机制，主要包括以下三个方面的内容。为了充分适应GPU的多层存储架构，在线程的执行方式上采用多层归约机制，避免共享内存数据的频繁换出，减少线程同步开销，提高线程的并发执行效率；提出基于归约频率的共享内存数据缓存策略，通过对数据进行预处理，收集应用程序执行过程中生成的中间键值对的频率特征，指导GPU上共享内存资源的分配，以提高共享内存的缓存效果，减少全局内存访问，从而提升线程在归约计算过程中的访存效率；引入CPU与GPU之间的异步数据传输机制，通过对原始输入数据进行分割，并在全局内存上设置两个输入缓冲区，使用两个GPU流实现了数据传输和GPU端计算的异步执行，有效隐藏了I/O时间开销。
　　在Linux平台和CUDA编程环境下，使用3个典型的MapReduce应用Kmeans、Word Count和Page View Count进行了测试。实验结果表明，基于以上优化机制的MapReduce实现方案，与现有基于局部归约的方案对比，减少了线程同步开销，提高了共享内存的使用效率，降低了输入数据的I/O开销，在整体性能上有明显提升。

著录项

作者
刘凯;
展开▼
作者单位

华中科技大学;

展开▼
授予单位华中科技大学;
学科计算机应用技术
授予学位硕士
导师姓名章勤;
年度 2014
页码
总页数
原文格式 PDF
正文语种中文
中图分类图像处理软件;
关键词
图形处理器; 编程方式; 手动性能; 优化机制; 映射归约模型;

相似文献

中文文献
外文文献
专利

1. 基于GPU编程优化策略及算法的研究 [J] . 文斌 . 电脑编程技巧与维护 . 2020,第010期
2. 基于MapReduce模型的并行处理优化策略 [J] . 王鹏 ,刘鹏 ,刘佳祎 . 电子技术与软件工程 . 2021,第001期
3. 基于MapReduce模型的推测执行优化算法 [J] . 黄中平 ,白光伟 ,沈航 . 计算机科学 . 2017,第004期
4. 基于MapReduce模型的排序算法优化研究 [J] . 蒋勇 ,赵作鹏 . 计算机科学与探索 . 2015,第004期
5. 基于MapReduce模型的排序算法优化研究 [J] . 金菁 . 计算机科学 . 2014,第012期
6. 基于GPU编程的海浪仿真技术研究 [C] . 夏青 ,岳利群 . '2007系统仿真技术及其应用学术研讨会 . 2007
7. 基于MapReduce模型的云平台调度策略优化研究 [A] . 童毅 . 2015

基于MapReduce模型的GPU编程优化机制研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅