面向CUDA的循环语句源到源并行化研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

近年来,图形处理单元(Graphics Processing Unit,GPU)被广泛用于高性能计算。将GPU用于图形渲染外的计算称为GPU通用计算(General Purpose Computing on GPU, GPGPU)。传统的GPGPU直接用图形学API编程,开发难度大。统一计算设备架构(Compute Unified Device Architecture,CUDA)降低了在GPU上编写并行程序的难度,目前已得到广泛应用。但开发人员在CUDA下手工开发并行程序需要深入了解GPU架构和CUDA模型,难度仍很大。所以降低并行程序的开发难度对于GPU通用计算的推广应用十分重要。
　　本文研究GPU并行程序的自动生成问题,提出了一种面向CUDA的源到源并行化架构STS-CUDA。STS-CUDA可将带循环的可并行化的串行C程序转化为在GPU上并行的CUDA C程序,方便CUDA并行编程。STS-CUDA的工作过程为:先分析可并行化的串行C程序并在其适当位置插入符合STS-CUDA规范的与并行转化有关的指导语句;后通过STS-CUDA识别匹配这些指导语句,转化成对应的CUDA C并行程序。文章研究了STS-CUDA实现并行转化过程中涉及到的任务合理划分、主机端-设备端通信优化、全局存储和共享存储访问优化等方法,最后用实例进行了测试。
　　通过STS-CUDA转化得到的两组矩阵乘法并行化和一组BP算法并行化程序与手写的CUDA并行程序在CUDA下执行得到的结果相近,二者相对于串行程序的加速比也是相近的,证明了提出的STS-CUDA架构的在简化CUDA编程方面的有效性。还可以进一步研究如何减少 STS-CUDA中的指导语句以完全屏蔽GPU底层架构,如何在STS-CUDA中加入更多优化方法使转化后的目标代码性能更佳。

著录项

作者
孙香玉;
展开▼
作者单位

西北师范大学;

展开▼
授予单位西北师范大学;
学科计算机软件与理论
授予学位硕士
导师姓名冯百明;
年度 2014
页码
总页数
原文格式 PDF
正文语种中文
中图分类 TP311.52;
关键词
图形处理单元; 循环语句; 源到源并行化; 串行C程序; CUDA模型;

相似文献

中文文献
外文文献
专利

1. 基于CUDA的大型γ辐照装置通用并行排源算法 [J] . 杨磊 ,王玲 ,龚学余 . 原子能科学技术 . 2013,第002期
2. 基于CUDA的图像去雾算法并行化计算的研究和设计 [J] . 侯天峰 ,曾舒婷 . 微型电脑应用 . 2019,第012期
3. 基于CUDA的k-means算法并行化研究 [J] . 刘端阳 ,郑江帆 ,沈国江 . 计算机科学 . 2018,第011期
4. 基于CUDA的Bezier曲线生成算法并行化研究 [J] . 梁志宏1 ,代飞1 ,曹鹏2 . 计算机科学与应用 . 2018,第003期
5. 基于CUDA的压缩感知重构算法并行化研究 [J] . 董蕾 ,黄方 ,卜栓栓 . 信息技术 . 2016,第004期
6. 相关距离在循环语句并行化重构中的应用 [C] . 周鹏 . '96全国计算机体系结构学术研讨会 . 1996
7. OpenHMPP+到CUDA源到源翻译系统的设计与实现 [A] . 吴石磊 . 2013

面向CUDA的循环语句源到源并行化研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅