声明
学位论文数据集
摘要
第一章 绪论
1.1 课题研究背景及意义
1.2 通用GPU并行计算概述
1.3 通用GPU并行计算现状
1.4 论文的主要贡献
1.5 论文的组织结构
1.6 本章小结
第二章 Fermi架构GPU并行计算模型
2.1 GPU硬件发展历史
2.2 传统GPU硬件构架
2.2.1 全局内存
2.2.2 多处理器
2.2.3 纹理内存
2.3 Fermi架构GPU硬件的改进
2.3.1 Fermi芯片概述
2.3.2 第三代流多处理器
2.4 CUDA开发原理概述
2.4.1 Linux平台上的开发环境
2.4.2 线程运行机制
2.4.3 存储器访问规则
2.5 本章小节
第三章 基于Fermi架构GPU的FDTD算法的实现与优化
3.1 问题来源及相关背景知识
3.2 经典FDTD算法与原理描述
3.2.1 麦克斯韦方程组与Yee元胞
3.2.2 三维空间中的FDTD算法
3.3 并行化三维FDTD算法与实现
3.3.1 实验模型的建立
3.3.2 串行版本的FDTD
3.3.3 数据划分与并行化
3.3.4 在两种不同结构GPU下的优化
3.4 试验结果比较与分析
3.4.1 实验结果
3.4.2 精度与准度的比较
3.4.3 GPU运行与CPU运行比较
3.4.4 Fermi架构GPU下不同优化策略的对比
3.5 本章小结
第四章 基于Fermi架构GPU并行算法优化分析
4.1 问题来源
4.2 Fermi架构GPU优化方法描述
4.2.1 Fermi架构中的存储器层次
4.2.2 两种优化方法的优劣
4.3 不同数据划分的算法
4.3.1 矩阵相乘
4.3.2 KD树的并行构建算法
4.4 实验结果与分析
4.3.1 矩阵相乘结果分析
4.3.2 KD树的并行构建算法结果分析
4.4 本章小节
第五章 总结与展望
5.1 总结
5.2 展望
参考文献
致谢
研究成果及发表的学术论文
作者和导师简介
硕士研究生学位论文答辩委员会决议书