首页> 中文学位 >基于Fermi架构GPU的FDTD算法及相关算法的研究
【6h】

基于Fermi架构GPU的FDTD算法及相关算法的研究

代理获取

目录

声明

学位论文数据集

摘要

第一章 绪论

1.1 课题研究背景及意义

1.2 通用GPU并行计算概述

1.3 通用GPU并行计算现状

1.4 论文的主要贡献

1.5 论文的组织结构

1.6 本章小结

第二章 Fermi架构GPU并行计算模型

2.1 GPU硬件发展历史

2.2 传统GPU硬件构架

2.2.1 全局内存

2.2.2 多处理器

2.2.3 纹理内存

2.3 Fermi架构GPU硬件的改进

2.3.1 Fermi芯片概述

2.3.2 第三代流多处理器

2.4 CUDA开发原理概述

2.4.1 Linux平台上的开发环境

2.4.2 线程运行机制

2.4.3 存储器访问规则

2.5 本章小节

第三章 基于Fermi架构GPU的FDTD算法的实现与优化

3.1 问题来源及相关背景知识

3.2 经典FDTD算法与原理描述

3.2.1 麦克斯韦方程组与Yee元胞

3.2.2 三维空间中的FDTD算法

3.3 并行化三维FDTD算法与实现

3.3.1 实验模型的建立

3.3.2 串行版本的FDTD

3.3.3 数据划分与并行化

3.3.4 在两种不同结构GPU下的优化

3.4 试验结果比较与分析

3.4.1 实验结果

3.4.2 精度与准度的比较

3.4.3 GPU运行与CPU运行比较

3.4.4 Fermi架构GPU下不同优化策略的对比

3.5 本章小结

第四章 基于Fermi架构GPU并行算法优化分析

4.1 问题来源

4.2 Fermi架构GPU优化方法描述

4.2.1 Fermi架构中的存储器层次

4.2.2 两种优化方法的优劣

4.3 不同数据划分的算法

4.3.1 矩阵相乘

4.3.2 KD树的并行构建算法

4.4 实验结果与分析

4.3.1 矩阵相乘结果分析

4.3.2 KD树的并行构建算法结果分析

4.4 本章小节

第五章 总结与展望

5.1 总结

5.2 展望

参考文献

致谢

研究成果及发表的学术论文

作者和导师简介

硕士研究生学位论文答辩委员会决议书

展开▼

摘要

在高性能计算领域中,由于GPU硬件为人们提供了数以百计的处理核心,使其成为通用并行计算研究中的热门方向。而Fermi架构GPU的推出,更是从硬件和软件两个方面使GPU的通用并行计算能力得以大幅度地提升。所以针对Fermi架构GPU上的并行算法的研究对于进一步优化GPU并行程序以获得更好的性能加速比有着十分重要的研究意义。
   在研究电磁波的传播时,需要精确地计算出在复杂空间中任意时刻的电磁波的波形图。在空间中,电场与磁场的分布遵循麦克斯韦方程组,但由于麦克斯韦方程组的强耦合性使得难以获得其数值解,而计算机可以通过实现时域有限差分法(FDTD)去求解空间中的电磁场数值。然而时域有限差分法需要通过对空间中大量数值进行成千上万次的迭代,这对于计算机来说是一个巨大的挑战。
   结合Fermi架构GPU的特点,本文做出了如下的工作和贡献:
   1,本文通过对相关电磁学物理背景知识的研究,建立了FDTD实验所需要的模型。设计、实现并改进了三维空间中的基于Fermi架构GPU并行FDTD程序,并行后的FDTD程序相对于传统的串行程序获得了三十倍以上的加速比。
   2,然后论文分析了并行FDTD程序在Fermi架构GPU上的实验模拟结果。尤其针对Fermi架构GPU和传统GPU的差异,进行了相关结果精度和准度的比较分析、优化策略的比较。论文还从软硬件的角度详细分析造成这种差异的原因。
   3,一最后论文针对Fermi架构GPU的特点,对FDTD并行化时产生的问题进行了延伸式地讨论,如使用L1缓存和使用共享内存的优化方法各自的优劣、不同的算法如何选择不同的优化策略。通过将算法中要处理的数据进行分类(密集型和稀疏型),得出不同类型的算法使用不同的优化策略可以方便快捷地获得令人满意的性能提升。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号