首页> 中文学位 >基于OpenCL的图形处理器FDTD算法仿真研究
【6h】

基于OpenCL的图形处理器FDTD算法仿真研究

代理获取

摘要

OpenCL是一种全新的开放的行业标准,可以用来开发在CPUs,GPUs及其它各种平台上通用的程序。OpenCL可以很好的将CPU跟GPU恰当的衔接起来降低系统能耗,降低硬件成本。此外OpenCL可以被使用在各种各样的宿主语言上如C,C++,Java,Python,JavaScript,Delphi等等。方便了具备掌握各种编程语言背景的人学习掌握,开发者们从而可以把主要精力放在加速算法的改进方面,便于写出高性能的算法。
  FDTD是一种通过时域,来求解麦克斯韦方程组,近而研究电磁波基本传播特性的数值计算方法。对电场或者磁场分量在时间和空间上采取交替抽样的方式,从而将麦克斯韦方程组离散化为差分方程组,进而通过递推的方式来进行求解。这种计算特性决定了FDTD需要大量的迭代计算,由于受到数值色散以及数值稳定性的限制,FDTD的空间步长以及时间步长不能取得过大。尤其是面对复杂结构的电磁仿真问题时,FDTD计算是非常耗时耗内存的。
  FDTD算法天然的并行特性,决定着我们可以使用并行计算的方法来缩短计算的时间。网络并行计算技术虽然在一定程度上解决了这一问题,但是网络性能以及负载平衡,软硬件间的匹配限制了其发展。FPGA基础设备成本较高而且效果不理想,CUDA编程在各种平台的通用性以及可移植性也不尽人意。本文阐述FDTD算法以及基本原理,研究OpenCL模型下的软硬件环境以及编程模型,实现了基于OpenCL的图形处理器二维TM波的FDTD算法仿真研究。主要完成的工作如下:
  (1)仿真平台的搭建。本文分别在CPU和GPU上面,实现均匀网格的二维TM波的电磁仿真,实验仿真平台分别是AMDAthlon(tm)ⅡX3440CPU和NVIDIATeslaC1060GPU。本文推导了二维直角坐标系均匀网格FDTD基本算法递推公式,以及FDTD收敛条件。在实现基于GPU的FDTD并行算法时,采用的是CPU和GPU进行协同工作的方式,将需要进行大量计算的任务交给GPU,而CPU主要负责内存调用,分配以及条件控制等。当Yee元胞数量达到百万级别数量级时,GPU并行计算的强大优势,就可以充分显示出来,大大提高计算的效率,缩短电磁仿真计算的时间。
  (2)二维TM波的仿真结果分析。通过合理的方式,将仿真过程中得到的每一仿真数据跟RGB系统结合起来,时域稳步推进过程当中,将仿真数据通过动态的二维FDTD图像显示出来。首先验证仿真结果的准确性,结果得知CPU与基于GPU仿真数据是一致的。然后对实验数据进行比较分析,得知当Yee元胞数量达到百万级别的数量级时,基于OpenCL的GPU跟CPU相比,可以得到稳定的40倍的加速度,大大减少了FDTD并行计算的时间,加速了FDTD并行算法的普及应用。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号