首页> 中文学位 >基于GPU和多核CPU的并行高阶矩量法的实现
【6h】

基于GPU和多核CPU的并行高阶矩量法的实现

代理获取

目录

声明

摘要

第一章 绪论

§1.1 研究背景

§1.2 并行计算

§1.3 基于GPU的并行计算

§1.3.1 GPU的发展史

§1.3.2 GPU在矩量法计算中的应用

§1.4 本文的主要工作

第二章 高阶矩量法的实现

§2.1 高阶矩量法

§2.1.1 高阶面片

§2.1.2 高阶基函数

§2.2 积分奇异性的处理

§2.2.1 电场积分方程中的奇异性处理

§2.2.2 磁场积分方程中的奇异性处理

§2.3 迭代收敛性

§2.4 数值算例

§2.5 本章小结

第三章 多核CPU加速生成高阶矩量法矩阵

§3.1 高阶矩量法矩阵元素计算的积分表法

§3.2 共用Green函数与共用方向向量相互作用法

§3.3 基函数按阶分组法

§3.4 多核CPU并行算法的实现

§3.4.1 本文用到的OpenMP指令

§3.4.2 数据一致性

§3.4.3 串行程序改写为并行程序

§3.4.4 加速比与并行效率

§3.5 数值算例

§3.6 本章小结

第四章 GPU加速生成高阶矩量法矩阵

§4.1 GPU的原理与特点

§4.1.1 GPU的硬件结构

§4.1.2 GPU计算的特点

§4.2 用GPU加速生成高阶矩量法矩阵的程序实现

§4.2.1 程序移植方法

§4.2.2 优化算法设计

§4.3 与其它程序设计方案的对比

§4.4 共用方向向量相互作用

§4.5 数值算例

§4.6 本章小结

第五章 GPU加速大矩阵填充及核外存储

§5.1 高阶矩量法矩阵的分块方法

§5.2 使用内存的GPU计算过程

§5.3 使用硬盘的GPU计算过程

§5.4 数值算例

§5.5 本章小结

结束语

致谢

参考文献

学习期间发表的论文

学习期间参加的项目

展开▼

摘要

电大目标电磁散射特性的快速分析方法一直是计算电磁学界的一个热点。在早期的矩量法中,局域基函数是低阶基函数(主要是RWG基函数),产生的未知量个数比较多,特别是对于电大目标问题。基于积分方程和矩量法的快速算法是目前求解电大目标电磁散射问题的常用算法,并采用迭代求解器求解矩量法矩阵方程。快速算法能够显著地降低每次迭代的计算复杂度和存储复杂度,但以适当牺牲数值精度为代价。近些年来,高阶基函数(特别是Legendre准正交基函数)被引入矩量法,以大幅度减少未知量个数,并适当提高数值精度。在大面片上采用高阶基函数的矩量法(高阶矩量法)已经成为电磁学界的一个热点。本文研究基于GPU和多核CPU的并行高阶矩量法的实现,重点在于高阶矩量法矩阵的快速生成方法。本文主要工作如下: 1.提出了两个加速方法:一是将现有的共用Green函数法扩展为“共用Green函数与共用方向向量相互作用法”;二是将高阶基函数按阶数高低进行分组积分的方法,即“基函数按阶分组法”。在这两个方法以及现有的高阶基函数积分表法基础上,研究了OpenMP控制多核CPU生成高阶矩量法矩阵的并行计算程序的实现方法; 2.提出了将高阶矩量法的CPU串行程序直接向GPU环境移植的方法。高阶矩量法矩阵的生成是一项计算密集型的工作,特别适合用众核GPU来提速。但是,在基于GPU的编程中要处理各种存储器之间的关系,比在基于多核CPU的情形复杂得多。文献中给出的是直接将针对采用RWG基函数的矩量法的GPU实现演变为针对高阶矩量法的,仅获得3倍左右的加速。本文的GPU程序实现是优化的,达到了20倍以上的加速; 3.提出了高阶矩量法矩阵在并行环境中高效计算的一种分块方法,非常匹配从GPU高效显存到CPU主内存的连续拷贝机制,避免了GPU与CPU间反复多次的小内存交互。该方法不仅可以基于内存来扩大计算规模(核内存储版本),还可以让内存结合硬盘来进一步扩大计算规模,即演变为带核外存储的GPU加速程序(核外存储版本)。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号