首页> 中文学位 >多GPU环境下三点相关函数算法研究
【6h】

多GPU环境下三点相关函数算法研究

代理获取

目录

封面

声明

中文摘要

英文摘要

目录

第一章 绪论

1.1研究背景

1.2国内外研究现状

1.3本文主要研究工作和创新

1.4本文内容和结构

第二章 三点相关函数与多GPU计算环境相关背景综述

2.1三点相关函数研究背景

2.2基于递归卷积算法的三点相关函数算法

2.3多GPU通用计算背景

第三章 多GPU环境下三点相关函数算法设计

3.1算法分析

3.2基于单GPU的并行三点相关函数算法设计

3.3基于GPU的算法优化

3.4多GPU三点相关函数算法研究

第四章 实验结果与分析

4.1实验环境与实验数据

4.2基于单GPU的算法实验结果与性能分析

4.3两种优化策略的实验结果与分析

4.4基于多GPU的算法实验结果与分析

4.5计算性能与计算精度的综合分析

第五章 总结与展望

5.1全文总结

5.2进一步的工作

参考文献

发表论文和参加科研情况说明

致谢

展开▼

摘要

N点相关函数在星系分布的研究上有重要的意义,是宇宙学模拟中的基本问题。但是朴素解法的计算复杂度却随着点集的扩大而呈点相关数的次方增长,虽然有基于KDTree等的相关优化算法,但是其复杂度也与点集中的点数相关,处理大规模点集时性能也难以满足要求。一种基于递归卷积的优化算法,可以求得近似解,而为了取得较高的计算精度,则要扩大计算矩阵的规模,这同样需要解决相应的性能问题。
  本文对解决递归卷积算法在解三点相关函数所存在的性能问题、计算精度问题、以及二者之间的折衷问题进行研究和分析。本文首先使用宇宙学模拟中的真实数据分析原始算法在不同的矩阵规模下的计算性能问题和计算精度问题。以此入手,提出相应的解决方案,即通过扩大矩阵规模提升相应的计算精度,而另一方面利用多GPU解决随之带来的性能问题。
  对于算法并行优化,首先将算法简单迁移到单颗 GPU上运行,分析对比不同参数下的性能变化。其次,分析改进后的GPU算法的程序结构,对GPU下的快速傅立叶变换的特性进行分析,调整快速傅立叶的变换维度和变换尺寸,以此获得进一步性能优化。
  最后分析多GPU程序运行特点,将优化过的单GPU算法进行调整,设计并实现出多GPU环境下的算法,使算法在多GPU环境下相对单GPU的加速比能够接近GPU数,以充分发挥各个GPU的计算效率。
  本文使用Tesla C2050 GPU相关环境进行相关实验,实验结果显示多GPU环境下的递归卷积算法较原始算法在较高计算精度下,性能提升近七百倍。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号