基于查找表的FFT CUDA并行算法研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

离散傅立叶变换（Discrete Fourier Transform）是我们这个时代最有影响力的数学公式之一，广泛应用于许多的科学和工程领域。数字信号处理技术作为一门具有强大生命力的科学技术，其核心算法就是离散傅立叶变换。在算法的实际应用中，算法复杂度以及算法的可行性等都是影响算法效率的重要因素。快速傅里叶变换（Fast Fourier Transform）大大降低了算法复杂度提高了算法效率。近年来， GPU（Graphics Processing Unit）正在不断的高速发展，GPU从原来的三维图像处理过度到更多的用来进行通用计算，科学研究中问题规模的扩大以及复杂度的提高使得GPU在科学计算中的存在意义非凡。GPGPU（General Purpose Computing on Graphics Processing Unit）编程技术尝试使GPU能够像CPU一样用来进行通用计算。NVIDIA公司推出的CUDA（Compute Unified Device Architecture）架构为GPU并行计算提供了新的解决办法。借助CUDA架构，利用CPU+GPU的异构模型进行并行计算为许多数据密集型科学计算提供了帮助。FFT在GPU上的并行实现具有广泛而深刻的意义。因此，本文的主要研究集中在如何利用CUDA提供的CPU+GPU异构环境实现FFT在GPU上的并行实现。
　　为了实现FFT算法的高效设计，本文实现了FFT在GPU上的并行算法，并提出了一种基于GPU纹理存储器的建表优化方法。通过使用GPU纹理存储器设计了两种并行算法，分别基于一维纹理存储器和二维纹理存储器。本文的主要内容为：
　　（1）针对FFT算法在CPU上运行效率不太理想的问题，设计了可以在GPU上运行的并行算法。通过对GPU的硬件体系结构和编程模型的深入分析以及对按时间抽选基-2的快速傅立叶变换的原理以及特性的深入探讨，提出了使用CUDA进行并行FFT算法设计的可行方法。众所周知快速傅立叶变换的时间复杂度为O(N log2 N)，通过并行计算，使得快速傅立叶变换的三层循环嵌套变为两层，使得计算量变小。
　　（2）参考多种优化方法，提出采用两种纹理存储器对算法进行加速，同时还从不同的角度对并行快速傅立叶算法进行了优化。在已经搭建和配置好的并行编程环境中，与CUDA提供的CUFFT库函数进行对比实验，成功的进行了两种不同快速傅立叶变换并行算法的性能评估。最后通过实验数据分析证明，并行FFT算法的高效GPU设计得到了实现。
　　（3）将算法移植到多个GPU上执行，使用GPUDirect技术实现多GPU上的通信，并且通过实验结果证明多GPU算法的高效性。

著录项

作者
任山;
展开▼
作者单位

湖南大学;

展开▼
授予单位湖南大学;
学科信息与通信工程
授予学位硕士
导师姓名李克勤;
年度 2017
页码
总页数
原文格式 PDF
正文语种中文
中图分类信号处理;
关键词
查找表; 离散傅立叶变换; 运行效率; FFT算法;

相似文献

中文文献
外文文献
专利

1. 基于CUDA架构的FFT并行计算研究 [J] . 骆岩红 ,万国峰 ,王建华 . 自动化与仪器仪表 . 2014,第12期
2. 用于交换芯片地址表查找的快速并行Hash算法研究 [J] . 曹晓东 ,石寅 ,张强 . 电子科技大学学报 . 2014,第002期
3. 基于CUDA与FAST特征的实时机场全景图像拼接并行算法研究 [J] . 韩宣宗 . 信息通信 . 2020,第008期
4. 基于CUDA技术的DCT并行算法研究与实现 [J] . 张金霜 ,黄旭彬 . 电脑知识与技术 . 2020,第033期
5. 基于CUDA的有限元矩阵并行装配算法研究 [J] . 胡斌星 ,李新国 ,孙鹏 . 计算力学学报 . 2020,第003期
6. 无查找表快速FFT的FPGA实现 [C] . 熊君君 ,王贞松 . 中国科学院计算技术研究所第八届计算机科学与技术研究生学术讨论会 . 2004
7. 基于查找表和维纳预测的高光谱图像无损压缩算法研究 [A] . 高总昌 . 2012

基于查找表的FFT CUDA并行算法研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅