声明
1 绪论
1.1 研究背景与意义
1.2 申威221处理器
1.3 FFT算法研究现状
1.4 论文主要内容与结构
2 FFT算法原理与分析
2.1 离散傅里叶变换
2.2 快速傅里叶变换算法
2.2.1 基-2 FFT变换算法
2.2.2 基-4 FFT变换算法
2.2.3 混合基算法
2.2.4其他FFT算法
2.3小结
3 混合基FFT的实现与优化
3.1 蝶形计算单元的实现
3.1.1 蝶形运算化简
3.1.2 蝶形计算步骤
3.2 生成旋转因子表
3.2.1旋转因子表的实现
3.2.2旋转因子访存优化
3.3 位序变换
3.3.1 位序变换原理
3.3.2 位序变换的实现
3.3.3 查表法优化
3.4 本章小结
4 申威平台FFT的深度优化
4.1 循环展开优化
4.2 SIMD向量化优化
4.3 数据预取优化
4.4本章小结
5 实验设计与结果分析
5.1 实验环境
5.2 正确性测试
5.3 性能评估
(1)混合基FFT 算法实现与优化性能对比
(2)申威221 处理器与TMS320C6678 处理器单核性能对比
5.4 本章小结
6 总结与展望
6.1 总结
6.2 本文的主要贡献
6.3展望
参考文献
个人简历、在校期间发表的学术论文与研究成果
致谢
郑州大学;