声明
摘要
第一章 绪论
1.1 课题背景及意义
1.2 国内外研究现状
1.3 研究内容及设计指标
1.3.1 研究内容
1.3.2 设计指标
1.4 论文组织
第二章 NEON架构及信号处理算法分析
2.1 NEON协处理器
2.1.1 NEON简介
2.1.2 NEON架构
2.2 GEM5平台
2.2.1 GEM5简介
2.2.2 GEM5 CPU模型
2.3 FIR算法分析
2.4 本章小结
第三章 基于SIMD架构实现FIR性能优化
3.1 基于单核SIMD协处理器的并行度挖掘
3.1.1 向量化编译器方式
3.1.2 GCC NEON Intrinsics
3.1.3 NEON汇编编程
3.2 基于多核SIMD的线程级并行度挖掘
3.2.1 OpenMP概述
3.2.2 OpenMP编程模型
3.2.3 FIR OpenMP并行化
3.3 本章小结
第四章 测试结果与分析
4.1 测试平台介绍
4.2 并行度优化数据分析
4.2.1 ILP优化数据分析
4.2.2 DLP优化数据分析
4.2.3 访存优化数据分析
4.2.4 单核总优化数据分析
4.2.5 多核TLP数据分析
4.3 实验结果对比分析
4.3.1 与Ne10库性能对比
4.3.1 与SSE代码性能对比
4.4 本章小结
第五章 总结与展望
5.1 总结
5.2 展望
致谢
参考文献
作者简介