基于SIMD架构的信号处理算法性能优化

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

信号处理算法中存在很多数据相关度低且数据级并行度较大的核心算子，非常适合于通过单指令多数据(Single Instruction Multiple Data，SIMD)技术提升其计算效率。然而，当前向量化编译器无法针对SIMD微结构进行有效的指令调度和存储布局，难以充分发挥SIMD技术的优势。本文针对广泛应用于通信、图像及模式识别等领域的有限脉冲响应滤波器算法，通过SIMD向量化技术充分挖掘算法内部的并行度，提升算法性能，即减少算法的执行时间，同时为其它同类算法优化课题研究提供参考依据。
　　本文在详细分析SIMD协处理器架构的基础上，对算法进行SIMD映射和优化。首先，利用向量化编译器和编译器内置接口函数对算法进行SIMD映射，并通过分析SIMD微结构数据和二进制可执行文件的反汇编代码定位算法性能瓶颈;然后，通过循环展开和软件流水等方法提升SIMD计算流水线的指令级并行度，利用手工指令排布减少主处理器与SIMD协处理器之间的寄存器传输，并通过软件预取技术降低访存开销;最后，本文利用并行化编程模型完成算法的切割与映射，以有限的数据通信与同步开销换取算法线程级的性能提升。
　　基于时钟周期精确的仿真平台GEM5进行测试，结果表明:汇编优化后的算法相对于向量化编译和通用处理器算法代码分别提升性能约1.5倍和20倍;相对于单核优化，采用双核、四核线程级并行处理分别进一步提升了算法性能1.87倍和3.67倍;与Ne10库相比，汇编优化后的算法可以达到0.9～3.5倍的加速比;与通用处理器代码相比，本文汇编优化代码的加速比是流式SIMD扩展优化代码加速比的1.3～1.9倍。

著录项

作者
樊明;
展开▼
作者单位

东南大学;

展开▼
授予单位东南大学;
学科集成电路设计
授予学位硕士
导师姓名陆生礼;
年度 2014
页码
总页数
原文格式 PDF
正文语种中文
中图分类信号处理;
关键词
信号处理算法; SIMD架构; 仿真平台; 编译器;

相似文献

中文文献
外文文献
专利

1. 一种基于SIMD功能部件处理器的三角函数性能优化算法 [J] . 陈世淼 ,郭绍忠 ,陈建勋 . 信息工程大学学报 . 2011,第001期
2. 基于位宽控制提高SIMD架构并行度的优化算法 [J] . 张为华 ,朱嘉华 ,张宏江 . 计算机学报 . 2009,第011期
3. 基于X86架构CPU的雷达信号处理算法研究 [J] . 魏梦瑶 . 电子科技 . 2017,第005期
4. 基于SIMD架构的相干累加运算优化方法 [J] . 陈源 ,王元钦 ,董绪荣 . 计算机工程 . 2011,第020期
5. 基于SIMD-BF模型的并行FFT算法设计与实现 [J] . 张世层 . 电声技术 . 2014,第012期
6. SIMD处理机设计及SIMD算法实现 [C] . 庄跃迁 ,李玉柏 . 中国西部青年通信学术会议 . 2005
7. 基于多核众核架构的并行雷达信号处理算法研究 [A] . 罗政 . 2018

基于SIMD架构的信号处理算法性能优化

目录

摘要

著录项

相似文献

相关主题

期刊订阅