首页> 中文学位 >基于GCC的Matrix2 DSP编译优化关键技术研究与实现
【6h】

基于GCC的Matrix2 DSP编译优化关键技术研究与实现

代理获取

目录

封面

声明

目录

中文摘要

英文摘要

第一章 绪论

1.1 课题研究背景

1.2 课题研究意义

1.3 国内外研究现状

1.4 论文主要工作

1.5 论文组织结构

第二章 Matrix2 DSP编译器候选功能单元分配研究与实现

2.1 Matrix2 DSP处理器指令执行单元特征

2.2 GCC指令约束匹配机制分析

2.3 Matrix2 DSP编译器候选功能单元分配的实现

2.4 实验结果与分析

2.5 本章小结

第三章 Matrix2 DSP编译器分支延迟槽调度算法的研究与实现

3.1 Matrix2 DSP处理器指令集中的分支指令

3.2 GCC分支延迟槽调度分析

3.3 Matrix2 DSP编译器分支延迟槽调度的实现

3.4 实验结果与分析

3.5 本章小结

第四章 Matrix2 DSP编译器支持不规则指令映射的研究与实现

4.1 Matrix2 DSP指令集中的不规则指令

4.2 GCC指令映射分析

4.3 Matrix2 DSP编译器支持不规则指令映射的实现

4.4 实验结果与分析

4.5 本章小结

第五章 总结与展望

5.1 论文总结

5.2 展望

致谢

参考文献

作者在学期间取得的学术成果

展开▼

摘要

Matrix2 DSP处理器是由国防科学技术大学计算机学院微电子所设计的拥有自主知识产权的高性能64位浮点数字信号处理器,具有强大的数据运算能力、高运行速度以及强大的并行处理能力,主要应用于天气预报、图形图像处理等数字信号处理领域。为了支持基于Matrix2 DSP处理器的高级语言应用程序开发,课题组基于开源编译器GCC-4.7.0开发了Matrix2 DSP编译器。
  Matrix2 DSP处理器采用的是VLIW体系结构,其计算能力的发挥在很大程度上取决于编译器优化的性能。论文结合Matrix2 DSP处理器的体系结构特征和指令集特点,主要在候选功能单元分配、分支延迟槽调度以及不规则指令映射三个方面对Matrix2编译器的编译性能进行了优化改进,使得Matrix2 DSP编译器的编译性能有较大提高。本文的主要研究内容和贡献如下:
  设计和实现了Matrix2 DSP编译器候选功能单元分配算法。Matrix2 DSP处理器硬件不支持功能单元的分配,而是要求编译器能够从候选功能单元中为指令分配合适的执行单元。本文以GCC指令约束匹配机制为基础,提出了以指令字为基本分配单元,综合考虑当前指令候选功能单元和空闲资源情况的分配方案,并在Matrix2 DSP编译器中予以实现。候选功能单元分配算法的实现弥补了GCC的不足,有助于编译器更好挖掘指令级并行,提高了Matrix2 DSP处理器的硬件利用率和程序执行性能。
  设计和实现了Matrix2 DSP编译器分支延迟槽调度优化算法。Matrix2 DSP指令集中的条件分支指令、无条件分支指令、函数调用指令以及函数调用返回指令均有六个延迟槽,因此实现延迟槽的最大化填充对提升处理器性能有非常重要的意义。论文基于GCC的分支延迟槽调度,提出了以修改候选填充指令搜索区域、放宽延迟槽填充指令限制、添加调度实现函数为主要内容的分支延迟槽调度优化算法,并在Matrix2 DSP编译器中予以实现。分支延迟槽调度优化算法的实现提高了分支指令延迟槽的填充率,有效降低了因分支引起的延迟开销。
  设计和实现了Matrix2 DSP编译器对不规则指令映射的支持。Matrix2 DSP指令集中存在大量操作数类型不规整的不规则指令,现有GCC不支持不规则指令的映射。论文以GCC指令映射机制为基础,结合不规则指令的特征,修改了C标准算术运算类型一致性检测与转换规则,添加了RTL指令扩展器对不规则指令映射的支持,实现了Matrix2 DSP编译器对不规则指令正确、高效的映射。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号