首页> 中文学位 >Matrix2可扩展向量化编译方法的设计与实现
【6h】

Matrix2可扩展向量化编译方法的设计与实现

代理获取

目录

封面

声明

目录

中文摘要

英文摘要

第一章 绪论

1.1 研究背景及意义

1.2 向量编译研究现状

1.3 论文主要工作

1.4 论文组织和结构

第二章 Matrix2可扩展向量化编译方法概述

2.1 Matrix2体系结构分析

2.2 GCC编译结构分析

2.3 Matrix2可扩展向量化编译方法概述

2.4 本章小结

第三章 Matrix2自动向量化算法的实现

3.1 GCC中自动向量化过程简析

3.2 Matrix2向量指令的自动向量化映射

3.3 本章小结

第四章 支持可扩展向量运算簇的向量化编译方法

4.1 支持可扩展向量运算簇的向量化编译方法介绍

4.2 支持可扩展向量运算簇的向量化编译方法的实现

4.3 实验结果和分析

4.4 本章小结

第五章 针对科学计算中矩阵乘法的向量化编译优化

5.1 矩阵乘法的介绍

5.2 矩阵乘法在Matrix2编译器上的向量化方法分析与实现

5.3 实验结果和分析

5.4 本章小结

第六章 总结和展望

6.1 工作总结

6.2 工作展望

致谢

参考文献

作者在学期间取得的学术成果

展开▼

摘要

Matrix2是一款具有VLIW和SIMD特征的高性能DSP,能够有效地支持指令级并行和数据级并行,可以应用于无线通信和科学计算等数据运算密集型领域。
  Matrix2体系结构中包括向量处理部件(VPU)和标量处理部件,VPU是一种可扩展向量运算簇结构。Matrix2包含130多条向量指令,现有的向量化编译方法不能满足Matrix2体系结构和指令集特点。为了更好的发挥Matrix2的体系结构优势,并充分利用Matrix2体系结构中向量运算簇灵活可扩展的特点,论文设计并实现了支持Matrix2体系结构的可扩展向量化编译方法。
  论文首先对当前向量化编译研究现状进行了分析,研究了国内外各主流编译器向量化解决方法。然后结合 Matrix2独特的体系结构和指令集特点,分析了在Matrix2编译器实现向量化编译方法的难点。在此基础上,论文选择 GCC4.7.0作为平台,对Matrix2可扩展向量化编译方法进行了设计和实现。论文的主要工作包括三个方面:
  1.论文对GCC中的自动向量化机制进行了分析,并在充分研究GCC的自动向量化优化遍处理过程的基础上,实现了支持 Matrix2的自动向量化算法,为Matrix2编译器搭建了特定的支持SIMD扩展的向量化后端环境,在Matrix2编译器上实现了部分向量指令的自动向量化映射。
  2.考虑到自动向量化的局限性,本文基于intrinsics设计并实现了支持Matrix2可扩展向量运算簇的向量化编译方法。该方法从降低功耗、数据重组和特殊应用的角度对Matrix2向量化编译方法进行了优化实现,能够对VPE个数可配置特点进行支持,实现了编译器的并行处理宽度的自适应调节功能。并实现了特殊指令的一对多映射支持,增加了灵活性。
  3.随着高性能科学计算的广泛应用,Matrix2 DSP应用于高性能科学计算的能力显得十分重要。论文使用Matrix2可扩展向量化编译方法,在Matrix2上对矩阵乘法算法进行了向量化。实验结果分析表明使用本文设计实现的向量化编译方法,Matrix2编译器能够正确地对矩阵乘算法进行支持。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号