文摘
英文文摘
论文说明:表格目录、插图目录
论文独创性声明及论文使用授权声明
第一章引言
1.1多媒体应用
1.2共享主存多SIMD结构
1.2.1多SIMD结构
1.2.2共享主存多SIMD结构
1.3共享主存多SIMD结构编译优化的意义
1.4共享主存多SIMD结构面临的主要问题
1.4.1共享主存多SIMD结构编译发展滞后的原因
1.4.2共享主存多SIMD结构编译需解决的主要问题
1.5已有研究
1.6本文的贡献及结构安排
第二章底层结构
2.1 Morphosys概述和特征
2.1.1 Morphosys概述
2.1.2基本特征
2.2 Morphosys组件的设计与实现
2.2.1 TinyRisc
2.2.2多SIMD功能单元
2.2.3指令缓冲器
2.2.4共享主存
2.2.5 DMA控制器
2.3 Morphosys的物理设计
第三章多媒体程序特性分析
3.1程序包简介
3.2多媒体程序运行时特点
3.3代码形式特点
3.3.1广泛使用指针进行运算
3.3.2大量的循环展开
3.3.3多媒体典型操作的变体很多
3.3.4使用映射数组替代复杂计算
3.3.5普遍使用宽数据类型
第四章问题分析
4.1并行性分析
4.1.1共享数据总线对并行的限制
4.1.2基于广播的并行
4.1.3基于数据复用的并行
4.1.4数据流水线并行
4.2有限寄存器对并行的限制
4.3结构的问题
第五章优化算法
5.1预备优化
5.1.1 SIMD优化
5.1.2代码划分
5.1.3向量数据重用信息的计算
5.2仿射划分
5.2.1仿射划分基本概念
5.2.2仿射划分算法
5.2.3只读数组复制的计算
5.3数据流水线信息识别
5.3.1实时数据分析
5.3.2数据流水方向的确定
5.3.3冗余通信的消除
5.4划分循环选择
5.4.1划分循环选择
5.4.2计算-通信的转换
5.4.3数据重用空间的构造
5.5资源分配
5.5.1寄存器分配
5.5.2平均指令级并行性计算
5.5.3资源分配
5.6调度算法
5.6.1指令调度
5.6.2针对共享主存多SIMD结构的调度算法
5.7调度实例
5.8总结
第六章其他优化算法
6.1规约操作
6.1.1规约变量的SIMD优化的额外处理
6.1.2规约变量的调度优化的额外处理
6.2数据预取
6.2.1数据预取概述
6.2.2基于软件流水线的数据预取
第七章实验结果
7.1 SimpleScalar模拟器
7.1.1 SimpleScalar模拟器简介
7.1.2 SimpleScalar模拟器工具集概述
7.1.3 SimpleScalar模拟器工具集概述
7.2共享主存多SIMD结构模拟器的实现
7.2.1模拟器的实现
7.2.2模拟器GCC工具链的调整
7.3测试程序
7.4实验结果
第八章性能分析
8.1阵列大小
8.2 GPPC执行模式
8.3寄存器个数
8.4互联
8.5共享数据总线
8.6 VLIW指令缓冲区
8.7总结
第九章总结
9.1结论
9.2将来的工作
参考文献
发表文章目录
致谢
复旦大学;