首页> 中文学位 >面向TI C67X DSP深度流水线及并行指令执行模拟优化技术的研究
【6h】

面向TI C67X DSP深度流水线及并行指令执行模拟优化技术的研究

代理获取

目录

声明

摘要

第1章 绪论

1.1 研究背景

1.2 研究意义

1.3 本文主要研究内容

1.4 本文组织结构

第2章 相关工作介绍

2.1 解释型模拟器

2.1.1 原理介绍

2.1.2 模拟器介绍

2.2 编译型模拟器

2.2.1 原理介绍

2.2.2 模拟器介绍

2.3 其他模拟器优化技术

2.3.1 Multiprocessing approach

2.3.2 QEMU based

2.3.3 KVM

2.4 本章小结

第3章 深度流水线模拟优化技术

3.1 c67x的流水线

3.1.1 c67x的流水线介绍

3.1.2 指令的时钟延迟

3.1.3 流水线举例

3.2 流水线模拟优化技术

3.2.1 流水线全模拟分析

3.2.2 流水线全模拟性能分析

3.2.3 深度流水线模拟优化算法

3.3 nop指令分析

3.3.1 nop指令作用分析

3.3.2 nop指令占比分析

3.3.3 nop指令实现优化

3.4 本章小结

第4章 并行指令的寄存器写时拷贝技术

4.1 c67x的指令并行特性

4.1.1 c67x的硬件功能单元

4.1.2 执行包举例

4.1.3 硬件的并行性在软件模拟时所产生的问题

4.2 并行指令的寄存器写时拷贝算法

4.2.1 c67x目标代码的并行指令占比分析

4.2.2 执行包的目标寄存器占比分析

4.2.3 并行指令的寄存器写时拷贝算法描述

4.3 本章小结

第5章 测试过程与结果分析

5.1 测试环境

5.1.1 测试环境的配置

5.1.2 测试用例

5.1.3 测试说明

5.2 测试结果及分析

5.2.1 流水线优化性能分析

5.2.2 流水线阶段分析

5.2.3 nop优化实现性能分析

5.2.4 并行指令寄存器写时拷贝优化分析

5.2.5 寄存器拷贝分析

5.2.6 总体优化分析

5.3 本章小结

第6章 总结及展望

6.1 工作总结

6.2 工作展望

参考文献

致谢

展开▼

摘要

指令集模拟器(ISS)是一种运行在宿主机平台上能够模拟目标硬件结构的软件系统。目标硬件结构可以与宿主机结构同构或者异构。由于ISS可以有力支撑处理器及芯片设计、软硬件协同开发,以及软件可靠性测试,因而得到广泛的应用。随着目标体系结构高性能、并行化发展,如何优化ISS软件性能,有效提高其执行效率已成为迫切需求。
  本文以TI公司的TMS320C67x(下文简称为c67x)高性能DSP为目标硬件结构,深入分析其VLIW(Very Long Instruction Word,超长指令字)体系结构中深度流水线及并行指令执行特性,提出了深度流水线模拟及并行指令执行的优化模拟技术。通过大量性能测试发现上述方法可以有效提升指令集模拟执行性能。同时这些方法也适用于其他VLIW体系结构的硬件模拟。基于这些优化技术,本文实现了c67x的模拟器sim6713。
  本文的主要工作如下:
  1)针对分阶段模拟c67x深度流水线机制导致的性能开销,提出了一种压缩流水线阶段的优化模拟方法,通过循环缓存记录指令的延迟周期数,使模拟器只模拟一个执行阶段即可完成等效的功能模拟,从而有效提升执行性能。进而针对目标程序中包含大量nop指令情况,通过分析nop的作用以及与流水线的关系,设计了nop指令的优化模拟方法。
  2)分析了c67x DSP支持指令包的并行指令执行特性,通过大量的实证分析,发现并行执行包中的指令更新存在显著的稀疏特性。据此提出了一种并行指令的寄存器写时拷贝技术,该方法可以有效降低指令更新时产生的大量内存拷贝操作。
  3)通过在dhrystone、whetstone、linpack等Benchmark测试,以及与TI公司的c67x ISS软件性能对比测试,验证了本文工作的有效性。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号