首页> 中文学位 >32位高性能M-DSP BP及向量归约部件的设计与实现
【6h】

32位高性能M-DSP BP及向量归约部件的设计与实现

代理获取

目录

声明

第一章 绪论

1.1课题研究背景及意义

1.2 M-DSP内核结构

1.3 相关研究

1.4 本文主要工作

1.5 文章组织结构

第二章 BP部件设计和优化

2.1 BP指令格式

2.2 BP部件结构

2.3 BP模块优化

2.4 综合结果对比

2.5 本章总结

第三章 向量归约部件设计与优化

3.1 M-DSP向量归约部件简介

3.2 归约部件设计与实现

3.3 归约部件优化

3.4 功耗优化

3.5 综合结果对比

3.6本章总结

第四章 验证

4.1 验证策略

4.2模块级验证

4.3单核系统级验证

4.4形式化验证

4.5 本章总结

第五章 结束语

5.1全文工作总结

5.2未来工作预期

致谢

参考文献

作者在学期间取得的学术成果

展开▼

摘要

随着科学技术的飞速发展,数字信号的数据量呈爆炸式增长。如何高效、高质量地处理庞大的数据群,给现代高性能DSP的性能带来了巨大挑战。
  M-DSP是一款完全由国防科学技术大学自主研发的32位高性能DSP处理器,支持超长指令字技术(VLIW)、单指令多数据流(SIMD)技术,工作主频1.0GHz。本文以M-DSP芯片的开发与设计为背景,在面向高性能DSP的位处理单元和向量归约部件方面进行了研究。本文主要工作如下:
  1.设计实现了 BP部件,并对其时序、面积和功耗进行优化,综合结果达到M-DSP的设计要求。根据M-DSP运算单元的设计要求,设计并实现了BP部件,此部件能够执行三类指令:移位指令、位处理指令、打包解包指令,除了打包解包指令,其余两类指令均支持 SIMD16位指令格式。采用硬件复用策略进行面积优化,对移位指令单元和位处理指令单元进行了结构上的合并,节省了一级移位器,提高了硬件复用率。同时采用操作数隔离方法对BP部件进一步优化,通过降低翻转率来降低动态功耗。综合结果显示:本文设计的BP部件相比X-DSP的BP部件在面积上缩小10.1%,动态功耗降低10.4%,静态功耗降低11.4%。
  2.设计实现了向量归约部件,优化其时序与功耗,综合结果达到M-DSP的设计要求。本文设计的向量归约部件能够对向量运算单元 VPU中的16个向量运算部件(VPE)进行八种归约指令操作,包括四种显式归约模式指令和四种隐式归约模式指令,每一种归约模式均能实现2归约、4归约、8归约、16归约四条指令。以Matrix-DSP的向量归约部件为基础,进行时序和功耗优化:对归约单元进行流水线优化,缩短关键路径,提高频率;根据VPE的布局,对全局信号走线长度进行优化,缩短关键路径;同时,采用门控时钟降低动态功耗。综合结果表明:相比Matrix-DSP的向量归约部件,本文设计在面积上缩小15.4%,动态功耗降低8.8%,静态功耗降低6%。
  3.对 BP部件和向量归约部件进行验证:①代码检查,使用 Qusetformal软件对代码的设计规范和存在的语法错误进行查验。②编写C语言黄金模型,为模块级和单核系统级的基本功能点的验证提供结果参考对照。③对 BP部件的三大指令和向量归约指令的基本功能点进行验证。模块级编写testbench验证,单核系统级使用汇编语言验证。④检查全局信号的可控性,并进行指令组合和覆盖率验证。⑤使用 ATEC和 Formality对设计进行形式化验证。验证结果表明:本文设计的两个部件的功能正确。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号