首页> 中文学位 >向量处理单元VPU的低功耗设计与验证
【6h】

向量处理单元VPU的低功耗设计与验证

代理获取

目录

声明

第一章 绪论

1.1 课题背景与研究意义

1.2 相关研究现状

1.3 X-DSP概述

1.4 论文的研究内容与组织结构

第二章 VPU的低功耗设计

2.1 VPU功能概述

2.2 VPU的结构

2.3 VPU的低功耗设计

2.4 VPU的性能评估

2.5 本章小结

第三章 MAC部件的功耗优化

3.1 MAC部件的结构

3.2 定浮点乘法器共享

3.3 基于保持电路的低功耗乘法器

3.4 MAC的性能评估

3.5 本章小结

第四章 VPU的验证与综合

4.1 验证方案

4.2 模块级验证

4.3 系统级验证

4.4 形式化验证

4.5 综合

4.6 本章小结

第五章 结束语

5.1 全文总结

5.2 工作展望

致谢

参考文献

作者在学期间取得的学术成果

展开▼

摘要

随着通信和多媒体技术的广泛应用,数字信号处理器(DSP, Digital Signal Processor)得到快速发展。早期的 DSP设计通过不断提高频率和扩大规模满足日益增长的性能需求,近年来,随着便携式设备的推广,功耗问题日益突出,严重制约着处理器的进一步发展,因此DSP设计的重点逐渐转变成了追求更高的性能和更低的功耗。
  X-DSP是一款自主研发的高性能64位DSP,采用哈佛总线结构,支持11发射的超长指令字和单指令多数据流操作,工作频率1GHz。本文以 X-DSP的研发为技术背景,完成向量处理单元(VPU:Vector Process Unit)的低功耗设计和验证综合,主要研究内容如下:
  1.向量处理单元VPU的低功耗设计。针对VPU的结构特点,使用多种不同的低功耗设计技术,对VPU进行低功耗优化:VPE的时钟门控、功能部件中的操作数隔离、基本门电路的逻辑重组。使用SpyGlass对VPU的功耗进行评估,结果表明在不使用时钟门控管理VPU的工作时,功耗优化效率达到13.95%,而使用时钟门控关掉一半的VPE时,功耗优化效率达到42.7%。
  2.为了进一步降低VPU的功耗,对其主要功耗来源乘加部件MAC进行功耗优化。根据MAC中定、浮点乘加的相互独立,设计并实现了定、浮点乘法器共享的MAC部件,减少了一个乘法器的使用。对共享的乘法器进行分析,设计并实现了基于保持电路的低功耗乘法器,降低了乘法器的无效翻转。在40nm工艺下,使用DC综合工具对MAC进行综合,结果表明优化后MAC的面积减小24.17%,动态功耗降低了32.25%,静态功耗降低了25.61%。
  3.针对本文所优化的电路进行了全面的验证和综合,制定了详细的验证方案,进行了模块级、系统级、形式化验证以及回归验证,验证结果证明优化后的电路功能正确。在40nm工艺下,使用DC综合工具对完成上述所有优化的VPU进行逻辑综合,综合结果表明优化后 VPU的面积减小了12.41%,动态功耗降低了19.36%,静态功耗降低了14.56%。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号