32位高性能M-DSP BP及向量归约部件的设计与实现

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

随着科学技术的飞速发展，数字信号的数据量呈爆炸式增长。如何高效、高质量地处理庞大的数据群，给现代高性能DSP的性能带来了巨大挑战。
　　M-DSP是一款完全由国防科学技术大学自主研发的32位高性能DSP处理器，支持超长指令字技术（VLIW）、单指令多数据流（SIMD）技术，工作主频1.0GHz。本文以M-DSP芯片的开发与设计为背景，在面向高性能DSP的位处理单元和向量归约部件方面进行了研究。本文主要工作如下：
　　1.设计实现了 BP部件，并对其时序、面积和功耗进行优化，综合结果达到M-DSP的设计要求。根据M-DSP运算单元的设计要求，设计并实现了BP部件，此部件能够执行三类指令：移位指令、位处理指令、打包解包指令，除了打包解包指令，其余两类指令均支持 SIMD16位指令格式。采用硬件复用策略进行面积优化，对移位指令单元和位处理指令单元进行了结构上的合并，节省了一级移位器，提高了硬件复用率。同时采用操作数隔离方法对BP部件进一步优化，通过降低翻转率来降低动态功耗。综合结果显示：本文设计的BP部件相比X-DSP的BP部件在面积上缩小10.1％，动态功耗降低10.4%，静态功耗降低11.4%。
　　2.设计实现了向量归约部件，优化其时序与功耗，综合结果达到M-DSP的设计要求。本文设计的向量归约部件能够对向量运算单元 VPU中的16个向量运算部件（VPE）进行八种归约指令操作，包括四种显式归约模式指令和四种隐式归约模式指令，每一种归约模式均能实现2归约、4归约、8归约、16归约四条指令。以Matrix-DSP的向量归约部件为基础，进行时序和功耗优化：对归约单元进行流水线优化，缩短关键路径，提高频率；根据VPE的布局，对全局信号走线长度进行优化，缩短关键路径；同时，采用门控时钟降低动态功耗。综合结果表明：相比Matrix-DSP的向量归约部件，本文设计在面积上缩小15.4%，动态功耗降低8.8%，静态功耗降低6%。
　　3.对 BP部件和向量归约部件进行验证：①代码检查，使用 Qusetformal软件对代码的设计规范和存在的语法错误进行查验。②编写C语言黄金模型，为模块级和单核系统级的基本功能点的验证提供结果参考对照。③对 BP部件的三大指令和向量归约指令的基本功能点进行验证。模块级编写testbench验证，单核系统级使用汇编语言验证。④检查全局信号的可控性，并进行指令组合和覆盖率验证。⑤使用 ATEC和 Formality对设计进行形式化验证。验证结果表明：本文设计的两个部件的功能正确。

著录项

作者
李林峰;
展开▼
作者单位

国防科学技术大学;

展开▼
授予单位国防科学技术大学;
学科软件工程
授予学位硕士
导师姓名彭元喜;
年度 2015
页码
总页数
原文格式 PDF
正文语种中文
中图分类运算器和控制器（CPU）;
关键词
多核DSP处理器; 位处理单元; 向量归约部件; 设计验证;

相似文献

中文文献
外文文献
专利

1. M-DSP中高性能浮点乘加器的设计与实现 [J] . 车文博 ,刘衡竹 ,田甜 . 计算机应用 . 2016,第008期
2. 32位高性能嵌入式CPU中Load Aligner 模块的设计与实现 [J] . 张书 ,王颖 ,林正浩 . 今日电子 . 2005,第001期
3. Microchip推出全新32位PIC32 MCU系列,具备以太网、CAN、USB和128 KB RAM,通过高性能连接扩展32位单片机产品组合 [J] . . 电子工业专用设备 . 2009,第12期
4. 支持向量回归约束去除断层阴影研究——以南海珠江口盆地东部YP油区某油田为例 [J] . 杨小江 ,文晓涛 ,王亚会 . 华南地震 . 2021,第001期
5. 一种单指令多数据向量化归约方法 [J] . 韩林 ,高伟 ,王冬 . 计算机工程 . 2017,第007期
6. M-DSP中DMA部件的设计与实现 [C] . 刘宝骞 ,孙书为 ,陈海燕 . 第十七届计算机工程与工艺年会暨第三届微处理器技术论坛 . 2013
7. 高性能M-DSP仿真/调试部件的设计与实现 [A] . 黄佳帅 . 2015

32位高性能M-DSP BP及向量归约部件的设计与实现

目录

摘要

著录项

相似文献

相关主题

期刊订阅