首页> 中文学位 >面向多媒体的粗粒度可重构处理单元的结构研究
【6h】

面向多媒体的粗粒度可重构处理单元的结构研究

代理获取

目录

文摘

英文文摘

第一章 绪论

第二章算法分析

第三章 可重构处理单元的结构设计

3.1重构处理单元设计讨论

3.2龙腾-DSRU模型的设计特点

3.3龙腾-DSRU总体结构

3.4数据通路

3.5控制通路

3.6小结

第四章FIR、FFT、点积类运算的映射

第五章仿真与综合

第六章结束语

致谢

参考文献

攻读硕士学位期间参与的科研工作及发表的论文

西北工业大学业学位论文知识产权声明书及学位论文原创性声明

展开▼

摘要

本文面向多媒体应用领域的三种基本计算结构:FIR(FiniteImpulseResponse)、FFT(FastFourierTransform)、点积类运算,实现了一种粗粒度的、高效、灵活的片上可重构处理单元——龙腾-DSRU(DomainSpecificReconfigurableUnit)。主要研究工作包括: ●以多媒体处理中具有高计算量,高并行性的应用为研究对象,提出了可重构阵列处理单元模型龙腾-DSRU。龙腾-DSRU模型设计的特点是粗粒度、Crossbar互连、VLIW计算模型、多配置文件。 ●研究多媒体领域常用算法的硬件实现,主要是FIR、FFT、DCT等算法,设计并实现了一个高速、高效的可重构ALU,使其能够恰当的与上述算法中的密集型计算相匹配,在最大程度上发挥其灵活性与高效性。 ●研究并设计了可配置的Crossbar和局部存储器,可以灵活的进行数据的缓存并对各部件进行互连。 ●为了减少控制信息,采用两级配置逻辑,第一级使用配置寄存器堆对龙腾-DSRU的数据路径进行灵活配置,第二级使用译码器RAM对配置寄存器堆进行灵活配置,将984个控制信号减少到了6个。 ●研究FIR、FFT、点积等算法在龙腾-DSRU上的映射,其中FFT算法在龙腾-DSRU上的映射完全避免了操作数读取按位序取反的寻址方式,最多可实现1024点复数FFT运算。 ●在FPGA上验证了龙腾-DSRU原型,并在SMIC0.18um工艺下进行逻辑综合。40MHz工作频率下,1024点复数FFT可以在64.5μs内完成,通过性能分析,龙腾-DSRU完全满足多媒体处理领域的应用要求。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号