首页> 中文学位 >基于CORDIC的离散三角变换快速算法及其实现研究
【6h】

基于CORDIC的离散三角变换快速算法及其实现研究

代理获取

目录

封面

中文摘要

英文摘要

目录

第1章 绪 论

1.1课题背景及研究意义

1.2离散三角变换国内外研究现状

1.3论文的主要研究内容

1.4论文结构

第2章 基于的CORDIC离散三角变换快速算法研究

2.1 引言

2.2基于CORDIC的基-2 DCT-II快速算法研究

2.3基于CORDIC的基-2 DST-II快速算法研究

2.4基于CORDIC基-2 DCT-III/DST-III快速算法研究

2.5 本章小结

第3章 离散三角变换快速算法VLSI实现研究

3.1 引言

3.2 改进型非重叠CORDIC(MCORDIC)设计及验证

3.3 基于MCORDIC的离散三角变换VLSI实现

3.4 基于MCORDIC的2-D DCT-II/DCT-III设计

3.5 本章小结

第4章 离散正交变换通用架构设计

4.1 引言

4.2 DCT-II/DCT-III通用架构设计

4.3 DCT-II/DST-II通用架构设计

4.4 DCT-II/DST-II/DCT-III/DST-III通用架构设计

4.5 离散三角变换与其他正交变换通用架构设计

4.6 本章小结

第5章 基于图像内容的压缩编码硬件实现架构研究

5.1引言

5.2基于图像内容的压缩编码硬件实现架构设计

5.3 基于Haar-DWT近似计算JND的算法

5.4实现两种工作模式的可重构DCT-II设计

5.5 控制方案选取

5.6压缩编码架构验证

5.7 本章小结

结论

参考文献

攻读博士学位期间发表的论文及其它成果

声明

致谢

个人简历

展开▼

摘要

离散三角变换(Discrete Trigonometic Transform, DTT)在信息处理,尤其是视频、图像处理领域具有非常重要的地位和应用,其快速算法及硬件实现一直是信息处理领域的研究热点。新视频压缩标准 H.265/HEVC发布后,传统的典型点数DTT已不能满足实际应用要求,大点数(尤其是2n点)、可变点数的快速算法将成为该领域的研究热点。
  在视频、图像处理领域,精确计算DTT的硬件实现方式已基本成熟,采用近似计算成为提高其计算速度的另一有效途径。随着使用者对图像品质、处理速度要求不断提高,采用一种编码方式已不能满足应用要求。视频、图像压缩编码正向多正交变换混合编码方向发展,设计出能实现多种正交变换且性能优良的通用架构(Unified architecture)是亟待解决的问题。
  本文针对以上研究热点问题,对大点数(2n点)DTT的快速算法及其基于改进型非重叠CORDIC的硬件实现以及离散正交变换的通用架构展开研究,主要研究工作包括:
  1、研究了以CORDIC作为变换核函数的任意2n点DTT快速算法。首先,通过奇偶分解推导出了以CORDIC作为变换核函数的任意2n点DCT-II和DST-II的快速算法,并给出了规律一致的信号流图;然后,根据正交变换的对偶原理得到了DCT-III和DST-III的快速算法及其信号流图,从而提出了一种新型的基于CORDIC的基-2 DTT快速算法。与现有算法比较,该算法在硬件复杂度、可扩展性、流水线设计、模块化设计等性能指标上优于同类算法,且具有以下突出特点:适用于任意2n点的DTT;既有较低的算法复杂度又易于VLSI硬件实现;算法中CORDIC的旋转角度为等差数列;具有规则的蝶形运算结构和统一的缩放因子,易于实现流水线设计;支持原位运算等。
  2、研究了基于非重叠CORDIC处理单元的DTT硬件实现方法。首先,针对传统非重叠CORDIC算法中迭代次数与计算精度相互制约的问题,提出了一种改进型非重叠CORDIC(MCORDIC),以牺牲极少精度为代价将迭代次数减少了50%;然后,根据所提出的算法中CORDIC的旋转角度为等差数列这一特点,采用复用设计和模块化设计思想,大幅度减少了计算DTT所需的CORDIC运算单元的数量和类型,理论上任意2n点的DTT仅需要一种类型CORDIC;在此基础上提出了一种新型DTT脉动阵列设计方法,基于该方法设计的脉动阵列在电路延迟、吞吐率、流水线操作及硬件复杂度等性能指标上优于其他类似架构,并解决了由于存在不同类型的基本运算单元(PE)而导致的计算时序不同步以及PE中存在多种算术运算等问题。
  3、以所提出的快速算法为研究基础,对四种类型 DTT之间的内在关系进行了探讨。利用相同点数的DTT具有相同的CORDIC运算单元这一特点,通过控制信号流向来实现不同类型DTT的计算,从而提出了一种基于CORDIC的DTT通用架构设计方法。所提出的方法适用于任意2n点DTT,可实现四种DTT的任意组合的通用架构,并且具有以下优点:具有统一的变换核函数,控制电路简单,硬件复用率高。利用该方法设计了具有代表性的几种通用架构,所设计的架构在硬件复杂度、控制复杂度、吞吐率、可扩展性、模块化程度、流水线设计等性能指标上优于现有通用架构。此外,还给出了DWHT/DCT-II和Haar-DWT/DCT-II通用架构的设计方法。
  4、在Haar-DWT/DCT-II通用架构的基础上,研究了基于图像内容的压缩编码硬件实现架构。该架构以图像的JND值为判断依据有选择的进行图像压缩编码。为解决JND计算复杂度高、难于硬件实现的问题,提出了一种基于Haar-DWT的近似计算JND算法,该算法虽然只得到JND的近似解,却大幅度降低了计算复杂度。设计了可实现两种工作模式(近似计算或非近似计算)的可重构DCT-II架构。研究了基于图像内容压缩编码的控制方案、工作模式选取的参考位置和JND阈值的选取方法。实验结果表明该压缩编码架构切实可行。所设计的压缩编码硬件实现架构中没有复杂的算术运算,计算复杂度非常低,因此非常易于VLSI硬件实现。
  本文提出了一种新型的以CORDIC作为变换核函数的DTT快速算法,为研究DTT快速算法提供了新的研究思路和方法。研究的近似计算DTT的VLSI实现方式及其通用架构可以满足视频、图像压缩领域目前的需求,并符合未来该领域的发展方向。正如FFT的提出使得DFT在实际应用中得到飞跃性的发展,具有类似FFT特点的DTT快速算法也将使得DTT得到更广泛的应用。论文所研究内容既具有理论研究的前瞻性又具有现实的应用价值。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号