首页> 中国专利> 嵌入式视频编码器量化方法

嵌入式视频编码器量化方法

摘要

本发明公开了一种嵌入式视频编码器量化方法,它通过构造移位量化矩阵,将移位操作代替了除法操作,包括以下步骤:①构造移位量化矩阵Q1=2n+4/(Q[i,j]Kq),其中Q[i,j]为视觉量化矩阵,Kq为量化因子,n为移位的位数;②设定量化因子Kq和视觉量化矩阵Q[i,j]的取值范围,α1≤Kq≤α2,β1≤Q[i,j]≤β2,则,n∈Z+;③进行量化,其量化结果为y=32x/(2Q[i,j]Kq)=(2n+4x/(Q[i,j]Kq))>>n,x为待量化的系数,“>>”为位右移运算符。采用上述技术方案的本发明,通过构造出的移位量化矩阵,将量化过程中的除法操作变成移位操作,实现了快速的一步量化。对不同的视频编码块类型,采用不同的量化策略,避免了统一量化引起的图像质量降低;选用适合DSP的MPEG-4误配控制算法用于反量化,有效地提高了编码器的整体效率。

著录项

  • 公开/公告号CN101854535A

    专利类型发明专利

  • 公开/公告日2010-10-06

    原文格式PDF

  • 申请/专利权人 郑州大学;

    申请/专利号CN200910064535.4

  • 发明设计人 苏士美;周兵;王宗敏;

    申请日2009-03-31

  • 分类号H04N7/26(20060101);H04N7/50(20060101);

  • 代理机构41109 郑州中原专利事务所有限公司;

  • 代理人张春

  • 地址 450001 河南省郑州市科学大道100号

  • 入库时间 2023-12-18 01:00:57

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2015-08-12

    专利权人的姓名或者名称、地址的变更 IPC(主分类):H04N7/26 变更前: 变更后: 申请日:20090331

    专利权人的姓名或者名称、地址的变更

  • 2015-07-01

    专利权人的姓名或者名称、地址的变更 IPC(主分类):H04N7/26 变更前: 变更后: 申请日:20090331

    专利权人的姓名或者名称、地址的变更

  • 2014-10-29

    专利权人的姓名或者名称、地址的变更 IPC(主分类):H04N7/26 变更前: 变更后: 申请日:20090331

    专利权人的姓名或者名称、地址的变更

  • 2014-10-29

    专利权的转移 IPC(主分类):H04N7/26 变更前: 变更后: 登记生效日:20141013 申请日:20090331

    专利申请权、专利权的转移

  • 2014-10-29

    著录事项变更 IPC(主分类):H04N7/26 变更前: 变更后: 申请日:20090331

    著录事项变更

  • 2011-10-05

    授权

    授权

  • 2010-11-24

    实质审查的生效 IPC(主分类):H04N7/26 申请日:20090331

    实质审查的生效

  • 2010-10-06

    公开

    公开

查看全部

说明书

技术领域

本发明涉及一种量化方法,具体地说是涉及一种基于嵌入式,特别是DSP芯片的视频编码器量化方法。

背景技术

由于音视频编码运算量大,目前实用系统广泛采用通用高性能数字信号处理芯片DSP。由于在视频处理能力上,通用DSP芯片和专用视频处理芯片还存在一定的差距,要达到专用视频处理芯片实现的性能,就必须针对DSP芯片的硬件特点,对软件视频压缩算法进行优化改进,以弥补DSP芯片在处理能力方面的不足。

H.26x和MPEG-x是当前流行的两大音视频编码标准,二者均是首先通过运动估计与运动补偿消除运动图像时间域上的冗余,然后利用DCT变换把图像数据从空域变到频域,通过量化来消除图像空间域上的冗余。其中量化部分在图像压缩中占据着非常重要的地位,因为,第一,图像的失真都是在量化阶段引入的,第二,量化粒度将直接控制图像编码的位率。对应的反量化是用于重建参考帧,其处理结果的质量将影响到下一帧的预测精度。这就是说,量化和反量化环节设计的好坏,将直接影响编码图像的质量和压缩比。因此,在实现基于DSP的视频编码器中,针对DSP系统结构特点,研究合适的量化技术是很有必要的。

一般来讲,视频编码器中的每一套量化方案都有它一定的应用环境和应用范围,视频压缩标准中的量化技术也有其局限性:在H.263量化技术中,图像变换系数没有采用视觉量化矩阵,而是采用量化因子直接进行处理。这样,虽然实现上比较简单,但是没有考虑人眼视觉对低频和高频分量敏感程度的差异,与考虑视觉因素的方法相比,该方法处理后的图像主观质量稍差。MPEG的量化策略是一种比较成熟的量化技术,考虑了人类视觉的特点,但MPEG的量化分两步完成:首先采用视觉量化矩阵处理系数,然后采用量化因子对系数进行二次处理,这种两步量化方法降低了编码器的量化效率。同时,MPEG量化处理需要大量的除法运算,而在基于DSP的视频编码器实现中,由于DSP内部没有提供相应的硬件除法部件,因此,如果直接采用这一量化策略,将会导致处理效率很差。此外,DSP采用的是流水线工作原理,单周期最大能8条指令并行工作,但在标准的量化技术中,由于饱和处理和误配控制的算法存在大量的条件判断和分支,导致DSP不能有效发挥并行处理性能,从而影响了编码器的整体效率。

发明内容

本发明的目的是提供一种量化效率高、图像质量好的嵌入式视频编码器量化方法。

为实现上述目的,本发明采用以下技术方案:

本发明通过构造移位量化矩阵,将移位操作代替了除法操作,它包括以下步骤:

①构造移位量化矩阵Q1=2n+4/(Q[i,j]Kq),其中Q[i,j]为视觉量化矩阵,Kq为量化因子,n为移位的位数;

②设定量化因子Kq和视觉量化矩阵Q[i,j]的取值范围,α1≤Kq≤α2,β1≤Q[i,j]≤β2,则

③进行量化,其量化结果为y=32x/(2Q[i,j]Kq)=(2n+4x/(Q[i,j]Kq))>>n,其中,x为待量化的系数,“>>”为位右移运算符。

具体地说,步骤①中所述的构造移位量化矩阵的过程包括以下步骤:

1)、利用视觉量化矩阵Q[i,j]来处理DCT系数,则一次量化结果y1=32x/Q[i,j];

2)、通过位率控制方法获得量化因子Kq,利用所述的量化因子Kq进行二次量化,其最终量化结果y为

y=(y1+sign(x)(pKq//q))/(2Kq),其中p和q为修正参数,符号“//”表示移位除,sign(x)表示取符号函数;

3)、根据所述的一次量化结果y1和最终量化结果y得到

y=(2n+4x/(Q[i,j]Kq))>>n,

从而对于一个确定的量化因子Kq,可获得一个移位量化矩阵Q1,则Q1=2n+4/(Q[i,j]Kq)。

另外,对于帧内编码块的量化,利用所获得的移位量化矩阵Q1而进行量化时,对量化结果y作取整操作。

采用上述技术方案的本发明,通过构造出的移位量化矩阵,将量化过程中的除法操作变成移位操作,并且实现了快速的一步量化。对不同的视频编码块类型,采用不同的量化策略,避免了统一量化引起的图像质量降低;同时,选用适合DSP的MPEG-4误配控制算法用于反量化,并利用DSP提供的硬件微指令来实现任意位的饱和处理,从而有效地提高了编码器的整体效率。

表格说明

表1为本发明与使用MPEG量化方法的对比实验结果;

表2为本发明与使用MPEG在量化、反量化所需的周期数、降幅及在编码器中所占比例比较。

具体实施方式

本发明利用视觉量化矩阵Q[i,j]来处理离散余弦变换DCT系数,目的是根据人类视觉对高频数据不敏感的特性,对视觉量化矩阵中的高频位置选择较大的参数值,以消除视觉上的冗余。本发明包括以下步骤:

①构造移位量化矩阵Q1=2n+4/(Q[i,j]Kq),其中Q[i,j]为视觉量化矩阵,Kq为量化因子,n为移位的位数。其具体的构造过程如下:

1)、利用视觉量化矩阵Q[i,j]来处理DCT系数,则一次量化结果y1=32x/Q[i,j],其中x表示待量化的系数;

2)、通过位率控制方法获得量化因子Kq,位率控制方法为本领域普通技术人员所熟知的技术,利用所述的量化因子Kq进行二次量化,其最终量化结果y为y=(y1+sign(x)(pKq//q))/(2Kq),其中p和q为修正参数,符号“//”表示移位除,sign(x)表示取符号函数;

3)、根据所述的一次量化结果y1和最终量化结果y得到

y=(2n+4x/(Q[i,j]Kq))>>n,从而对于一个确定的量化因子Kq,可获得一个移位量化矩阵Q1,则Q1=2n+4/(Q[i,j]Kq)。

②设定量化因子Kq和视觉量化矩阵Q[i,j]的取值范围,α1≤Kq≤α2,β1≤Q[i,j]≤β2,则

③进行量化,其量化结果为y=32x/(2Q[i,j]Kq)=(2n+4x/(Q[i,j]Kq))>>n,其中,x为待量化的系数,“>>”为位右移运算符。于是,对一个确定的量化因子Kq可以构造一个移位量化矩阵Q1,则Q1=2n+4/(Q[i,j]Kq),从而将量化过程中的除法操作变成移位操作,并且把通常需要的两步量化合并成一步完成。

需要指出的是,由于每一个量化因子Kq对应一个移位量化矩阵,所以当出现多个不同量化因子时,移位量化矩阵表将占用大量的存储资源。但是,针对特定的图像特征和编码位率,量化因子通常在一个比较小的范围内波动,因此,通过统计这一范围,并把量化因子限制在这个范围内,以此来降低量化矩阵表的规模。在上述的步骤②中设定了量化因子Kq和视觉量化矩阵Q[i,j]的取值范围,即α1≤Kq≤α2,β1≤Q[i,j]≤β2。对于16×16位乘法器,移位量化矩阵Q1选择短字short类型以适合进行乘法运算,于是有:1≤Q1[i,j]≤32767,同时结合得到的移位量化矩阵Q1=2n+4/(Q[i,j]Kq)可以得出(log2(α2*β2)-4)n(log2(α1*β1)+12),nZ+.

参数的典型设置α1=2,α2=62,β1=8,β2=83,因此可以得出移位位数n的有效范围为:9≤n≤16。考虑到移位量化矩阵中参数值不宜太大而且又要保证量化的精度,本发明选择了该范围的中值,即n=13。

在给定编码位率下,提高图像主观质量和提高压缩比是一对矛盾,因此,怎样根据不同的应用需求找到一个好的折衷方案,成为量化和反量化方案设计的一个关键。此外,在基于DSP的实时视频编码应用中,还必须考虑量化和反量化在DSP上的运行效率。

由于帧内编码块包含着当前块的完整信息,所以对量化结果的修正很重要。故利用步骤(3)获得的移位量化矩阵Q1而进行量化时,对量化结果y作取整round()操作,以保证量化时尽可能减少信息的损失,其调整公式为

y=round(xQ1[i,j]>>n),

上式round()表示四舍五入取整,然后对最终量化结果y饱和处理到(-255,255)范围内。同时,在构造Q1[i,j]矩阵时,选用合适的Q[i,j]矩阵以符合人们视觉对低频和高频分量敏感程度的差异。另外,由于帧内编码块中的AC系数和DC系数采用了不同的量化参数值,为了提高DSP处理效率,对Q1[0,0]即DC系数的量化参数值进行调整,使其能够和AC系数一起用相同的移位位数来处理。

非帧内编码块保存当前块和预测块的差值,由于它并没有保存当前块的完整信息,因此,对非帧内编码无须修正。此外,根据预测编码的思想,希望非帧内编码块的大部分系数近可能都归零,以保证最大限度的压缩图像。同时,由于非帧内块保存的是差值信息,所以也无须考虑视觉的因素,Q[i,j]矩阵可以选用相同的参数值,本发明选用Q[i,j]=16,为2整数倍,方便使用DSP上的移位操作。该类型的编码块AC系数和DC系数采用相同的量化参数:y=(xQ1[i,j]>>n),然后对结果y饱和处理到(-255,255)。

对于反量化,也要区分帧内编码块的反量化和非帧内编码块的反量化。

对于帧内编码块的量化,由于DC系数和AC系数采用不同的量化参数,反量化也要不同处理。

DC系数的反量化表示为:

y=xd其中d为一个量化时选用的参数

AC系数的反量化表示为:

y=(xQ[i,j]Kq)>>4

然后上式的结果y饱和处理到范围(-2048,2047)内,最后对饱和处理的结果利用MPEG-4的误配控制算法处理。上述MPEG-4的误配控制算法为本领域普通技术人员所熟知的技术。

对于非帧内编码块的反量化,由于原始的视觉量化矩阵Q[i,j]选择了相同的参数值16,因此,非帧内块的反量化可简化如下:y=xKq,然后再对上式的结果y饱和处理到(-2048,2047)范围内,最后对饱和处理的结果利用MPEG-4的误配控制算法处理。

为检测本发明的处理结果,采用了两方面的实验:

(一)实验一:在微机上,测试改进的量化技术对图像编码质量的影响。

实验条件:PC计算机PIV/1.8GHz/256M;图像为CIF格式(352×288);处理GOMB,即Group Of Marco Block的长度为22个宏块,每隔11个宏块加一个切片头,编码模式为彩色;移位位数为n=13。

对四个典型视频序列使用MPEG和本发明对比实验结果如表1所示。

表1

在上表中,PSNRY表示亮度Y的峰值信噪比,PSNRU、PSNRV分别表示色度Cr和Cb的峰值信噪比;A代表MPEG的量化技术;B代表本发明的量化技术。

实验比较结果表明:较之MPEG的量化技术方案,本发明的亮度PSNR值有明显升高,尽管个别测试序列的色度PSNR值稍有降低,但综合PSNR是升高的。由于人眼对亮度比对色度更敏感,所以图像的主观质量也是提高的。由以上数据可以得出,本发明有效提高了图像的编码质量。

(二)实验二:在TI的Load6x软件仿真器上,测试优化后的量化和反量化算法的工作效率。

Load6x仿真器是TI提供的一个性能仿真工具,它能够准确的仿真出程序中各部分代码在DSP上的运行效率,并能可靠地统计出程序在DSP上的各项性能指标。

实验条件:测试序列:a1;测试帧数:20f;位率:426000bps;帧率:10fps;Load6x仿真器;硬件环境:PIII 1GHz,256M内存。

MPEG和本文量化、反量化算法运行效率的对比实验结果见表-2。本实验的测试序列a1,是本文视频编码器应用环境的特征图像,针对该测试序列所测的结果,能够准确反应本文算法在应用环境中的执行效率情况。由于软件仿真比较耗时,仿真中没有选择太多的帧数。本实验中选择20帧图像,包括2个I帧和18个P帧,也覆盖了算法中用到的所有编码帧类型。因此,本实验的测试条件是能够保证结果是准确、可靠的。

表-2量化、反量化所需的周期数、降幅及在编码器中所占比例比较

表2

实验结果分析:如表2所示,相对于MPEG标准方案,本发明的量化和反量化的效率有了很大的提高,处理20帧图像量化和反量化所需的周期数降幅分别高达94%和91%。另外,对量化和反量化在编码器中所占比例的比较中,两者之和从47%降到了8%,说明也大大提高了整个编码器的工作效率。因此,本发明有效提高了编码器在DSP上的量化效率。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号