首页> 中国专利> 具有适度退化的降低了复杂度的反离散余弦变换译码

具有适度退化的降低了复杂度的反离散余弦变换译码

摘要

把根据基于有丢失DCT算法(例如MPEG或MPEG2算法)压缩的数据,根据动态选择的一组DCT系数加以解压缩,其中把未使用的系数加以掩蔽。使用DCT系数的一个小的子集,解压缩展示很小移动的数据的一个宏块,同时,使用DCT系数的一个较大的子集(直至DCT系数的全集),解压缩展示较大移动的数据的一个宏块。因此平均计算复杂度保持较低,从而能够使用价廉设备,同时使退化最小化。

著录项

  • 公开/公告号CN1460381A

    专利类型发明专利

  • 公开/公告日2003-12-03

    原文格式PDF

  • 申请/专利权人 皇家菲利浦电子有限公司;

    申请/专利号CN02800944.4

  • 发明设计人 T·-H·兰;Z·钟;Y·陈;

    申请日2002-03-26

  • 分类号H04N7/30;H04N7/50;

  • 代理机构72001 中国专利代理(香港)有限公司;

  • 代理人吴立明;王忠忠

  • 地址 荷兰艾恩德霍芬

  • 入库时间 2023-12-17 15:01:15

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2018-04-17

    未缴年费专利权终止 IPC(主分类):H04N7/30 授权公告日:20050907 终止日期:20170326 申请日:20020326

    专利权的终止

  • 2012-07-04

    专利权的转移 IPC(主分类):H04N7/30 变更前: 变更后: 登记生效日:20120524 申请日:20020326

    专利申请权、专利权的转移

  • 2009-10-07

    专利申请权、专利权的转移(专利权的转移) 变更前: 变更后: 登记生效日:20090904 申请日:20020326

    专利申请权、专利权的转移(专利权的转移)

  • 2005-09-07

    授权

    授权

  • 2004-06-16

    实质审查的生效

    实质审查的生效

  • 2003-12-03

    公开

    公开

查看全部

说明书

发明背景

1.发明领域

本发明涉及针对数字数据的压缩算法的译码,具体地说,涉及使用反离散余弦变换的译码算法。

2.相关技术的描述

为了存储和传输,常常对数字数据流进行压缩。通常要求含有字母数字数据的数据流在压缩和解压缩之后绝对地保持不变,但当使用音频或图片数据工作时,使用如下的“有丢失的”压缩可能是可接受的:其中某些细节可能会被丢失或被改变,但其中作为观察者的人,会觉得输出基本上类似于原始的内容。

已经设计出许多有丢失的压缩算法,例如针对声音记录的MP3(Moving Picture Group Layer-3 Audio)、针对静止画面的JPEG(Joint Photographic Experts Group)、以及针对视频记录的MPEG(Motion Picture Experts Group)和MPEG2。要加以描述的本发明的一个实施方案主要适用于MPEG2压缩,但也适用于其它的算法。

在MPEG2压缩中,把一个要被传输的视频帧划分成8×8个象素的宏块(MB)。在MB上进行一个离散余弦变换(DCT),得到一个8×8系数阵列。通过Huffman-树编码量化或许进一步压缩的这些系数加以存储或传输,以供一个重放设备加以检索。

重放设备在每一个8×8系数阵列上执行一个反离散余弦变换(IDCT),以根据原始帧重新构造8×8象素阵列的等价物(equivalent)。为了恢复最大的细节和精度,应该处理所有64个系数(因为以上所提到的量化过程,即使使用了所有64个系数,也仍将有某些细节的丢失。对于许多应用,例如消费娱乐,来说,用户将乐于牺牲一定程度的画面质量,以便拥有一个低开销的重放设备。在一个现有技术方案中,使用了少于全部64个的系数,达到了一个可用的或可接受的画面质量,因而允许使用较少能力的一个计算元素。在反DCT中所使用的系数的个数,是根据对某一特定计算元素的所希望的质量水平预先加以确定的。对于具有很少摄像机移动和很少对象移动的均匀场景来说,画面质量可以是相当好的,但对于高杂色场面的退化,或当存在快速的摄像机移动或快速的对象移动时,画面质量会退化,画面退化可能超过“适度”退化的极限,适度退化是这样的一个术语,表明:尽管退化是允许的,但退化应能够尽可能地不引人入目。因而存在着一种对一个具有处理少于全部DCT系数而同时又能维持画面质量的适度退化的MPEG2重放系统的需求。

发明内容

为了克服以上所述的现有技术的限制,并克服通过阅读和了解本说明将十分明显的其它限制,本发明提供了一种使用一系列根据高频部件的电流电平动态选择的DCT系数估价一个DCT块的横向高频部件和译码的系统和方法。

根据本发明的一个方面,对代表表示横向频率的DCT部件的最高频率的DCT部件进行估价,并因此选择DCT系数的一个掩蔽(masking)。

通过以下结合附图所考虑的详细的描述,本发明的其它目的和特性将会变得十分明显。然而,应该认识到:这些附图的设计仅仅是为了便于说明,并不作为对本发明的限制的定义。对本发明的限制,应参照所附的权利要求。还应该认识到,除非另作说明,不必按比例画这些图,它们仅旨在概念性地说明此处所描述的结构和过程。

附图说明

在这些图中,以相同的参照数字表示类似的元素:

图1描述了根据本发明的一个实施方案的8×8阵列中的DCT系数的位置的组成;

图1A示意性地说明了由图1中所给出的DCT系数的位置所代表的相对频率;

图2A-2H说明了可用于把一个所编码的信号译码成根据图1的DCT系数典型的掩蔽,说明了针对每一掩蔽的相对的计算复杂度;

图3是本发明的一个实施方案的流程图;以及

图4是一个适合用于执行图3的流程的装置的方框图。

具体实施方式

在一个典型的数据压缩方案中,例如在视频流的MPEG或MPEG2数据压缩中,把一个8×8的象素阵列(一个宏块或称MB)从一个视频帧中抽取出来,并在这一MB上执行一个离散的余弦变换,(DCT),以得到一组DCT系数,通常对它们加以量化,以产生一个8×8的DCT系数阵列。

在此,给出这一技术中人们所熟知的DCT算法,以作参考。已知数据A(i),其中i是0至N-1这一范围中的一个整数,正DCT(例如由译码器使用)为:

B(k)=[1-(1-sqrt(2)/2)delta(k)]/2 sum A(i)cos((pi k/N)(2i+1)/2)

i=0至N-1

其中,delta是kronecker的delta。

针对频率空间变量k的所有值定义B(k),但我们仅关心0~N-1这一范围中的整数k。反DCT(例如译码器将使用它)为:AA(i)=sum B(k)[1-(1-sqrt(2)/2)delta(k)]/2cos((pi k/N)(2i+1)/2)

k=0至N-1

图1说明了这样的一个阵列的典型布局,其中64个系数的位置以00-63表示。在施用于这一阵列的DCT算法中,N拥有值64。位置00包括一个代表MB中最低纵向频率和MB中的最低横向频率的DCT系数。代表较高横向频率的系数“向下”占据阵列的相继的位置,如图1中所描述的,而代表较高纵向频率的系数“横向”占据阵列的相继的位置,如图中所描述的。因此,位置7中的系数代表不考虑横向频率的最高纵向频率,位置56中的系数代表不考虑纵向频率的最高横向频率,位置63中的系数代表最高横向频率和最高纵向频率。图1A示意性地说明了阵列位置中的相对频率。

为了重新产生用于重放的原始帧,必须在8×8余弦系数阵列上执行一个反离散余弦变换(IDCT),以从原始帧恢复一个近似的8×8MB。这是近似的,因为压缩算法,例如MPEG,是先天地“有丢失的”压缩算法—某些细节被先天地丢失或改变。然而,细节的有丢失对于观看者来说可能是感觉不到的。另外,增加细节的丢失(为了简化重放设备,因而降低重放设备的开销)同时仍能产生一个不会令观看者不愉快的输出视频流是可能的。

通过完全画出的阴影线,图2A表示:把8×8DCT系数阵列的每一位置均用于IDCT译码。对于重新构造一个MB来说,这意味着100%的计算复杂度。图2B至2H,每一个都描述了IDCT译码中所使用的系数00-63的一个典型的子集。一个画阴影线的方框表示:把按照图1中所标识的相应位置的相应的DCT系数用于IDCT译码。一个未画阴影线的方框表示:把相应的DCT系数设置为0,并且不使用它。其中,图2B至2H中的每一个都是最终计算复杂度的一个相对(即百分比)表示。因使用DCT系数的一个子集而退化了图像质量的程度,取决于MB的频率复杂度。例如,一个为某一稳定平背景的一部分的MB,可能将不会显示出可以感觉到的退化,即使采用图2H的38%的复杂度。另一方面,对于为从左到右跨越镜头全速奔跑同时摄像机从右到左对其全景加以拍摄的一个男人的花格衬衫的一部分的MB来说,采用图2H的38%的复杂度,将出现相当糟糕的退化,因而采用每一较高的复杂度,将会产生较少的退化。

对沿纵方向所展示的高复杂度的MB,也给予类似的考虑,例如垂直落下悬崖的一个男人的花格子衬衫,如果他。在典型的视频节目内容中,遇到横向复杂度的频度远远大于遇到纵向复杂度的频度。与纵方向相比,本发明的优选实施方案更多地降低了横向复杂度,但应该认识到:本发明的技术也可以侧重于纵向复杂度或同等地对待横向和纵向复杂度。

在不能够连续提供100%计算能力的低开销的重放设备上提供观看质量的一个标称水平的现有技术方案,总是使用一个根据重放设备的计算能力所选择的DCT系数的一个预确定的子集进行译码。例如,对于一个基于一个100MHz Intel Pentium芯片的重放设备,可能总是使用图2G的55%的复杂度,但对于一个基于350MHz IntelPentium-II芯片的重放设备,可能总是使用图2C的86%的复杂度。后面的这一设备将产生较好的结果,但即使在这样一种情况下,对于具有高度横向复杂度的MB来说,也可能产生显著的和引人注目的退化。

本发明估价每一单独MB的横向复杂度,相应地选择复杂度水平。于是,在穿花格子衬衫全速奔跑过镜头的男人的例子中,针对来自快速移动的男人的花格子衬衫或其它部分的MB使用高复杂度译码,以便减少退化。然而,对于来自通常展示低得多的复杂度(在全速奔跑的男人之后的背景可能是一个均匀的建筑物墙壁或均匀的蓝天)的帧的其它MB来说,低复杂度译码可用于这些MB,而且不会引入令人不愉快的退化。

再次参照图1,系数56的幅值在最高横向频率时指示出当前MB的横向复杂度,因而把系数56用作前导,以选择将针对当前MB加以施加的处理的复杂度。如果对视频数据加以隔行扫描(这是针对多数TV信号的情况),这一选择是十分重要的。对数据进行隔行扫描以及在隔行扫描之后对数据进行DCT编码的情况,被称为帧型DCT(与字段型DCT相反,在非隔行扫描的MB上执行的)。在隔行扫描的数据中,顶字段可以非常不同于底字段,在这一情况中,系数56将拥有一个非常高的值。在盲目使用一个固定的译码复杂度的现有技术方案中,在这样的情况下,倾向于产生令人不愉快的退化。观看者已报告说,由于观看这样的输出,变得眼花缭乱。在典型的节目内容中,高纵向复杂度倾向于很少出现(如果希望同等地最小化横向的和纵向的退化,其它的实施方案可能使用系数63(或某些沿阵列的主对角线的其它系数),或如果希望仅最小化纵向退化,可以使用系数07)。

对于拥有低水平复杂度的MB(例如,来自一个均匀背景),系数56的幅值是非常低的,因此,图2H的低复杂度编码可用于译码MB,而且不会引入明显的退化。针对系数56的较高值,使用较高复杂度编码,因而使退化降低到可接受的值。对于其中系数56超过一个预先确定的阈值的MB来说,可以使用图2A的100%的复杂度,其中使用了全部64个DCT系数。对于实际上所有典型的帧,平均计算复杂度远远低于100%,即使把100%复杂度译码用于某些包含该帧的MB中。

在本发明的本实施方案中,仅定义了针对系数56的一个阈值。对于低于这一阈值的值,使用了图2G中所描述的具有55%相对复杂度的系数子集。对于等于或高于这一阈值的值,使用了图2C中所描述的具有86%相对复杂度的系数子集。

在图3中,以流程图的形式描述了本发明的一个实施方案。对于每一帧的每一MB,接收了通常来自一个存储设备或一个传输设备的一个8×8阵列的DCT系数(方框302)。在方框304中,估价系数56的值,如以上所讨论的,把系数56与横向移动的最高频率关联起来。本实施方案寻求最小化横向退化,同时允许纵向退化,因为在典型的节目内容中,纵向退化的出现频度要低得多。

在方框306中,根据针对具有系数56的值的DCT系数的子集的掩蔽(图2)的一个预先确定的关联,选择预先确定的掩蔽之一。在方框308中,在一个反DCT操作中,使用DCT系数的所选择的子集,以恢复对原始宏块的一个近似。根据系数56的值对系数子集的动态选择,当不存在大的横向移动时,可使用较低的复杂度,并可针对各种较大量的横向移动使用较高的复杂度,以使退化最小化。本实施方案使用了两个子集选择之一:图2G的55%的系数子集,针对低于一个预先确定的阈值的系数56的值;图2C的86%的系数子集,针对等于或高于预先确定的阈值的值。

从方框310回到方框302,以至于一个帧的每一MB均得以处理。方框312转回到方框302,以处理一个视频流中的每一个帧。

用于执行此处所描述的操作的装置,可以根据设计选择使用专用的硬件或通过适当的固件或软件加以编程的通用的数字逻辑硬件制造。图4中,以方框图的形式描述了这样一个装置400。它包括一个数据接收器402,用于接收输入数据;一个数据存储404,用于存储计算机指令和数据(输入数据、中间数据、所处理的输出数据、工作数据、例如预先确定的DCT子集);一个计算设备406;控制逻辑408,以及一个数据传输器410,用于输出数据。

因此,尽管已显示、描述、并指出了本发明的基本的新的特性,如施加于其优选实施方案的,然而人们将会领悟到:在不背离本发明的构思的情况下,这一领域中的熟练技术人员可以就所说明的设备的形式和细节、以及就它们的操作,对本发明进行各种删减、替代、以及变更。例如,明确的意图在于:以基本相同的方式执行基本相同的功能以达到相同的结果的这些元素与/或方法的步骤的所有组合,均处于本发明的范围内。而且还应该认识到:所显示与/或所描述的与本发明的任何所公开的形式或实施方案相关结构与/或元素与/或方法的步骤,可以根据一个总的设计选择,并入任何其它所公开或所描述或所建议的形式或实施方案中。因此,仅局限于此处所附权利要求的范围。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号