法律状态公告日
法律状态信息
法律状态
2016-08-24
专利权有效期届满 IPC(主分类):H04N7/26 授权公告日:20030423 申请日:19960703
专利权的终止
2013-05-08
专利权的转移 IPC(主分类):H04N7/26 变更前: 变更后: 登记生效日:20130419 申请日:19960703
专利申请权、专利权的转移
2003-07-02
专利申请权、专利权的转移专利权的转移 变更前: 变更后: 登记生效日:20030523 申请日:19960703
专利申请权、专利权的转移专利权的转移
2003-04-23
授权
授权
1999-08-04
实质审查请求的生效
实质审查请求的生效
1997-11-12
公开
公开
查看全部
本发明涉及一种视频信号编码方法;更具体地,涉及一种基于轮廓图象的大小及复杂性对视频信号的视频帧中的轮廓图象进行自适应编码的方法。
在诸如可视电话、电话会议和高清晰度电视系统这样的数字视频系统中,由于视频帧信号包含有被称作象素值的数字化数据,需要大量的数字化数据以确定各视频帧信号。然而由于常规发送信道的可用频带宽度是有限的,为了通过其发送大量的数字化数据,使用各种数据压缩技术来压缩或减少数据量是必要的,特别是在象可视电话和电话会议系统这样的低比特率视频信号编码器中。
对低比特率编码系统中的视频信号进行编码的技术之一就是被称作面向目标的分析合成编码技术(参见Michael Hotter著《基于运动的二维目标的面向目标的分析合成编码》,Signal Processing:Image Communication,2,No.4,409~428页(1990年12月)。
根据面向目标的分析合成编码技术,输入的视频图象被分为若干个目标且三组用来确定各目标的运动轮廓和象素数据的参数通过不同的编码信道被处理。
在处理一个目标的轮廓图象时,轮廓信息对于目标外形的分析和合成是重要的。用来表示轮廓信息的常规编码方案之一就是链式编码技术。在链式编码技术中,尽管轮廓信息没有损失,但所需要的比特量是很大的。
为了克服这一缺陷,已提出几种技术来对轮廓进行近似,例如多边形近似法和B-仿样函数近似法。同多边形近似法相比,B-仿样函数近似法有可能得到更准确的表现,其中它使用了高次多项式来减少近似误差。然而,B-仿样函数近似法会增大视频编码器的整体计算复杂度。
为改进增大的计算复杂度这一问题,一种使用了多边形近似法和离散正弦变换(DST)的轮廓编码技术被提了出来。在一份共有未决申请中说明了这一技术,其中国专利申请号为95116451.1,1995年9月7日递交,题目为“用来再现目标轮廓的改进的轮廓近似方法”。然而,在处理复杂的轮廓图象时,上述使用多边形近似法和DST的技术会产生一个与它的原始轮廓象很不一致的重构图象。
因此,本发明的主要目的是提供一种用于编码器的方法,它以轮廓图象的大小和复杂度为基础,对视频信号的视频帧中的轮廓图象进行适当的编码,从而提高视频帧中重构轮廓图象的质量。
按照本发明,提供一种对视频信号的视频帧中所包括的目标的轮廓图象进行自适应编码的方法,其中视频帧被分为多个块,每个块包含K×L个象素(K,L是正整数),轮廓图象由多个轮廓象素组成,轮廓象素是指位于轮廓上的象素。上述方法由下列步骤构成:(a)检测轮廓块的数目,每个轮廓块中包含一个或多个轮廓象素;(b)计算所选轮廓象素处的轮廓曲率,从而基于所计算的曲率来确定平均曲率,基中所谓所选轮廓象素处的轮廓曲率是指穿过该象素的两条直线之间的角度变化,该两条直线中的每一条都穿过所选轮廓象素和另一轮廓象素,和位于沿着轮廓方向离开所选象素的多个预定轮廓象素处的另一轮廓象素;(c)将轮廓块数和平均曲率分别与第一和第二预定阈值相比较;(d)如果轮廓块数小于第一预定阈值并且平均曲率大于或等于第二预定阈值,就使用第一轮廓编码方法对轮廓图象编码;(e)如果轮廓块数大于或等于第一预定阈值或者平均曲率小于第二预定阈值,就使用第二轮廓编码方法对轮廓图象编码,其中,所选用的第一轮廓编码方法与第二轮廓编码方法相比,能够更精确地再现轮廓图象。
结合下列附图,通过对优选实施例的进一步说明,本发明的上述和其他目的及特征会变得更为清楚:
图1是一个根据本发明的轮廓编码装置的方框图;
图2是定义轮廓块的示意图;
图3是说明曲率计算过程的放大图。
参见图1,示有一根据本发明的用来对视频信号的视频帧中的目标的轮廓图象进行自适应编码的轮廓编码装置10的方框图。
包含在视频帧中的目标的轮廓图象数据被并行输入到大小检测单元110,复杂度检测单元130,第一轮廓编码单元200和第二轮廓编码单元300中,其中,轮廓图象数据代表了轮廓象素的位置信息,轮廓象素是指位于轮廓上的象素。
在大小检测单元110中,视频帧首先被分为多个K×L个象素的块(K,L为正整数),因此,轮廓块的数目得以确定,各轮廓块是指其中至少包含了一个轮廓象素的块。正如图2中所示,位于阴影区20中的每一个块同视频帧40中的轮廓30部分重叠,这些块就被称为轮廓块。
然后,轮廓块数输入到第一比较单元120,其中,这一数目同第一预定阈值TH1相比较。如果该数目大于或等于第一阈值TH1,即,如果轮廓图象的大小被认为很大的话,则第一比较单元120输出一逻辑高信号;反之,则输出一逻辑低信号。
与此同时,复杂度检测单元130计算所选轮廓象素处的曲率,并确定轮廓的平均曲率。
参见图3,示有一说明了在复杂度检测单元130里所进行的曲率计算过程的放大示意图。首先,一个轮廓象素,例如T2,被选作目标象素,并且它的在轮廓30的两边的两个第N个象素,例如邻近轮廓象素的第6个象素,即T 1和T3被确定下来。然后,两条直线穿过目标象素T2和它的两个第N个邻近轮廓象素T1和T3。穿过目标象素T2的两条直线之间的角度变化被定义为目标象素T2处的轮廓曲率。在本发明的优选实施例中,所有轮廓象素都被选作目标象素。然而,为了减轻计算负担,也可以是每个第P个轮廓象素被选作为目标象素,P是大于1的整数。而后,剩余目标象素的轮廓曲率以上述同样的方法进行计算。
当所有目标象素的轮廓曲率确定之后,轮廓的平均曲率依下式计算:
回到图1,在第二比较单元140中,在复杂度检测单元130所确定的平均曲率CM同第二预定阈值TH2相比较。如果平均曲率CM大于或等于第二阈值TH2,即如果轮廓图象被确定为相当复杂,则第二比较单元140向控制单元150提供一逻辑低信号;反之,则提供一逻辑高信号。
在控制单元150中,来自两个比较单元120和140的信号进行逻辑组合,如果来自两个比较单元120和140的信号都是逻辑低,即如果轮廓被认为是小而复杂,则产生一逻辑低控制信号送往开关单元400。反之,即如果轮廓图象被认为是大或简单,则产生一逻辑高控制信号送往开关单元400。
同时,在第一和第二轮廓编码单元200和300中,轮廓图象数据被编码。
具体地说,在第一轮廓编码单元200中,例如使用常规的链式编码方法,轮廓图象数据被编码,并提供给开关单元400作为第一编码数据,其中连续轮廓象素间的方向矢量被编码。例如,通常使用的链式编码方案采用8个方向矢量,它们能被3位码字编码。在链式编码中,典型地,起始轮廓象素地址信息后紧接一串码字。
另一方面,在第二轮廓编码单元300中,轮廓图象数据被编码,例如使用多边形近似法和DST方法,结果编码数据作为第二编码数据提供给开关单元400,其中,轮廓图象数据首先使用多边形近似法来近似,原始轮廓图象与近似的轮廓图象之间的误差使用DST来计算;使用诸如不压缩的固定长度码对多边形近似的结果进行编码;然后,使用诸如JPEG(联合图象专家组)的二进制算术码对DST的结果进行编码。前述中国专利申请No.95116451.1,详细说明了多边形近似法和DST技术,该申请于1995年9月7日递交,题目为“用于再现目标轮廓的改进的轮廓近似方法”,在此引入作为参考。
响应于来自控制单元150的控制信号,开关单元400选择,或者是第一编码数据,或者是第二编码数据作为编码的轮廓图象数据。也就是说,如果提供给其的是逻辑低控制信号,则第一编码数据被送到发送器(未示出)去发送,如果提供给其的是逻辑高控制信号,则发送第二编码数据。
结果,视频帧中较小且较复杂的轮廓图象通过链式编码方法在第一轮廓编码单元200中进行编码,同时,视频帧中较大或较简单的轮廓图象通过采用多边形近似及DST的轮廓编码方法在第二轮廓编码单元300中被选择进行编码。
本发明仅以某一优选实施例进行说明,但在不脱离由权利要求书中提出的本发明的精神和保护范围的前提下,可以对本发明作一些其它修改和变化。
机译: 用于在视频信号中编码轮廓图像的自适应轮廓编码方法
机译: 通过使用中心点编码对象的轮廓的方法以及使用该编码方法编码的设备,尤其是在移动图像以及静态图像中的轮廓编码方面,特别是非常有效地执行
机译: 轮廓编码方法,轮廓解码方法和使用该方法的轮廓编码设备,轮廓解码设备和记录该方法的记录介质