首页> 中国专利> 基于改进的拉普拉斯求和滤波器标引与四叉树分割的组合的多输入自适应滤波器

基于改进的拉普拉斯求和滤波器标引与四叉树分割的组合的多输入自适应滤波器

摘要

在视频编码器处应用滤波,且在位流中编码滤波器信息以使视频解码器能够识别在所述视频编码器处应用的所述滤波。所述视频解码器接收包含所述滤波器信息的经编码视频数据,解码所述视频数据,且基于所述滤波信息应用滤波。以此方式,所述解码器应用在所述编码器处应用的相同滤波。可利用针对使用四叉树分割方案分割的经译码单元的多个输入使用拉普拉斯滤波器标引的多个滤波器来编码视频。

著录项

  • 公开/公告号CN103222263A

    专利类型发明专利

  • 公开/公告日2013-07-24

    原文格式PDF

  • 申请/专利权人 高通股份有限公司;

    申请/专利号CN201180042433.8

  • 申请日2011-07-08

  • 分类号H04N7/26(20060101);H04N7/50(20060101);

  • 代理机构11287 北京律盟知识产权代理有限责任公司;

  • 代理人宋献涛

  • 地址 美国加利福尼亚州

  • 入库时间 2024-02-19 20:08:03

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2016-06-01

    授权

    授权

  • 2013-08-21

    实质审查的生效 IPC(主分类):H04N7/26 申请日:20110708

    实质审查的生效

  • 2013-07-24

    公开

    公开

说明书

技术领域

本发明涉及用于压缩视频数据的基于块的数字视频译码,且更特定来说涉及用于确 定用于对视频块的滤波的滤波器的技术。

背景技术

数字视频能力可并入到广泛的装置中,包含数字电视、数字直播系统、例如无线电 电话手持机等无线通信装置、无线广播系统、个人数字助理(PDA)、膝上型计算机、桌 上型计算机、平板计算机、数码相机、数字记录装置、视频游戏装置、视频游戏控制台 等。数字视频装置实施视频压缩技术,例如MPEG-2、MPEG-4或ITU-T H.264/MPEG-4 第十部分(高级视频译码(AVC)),以更高效地发射及接收数字视频。视频压缩技术执行空 间和时间预测以减少或移除视频序列中固有的冗余。例如由“联合协作团队-视频译码” (JCTVC)开发的高效视频译码(HEVC)标准(其是MPEG与ITU-T之间的协作)等新的视频 标准持续出现和发展。此新的HEVC标准有时也称为H.265。

基于块的视频压缩技术可执行空间预测和/或时间预测。帧内译码依赖于空间预测来 减少或移除给定经译码视频单元(其可包括视频帧、视频帧的切片等)内的视频块之间的 空间冗余。与此相对,帧间译码依赖于时间预测来减少或去除视频序列的连续经译码单 元的视频块之间的时间冗余。对于帧内译码,视频编码器执行空间预测来基于同一经译 码视频单元内的其它数据而压缩数据。对于帧间译码,视频编码器执行运动估计和运动 补偿来跟踪两个或两个以上邻近经译码视频单元的对应视频块的移动。

经译码的视频块可由可用于创建或识别预测块的预测信息及指示正被译码的块与 预测块之间的差异的残余数据块表示。在帧间译码的情况下,一个或一个以上运动向量 用以从前一或后一经译码单元识别预测性数据块,而在帧内译码的情况下,预测模式可 用以基于与正被译码的视频块相关联的经译码单元内的数据产生预测性块。帧内译码及 帧间译码两者可界定若干不同预测模式,所述预测模式可界定译码中所使用的不同块大 小及/或预测技术。还可包括额外类型的语法元素作为经编码视频数据的一部分,以便控 制或界定译码过程中所使用的译码技术或参数。

在基于块的预测译码之后,视频编码器可应用变换、量化及熵译码过程以进一步减 小与残余块的通信相关联的位速率。变换技术可包含离散余弦变换(DCT)或概念上类似 的过程,例如小波变换(wavelet transform)、整数变换或其它类型的变换。在离散余弦变 换过程中,例如,变换过程将一组像素值转换成变换系数,其可表示像素值在频域中的 能量。将量化应用于变换系数,且量化通常涉及限制与任何给定变换系数相关联的位的 数目的过程。熵译码包含共同地压缩经量化变换系数的序列的一个或一个以上过程。

可应用视频块的滤波作为编码及解码循环的一部分,或作为对经重建的视频块的后 滤波过程的一部分。滤波通常用以(例如)减少成块效应(blockiness)或基于块的视频译码 所共有的其它假影。滤波器系数(有时称为滤波器分接头)可经界定或选择以便促进可减 少成块效应的所要等级的视频块滤波及/或以其它方式改进视频质量。举例来说,一组滤 波器系数可界定如何沿视频块的边缘或视频块内的其它位置应用滤波。不同滤波器系数 可引起关于视频块的不同像素的不同等级的滤波。举例来说,滤波可平滑化或锐化邻近 像素值的强度差异,以便帮助消除不想要的假影。

发明内容

本发明描述与视频编码及/或视频解码过程中的视频数据的滤波相关联的技术。根据 本发明,在编码器处应用滤波,且在位流中编码滤波器信息以使解码器能够识别编码器 处应用的滤波。解码器接收包含滤波器信息的经编码视频数据,解码所述视频数据,且 基于所述滤波信息应用滤波。以此方式,解码器应用在编码器处应用的相同滤波。

根据本发明的技术,可以称为经译码单元(CU)的单元对视频数据进行译码。经译码 单元可使用四叉树分割方案分割为较小经译码单元或子单元。针对特定经译码单元识别 四叉树分割方案的语法可从编码器发射到解码器。与每一子单元相关联的多个输入可在 解码和重建经编码视频数据的过程期间滤波。解码器接收的位流中的语法可识别针对特 定子单元在编码器处使用的滤波器。用于特定输入的滤波器可基于活动-度量滤波器标引 来选择,其中针对活动度量的某些值经标引到一组滤波器内的特定滤波器。在使用改进 的拉普拉斯求和值来确定活动度量的情况下,活动-度量滤波器标引有时称为改进的拉普 拉斯求和标引或简称为拉普拉斯标引。

可基于针对视频数据所确定的活动度量而应用不同类型的滤波。活动度量可量化与 视频数据内的一个或一个以上像素块相关联的活动。活动度量可包括指示一组像素内的 像素方差的方差度量。举例来说,活动度量可包含改进的拉普拉斯求和函数值,如下文 更详细阐释。根据本发明的技术,例如自适应环路中滤波器等滤波器单元可经配置以基 于改进的拉普拉斯求和滤波器标引而针对多个输入利用多个滤波器。如下文将更详细描 述,本发明中描述的多个输入大体指代在编码和解码过程期间产生的中间视频块数据或 图像数据。多个输入可包含(例如)经重建块或图像(RI)、经预解块的经重建块或图像 (pRI)、预测块或图像(PI),和/或经量化预测误差图像(EI)。并且,如下文更详细阐释, 本发明的滤波技术可使用四叉树分割方案应用于各种大小的经译码单元。通过利用针对 使用四叉树分割方案分割的经译码单元的多个输入使用拉普拉斯滤波器标引的多个滤 波器,如通过压缩率和经重建视频质量中的一者或两者所测量的视频译码性能可能得到 改善。

如本发明中预期的多输入多滤波器方法可产生较大数目的滤波器,且因此需要较大 数目的滤波器系数从编码器传递到解码器。然而,对于一些滤波器,所有系数可能为零。 举例来说,在4输入情境中,编码器可确定仅通过使用四个输入中的三者获得最佳图像。 在解码器处,仅基于四个输入中的三者重建图像可通过将全部为零的滤波器应用于第四 输入来实现。因此,具有全部为零的系数的滤波器的使用可在多输入滤波方案中比在单 输入滤波方案中更频繁发生。然而,发射全部为零的滤波器可需要较大数目的位。为减 少将滤波器系数从编码器传递到解码器所需的经译码位的数目,本发明的方面包含使用 零旗标,其可为视频块的帧、切片、最大经译码单元、经译码单元或其它系列的标头中 的1位语法元素。如果针对特定滤波器的所有系数均为零,那么编码器可将设定为第一 值的零旗标发射到解码器。在接收到设定为第一值的零旗标后,解码器可即刻在未实际 上从编码器接收到识别所有零系数的数据的情况下重建滤波器。如果针对特定滤波器的 系数包含至少一个非零系数,那么编码器可将设定为第二值的零旗标发射到解码器。在 接收到设定为第二值的零旗标后,解码器可即刻基于随后从编码器接收的系数重建滤波 器。因此,为了重建滤波器,编码器可仅需针对至少一个滤波器系数为非零的那些情况 将滤波器系数发射到解码器。

在一个实例中,一种对视频数据进行译码的方法包含:基于活动度量将来自一组滤 波器的第一滤波器应用于第一输入以产生第一经滤波结果;将第二滤波器应用于第二输 入以产生第二经滤波结果,其中第二输入不同于第一输入;以及基于第一经滤波结果和 第二经滤波结果产生经滤波图像。

在另一实例中,一种译码装置包含:滤波器单元,其经配置以基于活动度量将来自 一组滤波器的第一滤波器应用于第一输入以产生第一经滤波结果,且将第二滤波器应用 于第二输入以产生第二经滤波结果,其中第二输入不同于第一输入;以及存储器,其经 配置以存储基于第一经滤波结果和第二经滤波结果的经滤波图像。

在另一实例中,一种设备包含:用于基于活动度量将来自一组滤波器的第一滤波器 应用于第一输入以产生第一经滤波结果的装置;用于将第二滤波器应用于第二输入以产 生第二经滤波结果的装置,其中第二输入不同于第一输入;以及用于基于第一经滤波结 果和第二经滤波结果产生经滤波图像的装置。

本发明中所描述的技术可以硬件、软件、固件或其任一组合来实施。如果以硬件实 施,那么设备可作为集成电路、处理器、离散逻辑或其任何组合而实现。如果以软件来 实施,则可在例如微处理器、专用集成电路(ASIC)、现场可编程门阵列(FPGA)或数字信 号处理器(DSP)等一个或一个以上处理器中执行软件。可最初将执行所述技术的软件存 储于计算机可读媒体中且在处理器中加载并执行。

因此,本发明还预期一种有形地存储一个或一个以上指令的非暂时性计算机可读存 储媒体,所述指令在由一个或一个以上处理器执行时致使所述一个或一个以上处理器: 基于活动度量将来自一组滤波器的第一滤波器应用于第一输入以产生第一经滤波结果; 将第二滤波器应用于第二输入以产生第二经滤波结果,其中第二输入不同于第一输入; 且基于第一经滤波结果和第二经滤波结果产生经滤波图像。

附图说明

图1为说明示范性视频编码和解码系统的框图。

图2A和2B为说明应用于最大译码单元(LCU)的四叉树分割的实例的概念图。

图3为说明与本发明一致的示范性视频编码器的框图。

图4为说明与本发明一致的示范性视频解码器的框图。

图5为说明用于活动度量的值的范围的概念图。

图6为说明与本发明一致的示范性滤波器单元的框图。

图7为说明与本发明一致的编码技术的流程图。

图8为说明与本发明一致的解码技术的流程图。

图9为说明与本发明一致的编码技术的流程图。

图10为说明与本发明一致的解码技术的流程图。

具体实施方式

本发明描述与视频编码及/或视频解码过程中的视频数据的滤波相关联的技术。根据 本发明,在编码器处应用滤波,且在位流中编码滤波器信息以使解码器能够识别编码器 处应用的滤波。解码器接收包括滤波器信息的经编码视频数据,解码所述视频数据且基 于所述滤波信息应用滤波。以此方式,解码器应用曾在编码器处应用的相同滤波。

根据本发明的技术,可以称为经译码单元(CU)的单元对视频数据进行译码。经译码 单元可使用四叉树分割方案分割为较小经译码单元或子单元。针对特定经译码单元识别 四叉树分割方案的语法可从编码器发射到解码器。与每一子单元相关联的多个输入可在 解码和重建经编码视频数据的过程期间被滤波。解码器接收的位流中的语法可识别针对 特定子单元在编码器处使用的滤波器。用于特定输入的滤波器可基于活动-度量滤波器标 引来选择,其中针对活动度量的某些值被标引到一组滤波器内的特定滤波器。在使用改 进的拉普拉斯求和值来确定活动度量的情况下,活动-度量滤波器标引有时称为改进的拉 普拉斯求和标引或简称为拉普拉斯标引。

可基于针对视频数据所确定的活动度量而应用不同类型的滤波。活动度量可量化与 视频数据内的一个或一个以上像素块相关联的活动。活动度量可包含指示一组像素内的 像素方差的方差度量。举例来说,活动度量可包含改进的拉普拉斯求和函数值,如下文 更详细阐释。根据本发明的技术,例如自适应环路中滤波器等滤波器单元可经配置以基 于改进的拉普拉斯求和滤波器标引而针对多个输入利用多个滤波器。如下文将更详细描 述,本发明中描述的多个输入大体指代在编码和解码过程期间产生的中间视频块数据或 图像数据。多个输入可包含(例如)经重建块或图像(RI)、经预解块的经重建块或图像 (pRI)、预测块或图像(PI),和/或经量化预测误差图像(EI)。并且,如下文更详细阐释, 本发明的滤波技术可使用四叉树分割方案应用于各种大小的经译码单元。通过利用针对 使用四叉树分割方案分割的经译码单元的多个输入使用拉普拉斯滤波器标引的多个滤 波器,如通过压缩速率和经重建视频质量中的一者或两者所测量的视频译码性能可能得 到改善。

如本发明中预期的多输入多滤波器方法可产生较大数目的滤波器,且因此需要较大 数目的滤波器系数从编码器传递到解码器。然而,对于一些滤波器,所有系数可能为零。 举例来说,在4输入情境中,编码器可确定仅通过使用四个输入中的三者来获得最佳图 像。在解码器处,仅基于四个输入中的三者重建图像可通过将全部为零的滤波器应用于 第四输入来实现。因此,具有全部为零的系数的滤波器的使用可在多输入滤波方案中比 在单输入滤波方案中更频繁发生。然而,发射全部为零的滤波器可需要较大数目的位。 举例来说,在每一滤波器系数使用5位发射的9×9滤波器的情况下,将滤波器的所有系 数从编码器发射到解码器可花费超过400位。

为减少将滤波器系数从编码器传递到解码器所需的经译码位的数目,本发明的方面 包含使用零旗标,其可为视频块的帧、切片、最大经译码单元、经译码单元或其它系列 的标头中的1位语法元素。如果针对特定滤波器的所有系数均为零,那么编码器可将设 定为第一值的零旗标发射到解码器。在接收到设定为第一值的零旗标后,解码器可即刻 在未实际上从编码器接收到识别所有零系数的数据的情况下重建滤波器。如果针对特定 滤波器的系数包含至少一个非零系数,那么编码器可将设定为第二值的零旗标发射到解 码器。在接收到设定为第二值的零旗标后,解码器可即刻基于随后从编码器接收的系数 重建滤波器。因此,为了重建滤波器,编码器可仅需针对至少一个滤波器系数为非零的 那些情况将滤波器系数发射到解码器。

编码器发射的零旗标可例如包含在一系列视频块的标头中,例如切片标头、图片群 组标头、序列标头或其它标头中。尽管出于阐释的目的本发明将大体将零旗标论述为包 含在标头中,但零旗标或者可包含在脚注或其中可包含语法的其它数据结构中。标头可 每滤波器每输入包含一个零旗标。作为一实例,假定fm(l,n)等于第m输入的第l滤波器 的第n系数的滤波器系数。假定四个输入(即,m=0到3)且每输入四个滤波器(即,l=0 到3),那么经译码单元可能包含总共16个零旗标,16个滤波器中的每一者各一个。如 果zero_flagm(l)=1,表示第m输入的第l滤波器的所有系数均等于零,那么针对所述滤 波器不需要将任何系数从编码器发送到解码器。如果zero_flagm(l)=0,表示第m输入 的第l滤波器的至少一个系数不等于零,那么将识别第m输入的第l滤波器的系数的额 外数据从编码器发射到解码器。如下文将更详细描述,所述额外数据可包含一些或所有 滤波器系数的实际值,或可包含允许解码器基于额外数据与解码器已知的其它信息的组 合来重建滤波器的例如差异信息等信息。

尽管本发明的技术将大体参考环路中滤波来描述,但所述技术可应用于环路中滤 波、环路后滤波和例如切换式滤波等其它滤波方案。环路中滤波指代其中经滤波数据为 编码及解码环路的一部分,使得经滤波数据用于预测性帧内译码或帧间译码的滤波。环 路后滤波指代在编码环路之后应用于经重建视频数据的滤波。在后滤波的情况下,将未 经滤波的数据用于预测性帧内译码或帧间译码。本发明的技术不限于环路内滤波或后滤 波,且可应用于在视频译码期间应用的各种各样的滤波。

本发明中,术语“译码”指代编码或解码。类似地,术语“译码器”大体指代任何 视频编码器、视频解码器,或组合式编码器/解码器(codec)。因而,术语“译码器”在本 文中用以指代执行视频编码或视频解码的专用计算机装置或设备。

另外,本发明中,术语“滤波器”大体指代一组滤波器系数。举例来说,3×3滤波 器由一组9个滤波器系数界定,5×5滤波器由一组25个滤波器系数界定,等等。因此, 对滤波器进行编码大体指代对将使解码器能够确定或重建所述组滤波器系数的位流中 的信息进行编码。虽然编码滤波器可包含直接编码整个一组滤波器系数,但其也可包含 仅直接编码一部分组滤波器系数或完全不编码任何滤波器系数而是对使解码器能够基 于解码器已知或可获得的其它信息重建滤波器系数的信息进行编码。举例来说,编码器 可对描述如何更改一组现有滤波器系数以产生一组新的滤波器系数的信息进行编码。

术语“滤波器组”大体指代一组一个以上滤波器。举例来说,一组2个3×3滤波器 可包含第一组9个滤波器系数以及第二组9个滤波器。根据本发明中描述的技术,对于 一系列视频块(例如,帧、切片,或最大译码单元),识别滤波器组的信息在针对所述系 列的视频块的标头中从编码器发射到解码器。所述组滤波器中的每一滤波器可具有在所 述标头中的对应零旗标以指示所述滤波器含有全部为零的系数还是含有至少一个非零 系数。

图1为说明可实施本发明的技术的示范性视频编码及解码系统110的框图。如图1 中所示,系统110包含经由通信信道115将经编码视频数据发射到目的地装置116的源 装置112。源装置112及目的地装置116可包括各种各样的装置中的任一者。在一些情 况下,源装置112及目的地装置116可包括无线通信装置手持机,例如所谓的蜂窝式或 卫星无线电话。然而,更一般来说应用于视频数据的滤波的本发明的技术不一定限于无 线应用或环境,且可应用于包含视频编码和/或解码能力的非无线装置。

在图1的实例中,源装置112包含视频源120、视频编码器122、调制器/解调器(调 制解调器)123和发射器124。目的地装置116包含接收器126、调制解调器127、视频解 码器128和显示装置130。根据本发明,源装置112的视频编码器122可经配置以在视 频块滤波过程中针对多个输入选择一组或一组以上滤波器系数,且接着编码所述选定的 一组或一组以上滤波器系数。可基于针对一个或一个以上输入的活动度量而选择来自所 述一组或一组以上滤波器系数的特定滤波器,且所述滤波器系数可用于对所述一个或一 个以上输入进行滤波。本发明的滤波技术大体与用于从编码器向解码器译码或以信号发 送滤波器系数的任何技术兼容。

根据本发明的技术,视频编码器122可将帧或切片的一组或一组以上滤波器系数发 射到视频解码器128。对于帧或切片,视频编码器122可例如发射待与所有输入一起使 用的一组滤波器,或可发射待与多个输入一起使用的多组滤波器(例如,每输入一组)。 所述帧或切片内的每一视频块或经译码单元可因而含有额外语法来识别所述组滤波器 中哪个(些)滤波器将用于所述视频块的每一输入,或可基于与所述输入中的一者或一者 以上相关联的活动度量来确定将使用所述组滤波器中哪个(些)滤波器。

更特定来说,源装置112的视频编码器122可针对帧或切片选择一组或一组以上滤 波器,在编码过程期间将来自所述组的滤波器应用于与切片或帧的经译码单元相关联的 输入,且接着编码所述组滤波器(即,所述组滤波器系数)以传送到目的地装置116的视 频解码器128。视频编码器122可确定与经译码单元的输入相关联的活动度量以便选择 来自所述组滤波器的哪个(些)滤波器将与所述特定经译码单元一起使用。在解码器侧, 目的地装置116的视频解码器128还可确定针对与经译码单元相关联的一个或一个以上 输入的活动度量,使得视频解码器128可确定将来自所述组滤波器的哪个(些)滤波器应 用于像素数据,或在一些例子中,视频解码器128可直接依据在位流语法中接收的滤波 器信息来确定滤波器系数。视频解码器128可依据滤波器系数曾如何编码而基于直接解 码或预测性解码来解码滤波器系数,滤波器系数曾如何编码可作为位流语法的一部分而 用信号发送。另外,所述位流可包含针对每一滤波器的零旗标以指示一滤波器是否具有 非零滤波器系数。如果零旗标指示滤波器不具有任何非零系数,那么解码器128可在未 从源装置112接收到进一步语法的情况下重建全部为零系数的滤波器。图1的所说明系 统110仅是示范性的。本发明的滤波技术可由任何编码装置或解码装置执行。源装置112 及目的地装置116仅为可支持此些技术的译码装置的实例。

源装置112的视频编码器122可使用本发明的技术对从视频源120接收到的视频数 据进行编码。视频源120可包含例如摄像机等视频捕捉装置、含有先前捕捉到的视频的 视频档案,或来自视频内容提供者的视频馈送。作为另一替代方案,视频源120可产生 基于计算机图形的数据作为源视频,或直播视频(live video)、存档视频与计算机产生的 视频的组合。在一些情况下,如果视频源120为摄像机,那么源装置112及目的地装置 116可形成所谓的相机电话或视频电话。在每一情况下,视频编码器122可对所捕捉、 所预捕捉或计算机产生的视频进行编码。

一旦视频编码器122对视频数据进行编码,调制解调器123就可接着根据例如码分 多址(CDMA)等通信标准或另一通信标准或技术来调制经编码的视频信息,且经由发射 器124将其发射到目的地装置116。调制解调器123可包含各种混频器、滤波器、放大 器或经设计以用于信号调制的其它组件。发射器124可包含经设计以用于发射数据的电 路,包含放大器、滤波器及一个或一个以上天线。

目的地装置116的接收器126经由信道115接收信息,且调制解调器127解调所述 信息。由视频解码器128执行的视频解码过程可包含滤波,例如作为环路中解码的一部 分或作为解码环路之后的后滤波步骤。不管怎样,视频解码器128针对特定切片或帧所 应用的所述组滤波器可使用本发明的技术来解码。如果举例来说,零旗标指示滤波器包 含非零系数且将预测性译码用于所述滤波器系数,那么可利用不同滤波器系数之间的相 似性来减少在信道115上传达的信息量。特定来说,滤波器(即,一组滤波器系数)可预 测性译码为相对于与一不同滤波器相关联的另一组滤波器系数的差值。不同滤波器可例 如与不同切片或帧相关联。在此情况下,视频解码器128可能接收经编码位流,所述经 编码位流包括视频块和识别不同滤波器对于其为相关联滤波器的不同帧或切片的滤波 器信息。滤波器信息还包含相对于不同经译码单元的滤波器界定当前滤波器的差值。明 确地说,所述差值可包括相对于用于不同经译码单元的不同滤波器的滤波器系数界定用 于当前滤波器的滤波器系数的滤波器系数差值。

视频解码器128解码视频块,产生滤波器系数,且基于所产生的滤波器系数对经解 码的视频块进行滤波。经解码及滤波的视频块可经组合为视频帧以形成经解码的视频数 据。显示装置128向用户显示经解码的视频数据,且可包括多种显示装置中的任一者, 例如阴极射线管(CRT)、液晶显示器(LCD)、等离子体显示器、有机发光二极管(OLED) 显示器或另一类型的显示装置。

通信信道115可包括任何无线或有线通信媒体,例如射频(RF)频谱或者一个或一个 以上物理传输线,或无线媒体与有线媒体的任何组合。通信信道115可形成例如局域网、 广域网或例如因特网的全球网络的基于包的网络的部分。通信信道115通常表示用于将 视频数据从源装置112发射到目的地装置116的任何合适的通信媒体或不同通信媒体的 集合。

视频编码器122和视频解码器128可根据例如ITU-T H.264标准(或者称为MPEG-4 第10部分,高级视频译码(AVC),其将出于阐释的目的在本发明的部分中使用)等视频 压缩标准而操作。然而,本发明的许多技术可容易应用于多种其它视频译码标准中的任 一者,包含新出现的HEVC标准。一般来说,允许编码器和解码器处的滤波的任何标准 可从本发明的教示的各个方面受益。

尽管图1中未展示,但在一些方面中,视频编码器122及视频解码器128可各自与 音频编码器及解码器集成,且可包含适当的多路复用器-多路分用器(MUX-DEMUX)单元 或其它硬件及软件,以处理对共同数据流或单独数据流中的音频与视频两者的编码。如 果适用,则MUX-DEMUX单元可符合ITU H.223多路复用器协议或例如用户数据报协 议(UDP)等其它协议。

视频编码器122及视频解码器128各自可经实施为一个或一个以上微处理器、数字 信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)、离散逻辑、软件、 硬件、固件或其任何组合。视频编码器122和视频解码器128中的每一者可包含在一个 或一个以上编码器或解码器中,其任一者可作为组合式编码器/解码器(CODEC)的部分集 成在相应移动装置、订户装置、广播装置、服务器或类似装置中。

在一些情况下,装置112、116可以大体对称的方式操作。举例来说,装置112、116 中的每一者可包含视频编码和解码组件。因此,系统110可支持视频装置112、116之 间的单向或双向视频发射,例如用于视频流式传输、视频重放、视频广播或视频电话。

在编码过程期间,视频编码器122可执行若干译码技术或步骤。一般来说,视频编 码器122对个别视频帧内的视频块操作以便编码视频数据。在一个实例中,视频块可对 应于宏块或宏块的分区。宏块是由ITU H.264标准和其它标准界定的一种类型的视频块。 宏块通常指代16×16数据块,但所述术语有时也一般用于指代N×N大小的任何视频块。 ITU-T H.264标准支持例如针对亮度分量的16×16、8×8或4×4和针对色度分量的8×8 等各种块大小的帧内预测,以及例如针对亮度分量的16×16、16×8、8×16、8×8、8×4、 4×8和4×4和针对色度分量的对应成比例大小等各种块大小的帧间预测。在本发明中, “N×N”指代依据垂直和水平尺寸的块的像素尺寸,例如16×16像素。一般来说,16×16 块将具有在垂直方向上的16个像素和在水平方向上的16个像素。同样,N×N块一般具 有垂直方向上的N个像素和水平方向上的N个像素,其中N表示正整数值。一块中的 像素可布置成若干行和若干列。

新兴的HEVC标准界定视频块的新术语。特定来说,视频块(或其分区)可称为“经 译码单元”(或CU)。遵照HEVC标准,最大经译码单元(LCU)可根据四叉树分割方案划 分为较小CU,且所述方案中界定的不同CU可进一步分割为所谓的预测单元(PU)。LCU、 CU和PU在本发明的含义内全部为视频块。也可使用与HEVC标准或其它视频译码标 准一致的其它类型的视频块。因此,短语“视频块”指代任何大小的视频块。可针对给 定像素的亮度分量和色度分量的成比例大小而包含单独的CU,但也可使用其它色彩空 间。

视频块可具有固定或可变大小,且可根据指定译码标准而大小不同。每一视频帧可 包含多个切片。每一切片可包含多个视频块,其可布置成若干分区,也称为子块。根据 上文参考且下文中更详细描述的四叉树分割方案,N/2×N/2第一CU可包括N×N LCU 的子块,N/4×N/4第二CU也可包括第一CU的子块。N/8×N/8PU可包括第二CU的子 块。类似地,作为另一实例,小于16×16的块大小可称为16×16视频块的分区或16×16 视频块的子块。同样,针对N×N块,小于N×N的块大小可称为N×N块的分区或子块。 视频块可包括像素域中的像素数据的块,或(例如)在对表示经译码的视频块与预测视频 块之间的像素差异的残余视频块数据应用例如离散余弦变换(DCT)、整数变换、小波变 换或概念上类似的变换等变换之后的在变换域中的变换系数的块。在一些情况下,视频 块可包括变换域中的经量化的变换系数的块。

位流内的语法数据可界定帧或切片的LCU,其是依据所述帧或切片的像素的数目的 最大译码单元。一般来说,LCU或CU具有与根据H.264译码的宏块类似的用途,只是 LCU和CU不具有特定大小区别。事实上,LCU大小可以逐帧或逐切片为基础来界定, 且LCU可分裂为若干CU。一般来说,本发明中对CU的参考可指代LCU的图片或子 CU的最大经译码单元。LCU可分裂为若干子CU,且每一子CU可分裂为若干子CU。 位流的语法数据可界定LCU可分裂的最大次数,称为CU深度。因此,位流还可界定最 小译码单元(SCU)。本发明还使用术语“块”和“视频块”来指代LCU、CU、PU、SCU 或TU中的任一者。

如上文介绍,LCU可与四叉树数据结构相关联。一般来说,四叉树数据结构包含每 CU一个节点,其中根节点对应于LCU。如果CU分裂为四个子CU,那么对应于CU的 节点包含四个叶节点,其每一者对应于子CU中的一者。四叉树数据结构的每一节点可 提供对应CU的语法数据。举例来说,四叉树中的节点可包含分裂旗标,从而指示对应 于节点的CU是否分裂为子CU。CU的语法元素可以递归方式界定,且可取决于CU是 否分裂为子CU。

不分裂的CU可包含一个或一个以上预测单元(PU)。一般来说,PU表示对应CU的 全部或一部分,且包含用于检索PU的参考样本的数据。举例来说,当对PU进行帧内 模式编码时,PU可包含描述PU的帧内预测模式的数据。作为另一实例,当对PU进行 帧间模式编码时,PU可包含界定PU的运动向量的数据。界定运动向量的数据可描述(例 如)运动向量的水平分量、运动向量的垂直分量、运动向量的分辨率(例如,四分之一像 素精度或八分之一像素精度)、运动向量所指向的参考帧,和/或运动向量的参考列表(例 如,列表0或列表1)。界定PU的CU的数据还可描述(例如)CU分割为一个或一个以上 PU。分割模式可依据CU是未经译码、经帧内预测模式编码还是经帧间预测模式编码而 不同。

具有一个或一个以上PU的CU还可包含一个或一个以上变换单元(TU)。在使用PU 的预测之后,视频编码器可计算CU的对应于所述PU的部分的残余值。所述残余值可 经变换、量化和扫描。TU不一定限于PU的大小。因此,TU可比同一CU的对应PU 大或小。在一些实例中,TU的最大大小可为对应CU的大小。TU可包括包含与给定 CU相关联的残余变换系数的数据结构。

图2A和2B是说明实例四叉树250和对应的最大译码单元272的概念图。图2A描 绘实例四叉树250,其包含以层级方式布置的节点。四叉树(例如,四叉树250)中的每一 节点可为无子代的叶节点,或具有四个子节点。在图2A的实例中,四叉树250包含根 节点252。根节点252具有四个子节点,包含叶节点256A–256C(叶节点256)和节点254。 因为节点254不是叶节点,所以节点254包含四个子节点,其在此实例中为叶节点 258A–258D(叶节点258)。

四叉树250可包含描述对应的最大译码单元(LCU)(例如,在此实例中为LCU272) 的特性的数据。举例来说,四叉树250依据其结构可描述LCU分裂为子CU。假定LCU 272具有大小2N×2N。在此实例中,LCU272具有四个子CU276A–276C(子CU276)和 274,每一者大小为N×N。子CU274进一步分裂为四个子CU278A–278D(子CU278), 每一者大小为N/2×N/2。在此实例中,四叉树250的结构对应于LCU272的分裂。即, 根节点252对应于LCU272,叶节点256对应于子CU276,节点254对应于子CU274, 且叶节点258对应于子CU278。

四叉树250的节点的数据可描述对应于节点的CU是否分裂。如果CU分裂,那么 四个额外节点可呈现在四叉树250中。在一些实例中,可类似于以下伪码来实施四叉树 的节点:

split_flag值可为表示对应于当前节点的CU是否分裂的1位值。如果CU不分裂, 那么split_flag值可为'0',而如果CU分裂,那么split_flag值可为'1′。参看四叉树250 的实例,分裂旗标值的阵列可为101000000。

在一些实例中,子CU276和子CU278中的每一者可使用相同帧内预测模式进行帧 内预测编码。因此,视频编码器122可提供根节点252中的帧内预测模式的指示。此外, 某些大小的子CU可具有针对特定帧内预测模式的多个可能变换。根据本发明的技术, 视频编码器122可提供在根节点252中用于此类子CU的变换的指示。举例来说,大小 N/2×N/2的子CU可具有多个可能的可用变换。视频编码器122可用信号表示将在根节 点252中使用的变换。因此,视频解码器128可基于根节点252中用信号表示的帧内预 测模式和根节点252中用信号表示的变换来确定将应用于子CU278的变换。

如此,视频编码器122无需用信号表示将在叶节点256和叶节点258中应用于子 CU276和子CU278的变换,而是可改为根据本发明的技术仅用信号表示帧内预测模式, 且在一些实例中用信号表示将在根节点252中应用于某些大小的子CU的变换。以此方 式,这些技术可减少用信号表示LCU(例如,LCU272)的每一子CU的变换函数的开销 成本。

在一些实例中,针对子CU276和/或子CU278的帧内预测模式可不同于LCU272 的帧内预测模式。视频编码器122和视频解码器128可配置有将根节点252处用信号表 示的帧内预测模式映射到针对子CU276和/或子CU278的可用帧内预测模式的功能。 所述功能可提供LCU272可用的帧内预测模式到针对子CU276和/或子CU278的帧内 预测模式的多对一映射。

切片可划分为视频块(或LCU),且每一视频块可根据参看图2A-B描述的四叉树结 构来分割。另外,如图2C所示,“开”指示的四叉树子块可由本文描述的环路滤波器滤 波,而“关”指示的四叉树子块可不滤波。是否对给定块或子块进行滤波的决策可在编 码器处通过将经滤波结果和未经滤波结果与正译码的原始块进行比较来确定。图2D是 表示产生图2C所示的四叉树分割的分割决策的决策树。

特定来说,图2C可表示根据四叉树分割方案分割为可变大小的较小视频块的相对 大的视频块。每一视频块在图2C中经标记(开或关)以说明应针对所述视频块应用还是避 免滤波。视频编码器122可通过将每一视频块的经滤波和未经滤波版本与正译码的原始 视频块进行比较来界定此滤波器映射。

再次,图2D是对应于产生图2C所示的四叉树分割的分割决策的决策树。在图2D 中,每一圆圈可对应于一CU。如果圆圈包含“1”旗标,那么所述CU进一步分割为另 外四个CU,但如果圆圈包含“0”旗标,那么所述CU不进行进一步分割。每一圆圈(例 如,对应于CU)还包含相关联三角形。如果给定CU的三角形中的旗标设定为1,那么 针对所述CU接通滤波,但如果给定CU的三角形中的旗标设定为0,那么切断滤波。 以此方式,图2C和2D可个别或统一地视为可在编码器处产生且传送到解码器(经编码 视频数据的每切片至少一次以便传送针对给定视频块(例如,LCU)是否将滤波应用于每 一经分割视频块(例如,LCU内的每一CU)的四叉树分割的水平)的滤波器映射。

较小视频块可提供较好分辨率,且可用于包含高细节水平的视频帧的位置。较大视 频块可提供较高译码效率,且可用于包含低细节水平的视频帧的位置。切片可视为多个 视频块和/或子块。每一切片可为视频帧的可独立解码的视频块系列。或者,帧本身可为 可解码视频块系列,或帧的其它部分可界定为可解码的视频块系列。术语“视频块系列” 可指代视频帧的任何可独立解码部分,例如整个帧、帧的切片、图片群组(GOP)(也称为 序列)或根据适用的译码技术界定的另一可独立解码单元。本发明的方面可能参考帧或切 片来描述,但此类参考仅为示范性的。应理解,一般来说,可使用任何视频块系列代替 帧或切片。

可在每经译码单元基础上界定语法数据,使得每一经译码单元包含相关联的语法数 据。本文描述的滤波器信息可为针对经译码单元的此语法的部分,但可能更有可能为视 频块系列(例如,帧、切片、GOP或视频帧的序列)的语法的部分而非经译码单元。语法 数据可指示待与切片或帧的经译码单元一起使用的滤波器组。所述语法可另外描述用于 对切片或帧的经译码单元进行滤波的滤波器的其它特性(例如,滤波器类型)。举例来说, 滤波器类型可为线性的、双线性的、二维的、双三次的(bicubic),或可大体上界定任何 形状的滤波器支持。有时,滤波器类型可由编码器及解码器推定,在此情况下滤波器类 型不包含于位流中,但在其它情况下,滤波器类型可连同如本文中描述的滤波器系数信 息一起编码。语法数据还可向解码器用信号表示滤波器是如何编码的(例如,滤波器系数 是如何编码的),以及应针对其而使用不同滤波器的活动度量的范围。

在一些例子中,对于一组滤波器中的每一滤波器,语法数据可包含指示所述滤波器 是否具有任何非零系数的零旗标。如果零旗标设定为第一值,那么解码器可在未接收到 来自编码器的进一步信息的情况下重建全部为零的滤波器。如果零旗标设定为第二值, 那么解码器可接收用于重建滤波器的额外语法。零旗标可例如为单一位,其中0指示滤 波器仅含有零滤波器系数,且1指示滤波器含有至少一个非零滤波器系数。

在零旗标指示滤波器含有至少一个非零滤波器系数的情况下,额外语法可例如描述 用于对切片或帧的经译码单元进行滤波的滤波器的其它特性(例如,滤波器类型),以及 包含使解码器能够重建滤波器的系数的信息。举例来说,滤波器类型可为线性的、双线 性的、二维的、双三次的(bicubic),或可大体上界定任何形状的滤波器支持。有时,滤 波器类型可由编码器及解码器推定,在此情况下滤波器类型不包含于位流中,但在其它 情况下,滤波器类型可连同如本文中描述的滤波器系数信息一起编码。语法数据还可向 解码器用信号表示滤波器是如何编码的(例如,滤波器系数是如何编码的),以及应针对 其而使用不同滤波器的活动度量的范围。

视频编码器122可执行将正被译码的视频块与预测帧(或其它经译码单元)进行比较 以便识别预测块的预测译码。正被译码的当前视频块与预测块之间的差异被译码作为残 余块,且使用预测语法来识别预测块。可对残余块进行变换及量化。变换技术可包括 DCT过程或概念上类似的过程、整数变换、小波变换或其它类型的变换。在DCT过程 中,例如,变换过程将一组像素值转换为变换系数,其可表示像素值在频域中的能量。 通常对变换系数应用量化,且量化通常涉及限制与任何给定变换系数相关联的位的数目 的过程。

在变换及量化之后,可对经量化及经变换的残余视频块执行熵译码。语法元素(例如 在编码期间界定的滤波器信息及预测向量)也可包含于用于每一经译码单元的经熵译码 的位流中。一般来说,熵译码包括共同压缩一连串经量化的变换系数及/或其它语法信息 的一个或一个以上过程。对经量化的变换系数执行例如Z形扫描技术(zig-zag scanning  technique)等扫描技术(例如,作为熵译码过程的一部分),以便从二维视频块界定一个或 一个以上串行化一维系数向量。还可使用包含其它扫描次序或自适应扫描的其它扫描技 术,且其可能在经编码位流中用信号表示。在任何情况下,经扫描系数接着连同任何语 法信息一起例如经由内容自适应可变长度译码(CAVLC)、上下文自适应二进制算术译码 (CABAC)或另一熵译码过程进行熵译码。

作为编码过程的一部分,可解码经编码的视频块以便产生用于后续视频块的后续基 于预测的译码的视频数据。在此阶段,可使用滤波以便改进视频质量,且(例如)去除来 自经解码视频的成块效应假影。经滤波的数据可用于其它视频块的预测,在所述情况下, 滤波被称作“环路中”滤波。或者,其它视频块的预测可基于未经滤波的数据,在所述 情况下,滤波被称作“后滤波”。

以逐帧、逐切片或逐LCU为基础,编码器可选择一组或一组以上滤波器,且以逐 经译码单元为基础可从所述组选择一个或一个以上滤波器。在一些例子中,还可以逐像 素为基础或以子CU为基础(例如,以4×4块为基础)选择滤波器。滤波器组的选择和应 用来自所述组的哪个滤波器的选择两者均可以促进视频质量的方式进行。此类滤波器组 可从预界定的滤波器组选择,或可自适应地经界定以促进视频质量。作为一实例,视频 编码器122可针对给定帧或切片选择或界定若干滤波器组,使得不同滤波器用于所述帧 或切片的经译码单元的不同像素。特定来说,对于与经译码单元相关联的每一输入,可 界定若干组滤波器系数,且可使用与经译码单元的像素相关联的活动度量来确定来自滤 波器组的哪个滤波器将与此类像素一起使用。在一些情况下,视频编码器122可应用若 干组滤波器系数且选择产生依据经译码块与原始块之间的失真量的最佳质量视频和/或 最高压缩水平的一个或一个以上组。在任何情况下,一旦选定,就可编码由视频编码器 122对每一经译码单元应用的滤波系数组,并将其传送到目的地装置118的视频解码器 128,使得视频解码器128可应用曾在针对每一给定经译码单元的编码过程期间应用的 相同滤波。

如本发明中论述,零旗标可用于减少重建含有全部为零的系数的滤波器所需的位数 目。当活动度量用于确定哪个滤波器将与针对经译码单元的特定输入一起使用时,针对 所述特定经译码单元的滤波器的选择不一定需要传送到视频解码器128。事实上,视频 解码器128还可计算针对经译码单元的活动度量,且基于视频编码器122先前提供的滤 波器信息,使所述活动度量与特定滤波器匹配。

图3为说明与本发明一致的视频编码器350的框图。视频编码器350可对应于装置 120的视频编码器122或不同装置的视频编码器。如图3中所示,视频编码器350包含 预测单元332、加法器348及351,以及存储器334。视频编码器350还包含变换单元 338及量化单元340,以及逆量化单元342及逆变换单元344。视频编码器350还包含解 块滤波器347和自适应滤波器单元349。视频编码器350还包含熵编码单元346。视频 编码器350的滤波器单元349可执行滤波操作且还可包含用于识别待用于解码的最佳或 优选滤波器或滤波器组的滤波器选择单元(FSU)353。滤波器单元349还可产生识别选定 滤波器的滤波器信息,使得选定滤波器可作为滤波器信息有效传送到另一装置以在解码 操作期间使用。

在编码过程期间,视频编码器350接收待译码的视频块(例如,LCU),且预测单元 332对视频块执行预测性译码技术。使用上文论述的四叉树分割方案,预测单元332可 分割视频块且对不同大小的译码单元执行预测性译码技术,对于帧间译码,预测单元332 将待编码的视频块(包含视频块的子块)与一个或一个以上视频参考帧或切片中的各个块 进行比较以便界定预测块。对于帧内译码,预测单元332基于同一经译码单元内的相邻 数据而产生预测性块。预测单元332输出预测块,且加法器348从正被译码的视频块减 去所述预测块以便产生残余块。

对于帧间译码,预测单元332可包括运动估计及运动补偿单元,其识别指向预测块 的运动向量且基于所述运动向量而产生所述预测块。通常,将运动估计视为产生运动向 量的过程,其估计运动。举例来说,运动向量可指示预测帧内的预测块相对于当前帧内 正译码的当前块的位移。通常将运动补偿视为基于由运动估计确定的运动向量提取或产 生预测块的过程。对于帧内译码,预测单元332基于同一经译码单元内的相邻数据而产 生预测性块。一个或一个以上帧内预测模式可界定可界定帧内预测块的方式。

在预测单元332输出预测块且加法器48从正被译码的视频块减去所述预测块以便 产生残余块之后,变换单元38将变换应用于残余块。所述变换可包括离散余弦变换(DCT) 或例如由例如HEVC标准等译码标准界定的概念上类似的变换。也可使用小波变换、整 数变换、子带变换或其它类型的变换。在任何状况下,变换单元338均将变换应用于残 余块,从而产生残余变换系数的块。变换可将残余信息从像素域转换为频域。

量化单元340接着量化残余变换系数以进一步减小位速率。量化单元340(例如)可 限制用于对系数中的每一者进行译码的位的数目。在量化之后,熵编码单元346将经量 化系数块从二维表示形式扫描为一个或一个以上串行化一维向量。扫描次序可经预先编 程为以经界定次序发生(例如,Z形扫描、水平扫描、垂直扫描、组合,或另一预界定的 次序),或可能基于先前译码统计而自适应地界定。

在此扫描过程之后,熵编码单元346根据例如CAVLC或CABAC等熵译码方法来 编码经量化的变换系数(连同任何语法元素),以进一步压缩数据。包含于经熵译码的位 流中的语法元素可包含来自预测单元332的预测语法,例如用于帧间译码的运动向量或 用于帧内译码的预测模式。包含于经熵译码的位流中的语法元素还可包含来自滤波器单 元349的滤波器信息,其可以本文所描述的方式编码。

CAVLC是由ITU H.264/MPEG4,AVC标准支持的一种类型的熵译码技术,其可由熵 编码单元346以向量化基础而应用。CAVLC以有效地压缩变换系数及/或语法元素的串 行化“行程(run)”的方式使用可变长度译码(VLC)表。CABAC是由ITU H.264/MPEG4, AVC标准支持的另一类型的熵译码技术,其可由熵编码单元346以向量化基础而应用。 CABAC涉及若干阶段,包含二值化运算(binarization,)、上下文模型选择和二进制算术 译码。在此情况下,熵编码单元346根据CABAC对变换系数和语法元素进行译码。与 ITU H.264/MPEG4,AVC标准一样,新兴的HEVC标准也可支持CAVLC和CABAC熵 译码两者。此外,还存在许多其它类型的熵译码技术,且新的熵译码技术将可能在将来 出现。本发明不限于任何特定熵译码技术。

在由熵编码单元346熵译码之后,可将经编码的视频发射到另一装置或存档以供日 后发射或检索。此外,经编码的视频可包括经熵译码的向量及各种语法,其可由解码器 使用以恰当地配置解码过程。逆量化单元342及逆变换单元344分别应用逆量化及逆变 换,以在像素域中重建残余块。加法器351将经重建残余块加上由预测单元332产生的 预测块以产生经预解块的经重建视频块,有时称为经预解块的经重建图像。解块滤波器 347可将滤波应用于经预解块的经重建视频块以通过移除成块效应或其它假影而改进视 频质量。解块滤波器347的输出可称为后解块视频块、经重建视频块,或经重建图像。

滤波器单元349可经配置以接收多个输入。在图3的实例中,滤波器单元349接收 经后解块的经重建图像(RI)、经预解块的经重建图像(pRI)、预测图像(PI)和经重建残余 块(EI)作为输入。滤波器单元349可个别地或组合地使用这些输入中的任一者来产生经 重建图像以存储在存储器334中。另外,如下文将更详细论述,基于活动度量,可选择 一个或一个以上滤波器以应用于所述输入。在一个实例中,滤波器单元349的输出可为 应用于RI的一个额外滤波器。在另一实例中,滤波器单元349的输出可为应用于pRI 的一个额外滤波器。然而,在其它实例中,滤波器单元349的输出可基于多个输入。举 例来说,滤波器单元349可将第一滤波器应用于pRI,且接着使用pRI的经滤波版本结 合EI和PI的经滤波版本来产生经重建图像。在滤波器单元349的输出是正应用于单一 输入的一个额外滤波器的产物的例子中,滤波器单元349可实际上将滤波器应用于其它 输入,但那些滤波器可能具有全部为零的系数。类似地,如果滤波器单元349的输出是 将三个滤波器应用于三个输入的产物,那么滤波器单元349可实际上将滤波器应用于第 四输入,但所述滤波器可能具有全部为零的系数。如下文将更详细论述,滤波器单元349 将同一滤波器序列应用于针对待滤波的所有经译码单元的多个输入的技术可减小在装 置中实施滤波器单元349的复杂性。具有全部为零的系数的滤波器的应用可增加滤波器 单元349可处理多个输入的可能方式的数目,且因此可潜在地改进译码质量。

滤波器单元349进行的滤波可通过产生比未经滤波的预测性视频块更紧密地匹配正 译码的视频块的预测性视频块来改进压缩。在滤波之后,经重建的视频块可由预测单元 332用作参考块以帧间译码后续视频帧或其它经译码单元中的块。尽管将滤波器单元349 展示为“环路中”,但本发明的技术还可与后滤波器一起使用,在所述情况下,未经滤 波的数据(而非经滤波数据)将用于预测后续经译码单元中的数据的目的。

对于切片或帧,滤波器单元349可以促进视频质量的方式选择针对每一输入的滤波 器组。举例来说,滤波器单元349可从预界定组的系数中选择滤波器组,或可自适应地 界定滤波器以便促进视频质量或改进压缩。每一组的滤波器中的一者或一者以上可为具 有全部为零的系数的滤波器。滤波器单元349可选择或界定针对给定经译码单元的一组 或一组以上滤波器,使得相同组滤波器用于所述经译码单元的不同视频块的像素。对于 特定帧、切片或LCU,滤波器单元349可将若干组滤波器应用于多个输入,且FSU353 可选择产生最佳质量视频或最高压缩水平的组。或者,FSU353可通过分析多个输入与 原始图像之间的自相关和交叉相关来训练新滤波器。一组新的滤波器可例如通过基于自 相关和交叉相关对Wienter-Hopt方程式求解来确定。不管训练一组新的滤波器还是选择 一组现有滤波器,滤波器单元349均产生用于包含在位流中以使得解码器能够还识别待 用于特定帧或切片的滤波器组的语法。

根据本发明,对于帧或切片内的经译码单元的每一像素,滤波器单元349可基于使 与经译码单元内的一组或一组以上像素相关联的活动量化的活动度量而选择将使用来 自滤波器组的哪个滤波器。以此方式,FSU353可确定针对例如帧或切片等较高级经译 码单元的滤波器组,同时滤波器单元349基于与较低级经译码单元的像素相关联的活动 而选择将来自所述组的哪个(些)滤波器用于所述较低级经译码单元的特定像素。活动可 在经译码单元内的像素值方差方面得以指示。经译码单元中的像素值中的较大方差可指 示较高像素活动等级,而像素值中的较小方差可指示较低像素活动等级。不同滤波器(即, 不同滤波器系数)可依据像素方差水平(即,活动)产生较好滤波(例如,较高图像质量)。 像素方差可由活动度量量化,所述活动度量可包括改进的拉普拉斯求和值,如下文更详 细地论述。然而,还可使用其它类型的活动度量。

代替于针对每一输入的单一滤波器,可针对每一输入使用一组M个滤波器。依据设 计偏好,M可为例如小至2或大至16,或甚至更高。每输入较大数目的滤波器可改进视 频质量,但也可增加与从编码器向解码器用信号表示滤波器组相关联的开销。所述组M 个滤波器可针对每一帧或切片由如上文描述的FSU353确定且发射到解码器。分段图可 用于指示经译码单元如何分段以及是否将对经译码单元的特定子单元进行滤波。分段图 可例如针对经译码单元包含如上文描述的分裂旗标的阵列以及用信号表示是否将对每 一子译码单元进行滤波的额外位。对于与待滤波的经译码单元的像素相关联的每一输 入,可基于活动度量而选择来自滤波器组的特定滤波器。活动度量可使用针对像素(i,j) 的改进的拉普拉斯求和来计算,如下:

var(i,j)=Σk=-KKΣl=-LL|2R(i+k,j+l)-R(i+k-1,j+l)-R(i+k+1,j+l)|+.

|2R(i+k,j+l)-R(i+k,j+l-1)-R(i+k,j+l+1)|

作为一个实例,周围像素的7×7(K,L=3)群组可用于计算改进的拉普拉斯求和值。 还可将来自待用于特定范围的改进的拉普拉斯求和值的所述组M个滤波器中的特定滤 波器与所述组M个滤波器一起发送到解码器。可使用来自针对先前帧发射的系数的预测 或其它技术对滤波器系数进行译码。可能使用各种形状和大小的滤波器,包含例如具有 菱形支撑或正方形支撑的1×1、3×3、5×5、7×7和9×9滤波器。

针对到滤波器的输入的改进的拉普拉斯求和值的标引可以多种方式实施。举例来 说,在一些实施方案中,每一输入可能具有一组唯一的滤波器,而在一些实施方案中, 输入共享一组共同滤波器。另外,在一些实施方案中,针对每一输入的改进的拉普拉斯 求和值可能用于识别针对每一输入的特定滤波器。然而,在其它实施方案中,针对单一 输入的改进的拉普拉斯求和值可能用于识别针对所有输入的滤波器。在另外其它实施方 案中,针对第一输入的改进的拉普拉斯求和值可能用于识别针对第二不同输入的滤波 器。

根据本发明,滤波器单元349执行关于滤波器信息的译码技术,其可减少编码滤波 器信息及将滤波器信息从编码器350传达到另一装置所需的数据的量。再次,针对每一 帧或切片,滤波器单元349可界定或选择将应用于针对所述帧或切片的经译码单元的像 素的一组或一组以上滤波器系数。滤波器单元349应用所述滤波器系数以便对存储在存 储器334中的经重建视频帧的视频块进行滤波,其可用于与环路中滤波一致的预测性译 码。滤波器单元349可将滤波器系数编码为滤波器信息,其转发到熵编码单元346以供 包含在经编码位流中。

滤波器信息可包含针对每一滤波器的零旗标以减少将滤波器系数从视频编码器350 传递到解码器所需的经译码位的数目。零旗标可为帧、切片、最大经译码单元、经译码 单元或视频块的其它系列的标头中的1位语法元素。如果针对特定滤波器的所有系数均 为零,那么视频编码器350可将设定为第一值的零旗标发射到解码器。在接收到设定为 第一值的零旗标后,解码器可即刻在未实际上从编码器接收到识别所有零系数的数据的 情况下重建滤波器。如果针对特定滤波器的系数包含至少一个非零系数,那么视频编码 器350可将设定为第二值的零旗标发射到解码器。在接收到设定为第二值的零旗标后, 解码器可即刻基于随后从编码器接收的系数重建滤波器。因此,为了重建一组滤波器中 的滤波器的所有系数,视频编码器350可仅需针对至少一个滤波器系数为非零的那些情 况将滤波器系数发射到解码器。

另外,针对确实含有非零系数的滤波器,本发明的技术还可利用由FSU353界定或 选择的滤波器系数中的一些滤波器系数可能非常类似于相对于另一帧或切片的经译码 单元的像素应用的其它滤波器系数的事实。可针对不同帧或切片(例如,相同滤波器支持) 应用相同类型的滤波器,但所述滤波器可依据与滤波器支持的不同索引相关联的滤波器 系数值而不同。因而,为了减少传达此些滤波器系数所需的数据的量,滤波器单元349 可基于另一经译码单元的滤波器系数,利用所述滤波器系数之间的任何相似性来预测性 地编码待用于滤波的一个或一个以上滤波器系数。然而,在一些情况下,直接编码所述 滤波器系数(例如,不使用任何预测)可能更理想。各种技术(例如,利用活动度量的使用 来界定何时使用预测性译码技术编码滤波器系数以及何时在无任何预测性译码的情况 下直接编码滤波器系数的技术)可用于将滤波器系数有效传送到解码器。另外,还可强加 对称性以使得解码器已知的系数的子集(例如,5,-2,10)可用于界定完整的系数组(例如, 5,-2,10,10,-2,5)。可在直接及预测性译码情形两者中强加对称性。

图4为说明视频解码器460的实例的框图,视频解码器460对以本文中所描述的方 式进行编码的视频序列进行解码。所接收的视频序列可包括一组经编码图像帧、一组帧 切片、共同译码的图片群组(GOP),或包含经编码视频块和用以界定如何解码此类视频 块的语法的多种类型的视频块系列。

视频解码器460包含熵解码单元452,熵解码单元452执行由图3的熵编码单元346 执行的编码的互逆解码功能。明确地说,熵解码单元452可执行CAVLC或CABAC解 码,或由视频编码器350使用的任何其它类型的熵解码。呈一维串行化格式的经熵解码 的视频块可经逆扫描以将系数的一个或一个以上一维向量转换回到二维块格式中。向量 的数目及大小,以及为视频块界定的扫描次序可界定如何重建二维块。经熵解码的预测 语法可从熵解码单元452发送到预测单元454,且经熵解码的滤波器信息可从熵解码单 元452发送到滤波器单元459。

视频解码器460还包含预测单元454、逆量化单元456、逆变换单元458、存储器及 求和器464。另外,视频解码器460还包含对加法器464的输出进行滤波的解块滤波器 457。依据本发明,滤波器单元459可接收包含待应用于一个或一个以上输入的一个或 一个以上滤波器的经熵解码滤波器信息。尽管图4未图示,但解块滤波器457也可接收 包含待应用的一个或一个以上滤波器的经熵解码的滤波器信息。

由滤波器单元459应用的滤波器可由滤波器系数组界定。滤波器单元459可经配置 以基于从熵解码单元452接收的滤波器信息而产生所述滤波器系数组。对于一组滤波器 中的每一滤波器,滤波器信息可包含零旗标,其可为视频块系列的标头(例如,LCU标 头、帧标头、切片标头、GOP标头、序列标头等)中的1位语法元素。在其它实例中, 界定滤波器信息的语法元素还可包含在脚注或其它数据结构中。如果滤波器单元459接 收到设定为第一值从而指示滤波器不含有非零系数的零旗标,那么滤波器单元459可在 未实际上从编码器接收到识别所有零系数的数据的情况下重建滤波器。如果滤波器单元 459接收到设定为第二值从而指示特定滤波器的系数包含至少一个非零系数的零旗标, 那么滤波器单元459可基于后续滤波器信息重建滤波器。因此,为了重建滤波器,编码 器可仅需针对至少一个滤波器系数为非零的那些情况将滤波器系数发射到视频解码器 460。

滤波器信息可包含向解码器用信号表示用于任何给定系数组的编码的方式的额外 信令语法。在一些实施方案中,滤波器信息可例如还包含任何给定系数组应针对其使用 的活动度量范围。在滤波器的解码之后,滤波器单元459可基于一个或一个以上滤波器 系数组及包含应针对其使用不同滤波器系数组的活动度量范围的信令语法而对经解码 的视频块的像素值进行滤波。所述活动度量范围可由一组活动值界定,所述组活动值界 定用以界定所使用的编码的类型(例如,预测性或直接)的活动度量的范围。

滤波器单元459可在位流中接收针对每一帧或切片的一组滤波器。对于帧或切片内 的每一经译码单元,滤波器单元459可计算与针对多个输入(即,PI、EI、pRI和RI)的 经译码单元的经解码像素相关联的一个或一个以上活动度量,以便确定所述组中的哪个 (些)滤波器将应用于每一输入。对于第一范围的活动度量,滤波器单元459可应用第一 滤波器,针对第二范围的活动度量,滤波器单元459可应用第二滤波器,等等。在一些 实施方案中,四个范围可映射到四个不同滤波器,但可使用任何数目的范围和滤波器。 所述滤波器通常可采用任何类型的滤波器支持形状或布置。滤波器支持指代相对于正被 滤波的给定像素的滤波器的形状,且滤波器系数可根据滤波器支持而界定应用于相邻像 素值的加权。有时,滤波器类型可由编码器及解码器推定,在此情况下滤波器类型不包 含于位流中,但在其它情况下,滤波器类型可连同如本文中描述的滤波器系数信息一起 编码。语法数据还可向解码器用信号表示滤波器是如何编码的(例如,滤波器系数是如何 编码的),以及应针对其而使用不同滤波器的活动度量的范围。

预测单元454从熵解码单元452接收预测语法(例如,运动向量)。使用所述预测语 法,预测单元454产生曾用以译码视频块的预测块。逆量化单元456执行逆量化,且逆 变换单元458执行逆变换以将残余视频块的系数改变回到像素域。加法器464将每一预 测块与由逆变换单元458输出的对应残余块组合以便重建视频块。

滤波器单元459产生待应用于经译码单元的每一输入的滤波器系数,且接着应用此 类滤波器系数以便对所述经译码单元的经重建视频块进行滤波。所述滤波例如可包括使 边缘平滑且/或消除与视频块相关联的假影的额外解块滤波、用以减少量化噪声的去噪滤 波,或可改进译码质量的任何其它类型的滤波。将经滤波的视频块累积在存储器462中, 以便重建视频信息的经解码帧(或其它可解码单元)。经解码单元可从视频解码器460输 出以向用户呈现,但也可经存储以用于后续预测性解码中。

在视频译码的领域中,在编码器及解码器处应用滤波以便增强经解码的视频信号的 质量是常见的。滤波可经由后滤波器而应用,在所述情况下,经滤波的帧不用于将来帧 的预测。或者,可“环路中”应用滤波,在所述情况下,经滤波的帧可用以预测将来帧。 可通过最小化原始信号与经解码的经滤波信号之间的误差来设计所要的滤波器。通常, 此滤波已基于将一个或一个以上滤波器应用于经重建图像。举例来说,解块滤波器可能 在图像被存储在存储器中之前应用于经重建图像,或解块滤波器和一个额外滤波器可能 在图像被存储在存储器中之前应用于经重建图像。本发明的技术包含将滤波器应用于除 仅仅经重建图像以外的输入。另外,如下文将更详细论述,可基于拉普拉斯滤波器标引 来选择针对那些多个输入的滤波器。

以与变换系数的量化类似的方式,滤波器的系数h(k,l)(其中k=-K,...,K且l= -L,...,L)也可量化。K及L可表示整数值。滤波器的系数h(k,l)可量化为:

f(k,l)=round(normFact·h(k,l))

其中normFact是正规化因子且round是经执行以实现到所要位深度的量化的舍入操 作。滤波器系数的量化可由图3的滤波器单元349在编码期间执行,且解量化或逆量化 可由图4的滤波器单元459对经解码滤波器系数执行。滤波器h(k,l)希望一般地表示任 何滤波器。举例来说,滤波器h(k,l)可应用于多个输入中的任一者。在一些例子中,与 视频块相关联的多个输入将利用不同滤波器,在此情况下类似于h(k,l)的多个滤波器可 如上文描述经量化和解量化。

经量化的滤波器系数经编码且作为经编码位流的一部分从与编码器350相关联的源 装置发送到与解码器460相关联的目的地装置。在以上实例中,normFact的值通常等于 2n,但可使用其它值。normFact的较大值产生较精确量化,使得经量化滤波器系数f(k, l)提供较好性能。然而,normFact的较大值可产生需要更多位发射到解码器的系数f(k,l)。

在解码器460处,可将经解码滤波器系数f(k,l)应用于适当输入。举例来说,如果 经解码滤波器系数将应用于RI,那么滤波器系数可应用于经后解块的经重建图像RI(i,j), 其中i=0,…,M且j=0,..,N,如下:

R~I(i,j)=Σk=-KKΣl=-LLf(k,l)RI(i+k,j+l)/Σk=-KKΣl=-LLf(k,l)

变量M、N、K和L可表示整数。K及L可界定横跨从-K到K及从-L到L的两个 维度的像素块。应用于其它输入的滤波器可以相似方式应用。

本发明的技术可改进后滤波器或环路中滤波器的性能,且还可减少发射滤波器系数 f(k,l)所需的位数目。在一些情况下,针对每一视频块系列(例如,针对每一帧、切片、 帧的一部分、帧群组(GOP)等)将若干不同后滤波器或环路中滤波器发射到解码器。对于 每一滤波器,额外信息包含于位流中以识别应针对其应用给定滤波器的经译码单元、宏 块及/或像素。

所述帧可由帧数目及/或帧类型(例如,I帧、P帧或B帧)识别。I帧指代经帧内预测 的帧内帧。P帧指代具有基于一个数据列表(例如,一个先前帧)而预测的视频块的预测 性帧。B帧指代基于两个数据列表(例如,前一帧及后一帧)而预测的双向预测性帧。可 通过列出宏块类型及/或用以重建宏块的量化参数(QP)值的范围来识别宏块。

滤波器信息还可指示只有图像的局部特性的给定量度的值(称为活动度量)在指定范 围内的像素应当用特定滤波器来滤波。举例来说,对于像素(i,j),活动度量可包括如下 计算的改进的拉普拉斯求和值:

var(i,j)=Σk=-KKΣl=-LL|2R(i+k,j+l)-R(i+k-1,j+l)-R(i+k+1,j+l|+

|2R(i+k,j+l)-R(i+k,j+l-1)-R(i+k,j+l+1)|

其中针对横跨从-K到K及从-L到L的二维窗口,k表示从-K到K的像素值的求和 的值,且l表示从-L到L的求和的值,其中i和j表示像素数据的像素坐标,RI(i,j)表示 坐标i和j处的给定像素值,且var(i,j)是活动度量。可类似地针对pRI(i,j)、PI(i,j)和EI(i,j) 找到活动度量。

可使用来自针对先前经译码单元发射的系数的预测对针对任何输入的滤波器系数 f(k,l)进行译码。对于经译码单元m(例如,每一帧、切片或GOP)的每一输入,编码器可 编码和发射一组M个滤波器:

其中i=0,…,M-1。

对于每一滤波器,可编码位流以识别应针对其使用滤波器的活动度量值var的值的 范围。

举例来说,编码器350的滤波器单元349可指示滤波器:

应当用于活动度量值var针对其在区间[0,var0)内(即,var≥0且var<var0)的像素。此 外,编码器350的滤波器单元349可指示滤波器:

其中i=1,..,M-2,

应当用于活动度量值var针对其在区间[vari-1,vari)内的像素。另外,编码器350的 滤波器单元349可指示滤波器:

应当用于活动度量var满足var>varM-2的像素。如上文描述,滤波器单元349可针 对所有输入使用一组滤波器,或者可针对每一输入使用一组唯一滤波器。

可使用用于前一经译码单元中的经重建的滤波器系数来预测滤波器系数。先前滤波 器系数可表示为:

其中i=0,…,N-1,

在此情况下,经译码单元的数目n可用于识别用于当前滤波器的预测的一个或一个 以上滤波器,且数目n可作为经编码位流的一部分发送到解码器。另外,信息可经编码 且发射到解码器以识别针对其使用预测性译码的活动度量var的值。

举例来说,假定针对当前经译码帧m,系数:

针对活动度量值[varr-1,varr)而发射。根据帧n的滤波器系数预测帧m的滤波器系数。 假定滤波器

针对活动度量针对其在区间[vars-1,vars)内(其中vars-1==varr-1且vars>varr)的像素 而在帧n中使用。在此情况下,区间[varr-1,varr)包含在区间[vars-1,vars)内。另外,可向 解码器发射指示滤波器系数的预测应当用于活动值[vart-1,vart),而不用于活动值[vart, vart+1)的信息,其中vart-1==varr-1且vart+1==varr

区间[varr-1-1,varr)、[vars-1,vars)、[vart-1,vart)与[vart,vart+1)之间的关系描绘于图5中。 在此情况下,用于对具有区间[vart-1,vart)内的活动度量的像素进行滤波的滤波器系数的 最终值:

等于以下系数的和:

因此:

ftm(k,l)=fsn(k,l)+grm(k,l),k=-K,...,K,l=-L,...,L.

另外,用于具有活动度量[vart,vart+1)的像素的滤波器系数:

等于滤波器系数:

因此:

ft+1m(k,l)=grm(k,l),k=-K,...,K,l=-L,...,L.

滤波器系数g(k,l)的振幅取决于k和l的值。通常,具有最大振幅的系数为系数 g(0,0)。预期具有大振幅的其它系数为k或l的值等于0的系数。可利用此现象来进一步 减少发射所述系数所需的位的量。索引值k和l可界定已知滤波器支持内的位置。

用于每一帧m的系数:

gim(k,l),i=0,...,M-1

可使用例如根据参数p界定的Golomb或exp-Golomb码等参数化可变长度码来译 码。通过改变界定参数化可变长度码的参数p的值,这些码可用于有效表示源分布的较 宽范围。系数g(k,l)的分布(即,其具有大或小的值的似然性)取决于k和l的值。因此, 为增加译码效率,对于每一帧m,针对每一对(k,l)发射参数p的值。当编码以下系数时, 参数p可用于经参数化的可变长度译码:

其中k=-K,...,K,l=-L,...,L。

图6展示经配置以实施本发明的技术的滤波器单元600的实例,滤波器单元600的 功能性可例如并入到图3的滤波器单元349或图4的滤波器单元459中。滤波器单元600 包含多个滤波器模块610A-C(统称为“滤波器模块610”)。每一滤波器模块可经配置以 接收一个或一个以上输入。在此特定实例中,滤波器模块610A接收输入pRI且应用滤 波器以产生pRI的经滤波版本,在图6上展示为pRI'。滤波器模块610B接收PI和EI 作为输入pRI'。使用这三个输入,滤波器模块2610B可通过如下应用以下三个滤波器而 产生输出,在图6处展示为R':

R=Σi=1Mwi·pRIi+Σi=1NwM+i·PIi+Σi=1OwM+N+i·EIi

滤波器模块610C可通过如下应用两个滤波器而产生输出(R''):

R=Σi=1Mwi·Ri+Σi=1NwM+i·RIi

通过应用全部为零的滤波器,可实现不同输出。举例来说,如果滤波器模块610A 将全部为零的滤波器应用于pRI,且滤波器模块610B将全部为零的滤波器应用于PI和 EI,那么滤波器模块610B的输出将类似地为零,意味着滤波器模块610C的输出将简单 地为RI的经滤波版本。在另一实施方案中,应用于各个输入的所有滤波器可基于活动 度量例如经由拉普拉斯滤波器标引而从一组滤波器中选择。如先前提及,到滤波器的输 入的改进的拉普拉斯求和值的标引可以多种方式实施。举例来说,在一些实施方案中, 每一输入可能具有一组唯一滤波器,而在一些实施方案中,输入共享一组共同滤波器。 另外,在一些实施方案中,每一输入的改进的拉普拉斯求和值可能用于识别针对每一输 入的特定滤波器。然而,在其它实施方案中,单一输入的改进的拉普拉斯求和值可能用 于识别针对所有输入的滤波器。在另外其它实施方案中,第一输入的改进的拉普拉斯求 和值可能用于识别针对第二不同输入的滤波器。

图7为说明与本发明一致的编码技术的流程图。如图3所示,视频编码器350编码 视频块系列的像素数据。所述视频块系列可包括帧、切片、图片群组(GOP)或另一可独 立解码的单元。像素数据可布置在经译码单元中,且视频编码器350可通过根据例如 HEVC标准等视频编码标准编码经译码单元来编码像素数据。对于帧或切片,FSU353 可识别待用于所述帧或切片的一组滤波器(710)。FSU353可识别针对所有输入的一组滤 波器或可识别针对每一输入的一组滤波器。

作为视频编码过程的一部分,预测单元332执行基于预测的译码且确定针对特定经 译码单元的基于四叉树的分割方案(720)。此外,作为视频编码过程的一部分,视频编码 器350的滤波器单元349基于拉普拉斯滤波器标引而从滤波器组选择一个或一个以上滤 波器以用于帧、切片或LCU的特定经译码单元的子译码单元(730)。所述一个或一个以 上滤波器可应用于一个或一个以上输入,如上文描述。此滤波可用于通过通常使经解码 图像较类似于原始图像来改进视频译码。将滤波器单元349展示为在环路中,这意味着 经滤波的数据是用于后面视频块的预测性编码。然而,滤波器单元349可替代地应用后 滤波,在所述情况下,未经滤波的数据将用于后面视频块的预测性编码。

视频编码器350针对经译码单元输出经编码位流(740),其包含经编码像素数据和经 编码滤波器数据。经编码滤波器数据可包含用于识别待使用的滤波器组的信令信息,且 还可包含识别滤波器如何经编码以及应针对其应用不同滤波器的活动度量的范围的信 令信息。经编码像素数据可包含针对特定经译码单元的分段图,以及其它类型的数据。

图8为说明与本发明一致的解码技术的流程图。如图8所示,视频解码器460接收 包含经编码视频数据和经编码滤波器数据的经编码位流(810)。视频解码器460解码滤波 器数据以重建一组或一组以上滤波器和用于确定何时应用来自滤波器组的特定滤波器 的活动度量的范围(820)。如上文论述,滤波器数据可包含待与所有输入一起使用的一组 滤波器,或可包含针对每一输入的一组滤波器。如上文参看图4描述,重建过程可产生 针对滤波器单元459的多个输入(即,RI、pRI、PI和EI)。视频解码器460解码视频数 据以产生像素数据块(830)。像素数据可包含分段图,以及其它类型的数据。特定来说, 视频解码器460可通过执行符合例如新兴的HEVC标准等视频标准或类似的基于块的视 频译码标准的基于块的视频重建来产生像素数据。

基于针对经译码单元的分段图,视频解码器460可确定经译码单元的子译码单元是 否应由滤波器单元459滤波。如果将对子单元进行滤波,那么滤波器单元459可确定针 对子译码单元的一个或一个以上改进的拉普拉斯求和值,且基于拉普拉斯滤波器标引, 识别待与子译码单元的一个或一个以上输入一起使用的一个或一个以上滤波器(840)。

图9为说明与本发明一致的编码技术的流程图。如图3所示,视频编码器350编码 视频块系列的像素数据。所述视频块系列可包括帧、切片、图片群组(GOP)、整个视频 数据序列,或另一组可解码的视频数据。像素数据可布置在经译码单元中,且视频编码 器350可通过根据例如HEVC标准等视频编码标准编码经译码单元来编码像素数据。对 于帧或切片,FSU353可识别待用于所述帧或切片的一组滤波器(910)。FSU353可识别 针对所有输入的一组滤波器或可识别针对每一输入的一组滤波器。在一些例子中,滤波 器中的一者或一者以上可包含全部为零的系数。

作为视频编码过程的一部分,预测单元332执行基于预测的译码且确定针对特定经 译码单元的基于四叉树的分割方案(920)。此外,作为视频编码过程的一部分,视频编码 器350的滤波器单元349基于拉普拉斯滤波器标引而从滤波器组选择一个或一个以上滤 波器以用于帧、切片或LCU的特定经译码单元的子译码单元(930)。所述一个或一个以 上滤波器可应用于一个或一个以上输入,如上文描述。此滤波可用于通过通常使经解码 图像较类似于原始图像来改进视频译码。将滤波器单元349展示为在环路中,这意味着 经滤波的数据是用于后面视频块的预测性编码。然而,滤波器单元349可替代地应用后 滤波,在所述情况下,未经滤波的数据将用于后面视频块的预测性编码。

视频编码器350针对经译码单元输出经编码位流,其包含经编码像素数据和具有一 个或一个以上零旗标的经编码滤波器数据(940)。经编码滤波器数据可包含用于识别待使 用的滤波器组的信令信息(包含针对每一滤波器的零旗标),且还可包含识别滤波器如何 经编码以及应针对其应用不同滤波器的活动度量的范围的信令信息。经编码像素数据可 包含针对特定经译码单元的分段图,以及其它类型的数据。

图10为说明与本发明一致的解码技术的流程图。如图8所示,视频解码器460接 收包含经编码视频数据和具有一个或一个以上零旗标的经编码滤波器数据的经编码位 流(1010)。视频解码器460解码滤波器数据以重建一组或一组以上滤波器以及用于确定 何时应用来自滤波器组的特定滤波器的活动度量的范围(1020)。如上文描述,滤波器数 据可包含待与所有输入一起使用的一组滤波器,或可包含针对每一输入的一组滤波器。 如上文参看图4描述,重建过程可产生针对滤波器单元459的多个输入(即,RI、pRI、 PI和EI)。视频解码器460解码视频数据以产生像素数据块(1030)。像素数据可包含分段 图,以及其它类型的数据。特定来说,视频解码器460可通过执行符合例如新兴的HEVC 标准等视频标准或类似的基于块的视频译码标准的基于块的视频重建来产生像素数据。

基于针对经译码单元的分段图,视频解码器460可确定经译码单元的子译码单元是 否应由滤波器单元459滤波。如果将对子单元进行滤波,那么滤波器单元459可确定针 对子译码单元的一个或一个以上改进的拉普拉斯求和值,且基于拉普拉斯滤波器标引, 识别待与子译码单元的一个或一个以上输入一起使用的一个或一个以上滤波器(1040)。

前述揭示内容在某种程度上已简化以便表达细节。举例来说,本发明大体描述正以 每帧或每切片为基础发射的滤波器组,但滤波器组也可以每序列为基础、以每图片群组 为基础、以每切片群组为基础、以每CU为基础、以每LCU为基础或以其它此类为基础 发射。一般来说,滤波器可针对一个或一个以上经译码单元的任何分组而发射。另外, 在实施方案中,每经译码单元每输入可存在许多滤波器,每滤波器可存在许多系数,且 针对不同方差范围界定的滤波器中的每一者可存在许多不同方差水平。举例来说,在一 些情况下,可存在针对经译码单元的每一输入界定的十六个或更多滤波器以及对应于每 一滤波器的十六个不同方差范围。

针对每一输入的滤波器中的每一者可包含许多系数。在一个实例中,滤波器包括具 有针对在两个维度上延伸的滤波器支持而界定的81个不同系数的二维滤波器。然而, 在一些情况下,针对每一滤波器而发射的滤波器系数的数目可少于81个。举例来说, 可强加系数对称性以使得一个维度或象限中的滤波器系数可对应于相对于其它维度或 象限中的系数的反转值或对称值。系数对称性可允许81个不同系数由较少系数表示, 在所述情况下,编码器及解码器可假定系数的反转值或镜像值界定其它系数。举例来说, 可编码系数(5,-2,10,10,-2,5),且将其作为系数子集(5,-2,10)而发射。在此情况下,解 码器可知晓这三个系数界定较大的对称系数集合(5,-2,10,10,-2,5)。

本发明的技术可实施于各种各样的装置或设备中,包含无线手持机及集成电路(IC) 或一组IC(即,芯片组)。提供已描述的任何组件、模块或单元是为了强调功能方面,且 未必要求通过不同硬件单元来实现。

因此,本文中所描述的技术可以硬件、软件、固件或其任何组合来实施。如果以硬 件实施,那么描述为模块、单元或组件的任何特征可一起实施于集成逻辑装置中或单独 作为离散但可互操作的逻辑装置而实施。如果以软件实施,那么所述技术可至少部分地 由包括指令的计算机可读媒体实现,当在处理器中执行时,所述指令执行上述方法中的 一者或一者以上。计算机可读媒体可包括计算机可读存储媒体,且可形成计算机程序产 品(其可包含封装材料)的一部分。计算机可读存储媒体可包括例如同步动态随机存取存 储器(SDRAM)等随机存取存储器(RAM)、只读存储器(ROM)、非易失性随机存取存储器 (NVRAM)、电可擦除可编程只读存储器(EEPROM)、快闪存储器、磁性或光学数据存储 媒体等。另外或替代地,所述技术可至少部分由载运或传送呈指令或数据结构的形式的 代码且可由计算机存取、读取和/或执行的计算机可读通信媒体来实现。

所述代码可由一个或一个以上处理器执行,例如,一个或一个以上数字信号处理器 (DSP)、通用微处理器、专用集成电路(ASIC)、现场可编程逻辑阵列(FPGA)或其它等效 集成或离散的逻辑电路。因此,如本文中所使用的术语“处理器”可指上述结构或适合 于实施本文中所描述的技术的任一其它结构中的任一者。另外,在一些方面中,本文中 所描述的功能性可提供于经配置以用于编码及解码的专用软件模块或硬件模块内,或并 入于组合式视频编解码器中。并且,可将所述技术完全实施于一个或一个以上电路或逻 辑元件中。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号