首页> 中国专利> 视频译码中的跨分量预测和自适应色彩变换的协调

视频译码中的跨分量预测和自适应色彩变换的协调

摘要

一种视频译码器基于初始亮度样本的位深度与初始色度样本的位深度之间的差异,将一组初始样本变换为一组经修改样本。所述组初始样本可包含所述初始亮度样本和所述初始色度样本。所述初始色度样本可包含初始Cb样本和初始Cr样本。所述组经修改样本可包含经修改亮度样本和经修改色度样本。所述经修改色度样本可包含经修改Cb样本和经修改Cr样本。此外,所述视频译码器将所述经修改样本添加到预测性块的对应样本,以产生经重构样本。

著录项

  • 公开/公告号CN106717004A

    专利类型发明专利

  • 公开/公告日2017-05-24

    原文格式PDF

  • 申请/专利权人 高通股份有限公司;

    申请/专利号CN201580053003.4

  • 申请日2015-10-01

  • 分类号H04N19/50(20140101);H04N19/176(20140101);H04N19/61(20140101);H04N19/60(20140101);H04N19/186(20140101);H04N19/85(20140101);

  • 代理机构11287 北京律盟知识产权代理有限责任公司;

  • 代理人宋献涛

  • 地址 美国加利福尼亚州

  • 入库时间 2023-06-19 02:14:58

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2019-05-10

    授权

    授权

  • 2017-06-16

    实质审查的生效 IPC(主分类):H04N19/50 申请日:20151001

    实质审查的生效

  • 2017-05-24

    公开

    公开

说明书

本专利申请案主张2014年10月10日申请的第62/062,728号美国临时专利申请案的权益,所述临时专利申请案的全部内容以引用的方式并入本文中。

技术领域

本发明涉及视频编码和视频解码。

背景技术

数字视频能力可并入到多种多样的装置中,包含数字电视、数字直播系统、无线广播系统、个人数字助理(PDA)、膝上型或桌上型计算机、平板计算机、电子书阅读器、数码相机、数字记录装置、数字媒体播放器、视频游戏装置、视频游戏控制台、蜂窝式或卫星无线电电话(所谓的“智能电话”)、视频电话会议装置、视频串流装置及其类似者。数字视频装置实施视频译码技术,例如由MPEG-2、MPEG-4、ITU-T H.263、ITU-T H.264/MPEG-4,第10部分,高级视频译码(AVC)、高效视频译码(HEVC)标准和此类标准的扩展,例如可缩放视频译码(SVC)、多视图视频译码(MVC)、可缩放HEVC(SHVC)、多视图HEVC(MV-HEVC)、3D-HEVC、HEVC范围扩展以及HEVC屏幕内容译码(SCC)扩展定义的标准中描述的那些技术。视频装置可通过实施此些视频译码技术而更高效地发射、接收、编码、解码和/或存储数字视频信息。

视频译码技术包含空间(图片内)预测和/或时间(图片间)预测以减少或去除视频序列中固有的冗余。对于基于块的视频译码来说,视频切片(例如,视频帧或视频帧的一部分)可分割成视频块,视频块还可被称作树块、译码树单元(CTU)、译码单元(CU)和/或译码节点。视频块可包含亮度块和色度块。使用相对于同一图片中的相邻块中的参考样本的空间预测对图片的经帧内译码(I)切片中进行编码。图片的经帧间译码(P或B)切片中的视频块可使用相对于同一图片中的相邻块中的参考样本的空间预测或相对于其它参考图片中的参考样本的时间预测。图片可被称为帧,且参考图片可被称为参考帧。

空间或时间预测产生待译码块的预测性块。残差数据表示待译码原始块与预测性块之间的像素差。经帧间译码块是根据指向形成预测性块的参考样本块的运动向量和指示经译码块与预测性块之间的差的残差数据编码的。根据帧内译码模式和残差数据来编码经帧内译码块。为了进一步压缩,可将残差数据从像素域变换到变换域,从而产生残差变换系数,可接着量化所述残差变换系数。经量化变换系数可经熵译码以实现更多的压缩。

发明内容

视频译码器,例如视频编码器或视频解码器,可执行组合色彩分量预测变换和色彩变换的变换。所述组合的变换使用初始亮度样本的位深度与初始色度样本的位深度之间的差异。因此,在一些实例中,所述视频译码器基于初始亮度样本的位深度与初始色度样本的位深度之间的差异,来将一组初始样本变换为一组经修改样本,所述组初始样本包含初始亮度样本和初始色度样本。

在一个实例中,本发明描述一种解码视频数据的方法,所述方法包括:基于初始亮度样本的位深度与初始色度样本的位深度之间的差异,将一组初始样本变换为一组经修改样本,所述组初始样本包含所述初始亮度样本和所述初始色度样本,所述组经修改样本包含经修改亮度样本和经修改色度样本;以及将所述经修改样本添加到预测性块的对应样本,以产生所述视频数据的经重构样本。

在另一实例中,本发明描述一种用于译码视频数据的装置,所述装置包括:数据存储媒体,其经配置以存储所述视频数据;以及一或多个处理器,其经配置以:基于初始亮度样本的位深度与初始色度样本的位深度之间的差异,将一组初始样本变换为一组经修改样本,所述组初始样本包含所述初始亮度样本和所述初始色度样本,所述组经修改样本包含经修改亮度样本和经修改色度样本;以及将所述经修改样本添加到预测性块的对应样本,以产生所述视频数据的经重构样本。

在另一实例中,本发明描述一种译码视频数据的装置,所述装置包括:用于基于初始亮度样本的位深度与初始色度样本的位深度之间的差异,将一组初始样本变换为一组经修改样本的装置,所述组初始样本包含所述初始亮度样本和所述初始色度样本,所述组经修改样本包含经修改亮度样本和经修改色度样本;以及用于将所述经修改样本添加到预测性块的对应样本,以产生所述视频数据的经重构样本的装置。

在另一实例中,本发明描述一种上面存储有指令的计算机可读存储媒体(例如非暂时性计算机可读存储媒体),所述指令在被执行时,致使用于译码视频数据的装置:基于初始亮度样本的位深度与初始色度样本的位深度之间的差异,将一组初始样本变换为一组经修改样本,所述组初始样本包含所述初始亮度样本和所述初始色度样本,所述组经修改样本包含经修改亮度样本和经修改色度样本;以及将所述经修改样本添加到预测性块的对应样本,以产生所述视频数据的经重构样本。

在附图和下文描述中陈述本发明的一或多个实例的细节。其它特征、目标和优点将从所述描述、图式以及所附权利要求书而显而易见。

附图说明

图1是说明可执行根据本发明的一或多个方面的技术的实例视频编码和解码系统的框图。

图2是说明高效视频译码(HEVC)中的帧内预测模式的概念图。

图3A是说明用于合并模式的实例空间相邻运动向量候选者的概念图。

图3B是说明用于高级运动向量预测(AMVP)模式的实例空间相邻运动向量候选者的概念图。

图4是说明块内复本的实例的概念图。

图5是说明屏幕内容译码中的实例解码过程的框图。

图6是说明根据本发明的技术的视频解码器的实例实施方案的框图。

图7是说明根据本发明的技术的视频编码器的实例实施方案的框图。

图8是说明根据本发明的技术的视频译码器的实例操作的流程图。

具体实施方式

在视频译码中,图片包括像素阵列。图片的每一像素可包括一组样本。举例来说,像素可包括红色样本、绿色样本和蓝色样本。红色、绿色和蓝色样本中的每一者的亮度控制像素的所察觉色彩和亮度。包括红色样本、绿色样本和蓝色样本的像素被称为处于RGB格式。在一些实例中,像素包括对应于像素的亮度的亮度样本(即,Y样本),以及对应于所述样本的色度的两个色度样本(即,U样本和V样本)。

当编码视频数据时,视频编码器可产生块的残差数据,作为所述块与一或多个预测性块之间的差异。所述视频编码器可使用运动补偿或帧内预测来产生所述预测性块。此外,视频编码器可应用色彩变换来将RGB格式的残差样本转换为另一格式(例如YCbCr格式或YCoCg格式)的样本。在一些实例中,所述视频编码器使用自适应色彩变换(ACT)。当视频编码器使用ACT时,视频编码器在逐块基础上自适应性地应用色彩变换。举例来说,视频编码器可将色彩变换应用于图片的一些块,而不是同一图片的其它块。所述视频编码器可发信号通知视频编码器是否将色彩变换应用于特定块。

虽然色彩变换可减少数据的量,但视频编码器可通过应用跨分量预测(CCP)变换来实现进一步减少。CCP变换可通过使用亮度分量作为用于色度分量的预测符来去除色彩分量之中的相关。在应用CCP变换之后,视频编码器可应用另一变换,例如离散余弦变换(DCT),以在频域中将残差样本转换为变换系数。所述视频编码器接着可量化所述变换系数,并对表示所述经量化变换系数的语法元素进行熵编码。

视频解码器可使所述变换反向,以获得原始色彩格式的残差样本值。举例来说,所述视频解码器可接收包括变换系数块的位流。在此实例中,所述视频解码器应用逆变换来将变换系数从频域转换为残差样本块。此外,所述视频解码器将逆CCP变换应用于所述残差样本块。在应用逆CCP变换之后,所述视频解码器可将逆色彩变换应用于所述残差样本块。举例来说,所述视频解码器可将逆ACT应用于所述残差样本块。随后,视频解码器可至少部分地通过将所述残差样本块中的样本添加到使用运动补偿或帧内预测产生的预测性块的对应样本来重构视频数据块。

修小玉(Xiaoyu Xiu)等人的“用于屏幕内容译码的分量间去相关(On inter-component de-correlation for screen content coding)”,ITU-T SG 16WP 3和ISO/IEC JTC 1/SC 29/WG11的视频译码联合合作小组(JCT-VC),2014年6月30日到7月9日,日本札幌第18届会议,文档JCTVC-S0179(下文中,“JCTVC-S0179”),其可从http://phenix.int-evry.fr/jct/doc_end_user/current_document.php?id=9626获得,描述了将ACT和CCP变换组合成单个组合变换。然而,JCTVC-S0179所描述的所述组合变换使样本的内部位深度增加3。此外,JCTVC-S0179所描述的组合变换涉及若干复杂乘法运算,因为组合变换中的变换系数的绝对值不再小于2。

本发明描述解决此问题的技术。如本文所述,当逆CCP和逆ACT组合在一起时,即使用一个步骤而不是两个连续步骤,且对于在组合变换过程的最终阶段确定右移的位,考虑亮度和分量的位深度的差异,而不仅考虑亮度分量的位深度。因此,在一些实例中,视频译码器基于初始亮度样本的位深度与初始色度样本的位深度之间的差异,来将一组初始样本变换为一组经修改样本,所述组初始样本包含初始亮度样本和初始色度样本。

举例来说,一种视频译码器,例如视频编码器或视频解码器,可将一组初始样本变换为一组经修改样本。在此实例中,所述组初始样本包含初始亮度样本和初始色度样本。所述初始色度样本可包含初始Cb样本和初始Cr样本。所述组经修改样本可包含经修改亮度样本和经修改色度样本。所述经修改色度样本可包含经修改Cb样本和经修改Cr样本。所述视频译码器可将所述经修改样本添加到预测性块的对应样本,以产生经重构样本。

在此实例中,作为应用所述变换的一部分,所述视频译码器将位移位值确定作为3加0和等于初始亮度样本的位深度减初始色度样本的位深度的值中的最大者。此外,视频译码器将第一参数值确定为1左移所述位移位值。所述视频译码器将第二参数值确定为初始Cb样本的跨分量预测参数左移了0和等于初始色度样本的位深度减初始亮度样本的位深度的值中的最大者。所述视频译码器将第三参数值确定为初始Cr样本的跨分量预测参数左移了0和等于初始色度样本的位深度减初始亮度样本的位深度的值中的最大者。

在此实例中,所述视频译码器将亮度残差系数值确定为第一参数值和第二参数值的总和,乘以初始亮度样本,加第一参数值乘以初始Cb样本。视频译码器将第一色度残差系数值确定为第一中间值与第二中间值之间的差异。在此实例中,所述第一中间值等于第一参数值减第二参数值,乘以初始亮度样本,减第一参数值乘以初始Cb样本。此外,在此实例中,所述第二中间值等于第三参数值乘以初始亮度样本,加第一参数值乘以初始Cr样本。所述视频译码器将第二色度残差系数值确定为第一中间值和第二中间值的总和。

在此实例中,视频译码器将所述经修改亮度样本确定为亮度残差系数值右移所述位移位值。所述视频译码器将经修改Cb样本确定为第一色度系数值右移所述位移位值。所述视频译码器将所述经修改Cr样本确定为第二色度系数值右移所述位移位值。

图1是说明可以利用本发明的技术的实例视频译码系统10的框图。如本文所使用,术语“视频译码器”一般是指视频编码器和视频解码器两者。在本发明中,术语“视频译码”或“译码”可一般地指代视频编码或视频解码。

如图1中所示,视频译码系统10包含源装置12和目的地装置14。源装置12产生经编码视频数据。因此,源装置12可被称为视频编码装置或视频编码设备。目的地装置14可对由源装置12所产生的经编码的视频数据进行解码。因此,目的地装置14可被称为视频解码装置或视频解码设备。源装置12以及目的地装置14可为视频译码装置或视频译码设备的实例。

源装置12和目的地装置14可包括各种装置,包含桌上型计算机、移动计算装置、笔记型(例如,膝上型)计算机、平板计算机、机顶盒、例如所谓的“智能”电话等电话手持机、电视机、相机、显示装置、数字媒体播放器、视频游戏控制台、车载计算机或其类似者。

目的地装置14可经由信道16从源装置12接收经编码的视频数据。信道16可包括能够将经编码的视频数据从源装置12移动到目的地装置14的一或多个媒体或装置。在一个实例中,信道16可包括使得源装置12能够实时地将经编码的视频数据直接发射到目的地装置14的一或多个通信媒体。在此实例中,源装置12可根据通信标准(例如无线通信协议)来调制经编码的视频数据,且可将经调制视频数据发射到目的地装置14。所述一或多个通信媒体可包含无线和/或有线通信媒体,例如射频(RF)频谱或一或多个物理传输线。所述一或多个通信媒体可形成基于分组的网络的一部分,所述基于分组的网络例如为局域网、广域网或全球网络(例如,因特网)。所述一或多个通信媒体可包含路由器、交换器、基站或促进从源装置12到目的地装置14的通信的其它设备。

在另一实例中,信道16可包含存储由源装置12产生的经编码视频数据的存储媒体。在此实例中,目的地装置14可(例如)经由磁盘存取或卡存取来存取存储媒体。存储媒体可包含多种本地存取的数据存储媒体,例如蓝光光盘、DVD、CD-ROM、快闪存储器或用于存储经编码的视频数据的其它合适数字存储媒体。

在另一实例中,信道16可包含存储由源装置12产生的经编码的视频数据的文件服务器或另一中间存储装置。在此实例中,目的地装置14可经由流式传输或下载来存取存储于文件服务器或其它中间存储装置处的经编码的视频数据。文件服务器可为能够存储经编码的视频数据并且将经编码的视频数据发射到目的地装置14的服务器类型。实例文件服务器包含网络服务器(例如,用于网站)、文件传输协议(FTP)服务器、网络附接存储(NAS)装置和本地磁盘驱动器。

目的地装置14可通过标准数据连接(例如因特网连接)来存取经编码的视频数据。实例类型的数据连接可包含无线信道(例如Wi-Fi连接)、有线连接(例如DSL、电缆调制解调器等),或适合于存取存储在文件服务器上的经编码视频数据的两者的组合。经编码视频数据从文件服务器的发射可为流式发射、下载发射或两者的组合。

本发明的技术不限于无线应用或设置。所述技术可应用于视频译码以支持多种多媒体应用,例如空中电视广播、有线电视发射、卫星电视发射、串流视频发射(例如,经由因特网)、用于存储于数据存储媒体上的视频数据的编码、存储在数据存储媒体上的视频数据的解码,或其它应用。在一些实例中,视频译码系统10可经配置以支持单向或双向视频传输以支持例如视频流式传输、视频重放、视频广播和/或视频电话等应用。

图1中说明的视频译码系统10仅为实例,并且本发明的技术可适用于未必包含编码装置与解码装置之间的任何数据通信的视频译码设置(例如,视频编码或视频解码)。在其它实例中,从本地存储器检索数据,经由网络流式传输数据等。视频编码装置可对数据进行编码并且将数据存储到存储器,和/或视频解码装置可从存储器检索数据并且对数据进行解码。在许多实例中,由并不彼此通信而是仅编码数据到存储器和/或从存储器检索数据且解码数据的装置执行编码和解码。视频编码器20和视频解码器30可包括存储器,其经配置以存储视频数据。视频编码器20可编码存储于存储器中的视频数据。视频解码器30可解码经编码视频数据,并将所得视频数据存储在所述存储器中。

在图1的实例中,源装置12包含视频源18、视频编码器20和输出接口22。在一些实例中,输出接口22可包含调制器/解调器(调制解调器)和/或发射器。视频源18可包含视频捕获装置(例如,摄像机)、含有先前捕获的视频数据的视频存档、用以从视频内容提供者接收视频数据的视频馈入接口,和/或用于产生视频数据的计算机图形系统,或视频数据的此些来源的组合。

视频编码器20可对来自视频源18的视频数据进行编码。在一些实例中,源装置12经由输出接口22将经编码的视频数据直接发射到目的地装置14。在其它实例中,经编码的视频数据也可存储到存储媒体或文件服务器上以供稍后由目的地装置14存取以用于解码和/或重放。

在图1的实例中,目的地装置14包含输入接口28、视频解码器30和显示装置32。在一些实例中,输入接口28包含接收器和/或调制解调器。输入接口28可经由信道16接收经编码的视频数据。显示装置32可与目的地装置14集成在一起或可在目的地装置14的外部。一般来说,显示装置32显示经解码的视频数据。显示装置32可包括多种显示装置,例如液晶显示器(LCD)、等离子显示器、有机发光二极管(OLED)显示器或另一类型的显示装置。

视频编码器20和视频解码器30各自可实施为例如以下各项的多种合适电路中的任一者:一或多个微处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)、离散逻辑、硬件或其任何组合。如果部分地以软件实施所述技术,装置可将软件的指令存储于合适的非暂时性计算机可读存储媒体中,且可使用一或多个处理器以硬件执行指令从而执行本发明的技术。前述内容(包含硬件、软件、硬件与软件的组合等)中的任一者可被视为一或多个处理器。视频编码器20和视频解码器30中的每一者可包含在一或多个编码器或解码器中,所述编码器或解码器中的任一者可集成为相应装置中的组合编码器/解码器(编解码器)的一部分。

本发明可大体上将视频编码器20称为将某些信息“发信号通知”或“发射”到例如视频解码器30的另一装置。术语“发信号通知”或“发射”可大体上指代用以对经压缩视频数据进行解码的语法元素和/或其它数据的传送。此传送可实时或几乎实时发生。或者,可历时时间跨度而发生此通信,例如当在编码时,以经编码位流将语法元素存储到计算机可读存储媒体时,可发生此通信,接着在存储到此媒体之后可由解码装置在任何时间检索所述语法元素。

在一些实例中,视频编码器20和视频解码器30可根据视频压缩标准操作,所述视频压缩标准例如是高效视频译码(HEVC)标准。王(Wang)等人的“高效视频译码(HEVC)缺陷报告4”,ITU-T SG 16WP 3和ISO/IEC JTC 1/SC 29/WG 11的视频译码联合合作小组(JCT-VC),第17次会议:西班牙巴伦西亚市,2014年3月27日到4月4日,文献JCTVC-Q1003(v.1)(下文,“JCTVC-Q1003”)是描述HEVC的文献。在本发明中,JCTVC-Q1003中的HEVC规范文本可被称为“HEVC版本1”。除基础HEVC标准之外,还正在努力产生用于HEVC的可缩放视频译码、多视图视频译码和3D译码扩展。

在HEVC和其它视频译码标准中,视频序列通常包含一连串图片。图片也可被称作“帧”。图片可包含三个样本阵列,表示为SL、SCb以及SCr。SL是亮度样本的二维阵列(即,块)。SCb是Cb色度样本的二维阵列。SCr是Cr色度样本的二维阵列。色度样本在本文中还可被称为“色度”样本。在其它情况下,图片可为单色的且可仅包含亮度样本阵列。

为了产生图片的经编码的表示,视频编码器20可产生一组译码树单元(CTU)。CTU中的每一者可为亮度样本的译码树块、色度样本的两个对应译码树块及用于对译码树块的样本进行译码的语法结构。译码树块可为样本的NxN块。CTU也可被称为“树块”或“最大译码单元(LCU)”。HEVC的CTU可广泛地类似于例如H.264/AVC等其它标准的宏块。然而,CTU未必限于特定大小,并且可包含一或多个译码单元(CU)。切片可包含光栅扫描中连续排序的整数数目的CTU。

为了产生经译码CTU,视频编码器20可对CTU的译码树块以递归方式执行四叉树分割,以将译码树块划分为译码块,因此命名为“译码树单元”。译码块是样本的NxN块。CU可为具有亮度样本阵列、Cb样本阵列和Cr样本阵列的图片的亮度样本的译码块和色度样本的两个对应译码块,以及用于对译码块的样本进行译码的语法结构。在单色图片或具有三个单独色彩平面的图片中,CU可包括单个译码块和用以对译码块的样本进行译码的语法结构。

视频编码器20可将CU的译码块分割为一或多个预测块。预测块可为应用相同预测的样本的矩形(即,正方形还是非正方形)块。CU的预测单元(PU)可为图片的亮度样本的预测块,图片的色度样本的两个对应的预测块,以及用以对预测块样本进行预测的语法结构。视频编码器20可产生用于CU的每个PU的亮度预测块、Cb预测块以及Cr预测块的预测性亮度块、Cb块以及Cr块。在单色图片或具有三个单独色彩平面的图片中,PU可包括单个预测块和用以预测预测块的语法结构。

视频编码器20可使用帧内预测或帧间预测来产生PU的预测性块。如果视频编码器20使用帧内预测产生PU的预测性块,那么视频编码器20可基于与PU相关联的图片的经解码的样本来产生PU的预测性块。在HEVC版本1中,对于每一PU的亮度分量,使用33个角度预测模式(从2到34编索引)、DC模式(以1编索引)以及平面模式(以0编索引)利用帧内预测方法,如图2中所示。图2是说明高效视频译码(HEVC)中的帧内预测模式的概念图。

除以上35个帧内模式之外,HEVC还采用被命名为‘I-PCM’的再一个模式。在I-PCM模式中,绕过预测、变换、量化和熵译码,同时通过预定义数目的位来对预测样本进行译码。I-PCM模式的主要目的是处置当其它模式无法对信号高效地进行译码时的情形。

如果视频编码器20使用帧间预测产生PU的预测性块,那么视频编码器20可基于除与PU相关联的图片以外的一或多个图片的经解码样本产生PU的预测性块。视频编码器20可使用单向预测或双向预测来产生PU的预测性块。当视频编码器20使用单向预测来产生PU的预测性块时,PU可具有单个运动向量。当视频编码器20使用双向预测来产生PU的预测性块时,PU可具有两个运动向量。

在视频编码器20产生CU的一或多个PU的预测性块(例如,预测性亮度块、Cb块和Cr块)之后,视频编码器20可产生CU的残差块。CU的残差块中的每一样本指示CU的PU的预测性块中的样本与CU的译码块中的对应样本之间的差异。举例来说,视频编码器20可产生CU的亮度残差块。CU的亮度残差块中的每一样本指示CU的PU的预测性亮度块中的亮度样本与CU的亮度译码块中的对应样本之间的差异。

另外,视频编码器20可产生CU的Cb残差块。CU的Cb残差块中的每一样本可指示CU的PU的预测性Cb块中的Cb样本与CU的Cb译码块中的对应样本之间的差异。视频编码器20还可产生CU的Cr残差块。CU的Cr残差块中的每一样本可指示CU的PU的预测性Cr块中的Cr样本与CU的Cr译码块中的对应样本之间的差异。

此外,视频编码器20可使用四叉树分割将CU的残差块(例如,亮度、Cb和Cr残差块)分解为一或多个变换块(例如,亮度、Cb和Cr变换块)。变换块可为其上应用相同变换的样本的矩形块。CU的变换单元(TU)可为亮度样本的变换块、色度样本的两个对应的变换块,以及用以对变换块样本进行变换的语法结构。因此,CU的每个TU可与亮度变换块、Cb变换块以及Cr变换块相关联。与TU相关联的亮度变换块可为CU的亮度残差块的子块。Cb变换块可为CU的Cb残差块的子块。Cr变换块可为CU的Cr残差块的子块。在单色图片或具有三个单独色彩平面的图片中,TU可包括单个变换块和用以对变换块的样本进行变换的语法结构。

视频编码器20可将一或多个变换应用到TU的变换块从而产生TU的系数块。举例来说,视频编码器20可将一或多个变换应用于TU的亮度变换块以产生TU的亮度系数块。视频编码器20可将一或多个变换应用于TU的Cb变换块以产生TU的Cb系数块。视频编码器20可将一或多个变换应用于TU的Cr变换块以产生TU的Cr系数块。系数块可为变换系数的二维阵列。变换系数可为标量。

在产生系数块(例如,亮度系数块、Cb系数块或Cr系数块)之后,视频编码器20可量化系数块。量化总体上是指对变换系数进行量化以可能减少用以表示变换系数的数据的量从而提供进一步压缩的过程。在视频编码器20量化系数块之后,视频编码器20可对指示经量化变换系数的语法元素进行熵编码。举例来说,视频编码器20可对指示经量化变换系数的语法元素执行上下文自适应二进制算术译码(CABAC)。视频编码器20可在位流中输出经熵编码的语法元素。位流可包括视频数据的经编码表示。

视频编码器20可输出包含经熵编码的语法元素的位流。位流可包含形成经译码图片和相关联数据的表示的位序列。位流可包括一连串网络抽象层(NAL)单元。所述NAL单元中的每一者包含NAL单元标头,且包封原始字节序列有效负载(RBSP)。NAL单元标头可包含指示NAL单元类型码的语法元素。由NAL单元的NAL单元标头指定的所述NAL单元类型代码指示NAL单元的类型。RBSP可为含有包封在NAL单元内的整数数目个字节的语法结构。在一些情况下,RBSP包含零个位。

不同类型的NAL单元可包封不同类型的RBSP。举例来说,第一类型的NAL单元可包封用于图片参数集(PPS)的RBSP,第二类型的NAL单元可包封用于经译码切片的RBSP,第三类型的NAL单元可包封用于补充增强信息(SEI)的RBSP,等等。包封视频译码数据的RBSP(与参数集和SEI消息的RBSP相对)的NAL单元可被称为视频译码层(VCL)NAL单元。

在图1的实例中,视频解码器30接收视频编码器20所产生的位流。另外,视频解码器30可剖析所述位流以从所述位流获得语法元素。视频解码器30可至少部分地基于从位流获得的语法元素重构视频数据的图片。用以重构视频数据的过程通常可与由视频编码器20执行的过程互逆。举例来说,视频解码器30可使用帧内预测或帧间预测来确定当前CU的PU的预测性块。另外,视频解码器30可逆量化当前CU的TU的系数块。视频解码器30可对系数块执行逆变换以重构当前CU的TU的变换块。通过将用于当前CU的PU的预测性块的样本添加到当前CU的TU的变换块的对应样本,视频解码器30可重构当前CU的译码块。通过重构用于图片的每一CU的译码块,视频解码器30可重构所述图片。

在HEVC标准中,存在两个帧间预测模式,其分别被命名为PU的合并模式和高级运动向量预测(AMVP)模式。所谓的跳过模式被认为是合并模式的特殊情况。在AMVP模式或合并模式中,视频译码器保持多个运动向量预测符的运动向量(MV)候选者列表。通过从MV候选者列表取一个候选者来产生PU的运动向量,以及合并模式下的参考索引。

在一些实例中,MV候选者列表含有针对合并模式的至多达五个候选者和针对AMVP模式的仅两个候选者。合并候选者可含有一组运动信息,例如对应于两个参考图片列表(列表0和列表1)的运动向量和参考索引。如果通过合并指数来识别合并候选者,那么确定用于当前块的预测的参考图片以及相关联的运动向量。然而,在针对从列表0或列表1的每一相应潜在预测方向的AMVP模式下,视频编码器20明确地将相应参考索引与到MV候选者列表的MVP索引一起发信号通知,因为每一AMVP候选者仅含有一运动向量。在AMVP模式中,可进一步细化经预测运动向量。如可从上文看出,合并候选者对应于整个运动信息集,而AMVP候选者仅含有用于特定预测方向的一个运动向量和参考索引。两种模式的候选者由视频编码器20和视频解码器30从相同的空间和时间相邻块类似地导出。

图3A是说明用于合并模式的实例空间相邻运动向量候选者的概念图。图3B是说明用于AMVP模式的实例空间相邻运动向量候选者的概念图。视频译码器(例如视频编码器20或视频解码器30)可从图3A和图3B中所示的相邻块为特定PU(PU0)导出空间MV候选者,但从所述块产生所述候选者的方法可针对合并和AMVP模式而不同。在合并模式中,可以图3A中示出的次序导出至多达四个空间MV候选者,其中编号和次序如下:左(0)、上(1)、右上(2)、左下(3)和左上(4),如图3A中所示。

在AMVP模式中,相邻块分成两个群组:由块0和1组成的左群组,以及由块2、3和4组成的上群组,如图3B中所示。对于每一群组,如发信号通知的参考索引所指示的参考同一参考图片的相邻块中的潜在候选者具有最高待选优先级,以形成所述群组的最终候选者。有可能所有相邻块均不含有指向同一参考图片的运动向量。因此,如果无法找到此候选者,那么视频译码器可缩放第一可用候选者以形成最终候选者;因此,可补偿时间距离差异。

作为对HEVC标准的扩展的HEVC范围扩展针对额外色彩表示(也被称作“色彩格式”)以及针对增加的色彩位深度对HEVC增加支持。HEVC范围扩展的草案是:弗林(Flynn)等人的“HEVC范围扩展文本说明书:草案7”,第17次会议:西班牙巴伦西亚市,2014年3月27日到4月4日,文献JCTVC-Q1005_v7(下文JCTVC-Q1005),其可从http://phenix.int-evry.fr/jct/doc_end_user/documents/17_Valencia/wg11/JCTVC-Q1005-v9.zip找到。色彩位深度是用以表示色彩表示的每一分量的位数目。针对其它色彩格式的支持可包含针对编码和解码RGB视频数据源以及具有其它色彩表示且使用与HEVC主规范不同的色度子取样模式的视频数据的支持。

正在开发HEVC的另一扩展,即屏幕内容译码(SCC),用于译码屏幕内容材料,例如文本和具有运动的图形。SCC扩展的草案是:乔希(Joshi)等人的“高效视频译码(HEVC)屏幕内容译码:草案1”,ITU-T SG 16WP 3和ISO/IEC JTC 1/SC 29/WG 11的视频译码联合合作小组(JCT-VC),第18次会议:日本札幌市,2014年6月30日到7月9日,文献JCTVC-R1005_v3(下文,“JCTVC-R1005”),其可从http://phenix.int-evry.fr/jct/doc_end_user/documents/18_Sapporo/wg11/JCTVC-R1005-v3.zip获得,是SCC的工作草案(WD)。

块内复本(BC)模式已包含于HEVC的SCC扩展中。图4中所示的帧内BC的实例,其中当前CU是从当前图片/切片的已经解码块预测的。换句话说,图4是说明帧内BC的实例的概念图。当前帧内BC块大小可与CU大小一样大,范围从8x8到64x64,但针对一些应用,可应用其它约束。

如图4的实例中示出,视频编码器20可例如基于像素差值在搜索区50内执行搜索,以寻找与当前CU 52的PU的预测块最紧密匹配的块。在图4的实例中,视频编码器20已将标记为预测信号54的块识别为与所述预测块最紧密匹配的块。视频编码器20确定指示预测信号54相对于预测块的位移的偏移向量56。

每一视频数据块的像素各自表示特定格式的色彩,称为“色彩表示”。不同视频译码标准可将不同色彩表示用于视频数据块。作为一个实例,由视频译码联合合作小组(JCT-VC)开发的高效视频译码(HEVC)视频标准的主规范使用YCbCr色彩表示来表示视频数据块的像素。

YCbCr色彩表示大体上指代其中视频数据的每一像素由色彩信息的三个分量或信道“Y”、“Cb”和“Cr”表示的色彩表示。Y信道表示特定像素的亮度(即,光强度或亮度)数据。Cb分量和Cr分量分别是蓝差和红差色度,即“色度”分量。YCbCr常常用以表示经压缩视频数据中的色彩,因为Y、Cb和Cr分量中的每一者之间存在强去相关,意味着Y、Cb和Cr分量中的每一者之间存在极少的重复或冗余的数据。使用YCbCr色彩表示对视频数据进行译码因此在许多情况下提供良好压缩性能。

YCgCo色彩表示通常是指其中视频数据的每一像素由色彩信息的三个分量或信道“Y”、“Cg”和“Co”表示的色彩表示。如在YCbCr中,Y信道表示特定像素的亮度(即,光强度或亮度)数据。Cg和Co分量分别是绿差和橙差色度,即“色度”分量。YCgCo色彩模型优于YCbCr色彩模型的潜在优点是较简单且较快的计算,以及色彩平面的较好去相关,来改进压缩性能。

归因于亮度分量与色彩表示的两个色度分量(还被称作色彩格式)之间的通常较强色彩去相关,HEVC主规范使用YCbCr。然而,在一些情况下,Y、Cb和Cr分量之间可仍存在相关。色彩表示的分量之间的相关可被称为交叉色彩分量相关或色彩分量间相关。

视频译码器可经配置以基于不同分量的值(例如亮度分量的样本)来预测一个分量的值(例如色度分量的样本)。基于第二分量从第一分量预测样本的过程被称作“用于彩色视频的跨分量预测”或“色彩分量间预测”。视频译码器可基于第一分量与第二分量之间的相关来预测第一分量的值。

跨分量预测(CCP)在以下文献中描述:朴(Pu)等人的“RCE1:实验1、2、3和4的描述和结果”ITU-T SG 16WP 3和ISO/IEC JTC 1/SC 29/WG 11的视频译码(JCT-VC)联合合作小组,第15次会议:瑞士日内瓦市,2013年10月25日到11月1日,文献JCTVC-O0202,可在http://phenix.int-evry.fr/jct/doc_end_user/documents/15_Geneva/wg11/JCTVC-O0202-v5.zip获得,且可由HEVC范围和SCC扩展两者使用。JCTVC-O0202描述了通过使用亮度残差作为用于色度分量的预测符来去除色彩分量之中的相关。一组按比例缩放参数是预定义的,且选择其中的一者并在位流中发信号通知。针对经帧内和帧间译码的块两者来执行此预测。然而,在帧内译码的情况下,仅允许具有DM色度模式的那些(即,当分区大小等于2N×2N时,色度预测模式等同于亮度预测模式,而当分区大小等于N×N时,色度预测模式等同于与第一(左上)预测单元相关联的亮度预测模式)使用此预测。在JCTVC-O0202中,可为每一变换块选择按比例缩放参数。

如JCTVC-O0202中所描述,rC(x,y)表示位置(x,y)处的最终色度经重构残差样本,rc′(x,y)表示位置(x,y)处来自位流的经重构色度残差样本,且rL(x,y)表示位置(x,y)处的亮度分量中的经重构残差样本。在JCTVC-O0202的CCP过程中,视频编码器将色度残差预测为:

rC'(x,y)=rC(x,y)-(α×rL(x,y))>>3(1)

视频解码器执行逆CCP过程,其补偿色度残差为:

rC(x,y)=rC'(x,y)+(α×rL(x,y))>>3(2)

视频编码器计算并发信号通知按比例缩放参数α。

此外,在JCTVC-O0202中,如果假定BDc(即,色度样本的位深度)等于BDY(即,亮度样本的位深度),那么逆CCP过程可由以下矩阵相乘来表示:

其中Minv-CCP是逆CCP的矩阵,and分别是色度分量的发信号通知的CCP参数。因此,对应于将在等式(2)中用于补偿Cg色度值的按比例缩放参数α,且对应于将在等式(2)中用于补偿Co色度值的按比例缩放参数α。

HEVC版本1允许将不同位深度用于亮度和色度分量。为了考虑其中亮度和色度分量的位深度不同的情况,等式(2)可进一步经修改以:

rC(x,y)=rC'(x,y)+((((α×rL(x,y))<<BDc)>>BDY)>>3)(4)

在等式(4)中,BDc和BDY分别是色度和亮度的位深度。BDc、BDY分别由BitDepthC和BitDepthY表示。在此情况下,等式(3)的Minv-CCP可修改为:

按比例缩放参数α可选自值集合{-8,-4,-2,-1,0,1,2,4,8},包含性地。视频编码器可使用速率失真度量来选择按比例缩放参数α。在一些实例中,视频编码器可使用另一快速算法来计算不同按比例缩放参数的成本。当α=0时,断开分量间残差预测。对于每一TU,视频编码器可选择适合于TU的最佳α,例如,在HEVC范围扩展和SCC扩展中使用TU等级开/关切换。

CU等级自适应色彩变换(ACT)在以下文献中描述:张(Zhang)等人的“SCCE5测试3.2.1:循环内色彩空间变换”,ITU-T SG 16WP 3和ISO/IEC JTC 1/SC 29/WG 11的视频译码联合合作小组(JCT-VC),第18次会议:日本札幌市,2014年6月30日到7月9日,文献JCTVC-R0147(下文,“JCTVC-R0147),可在http://phenix.int-evry.fr/jct/doc_end_user/documents/18_Sapporo/wg11/JCTVC-R0147-v2.zip获得),并在第18次JCTVC会议中采用。如JCTVC-R0147中所描述,对于经帧内译码的CU、经帧内BC译码的CU以及经帧间译码的CU,视频编码器有条件地发信号通知旗标以指示自适应色彩变换的使用。当针对一个CU启用ACT时,视频编码器首先通过调用色彩变换,将预测错误(即,残差数据)(其可使用帧内预测(包含帧内BC)或帧间预测来确定)转换到不同色彩空间。视频编码器接着在ACT停用的情况下,即通过依次调用CCP、变换、量化和熵译码,来以与那些块相同的方式来处理经转换的预测错误。在解码器侧,在调用CCP之后,如果在ACT启用的情况下译码当前CU,那么添加逆色彩变换模块。

图5是说明屏幕内容译码中的实例解码过程的框图。尽管关于屏幕内容译码描述,但图5的解码过程不限于屏幕内容译码。因此,图5描绘包含有ACT的解码流。在图5的实例中,视频解码器包括熵解码单元100、去量化单元102、逆变换单元104、CCP单元106、逆色彩变换单元108、运动补偿单元110、帧内预测单元112、去块滤波器单元114、样本自适应偏移(SAO)滤波器单元116和经解码图片缓冲器118。

熵解码单元100接收位流。熵解码单元100可剖析来自所述位流的语法元素。作为剖析来自位流的语法元素的一部分,熵解码单元100可对位流中的数据进行熵解码以恢复特定语法元素,包含表示变换系数的语法元素。去量化单元102可使变换系数去量化。逆变换单元104可将逆变换,例如逆DCT,应用于变换系数块,以产生残差数据块。

此外,在图5的实例中,CCP单元106将逆CCP变换应用于残差数据块。逆色彩变换单元108将逆色彩变换应用于残差数据块。如图5的实例中示出,可绕过对一些残差数据块的逆色彩变换单元108。随后,可将CCP单元106或逆色彩变换单元108所产生的残差样本添加到帧内或帧间预测性块的对应样本来重构样本。

运动补偿单元110或帧内预测单元112可产生所述预测性块。帧内预测单元112可使用帧内预测来产生所述预测性块。帧内预测是基于相同经解码切片的例如样本值的数据元素来预测数据元素的技术。举例来说,帧内预测单元112可使用定向帧内预测模式、DC帧内预测模式、平面帧内预测模式、帧内BC,或基于相同经解码切片的数据元素来预测数据元素(例如样本值)的另一技术。运动补偿单元110可使用运动补偿来例如使用定义运动向量的语法元素来产生所述预测性块。

去块滤波器单元114可将去块滤波器应用于经重构样本。所述去块滤波器可去除成块假影。SAO过滤器单元116可将SAO过滤器应用于经重构样本。

DPB 118可存储经重构的样本。因此,DPB 118可为存储器或计算机可读存储媒体,其经配置以存储视频数据。DPB 118可为存储参考视频数据(例如参考图片)供视频解码器30例如在帧内或帧间译码模式中解码视频数据的参考图片存储器。经解码图片缓冲器118可由多种存储器装置中的任一者形成,例如动态随机存储器(DRAM)(包含同步DRAM(SDRAM))、磁阻式RAM(MRAM)、电阻式RAM(RRAM)或其它类型的存储器装置。经解码图片缓冲器118可由同一存储器装置或单独的存储器装置提供。在各种实例中,经解码图片缓冲器118可与视频解码器30的其它组件在芯片上,或相对于那些组件在芯片外。

在JCTVC-R1005中,如下定义色彩变换:

YCoCg(用于有损译码):

正向:

逆向:

YCoCg-R(RGB<->YCgCo的可逆形式,其使Co和Cg分量按比例缩放因子二,用于无损译码))。通过使用常见的提升技术,可通过以下等式来实现正向和逆变换:

正向:

逆向:

由于CCP和ACT两者独立于相邻块和相邻像素,因此可使用像素等级处理来执行CCP和ACT两者。尽管ACT旗标在CU等级处发信号通知,且CCP在TU等级处发信号通知,但其两者可在像素等级执行。ACT旗标可指示是否应用色彩变换。如果ACT和CCP两者在像素/TU等级处执行,那么可减少解码延迟。

修小玉等人的“用于屏幕内容译码的分量间去相关”,ITU-T SG 16WP 3和ISO/IEC JTC 1/SC 29/WG 11的视频译码联合合作小组(JCT-VC),第18次会议:日本札幌市,2014年6月30日到7月9日,文献JCTVC-S0179(下文,“JCTVC-S0179”),其可在http://phenix.int-evry.fr/jct/doc_end_user/current_document.php?id=9626处获得,描述了通过将不同变换矩阵用于有损译码来将两个步骤(即,CCP和ACT)合并成一个步骤。

基于BDc等于BDY的假定,对于有损译码,可仅通过使两个操作的矩阵相乘来实现组合的解码过程,即,

在BDc不同于BDY的情况下,对于有损译码,通过用(5)来替换上式(3),可将对应解码过程定义为:

就是说,在给定由用于三个色彩分量的rY[x][y]、rCb[x][y]、rCr[x][y]表示的输入样本的情况下,可用以下步骤来计算经修改样本值的输出:

bShift=BDY+3

wPara0=1<<bShift

wPara1=ResScaleVal[1][xTbY][yTbY]<<BDc

wPara2=ResScaleVal[2][xTbY][yTbY]<<BDc

resCoeffY=(wPara0+wPara1)*rY[x][y]+wPara0*rCb[x][y]

tmp0=(wPara0-wPara1)*rY[x][y]-wPara0*rCb[x][y]

tmp1=wPara2*rY[x][y]+wPara0*rCr[x][y]

resCoeffCb=tmp0-tmp1

resCoeffCr=tmp0+tmp1

rY[x][y]=resCoeffY>>bShift

rCb[x][y]=resCoeffCb>>bShift

rCr[x][y]=resCoeffCr>>bShift

(8)以及上方步骤的输入是Y(Y)、Cg(Cb)和Co(Cr);(8)以及上方步骤的输出是G(rY)、B(rCb)、R(rCr)。因此,在(8)和上方步骤中,存在不同变量但具有相同含义。在上方步骤中,ResScaleVal[1][xTbY][yTbY]和ResScaleVal[2][xTbY][yTbY]表示分别对应于rCb和rCr的跨分量预测(CCP)参数。举例来说,假定输入样本将处于变换块内的位置(xTbY,yTby)。因此,ResScaleVal[1][xTbY][yTbY]是Cb的按比例缩放参数α,且ResScalVal[1][xTbY][yTbY]是Cr的按比例缩放参数α。

JCTVC-S0179的设计至少具有以下问题。当将等式(8)中的组合步骤与原始逆YCoCg变换进行比较时,应注意,内部位深度增加了(3+BitDepthY)。另外,需要更复杂的乘法,因为绝对变换系数不再小于2。与JCTVC-S0179中的设计相比,本发明的实例可降低解码器复杂性。

当逆CCP和逆ACT组合在一起时,即,使用一个步骤而不是两个连续步骤,且针对最终阶段处的右移的位的确定,考虑亮度和分量的位深度的差异,而不是仅考虑亮度分量的位深度。为了更精确,JCTVC-S0179中的bShift的定义由3+最大(0,BitDepthY-BitDepthC))代替,其中最大函数返回两个变量的较大值。在此情况下,内部位深度增量从(3+BitDepthY)减小到(3+max(0,BitDepthY-BitDepthC)))。

经修改解码过程定义如下,其中相对于JCTVC-S0179的删除示出为包括在双大括号中且为斜体(例如[[实例]]),且相对于JCTVC-S0179的添加带下划线(例如实例):

bShift=[[BDY+]]3+max(0,BitDepthY-BitDepthC))

wPara0=1<<bShift

wPara1=(ResScaleVal[1][xTbY][yTbY]<<[[BDc]]max(0,BitDepthC-BitDepthY))

wPara2=(ResScaleVal[2][xTbY][yTbY]<<[[BDc]]max(0,BitDepthC-BitDepthY))

resCoeffY=(wPara0+wPara1)*rY[x][y]+wPara0*rCb[x][y]

tmp0=(wPara0-wPara1)*rY[x][y]-wPara0*rCb[x][y]

tmp1=wPara2*rY[x][y]+wPara0*rCr[x][y]

resCoeffCb=tmp0-tmp1

resCoeffCr=tmp0+tmp1

rY[x][y]=resCoeffY>>bShift

rCb[x][y]=resCoeffCb>>bShift

rCr[x][y]=resCoeffCr>>bShift

因此,根据本发明的实例,视频译码器(例如视频编码器20或视频解码器30)可基于初始亮度样本的位深度与初始色度样本的位深度之间的差异,来将一组初始样本变换为一组经修改样本。在此实例中,所述组初始样本包含初始亮度样本和初始色度样本。在一些实例中,所述组初始色度样本包含初始Cb样本和初始Cr样本。所述组经修改样本包含经修改亮度样本和经修改色度样本。在一些实例中,所述经修改色度样本包含经修改Cb样本和经修改Cr样本。所述视频译码器可将所述经修改样本添加到预测性块的对应样本,以产生经重构样本。

在一些实例中,当应用所述变换时,视频译码器将位移位值(例如bShift)确定为3加0和等于初始亮度样本的位深度(例如BitDepthY)减初始色度样本的位深度(例如BitDepthC)的值中的最大者。所述视频译码器可将第一参数值(例如wPara0)确定为1左移了所述位移位值。所述视频译码器将第二参数值(例如wPara1)确定为初始Cb样本的跨分量预测参数左移了0和等于初始色度样本的位深度减初始亮度样本的位深度的值中的最大者。所述视频译码器可将第三参数值(例如wPara2)确定为初始Cr样本的跨分量预测参数左移了0和等于初始色度样本的位深度减初始亮度样本的位深度的值中的最大者。

在此实例中,视频译码器将亮度残差系数值(例如resCoeffY)确定为第一参数值和所述第二参数值的总和,乘以初始亮度样本,加第一参数值乘以初始Cb样本。此外,视频译码器将第一色度残差系数值(例如resCoeffCb)确定为第一中间值(例如tmp0)与第二中间值(例如tmp1)之间的差异。在此实例中,所述第一中间值等于第一参数值减第二参数值,乘以初始亮度样本,减第一参数值乘以初始Cb样本。此外,在此实例中,所述第二中间值等于第三参数值乘以初始亮度样本,加第一参数值乘以初始Cr样本。视频译码器将第二色度残差系数值(例如resCoeffCr)确定为第一中间值和第二中间值的总和。

在此实例中,视频译码器将经修改亮度样本(例如rY[x][y])确定为亮度残差系数值右移所述位移位值。在此实例中,视频译码器将经修改Cb样本(例如rCb[x][y])确定为第一色度系数值右移所述位移位值。在此实例中,视频译码器将经修改Cr样本(例如rCr[x][y])确定为第二色度系数值右移所述位移位值。

在其中视频译码器是视频编码器(例如视频编码器20)的实例中,视频译码器可在位流中发信号通知指示用于初始Cb样本的跨分量预测参数和用于初始Cr样本的跨分量预测参数的语法元素。类似地,在其中视频译码器是视频解码器(例如视频解码器30)的实例中,视频译码器可从位流获得指示用于初始Cb样本的跨分量预测参数和用于初始Cr样本的跨分量预测参数的语法元素。

或者,以下可适用于wPara1和wPara2的定义:

wPara1=(ResScaleVal[1][xTbY][yTbY]<<BitDepthc)>>min(BitDepthY,BitDepthc)

wPara2=(ResScaleVal[2][xTbY][yTbY]<<BitDepthc)>>min(BitDepthY,BitDepthc)

图6是说明根据本发明的技术的视频解码器30的实例实施方案的框图。图6中所示的视频解码器30的实例实施方案类似于图5的视频解码器。然而,代替于包含CCP单元106和逆色彩变换单元108,图6的视频解码器包含组合CCP/ACT单元120。组合CCP/ACT单元120应用组合的逆CCP和ACT。

根据本发明的一或多种技术,组合CCP/ACT单元120基于初始亮度样本的位深度与初始色度样本的位深度之间的差异,来将一组初始样本变换为一组经修改样本,所述组初始样本包含所述初始亮度样本和所述初始色度样本。所述初始色度样本包含初始Cb样本和初始Cr样本。所述组经修改样本包含经修改亮度样本和经修改色度样本。所述经修改色度样本包含经修改Cb样本和经修改Cr样本。

图7是说明根据本发明的技术的视频编码器20的实例实施方案的框图。图7是出于解释的目的而提供,并且不应被视为将技术限制为本发明中所大致示范和描述的技术。出于解释的目的,本发明描述在HEVC译码的上下文中的视频编码器20。然而,本发明的技术可适用于其它译码标准或方法。

在图7的实例中,视频编码器20包含视频数据存储器130、预测处理单元132、残差产生单元134、组合CCP/ACT单元136、变换处理单元138、量化单元140、逆量化单元142、逆变换处理单元144、逆组合CCP/ACT单元146、重构单元148、滤波器单元150、经解码图片缓冲器152以及熵编码单元154。预测处理单元132包含帧间预测处理单元156和帧内预测处理单元158。在其它实例中,视频编码器20可包含更多、更少或不同功能组件。

视频数据存储器130可存储待由视频编码器20的组件编码的视频数据。可例如从视频源18获得存储在视频数据存储器130中的视频数据。经解码图片缓冲器152可为参考图片存储器,其存储用于由视频编码器20(例如)在帧内或帧间译码模式中对视频数据进行编码的参考视频数据。视频数据存储器130和经解码图片缓冲器152可由多种存储器装置中的任一者形成,例如动态随机存取存储器(DRAM),包含同步DRAM(SDRAM)、磁阻式RAM(MRAM)、电阻式RAM(RRAM)或其它类型的存储器装置。视频数据存储器130和经解码图片缓冲器152可由相同存储器装置或单独的存储器装置提供。在各种实例中,视频数据存储器130可与视频编码器20的其它组件一起在芯片上,或相对于所述组件在芯片外。

视频编码器20可对CTU的CU进行编码以产生CU的经编码表示(即,经译码的CU)。作为对CU进行编码的部分,预测处理单元132可在CU的一或多个PU当中分割与CU相关联的译码块。因此,每一PU可与亮度预测块和对应的色度预测块相关联。帧间预测处理单元156可通过对CU的每一PU执行帧间预测产生用于PU的预测性数据。PU的预测性数据可包含PU的预测性块和PU的运动信息。帧内预测处理单元158可通过对PU执行帧内预测来产生PU的预测性数据。预测处理单元132可从PU的由帧间预测处理单元156产生的预测性数据或PU的由帧内预测处理单元158产生的预测性数据当中选择CU的PU的预测性数据。

残差产生单元134可基于CU的译码块和CU的PU的选定预测性块而产生CU的残差块。举例来说,残差产生单元134可产生CU的残差块,使得残差块中的每一样本具有等于CU的译码块中的样本与CU的PU的对应选定预测性样本块中的对应样本之间的差异的值。

组合CCP/ACT单元136将组合CCP和ACT应用于残差产生单元134所产生的残差数据。组合CCP/ACT单元136可基于初始亮度样本的位深度与初始色度样本的位深度之间的差异,来将一组初始样本变换为一组经修改样本。所述组初始样本包含初始亮度样本和初始色度样本。所述初始色度样本包含初始Cb样本和初始Cr样本。所述组经修改样本包含经修改亮度样本和经修改色度样本。所述经修改色度样本包含经修改Cb样本和经修改Cr样本。在一些实例中,三个色彩分量可以不同方式命名,例如(Y,Cb,Cr)。

变换处理单元138可通过将一或多个变换应用于TU的变换块而产生用于CU的每一TU的变换系数块。变换处理单元138可将各种变换应用于TU的变换块。举例来说,变换处理单元138可将离散余弦变换(DCT)、定向变换或概念上类似的变换应用于变换块。在一些实例中,变换处理单元138不将变换应用于变换块。在此类实例中,变换块可被视作变换系数块。

量化单元140可量化系数块中的变换系数。量化过程可减少与变换系数中的一些或全部相关联的位深度。举例来说,n位变换系数可在量化期间舍入到m位变换系数,其中n大于m。量化可引入信息损失,因此经量化变换系数可具有比原始变换系数低的精度。

逆量化单元142和逆变换处理单元144可分别将逆量化和逆变换应用于系数块,以从系数块重构残差块。逆组合CCP/ACT单元146将逆CCP和ACT应用于逆变换处理单元144所产生的残差数据。举例来说,根据本发明的技术,逆组合CCP/ACT单元146可基于初始亮度样本的位深度与初始色度样本的位深度之间的差异,来将一组初始样本变换为一组经修改样本。所述组初始样本包含初始亮度样本和初始色度样本。所述初始色度样本包含初始Cb样本和初始Cr样本。所述组经修改样本包含经修改亮度样本和经修改色度样本。所述经修改色度样本包含经修改Cb样本和经修改Cr样本。

重构单元148可将经重构残差块添加到来自由预测处理单元132产生的一或多个预测性样本块的对应样本,以产生与TU相关联的经重构变换块。通过以此方式重构CU的每一TU的变换块,视频编码器20可重构CU的译码块。以此方式,视频编码器20可执行用于对视频数据进行解码的方法。

滤波器单元150可执行一或多个去块操作来减少与CU相关联的译码块中的成块假影。经解码图片缓冲器152可在过滤器单元150对经重构的译码块执行一或多个解块操作之后存储经重构的译码块。帧间预测处理单元156可使用含有经重构译码块的参考图片来对其它图片的PU执行帧间预测。

熵编码单元154可从视频编码器20的其它功能组件接收数据。举例来说,熵编码单元154可从量化单元140接收系数块,且可从预测处理单元132接收语法元素。熵编码单元154可对数据执行一或多个熵编码操作以产生经熵编码的数据。举例来说,熵编码单元154可对数据执行CABAC操作、上下文自适应可变长度译码(CAVLC)操作、可变到可变(V2V)长度译码操作、基于语法的上下文自适应二进制算术译码(SBAC)操作、概率区间分割熵(PIPE)译码操作、指数哥伦布编码操作或另一类型的熵编码操作。视频编码器20可输出包含由熵编码单元154产生的经熵编码的数据的位流。举例来说,位流可包含表示用于CU的RQT的数据。

图8是说明根据本发明的技术的视频译码器(例如视频编码器20或视频解码器30)的实例操作的流程图。图8是作为实例提供。其它实例可包含更多、更少或不同的行动。此外,在其它实例中,所述动作可呈不同次序。

在图8的实例中,视频译码器可基于初始亮度样本的位深度与初始色度样本的位深度之间的差异,将一组初始样本变换为一组经修改样本(200)。所述组初始样本包含初始亮度样本(例如rY[x][y])和初始色度样本。在一些实例中,初始色度样本包含初始Cb样本(例如rCb[x][y])和初始Cr样本(例如rCr[x][y])。所述组经修改样本包含经修改亮度样本和经修改色度样本。在一些实例中,所述经修改色度样本包含经修改Cb样本和经修改Cr样本。

在图8的实例中,为了变换初始样本,视频译码器可将位移位值(例如bShift)确定为3加0和等于初始亮度样本的位深度(例如BitDepthY)减初始色度样本的位深度(例如BitDepthC)的值中的最大者(202)。

视频译码器可将第一参数值(例如wPara0)确定为1左移所述位移位值(204)。此外,视频译码器可将第二参数值(例如wPara1)确定为用于初始Cb样本的跨分量预测参数(例如ResScalVal[1][xTbY][yTbY])左移了0和等于初始色度样本的位深度减初始亮度样本的位深度的值中的最大者(206)。视频译码器可将第三参数值确定为用于初始Cr样本的跨分量预测参数(例如ResScalVal[2][xTbY][yTbY])左移了0和等于初始色度样本的位深度减初始亮度样本的位深度的值中的最大者(208)。

视频译码器可将亮度残差系数值(例如resCoeffY)确定为第一参数值和所述第二参数值的总和,乘以初始亮度样本,加第一参数值乘以初始Cb样本(210)。视频译码器可将第一色度残差系数值(例如resCoeffCb)确定为第一中间值(例如tmp0)与第二中间值(例如tmp1)之间的差异(212)。第一中间值可等于第一参数值减第二参数值,乘以初始亮度样本,减第一参数值乘以初始Cb样本(例如tmp0=(wPara0-wPara1)*rY[x][y]-wPara0*rCb[x][y])。第二中间值等于第三参数值乘以初始亮度样本,加第一参数值乘以初始Cr样本(例如tmp1=wPara2*rY[x][y]+wPara0*rCr[x][y])。视频译码器可将第二色度残差系数值(例如resCoeffCr)确定为第一中间值和第二中间值的总和(214)。

视频译码器可将经修改亮度样本确定为亮度残差系数值右移了位移位值(例如resCoeffY>>bShift)(216)。所述视频译码器可将经修改的Cb样本确定为第一色度系数值右移了所述位移位值(例如resCoeffCb>>bShift)(218)。视频译码器可将经修改Cr样本确定为第二色度系数值右移了所述位移位值(例如resCoeffCr>>bShift)(220)。

在将初始样本变换为经修改样本之后,视频译码器可将经修改样本添加到预测性块的对应样本,以产生经重构样本(222)。在编码过程的上下文中,经重构样本可用于其它块的帧间预测。在解码过程中,可存储经重构的样本,以供输出和显示。

将认识到,取决于实例,本文中所描述的技术中的任一者的某些动作或事件可用不同序列执行,可添加、合并或全部省略(例如,实践所述技术并不需要所有的所描述动作或事件)。此外,在某些实例中,可(例如)通过多线程处理、中断处理或多个处理器同时而非依序地执行动作或事件。为清晰地说明硬件与软件的这种可互换性,上文已大体就其功能性描述了各种说明性组件、块、模块、电路和步骤。将此功能性实施为硬件还是软件取决于特定应用以及强加于整个系统的设计约束。熟练的技术人员可针对每一特定应用以不同方式来实施所描述的功能性,但这样的实施决策不应被解释为会引起脱离本发明的范围。

在一或多个实例中,所描述的功能可在硬件(例如电子硬件)、软件、固件或其任何组合中实施。如果在软件中实施,那么所述功能可作为一或多个指令或代码在计算机可读媒体上存储或传输,并且由基于硬件的处理单元来执行。如果在软件中实施,那么所述技术可至少部分地由包括程序代码的计算机可读数据存储媒体来实现,所述程序代码包含在被执行时实施上文所描述的方法中的一或多者的指令。计算机可读媒体可包含计算机可读存储媒体,其对应于例如数据存储媒体等有形媒体,或包含例如根据通信协议促进将计算机程序从一处传送到另一处的任何媒体的通信媒体。以此方式,计算机可读媒体大体上可对应于(1)非暂时性的有形计算机可读存储媒体或(2)通信媒体,例如,信号或载波。数据存储媒体可为可由一或多个计算机或一或多个处理器存取以检索用于实施本发明中描述的技术的指令、代码和/或数据结构的任何可用媒体。计算机程序产品可包含计算机可读媒体。

作为实例而非限制,此类计算机可读存储媒体可包括RAM、ROM、EEPROM、CD-ROM或其它光盘存储装置、磁盘存储装置或其它磁性存储装置、快闪存储器或可以用来存储指令或数据结构的形式的期望程序代码并且可以由计算机存取的任何其它媒体。并且,任何连接恰当地称为计算机可读媒体。举例来说,如果使用同轴缆线、光纤缆线、双绞线、数字订户线(DSL)或例如红外线、无线电和微波等无线技术从网站、服务器或其它远程源传输指令,那么同轴缆线、光纤缆线、双绞线、DSL或例如红外线、无线电和微波等无线技术包含在媒体的定义中。然而,应理解,所述计算机可读存储媒体和数据存储媒体并不包含连接、载波、信号或其它暂时性媒体,而是实际上针对非暂时性的有形存储媒体。如本文中所使用,磁盘和光盘包含压缩光盘(CD)、激光光盘、光学光盘、数字多功能光盘(DVD)、软性磁盘和蓝光光盘,其中磁盘通常以磁性方式再现数据,而光盘利用激光以光学方式再现数据。以上各项的组合也应包含在计算机可读媒体的范围内。

可由例如一或多个数字信号处理器(DSP)、通用微处理器、专用集成电路(ASIC)、现场可编程逻辑阵列(FPGA)或其它等效集成或离散逻辑电路等一或多个处理器来执行指令。通用处理器可为微处理器;但在替代方案中,处理器可为任何常规处理器、控制器、微控制器或状态机。处理器还可实施为计算装置的组合,例如,DSP与微处理器的组合、多个微处理器、一或多个微处理器结合DSP核心,或任何其它此类配置。因此,如本文中所使用的术语“处理器”可指前述结构或适合于实施本文中所描述的技术的任一其它结构中的任一者。另外,在一些方面中,本文中所描述的功能性可以在经配置用于编码和解码的专用硬件和/或软件模块内提供,或者并入在组合编解码器中。而且,所述技术可完全实施于一或多个电路或逻辑元件中。

本发明的技术可在广泛多种装置或设备中实施,包含无线手持机、集成电路(IC)或一组IC(例如,芯片组)。本发明中描述各种组件、模块或单元是为了强调经配置以执行所公开的技术的装置的功能方面,但未必需要由不同硬件单元实现。实际上,如上文所描述,各种单元可以结合合适的软件及/或固件组合在编码解码器硬件单元中,或者通过互操作硬件单元的集合来提供,所述硬件单元包含如上文所描述的一或多个处理器。

已描述了各种实例。这些和其它实例属于所附权利要求书的范围内。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号