首页> 中国专利> 用于视频译码的单一参考图片列表建构

用于视频译码的单一参考图片列表建构

摘要

本发明中描述的实例技术提供用以使用单一参考图片列表编码或解码图片的视频块的有效方式。所述单一参考图片列表可包含用于用以编码或解码所述视频块的一个或一个以上参考图片的识别符。在一些实例中,视频编码器或解码器可编码或解码使用所述单一参考图片列表从两个参考图片预测的视频块,且编码或解码使用所述相同的单一参考图片列表从一个参考图片预测的视频块。

著录项

  • 公开/公告号CN103339936A

    专利类型发明专利

  • 公开/公告日2013-10-02

    原文格式PDF

  • 申请/专利权人 高通股份有限公司;

    申请/专利号CN201280006065.6

  • 申请日2012-01-20

  • 分类号H04N7/26(20060101);H04N7/46(20060101);H04N7/50(20060101);

  • 代理机构11287 北京律盟知识产权代理有限责任公司;

  • 代理人宋献涛

  • 地址 美国加利福尼亚州

  • 入库时间 2024-02-19 20:39:13

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2017-02-08

    授权

    授权

  • 2013-11-06

    实质审查的生效 IPC(主分类):H04N7/26 申请日:20120120

    实质审查的生效

  • 2013-10-02

    公开

    公开

说明书

本申请案主张2011年1月24日申请的第61/435,496号美国临时申请案、2011年2 月22日申请的第61/445,476号美国临时申请案及2011年3月8日申请的第61/450,550 号美国临时申请案的权利,每一临时申请案的相应全部内容特此以引用的方式并入。

技术领域

本发明涉及视频译码,且更确切地说,涉及视频帧间译码技术。

背景技术

数字视频能力可并入到广泛范围的装置中,所述装置包含数字电视、数字直播系统、 无线广播系统、个人数字助理(PDA)、膝上型或桌上型计算机、数码相机、数字记录装 置、数字媒体播放器、视频游戏装置、视频游戏控制台、蜂窝式或卫星无线电电话、视 频电话会议装置等。数字视频装置实施视频压缩技术以更有效地发射和接收数字视频信 息,所述视频压缩技术例如以下各者中描述的技术:由MPEG-2、MPEG-4、ITU-T H.263、 ITU-T H.264/MPEG-4第10部分高级视频译码(AVC)定义的标准,或新兴的高效率视频 译码(HEVC)标准,和此等标准的扩展。

视频压缩技术执行空间预测和/或时间预测,以减少或移除视频序列中所固有的冗 余。对于基于块的视频译码,可将视频图片或片段分割成视频块或译码单元(CU)。使用 相对于同一图片中的相邻块的空间预测来编码帧内译码(I)片段中的视频块。帧间译码(P 或B)片段中的视频块可使用相对于同一图片中的相邻块的空间预测或相对于其它参考 图片的时间预测。视频译码装置将参考图片列表存储在存储器中以供在图片间译码期间 使用。显示时间在当前译码的图片之前的参考图片列表称为列表0,而显示时间在当前 译码的图片之后的参考图片列表称为列表1。

可使用具有指向列表0中的过往参考图片的单一运动向量的单向预测来编码P片段 中的视频块。可使用以下各者来编码B片段中的视频块:(a)具有指向列表0中的过往参 考图片的单一运动向量的单向预测,(b)具有指向列表1中的未来参考图片的单一运动向 量的单向预测,(c)或具有分别指向列表0和列表1中的过往和未来参考图片的两个运动 向量的双向预测。P和B片段分类之前已扩展到包含广义的P/B(GPB)片段,其中视频块 被编码为B片段,只是列表0和列表1可包含在相同时间方向或不同时间方向上的参考 图片。在GPB片段的一个特定实例中,列表0与列表1可相同。

经定义以指示参考图片列表信息的语法元素经编码且在经译码视频片段的片段标 头中传信到解码装置。在接收到经译码视频片段和其相关联语法元素之后,解码器随即 基于所述语法元素执行列表0和列表1的参考图片列表建构。对于B片段,每一经译码 视频块可具有相关联的语法元素(即inter_pred_idc)以指示视频块是从列表0(Pred_L0)在 向前方向上经双向预测(Bi)、经单向预测,还是从列表1(Pred_L1)在向后方向上经单向 预测。因此,用于B片段的inter_pred_idc语法元素耗用两个位来指示三个状态中的一 者:Bi、Pred_L0或Pred_L1。

发明内容

大体来说,本发明涉及用于建构单一参考图片列表的技术,视频译码器可通过所述 单一参考图片列表译码视频图片的视频块,而不管所述视频块是使用双向预测还是单向 预测来进行帧间译码的。例如,仅通过单一参考图片列表,视频译码器可使用相对于包 含于所述单一参考图片列表中的两个参考图片的双向预测来译码视频块。所述单一参考 图片列表中的参考图片在时间上可都在当前图片之前、在时间上都在当前图片之后,或 在时间上在当前图片之前和之后两者。在一些实例中,视频译码器还可译码指示视频序 列、视频图片或视频片段中的所有视频块的译码是否限于相对于仅一个参考图片的单向 预测,此可导致较不复杂的译码技术的实施。

视频图片的每一经译码视频块可具有相关联的语法元素以指示所述视频块是从单 一参考图片列表经双向预测(Bi)还是从单一参考图片列表经单向预测(Uni)。因此,所述 技术导致减少译码视频图片中的视频块的帧间预测状态的成本,而不管所述视频块是经 双向预测还是单向预测。例如,因为可能仅需要单一参考图片列表来对双向预测和单向 预测视频块两者进行帧间译码,所以可能不需要建构多个参考图片列表(例如,常规列表 0和列表1),此可减少所需的计算资源的量。此外,以此方式,视频译码器可能不需要 指定单向预测视频块是相对于列表0还是列表1来预测的(例如,常规语法元素Pred_L0 和Pred_L1),此可减少需要传信的语法元素的量,因为可能仅需要单一参考图片列表而 不需要额外参考图片列表来对单向预测视频块进行帧间译码。

在一个实例中,本发明描述译码视频数据的方法,所述方法包含通过视频译码器建 构单一参考图片列表,所述单一参考图片列表包含用于来自存储经解码参考图片的存储 器的一个或一个以上参考图片中的每一者的识别符。所述方法还包含通过所述视频译码 器使用相对于在所述单一参考图片列表中所识别的参考图片中的两者的双向预测和相 对于在所述单一参考图片列表中所识别的所述参考图片中的一者的单向预测中的一者 来译码当前图片的视频块。

在另一实例中,本发明描述一种视频译码装置,其包含可操作以存储经译码参考图 片的存储器。所述视频译码装置还包含可操作以建构单一参考图片列表的视频译码器, 所述单一参考图片列表包含存储于所述存储器中的一个或一个以上参考图片中的每一 者的识别符。所述视频译码器还可操作以使用相对于在所述单一参考图片列表中所识别 的参考图片中的两者的双向预测和相对于在所述单一参考图片列表中所识别的所述参 考图片中的一者的单向预测中的一者来译码当前图片的视频块。

在另一实例中,本发明描述一种视频译码装置,所述视频译码装置包含用于建构单 一参考图片列表的装置,所述单一参考图片列表包含用于来自存储经解码参考图片的存 储器的一个或一个以上参考图片中的每一者的识别符。所述视频译码装置还包含用于使 用相对于在所述单一参考图片列表中所识别的参考图片中的两者的双向预测和相对于 在所述单一参考图片列表中所识别的所述参考图片中的一者的单向预测中的一者来译 码当前图片的视频块的装置。

在另一实例中,本发明描述一种包括用于译码视频数据的指令的计算机可读存储媒 体,所述指令在视频译码器上执行之后随即致使所述视频译码器建构包含用于来自存储 经解码参考图片的存储器的一个或一个以上参考图片中的每一者的识别符的单一参考 图片列表,及使用相对于在所述单一参考图片列表中所识别的参考图片中的两者的双向 预测和相对于在所述单一参考图片列表中所识别的所述参考图片中的一者的单向预测 中的一者来译码当前图片的视频块。

一个或一个以上实例的细节陈述于附图及以下描述中。其它特征、目标及优势将从 描述及附图和从权利要求书中显而易见。

附图说明

图1是说明实例视频编码和解码系统的框图,所述视频编码和解码系统可利用用于 有效地针对视频块的双向预测和单向预测两者来译码和建构单一参考图片列表的技术。

图2是说明包含按显示次序的视频图片的实例视频序列的概念图。

图3是说明可实施根据本发明的一个或一个以上方面的技术的实例视频编码器的框 图。

图4是说明可实施根据本发明的一个或一个以上方面的技术的实例视频解码器的框 图。

图5是说明根据本发明的一个或一个以上方面的译码视频块的实例操作的流程图。

图6和7是说明用于实施根据本发明的一个或一个以上方面的用以建构单一参考图 片列表的默认建构技术的实例操作的流程图。

具体实施方式

本发明描述用以使用相对于仅单一参考图片列表中的参考图片的双向预测或单向 预测来译码(例如,解码或编码)片段的视频块的实例技术。举例来说,视频译码器可使 用具有指向包含于相同单一参考图片列表中的一个或两个参考图片的两个运动向量的 双向预测来译码B片段的视频块。在一些实例中,所述两个运动向量中的每一者可指向 相同参考图片。在一些其它实例中,所述两个运动向量中的每一者可指向两个不同参考 图片。为实现简洁的目的,描述其中两个运动向量指向两个不同参考图片的实例中的许 多者;然而,本发明的方面不限于此。

视频译码器可使用具有指向包含于单一参考图片列表中的一个参考图片的一个运 动向量的单向预测来译码B片段或P片段的视频块。类似地,视频译码器可使用包含于 单一参考图片列表中的一个或两个参考图片来译码广义P/B(GPB)片段的视频块。

根据本发明中描述的一个或一个以上实例技术,当视频块是相对于两个运动向量进 行译码(例如,相对于一个或两个参考图片的双向预测)时或当视频块是相对于一个运动 向量进行译码(例如,通过一个参考图片进行单向预测)时,视频译码器可仅利用单一参 考图片列表来译码所述视频块,而不管所述视频块属于B片段、P片段还是GPB片段。 换句话说,视频译码器(例如,视频编码器或视频解码器)可建构单一参考列表以译码(例 如,编码或解码)所有类型的帧间译码视频片段的视频块。根据这些实例技术中的一者或 一者以上,不需要其它参考图片列表来译码所述视频块,而不管所述视频块是经双向预 测还是单向预测(例如,双向预测或单向预测的B片段、单向预测的P片段,或双向预 测或单向预测的GPB片段)。

术语“片段”在用于本发明中时是指图片的部分,但可涵盖整个图片。术语“图 片”在用于本发明中时是指视频内容的例项。举例来说,连续图片的快速显示导致流畅 的视频回放。在一些部分中,术语“图片”可与术语“帧”互换地使用。

单一参考图片列表包含识别用以译码片段的视频块的一个或一个以上参考图片的 识别符。这些参考图片可存储在视频译码装置的存储器中。所述一个或一个以上参考图 片的识别符可为指派给所述参考图片的图片次序计数(POC)值和/或图片编号值。POC值 可指示视频序列或图片群组(GOP)中的图片的显示次序。图片编号值可指示视频序列或 GOP中的图片的译码次序。作为一个实例,相较于另一图片具有较小POC值的图片较 早显示,但未必是较早译码的。相较于另一图片具有较小图片编号值的图片较早译码, 但未必较早显示。参考图片可基于参考图片距当前图片的时间距离而组织于单一参考图 片列表中。时间距离可定义为例如给定参考图片与当前正编码的图片的POC值和/或图 片编号值之间的差。

作为一个实例,视频译码器可利用单一参考图片列表来预测P片段的视频块或单向 预测相对于仅一个参考图片译码的B片段或GPB片段的视频块。视频译码器还可利用 相同单一参考图片列表来双向预测相对于两个不同参考图片译码的B片段。在此情况 下,两个不同参考图片两者皆在所述单一参考图片列表中识别。此可增加视频译码器处 理P片段、B片段和/或GPB片段的方式的类似性,由此增加视频译码器的处理效率。 换句话说,当视频块是相对于一个或两个参考图片进行译码时,视频译码器可能不需要 建构一个以上参考图片列表来译码任何类型的帧间译码片段的视频块。

在本发明中描述的实例技术中的一者或一者以上中,视频译码器可能不需要指示或 以其它方式辨识(例如,确定)帧内译码片段是P片段、B片段或甚至是GPB片段,因为 这些片段类型的视频块可各自用在仅一个参考图片列表(例如,单一参考图片列表)中识 别的参考图片来译码。此可导致需要译码的信息量的减少。例如,视频编码器可能不需 要编码指示帧间译码片段的特定类型的语法信息,且视频解码器可能不需要解码指示帧 间译码片段的特定类型的信息,因为所有类型帧间译码片段中的视频块都是相对于相同 单一参考图片列表进行译码的,且还是相对于相同单一参考图片列表进行译码的,而不 管用以预测视频块的参考图片的数目是多少。

在一些实例中,视频解码器可实施用以建构所述单一参考图片列表的默认建构技 术。用以建构单一参考图片列表的默认建构技术是指视频解码器建构单一参考图片列表 的一组定义的方式。大体来说,视频解码器可实施用以建构单一参考图片列表的默认建 构技术,而不接收由视频编码器传信的译码指令。

用以建构单一参考图片列表的默认建构技术可大体基于用以译码当前图片的视频 块的参考图片与当前图片之间的时间距离。作为一个实例,参考图片与当前图片之间的 时间距离可为呈现时间的差。如上所述,每一图片可被指派指示显示(即,呈现)图片的 次序的图片次序计数(POC)值,且呈现时间的差可为参考图片与当前图片的POC值的差。

作为另一实例,参考图片与当前图片之间的时间距离可为译码时间的差。如上所述, 每一图片可被指派指示译码(例如,解码)图片的次序的图片编号值,且译码时间的差可 为参考图片与当前图片的图片编号值的差。为说明和清晰目的,在时间距离为呈现时间 的差的上下文中描述本发明的技术。然而,本发明的方面不限于此,且时间距离可为译 码时间(例如,解码时间)的差。

作为默认建构技术的部分,视频解码器可包含基于参考图片到当前图片的时间距离 的单一参考图片列表中的参考图片的识别符。所述参考图片的识别符可为参考图片的 POC值或图片编号值。在两个参考图片与当前图片之间的时间距离相等的情况下,默认 建构技术可定义所述两个参考图片中的哪一者应在另一参考图片之前包含于单一参考 图片列表中,如下文更详细描述。

用以建构单一参考图片列表的默认建构技术可进一步减少被译码的信息量。举例来 说,通过所述默认建构技术,视频解码器可能不需要解码指示建构单一参考图片列表的 方式的信息。确切地说,视频解码器可经编程或以其它方式经配置以实施默认建构技术, 所述默认建构技术可能并不依赖于接收明显地指示如何建构单一参考图片列表的信息, 例如将添加到单一参考图片列表的每一条目中的每一参考图片。以此方式,视频编码器 可能不需要传信告知视频解码器所述视频解码器建构单一参考图片列表所应采取的方 式的语法信息。

为减少被译码的信息量,在一些实例中,视频编码器可编码指示图片的片段、整个 图片还是一组图片被限于单向预测式译码的语法元素。单向预测式译码意指相对于仅一 个参考图片的译码。如更详细描述的,指示译码被限于单向预测式译码的语法元素称为 uni_pred_only语法元素。

作为一个实例,帧间译码片段的每一视频块可相对于一个参考图片或两个参考图片 来译码。当给定片段中的所有视频块是相对于一个参考图片进行译码时,视频编码器可 编码uni_pred_only语法元素以指示片段(不管片段是P片段、B片段还是GPB片段)是 相对于仅一个参考图片进行译码。视频解码器可解码uni_pred_only语法元素以辨识(例 如,确定)当前片段中的所有视频块是相对于仅一个参考图片进行编码。

在此实例中,对于当前片段中的每一视频块,视频解码器可能期望解码指示单一参 考图片列表中被用来编码视频块的单一参考图片的语法元素,且将未必需要等待指示是 否使用了任何其它参考图片来编码视频块的额外语法元素。以此方式,指示译码被限于 单向预测式译码的语法元素可进一步促进视频解码器处理所有帧间译码片段的方式的 类似性,且进一步促进视频解码器的计算效率(例如,降低与解码片段相关联的复杂性)。

视频编码器可在附加到每一片段的标头中传信此新语法元素(例如,uni_pred_only 语法元素),所述语法元素指示预测是否限于单向预测式译码。尽管描述为嵌入于片段标 头中,但此新语法元素可嵌入于单独传信的参数集中,例如图片参数集(PPS)或序列参数 集(SPS)。

当译码限于单向预测式译码时,视频译码器可译码uni_pred_only语法元素,用等于 1的值指示“真”,其意指片段中的视频块仅经单向预测。否则,视频译码器可译码 uni_pred_only语法元素,用等于0的值指示“假”,其意指片段中的视频块可经双向预 测或单向预测,或根本没有译码uni_pred_only语法元素。

在译码并不限于单向预测式译码的情况下,视频编码器还可传信指示片段的块使用 相对于一个或两个参考图片的双向预测进行编码的百分比的信息。在一些实例中,除了 或替代传信指示片段的块使用双向预测进行编码的百分比的信息,视频编码器还可传信 指示片段内的区域使用双向预测进行编码的百分比的信息。指示经双向预测的片段块百 分比或经双向预测的片段区域百分比的信息可嵌入于片段标头中、单独嵌入于PPS或 SPS中,或嵌入于层级定义中,使得符合较低层级的解码器可具有使用双向预测的译码 单元(CU)的较少百分比,因此需要较少解码计算。

图1是说明根据本发明的实例的实例视频编码和解码系统10的框图,所述视频编 码和解码系统可利用用于有效地针对视频块的双向预测和单向预测两者来译码和建构 单一参考图片列表的技术。大体来说,单一参考图片列表可替代地称为单一参考帧列表。 如图1中所示,系统10包含源装置12,所述源装置12产生经编码视频以供由目的地装 置14解码。源装置12和目的地装置14可各自为视频译码装置的实例。源装置12可经 由通信信道16将经编码视频发射到目的地装置14,或可将经编码视频存储在存储媒体 17或文件服务器19上,使得经编码视频可由目的地装置14按需要加以存取。

源装置12和目的地装置14可包括广泛多种装置中的任一者,包含桌上型计算机、 笔记本(即,膝上型)计算机、平板计算机、机顶盒、例如所谓的智能电话等电话手持机、 电视、相机、显示装置、数字媒体播放器、视频游戏控制台等。在许多情况下,此些装 置可经配备用于无线通信。因此,通信信道16可包括无线信道、有线信道,或适于发 射经编码视频数据的无线与有线信道的组合。类似地,文件服务器19可由目的地装置 14经由任何标准数据连接(包含因特网连接)加以存取。此可包含无线信道(例如,Wi-Fi 连接)、有线连接(例如,DSL、电缆调制解调器,等),或适于存取存储在文件服务器上 的经编码视频数据的无线信道与有线信道两者的组合。

根据本发明的实例的用于建构单一参考图片列表以译码任何类型片段的视频块的 技术可应用于视频译码以支持多种多媒体应用中的任一者,所述多媒体应用例如空中电 视广播、有线电视发射、卫星电视发射、流式视频发射(例如,经由因特网)、供存储在 数据存储媒体上的数字视频的编码、存储在数据存储媒体上的数字视频的解码,或其它 应用。在一些实例中,系统10可经配置以支持单向或双向视频发射以支持例如视频流 式发射、视频回放、视频广播和/或视频电话等应用。

在图1的实例中,源装置12包含视频源18、视频编码器20、调制器/解调器(调制 解调器)22和输出接口24。在源装置12中,视频源18可包含例如以下各者的源:视频 俘获装置,例如摄像机;含有先前俘获的视频的视频存档;用以从视频内容提供者接收 视频的视频馈送接口;和/或用于产生计算机图形数据作为源视频的计算机图形系统,或 此些源的组合。作为一个实例,如果视频源18为摄像机,那么源装置12和目的地装置 14可形成所谓的相机电话或视频电话。然而,本发明中所描述的技术可大体适用于视频 译码,且可应用于无线和/或有线应用。

可由视频编码器20来编码经俘获的、经预先俘获的或计算机产生的视频。经编码 的视频信息可由调制解调器22根据通信标准(例如,无线通信协议)来调制,且经由输出 接口24而发射到目的地装置14。调制解调器22可包含各种混频器、滤波器、放大器或 经设计以用于信号调制的其它组件。输出接口24可包含经设计以用于发射数据的电路, 包含放大器、滤波器和一个或一个以上天线。

由视频编码器20编码的经俘获、经预先俘获或计算机产生的视频还可存储在存储 媒体17或文件服务器19上以供稍后消费。存储媒体17可包含蓝光光盘、DVD、CD-ROM、 闪存存储器,或用于存储经编码视频的任何其它适当数字存储媒体。存储在存储媒体17 上的经编码视频可接着由目的地装置14存取以解码并回放。

文件服务器19可为能够存储经编码视频并将所述经编码视频发射到目的地装置14 的任何类型的服务器。实例文件服务器包含web服务器(例如,用于网页)、FTP服务器、 网络附接存储(NAS)装置、本地磁盘驱动器,或能够存储经编码视频数据并将其发射到 目的地装置的任何其它类型的装置。经编码视频数据从文件服务器19的发射可为流式 发射、下载发射,或两者的组合。文件服务器19可由目的地装置14经由任何标准数据 连接(包含因特网连接)加以存取。此可包含无线信道(例如,Wi-Fi连接)、有线连接(例如, DSL、电缆调制解调器、以太网、USB,等),或适于存取存储在文件服务器上的经编码 视频数据的无线信道与有线信道两者的组合。

在图1的实例中,目的地装置14包含输入接口26、调制解调器28、视频解码器30 和显示装置32。目的地装置14的输入接口26经由信道16接收信息,且调制解调器28 将所述信息解调以产生经解调的位流用于视频解码器30。经解调的位流可包含由视频编 码器20产生以供由视频解码器30用于解码视频数据的多种语法信息。此语法还可与存 储在存储媒体17或文件服务器19上的经编码视频数据包含在一起。作为一个实例,所 述语法可与经编码视频数据嵌入在一起,但不应认为本发明的方面限于此要求。由视频 编码器20界定的语法信息(其也由视频解码器30使用)可包含描述预测单元(PU)、译码 单元(CU)或经译码视频的其它单元(例如视频片段、视频图片,和视频序列或图片群组 (GOP))的特性和/或处理的语法元素。视频编码器20和视频解码器30中的每一者可形成 能够编码或解码视频数据的相应编码器-解码器(编解码器(CODEC))的部分。

显示装置32可与目的地装置14集成或在目的地装置14外部。在一些实例中,目 的地装置14可包含集成式显示装置,且还经配置以与外部显示装置介接。在其它实例 中,目的地装置14可为显示装置。大体来说,显示装置32向用户显示经解码的视频数 据,且可包括多种显示装置中的任一者,例如液晶显示器(LCD)、等离子体显示器、有 机发光二极管(OLED)显示器或另一类型的显示装置。

在图1的实例中,通信信道16可包含任何无线或有线通信媒体,例如,射频(RF) 频谱或一个或一个以上物理传输线,或无线和有线媒体的任何组合。通信信道16可形 成例如局域网、广域网或例如因特网等全球网络的基于包的网络的部分。通信信道16 一般表示用于将视频数据从源装置12发射到目的地装置14的任何合适的通信媒体或不 同通信媒体的集合,包含有线或无线媒体的任何合适组合。通信信道16可包含可用于 促进从源装置12到目的装置14的通信的路由器、交换器、基站或任何其它设备。

视频编码器20和视频解码器30可根据视频压缩标准来操作,所述视频压缩标准例 如新兴的高效率视频译码(HEVC)标准或ITU-T H.264标准(替代地称为MPEG-4,第10 部分,高级视频译码(AVC))。HEVC标准当前正由ITU-T/ISO/IEC视频译码联合协作小 组(JCT-VC)进行开发。然而,本发明的技术不限于任何特定译码标准。其它实例包含 MPEG-2和ITU-T H.263。

尽管图1中未展示,但在一些方面中,视频编码器20及视频解码器30可各自与音 频编码器及解码器集成,且可包括适当的多路复用器-多路分用器(MUX-DEMUX)单元或 其它硬件及软件,以处理对共同数据流或单独数据流中的音频与视频两者的编码。如果 适用,MUX-DEMUX单元可符合ITU H.223多路复用器协议或例如用户数据报协议(UDP) 等其它协议。

视频编码器20和视频解码器30各自可实施为例如一个或一个以上微处理器、数字 信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)、离散逻辑、软件、 硬件、固件或其任何组合的多种合适编码器电路中的任一者。当所述技术部分地以软件 实施时,装置可将用于所述软件的指令存储在适当的非暂时计算机可读媒体中,且使用 一个或一个以上处理器执行硬件中的指令以执行本发明的技术。

视频编码器20和视频解码器30中的每一者可包含在一个或一个以上编码器或解码 器中,其任一者可作为经组合的编码器/解码器(CODEC)的部分集成在相应装置中。在一 些情况下,视频编码器20和视频解码器30可统称为译码信息(例如,图片和语法元素) 的视频译码器。当视频译码器对应于视频编码器20时,信息的译码可指编码。当视频 译码器对应于视频解码器30时,信息的译码可指解码。

此外,本发明中描述的技术可指视频编码器20传信例如语法元素等信息。当视频 编码器20传信信息时,本发明的技术大体是指视频编码器20提供信息的任何方式。举 例来说,当视频编码器20将语法元素传信到视频解码器30时,其可意指视频编码器20 经由输出接口24和通信信道16将语法元素发射到视频解码器30,或视频编码器20经 由输出接口24将语法元素存储在存储媒体17和/或文件服务器19上以供最终由视频解 码器30接收。以此方式,从视频编码器20传信到视频解码器30不应被解释为要求从 视频编码器20的发射立即被视频解码器30接收到,但此可为可能的。确切地说,从视 频编码器20到视频解码器30的传信应解释为视频编码器20借以提供信息以供最终由 视频解码器30接收的任何技术。

在本发明的实例中,视频编码器20可使用帧内预测或帧间预测来编码视频数据的 图片的一部分(称为视频块)。视频块可为片段的部分,片段可为图片的一部分。为说明 的目的,大体相对于片段的视频块来描述本发明中描述的实例技术。例如,片段的经帧 内预测视频块意指片段内的视频块是经帧内预测(例如,相对于片段或包含所述片段的图 片内的相邻块进行预测)。类似地,片段的经帧间预测视频块意指片段内的视频块是经帧 间预测(例如,相对于参考图片的一个或两个视频块进行预测)。

对于称为帧内译码视频块的帧内预测视频块,视频编码器20相对于图片内的其它 部分来预测并编码视频块。视频解码器30可解码帧内译码视频块而不参考视频数据的 任何其它图片。对于称为帧间译码视频块的帧间预测视频块,视频编码器20相对于一 个或两个其它图片内的一个或两个部分来预测并编码视频块。这些其它图片称为参考图 片,其也可是相对于又其它参考图片预测的图片,或帧内预测图片。

片段内的帧间预测视频块可包含相对于指向一个参考图片的一个运动向量或指向 两个不同参考图片的两个运动向量预测的视频块。当视频块是相对于指向一个参考图片 的一个运动向量进行预测时,认为所述视频块是经单向预测。当视频块是相对于指向两 个不同参考图片的两个运动向量进行预测时,认为所述视频块是经双向预测。在一些实 例中,运动向量还可包含参考图片信息(例如,指示运动向量指向哪个参考图片的信息)。 然而,本发明的方面不限于此。

举例来说,P片段可包含相对于按显示次序在时间上先于包含所述片段的图片而出 现的一个参考图片而预测的视频块。B片段可包含相对于按显示次序在时间上先于包含 所述片段的图片而出现的一个参考图片、相对于按显示次序在时间上晚于包含所述片段 的图片而出现的一个参考图片,或相对于各自按显示次序在时间上先于包含所述片段的 图片和在时间上晚于包含所述片段的图片的一个时间在先参考图片和一个时间在后参 考图片而预测的视频块。

在一些实例中,P片段和B片段分类扩展到广义的P/B(GPB)片段。在GPB片段中, 视频块编码为B片段。在一些实例中,对于从两个参考图片预测的GPB片段的视频块, 所述参考图片两者都可按显示次序在时间上先于包含所述片段的图片,或按显示次序在 时间上晚于包含所述片段的图片。类似于B片段,对于从两个参考图片预测的GPB片 段的视频块,一个参考图片可按显示次序在时间上晚于包含所述片段的图片,且另一参 考图片可按显示次序在时间上先于包含所述片段的图片。

例如,单向预测视频块为从指向一个参考图片的一个运动向量预测的视频块,且可 为P片段、B片段或GPB片段的单向预测视频块。双向预测视频块为从各自指向两个不 同参考图片的两个运动向量预测的视频块,且可为B片段或GPB片段的双向预测视频 块。如更详细描述的,视频编码器20和视频解码器30可利用单一参考图片列表(且在一 些实例中,仅利用所述单一参考图片列表)来编码或解码单向预测与双向预测视频块两 者,而不管视频块是P片段、B片段还是GPB片段的部分。

举例来说,对于帧间预测视频块,视频编码器20可被看作建构参考图片列表,其 指示视频编码器20利用哪些参考图片来预测当前视频块。视频解码器30也可建构参考 图片列表,其指示视频编码器20利用哪些参考图片来编码当前视频块,以使得视频解 码器30可基于由视频编码器20利用的参考图片来解码当前视频块。

如更详细描述的,本发明中描述的实例技术描述视频解码器30建构单一参考图片 列表的方式,其指示视频编码器20利用哪些参考图片来预测视频块,而不管视频编码 器20预测视频块的方式。视频解码器30可利用此单一参考图片列表来解码帧间预测的 视频块,而不管视频块被帧间预测的方式。在一些实例中,视频编码器20可使用其自 身的单一参考图片列表来预测视频块,所述单一参考图片列表指示视频编码器20应利 用哪些参考图片来预测视频块。

用于任何类型片段的视频块的实例包含译码单元(CU)、预测单元(PU),或变换单元 (TU)。为预测当前视频块,视频编码器20识别包含与当前视频块类似的内容的一个或 两个参考图片的块。视频编码器20确定每一经识别块的运动向量,所述运动向量识别 当前视频块的块的位置与参考图片中的每一者的匹配块的位置的差。

在一些实例中,视频编码器20和视频解码器30可各自建构单一参考图片列表,所 述单一参考图片列表指示利用哪些参考图片来预测P片段、B片段或GPB片段的视频块。 或者,仅一者可建构单一参考图片列表,例如视频解码器30而非视频编码器20。相对 于视频解码器30建构单一参考图片列表来描述各种实例,应认识到,视频编码器20也 可以类似方式建构单一参考图片列表。然而,在本发明的一些部分中,从视频编码器20 的角度描述单一参考图片列表的建构以辅助理解。

单一参考图片列表中的参考图片的识别符可为指派给所述参考图片的图片次序计 数(POC)值和/或图片编号值。POC值可指示视频序列或图片群组(GOP)中的图片的显示 次序。图片编号值可指示视频序列或GOP中的图片的译码次序。作为一个实例,相较 于另一图片具有较小POC值的图片较早显示,但未必是较早译码的。相较于另一图片 具有较小图片编号值的图片较早译码,但未必较早显示。

举例来说,视频解码器30可建构其单一参考图片列表,所述单一参考图片列表可 指示将用来解码片段的视频块的参考图片(例如,具有POC值或图片编号值)。在一个或 一个以上实例技术中,视频解码器30可使用此单一参考图片列表来解码视频块,而不 管视频块被预测的方式,例如,不管视频块是经单向预测还是双向预测。

此外,视频解码器30可使用单一参考图片列表来解码视频块,而不管用以编码视 频块的参考图片的数目。例如,假定P片段的视频块是相对于一个参考图片预测的,那 么在此实例中,单一参考图片列表包含用以预测P片段的视频块的参考图片的识别符。 假定GPB片段的视频块是相对于两个不同参考图片预测的,那么在此实例中,单一参 考图片列表包含用以预测P片段的视频块的参考图片的识别符,且包含用以预测GPB 片段的视频块的两个参考图片的识别符。

此单一参考图片列表可进一步促进不同片段类型之间的一般化,因为视频解码器30 利用所述单一参考图片列表来解码片段的视频块,而不管所述片段的视频块被预测的方 式。举例来说,常规技术需要建构第一参考图片列表(称为列表0)及建构第二参考图片 列表(称为列表1)。在这些常规技术中,对于P片段的视频块,视频解码器30将解码将 会把视频块识别为P片段的视频块的语法信息。视频解码器30将接着解码将指示用以 预测P片段的视频块的参考图片的识别符位于列表0中何处的语法信息。

在这些常规技术中,对于B片段的视频块,视频解码器30将解码将会把视频块识 别为B片段的视频块的语法信息。视频解码器30将接着解码将指示视频块是从列表0 中所识别的仅一个参考图片预测、从列表1中所识别的仅一个参考图片预测还是从两个 参考图片(其中一个图片是在列表0中识别,且另一图片是在列表1中识别)预测的语法 信息。视频解码器30将接着解码将指示用以预测B片段的视频块的参考图片的识别符 位于列表0、列表1或列表0与列表1两者中何处的语法信息。

在常规技术中,对于GPB片段的视频块,视频解码器30将建构列表1和列表0。 然而,在一些特殊情境中,视频解码器30将解码指示列表1与列表0对于特定GPB片 段是相同的语法信息。对于这些情境,视频解码器30将建构列表0,且建立列表0的副 本以建立列表1,或反之亦然。类似于B片段,甚至对于这些情境,在常规技术中,视 频解码器30也将解码将指示GPB片段的视频块是从列表0中所识别的仅一个参考图片 预测、从列表1中所识别的仅一个参考图片预测还是从两个参考图片(其中一个图片是在 列表0中识别,且另一图片是在列表1中识别)预测的语法信息。视频解码器30将接着 解码将指示用以预测GPB片段的视频块的参考图片的识别符位于列表0、列表1或列表 0与列表1两者中何处的语法信息。

在本发明中描述的实例实施方案中,视频解码器30可能不需要依赖于第一和第二 参考图片列表(例如,列表0和列表1)来解码P片段、B片段或GPB片段的视频块,而 是可利用相同的单一参考图片列表来解码任一片段类型的视频块。例如,在本发明中描 述的实例实施方案中,如果视频块是相对于一个参考图片进行编码,那么视频解码器30 可解码指示参考图片的识别符位于单一参考图片列表中何处的语法信息。同样,在本发 明中描述的实例实施方案中,如果视频块是相对于两个参考图片(例如,第一参考图片和 第二参考图片)进行编码,那么视频解码器30可解码指示第一参考图片的识别符位于单 一参考图片列表中何处的语法信息,且可解码指示第二参考图片的识别符位于相同的单 一参考图片列表中何处的语法信息。

在一些实例中,第一与第二参考图片可为相同的参考图片。在这些实例中,视频解 码器30可仍解码指示第一参考图片的识别符位于单一参考图片列表中何处的语法信息, 且可解码指示第二参考图片的识别符位于相同的单一参考图片列表中何处的语法信息。 然而,在此实例中,指示第一与第二参考图片的识别符位于单一参考图片列表中何处的 经解码语法信息可为相同语法信息。

同样,在本发明中描述的一个或一个以上实例中,视频编码器20可能不需要传信 关于(例如,指示)视频块是用于P片段、B片段还是GPB片段的信息,因为视频解码器 30可能仅建构单一参考图片列表来解码P片段、B片段或GPB片段的视频块。换句话 说,在一些实例中,片段类型的指示可能关系不大,因为用以解码任何片段类型的视频 块的参考图片列表是相同的单一参考图片列表,且在一些实例中,为仅有的单一参考图 片列表。以此方式,本发明中描述的实例实施方案可减少由视频编码器20产生的位流 中的语法元素的量,且减少由视频解码器30接收的位流中的语法元素的量。

为进一步减少被译码(例如,编码或解码)的语法元素的量,在一些实例中,视频解 码器30可实施用以建构单一参考图片列表的默认建构技术。例如,用以建构单一参考 图片列表的默认建构技术可能不需要视频解码器30接收指示视频解码器30建构单一参 考图片列表所应采取的方式的语法元素。在这些实例中,视频编码器20可能不编码告 知视频解码器30视频解码器30建构单一参考图片列表所应采取的方式的语法元素,由 此进一步减少需要传信的语法元素的量。

用以建构单一参考图片列表的默认建构技术是指视频解码器30建构单一参考图片 列表的一组定义的方式。可能存在默认建构技术的各种实例实施方案,如下文更详细描 述。在任何情况下,视频编码器20可利用实例实施方案中的至少一者来指示哪些参考 图片属于单一参考图片列表内。视频解码器30可接着利用视频编码器20用以指示哪些 参考图片属于单一参考图片列表内的相同实例实施方案来建构单一参考图片列表以用 于解码任何片段类型的视频块。

用以建构单一参考图片列表的默认建构技术可大体基于用以预测当前图片的视频 块的参考图片与当前图片之间的时间距离。这些参考图片可能先前已经解码。举例来说, 视频解码器30可通过先前经解码的参考图片来解码视频块。视频解码器30可将先前经 解码的参考图片存储在内部缓冲器或存储器中。

作为一个实例,参考图片与当前图片(例如,包含经预测视频块的图片)之间的时间 距离可为呈现时间的差。如上所述,每一图片可被指派有指示图片被显示(即,呈现)的 次序的图片次序计数(POC)值。在此实例中,两个图片之间的时间距离可为两个图片的 POC值的差的绝对值。例如,按显示次序紧接在当前图片之前的参考图片与当前图片之 间的时间距离为1,因为参考图片与当前图片的POC值的差的绝对值将为1。作为另一 实例,按显示次序紧跟在当前图片的下一图片之后的参考图片与当前图片之间的时间距 离为2,因为参考图片与当前图片的POC值的差的绝对值将为2。

在用以建构单一参考图片列表的默认建构技术的一个实例中,视频解码器30可将 参考图片中的每一者的识别符基于其到当前图片的时间距离按升序包含于单一参考图 片列表中。举例来说,较之于在时间上距当前图片较远(例如,POC值的差较大)的参考 图片的识别符,视频解码器30可将在时间上较接近于当前图片(例如,POC值的差较小) 的参考图片的识别符放置在单一参考图片列表中的较前位置。在此实例中,参考图片在 时间上先于还是在时间上晚于当前图片可能关系不大。同样,在此实例中,参考图片的 识别符可为参考图片的图片编号值或POC值。

在用以建构单一参考图片列表的默认建构技术的另一实例中,视频解码器30可将 参考图片中的每一者的识别符基于其到当前图片的时间距离按降序包含于单一参考图 片列表中。举例来说,较之于在时间上较接近于当前图片的参考图片的识别符,视频解 码器30可将在时间上距当前图片较远的参考图片的识别符放置在单一参考图片列表中 的较前位置。类似于上文,在此实例中,参考图片在时间上先于还是在时间上晚于当前 图片可能关系不大。同样,类似于上文,在此选项中,参考图片的识别符可为参考图片 的图片编号值或POC值。

在一些情况下,有可能两个参考图片与当前图片之间的时间距离相同。举例来说, 第一参考图片可为紧接在当前图片之前的图片,而第二参考图片可为紧跟在当前图片之 后的图片。在此实例中,当前图片与第一参考图片之间的时间距离同当前图片与第二参 考图片之间的时间距离相同。

在两个参考图片与当前图片之间的时间距离相同的情况下,视频解码器30可将具 有较早呈现时间(例如,较小POC值)的参考图片的识别符包含在单一参考图片列表中的 较前位置,且将具有较晚呈现时间(例如,较大POC值)的参考图片的识别符包含在单一 参考图片列表中的较后位置。作为一替代实例,视频解码器30可将具有较晚呈现时间(例 如,较大POC值)的参考图片的识别符包含在单一参考图片列表中的较前位置,且将具 有较早呈现时间(例如,较小POC值)的参考图片的识别符包含在单一参考图片列表中的 较后位置。

在任一实例中,参考图片的识别符可为POC值或图片编号值。例如,视频解码器 30可利用POC值来确定首先将哪一参考图片包含在单一参考图片列表中。然而,视频 解码器30可包含POC值或图片编号值作为单一参考图片列表中的参考图片的识别符。

尽管以上实例将时间距离描述为随呈现次序而变,但本发明的方面不限于此。在替 代实例中,时间距离可随译码次序而变。再次,译码次序可通过图片编号值来识别。在 这些替代实例中,视频解码器30可基于当前图片与参考图片的图片编号值之间的差的 绝对值来确定时间距离。视频解码器30可如上所述按升序或降序但基于图片编号值而 非POC值的差来列出参考图片的识别符。在此实例中,参考图片的识别符可为图片编 号值或POC值。

同样,在这些替代实例中,在两个参考图片与当前图片之间的图片编号值的差相同 的情况下,视频解码器30可将一个参考图片比另一参考图片放置在单一参考图片中的 较前位置,如上文实例中所描述。在此情境下,视频解码器30可基于图片编号值来将 参考图片放置在单一参考图片列表中。为简洁的目的,在时间距离是基于POC值的上 下文中描述本发明的技术,但应理解,本发明的技术不限于此。

描述以上实例是仅用于说明目的。大体来说,视频解码器30可采用任何用以建构 单一参考图片列表的默认建构技术,视频解码器30可通过所述默认建构技术解码任何 片段的视频块,而不管用以编码所述视频块的参考图片的数目。本发明的方面不应解释 为限于上文所描述的实例。

所述默认建构技术还可包含重新排序步骤,但可能并非在默认建构技术的每一实例 中都需要所述重新排序步骤。在重新排序之前,可将单一参考图片列表看作已初始化图 片列表。在重新排序之后,单一参考图片列表可能包含参考图片的相同识别符;然而, 参考图片的这些识别符在单一参考图片列表中的位置可能已改变。

举例来说,可将单一参考图片列表看作具有多个位置的阵列。所述阵列内的每一位 置可用其索引值来识别,且可存储参考图片中的一者的识别符。通过重新排序,视频解 码器30可修改参考图片的识别符在单一参考图片列表内的位置,使得单一参考图片列 表的至少一个索引值与参考图片的不同识别符相关联。

在一些实例中,视频编码器20可将片段或整个图片的视频块的预测限于单向预测 (例如,相对于仅一个参考图片的预测)。此种约束可称为单向预测式译码以指示对于任 何片段类型的视频块将仅存在一个运动向量。举例来说,通过此些约束,可能不会通过 一个以上参考图片来编码B片段和GPB片段的视频块。大体来说,与编码和解码从指 向一个参考图片的仅一个运动向量预测的片段的视频块相比,编码和解码相对于指向一 个或两个参考图片的两个运动向量而预测的片段的视频块可能更为复杂。举例来说,与 单向预测片段相比,补偿复杂性对于双向预测片段可能加倍。

视频编码器20可编码指示片段的视频块被约束于单向预测式译码的语法元素。为 说明的目的,此语法元素被称为“uni_pred_only”。当uni_pred_only语法元素为“1”(例 如,真)时,其指示片段内的所有视频块被约束于单向预测式译码。当uni_pred_only语 法元素为“0”(例如,假)时,其指示片段的视频块有可能相对于一个或两个参考图片进 行译码。换句话说,如果uni_pred_only为0,那么片段内的一个或一个以上视频块可能 相对于一个以上参考图片进行译码;然而,仍可能由于选择适当参考图片而没有视频块 是相对于一个以上参考图片进行预测的。

在一些实例中,uni_pred_only语法元素可为片段的标头的部分。在这些实例中,视 频编码器20可在附加到每一经预测片段的标头中传信uni_pred_only语法元素。在替代 实例中,uni_pred_only语法元素可能未必为每一经预测片段的标头的部分。例如,有可 能整个图片被约束于仅单向预测式译码。在这些实例中,uni_pred_only语法元素可为整 个图片的标头的部分,而未必处于片段层级。

在一些替代实例中,视频编码器20可与片段或图片分开来传信uni_pred_only语法 元素。例如,如果图片群组(GOP)内的图片都是经单向预测的,那么视频编码器20可在 图片参数集(PPS)或序列参数集(SPS)中传信uni_pred_only语法元素。还有可能视频编码 器20对于某一片段或图片在PPS或SPS中传信uni_pred_only语法,甚至在GOP内的 所有图片都不是经单向预测的实例中也是这样。

在图片并不约束于单向预测的情况下,视频编码器20可传信指示片段内有多少视 频块是相对于两个参考图片进行编码的信息。举例来说,视频编码器20可传信指示片 段内相对于两个参考图片进行编码的视频块(例如,预测单元)的百分比的语法元素。除 了或替代传信指示相对于两个参考图片进行编码的视频块的百分比的语法元素,视频编 码器20可传信指示图片有多少被相对于两个多张图片进行编码的视频块涵盖的语法元 素。作为一个实例,视频编码器20可传信指示片段内的视频块有10%是相对于两个参 考图片进行编码的语法元素和/或传信指示相对于两个参考图片进行编码的视频块涵盖 图片的25%的语法元素。视频编码器20可在片段标头或图片标头中传信此些语法元素, 或单独作为PPS或SPS的部分传信此些语法元素。

上文描述的语法元素经提供用于说明目的,且可能并非在本发明的每一实例中都是 必需的。举例来说,视频编码器20可建构指示使用哪些参考图片来预测任一片段类型 的视频块的单一参考图片列表。对于视频块,视频编码器20可传信用以预测视频块的 运动向量,且传信识别参考图片的识别符位于单一参考图片列表中的位置的索引值。除 了运动向量和索引值以外,视频编码器20还可任选地传信例如uni_pred_only语法元素 等语法元素。此外,视频编码器20可任选地传信指示有多少视频块是相对于多个参考 图片进行译码的语法元素(例如,作为图片内视频块的百分比和/或作为由图片中的视频 块涵盖的区域的百分比)。

在一些实例中,替代传信视频块的运动向量,视频编码器20可传信一个或一个以 上运动预测符。可从所述一个或一个以上运动预测符预测运动向量。举例来说,运动预 测符的平均值可导致运动向量。例如,如果使用N个运动预测符用于运动向量,那么所 述N个运动预测符的平均值可导致运动向量。

视频解码器30可经由通信信道16直接从源装置12,或从存储媒体17或文件服务 器19接收所有此信息。视频解码器30可接着建构其自身的单一参考图片列表。作为一 个实例,视频解码器30可通过实施默认建构技术(例如,不接收关于如何建构单一参考 图片列表的信息)来建构其自身的单一参考图片列表。接着,如果视频编码器20传信了 告知视频解码器30重新排序单一参考图片列表的信息,那么视频解码器30可重新排序 所述单一参考图片列表。

为解码任一片段类型的视频块,视频解码器30可解码运动向量信息和索引值。通 过索引值,视频解码器30可识别来自单一参考图片列表的参考图片,而不管视频块是 经单向预测还是双向预测,且不管视频块是属于P片段、B片段还是GPB片段。视频解 码器30可从其存储器检索所识别的参考图片,且通过所检索到的参考图片和经解码的 运动向量信息来解码视频块。再次,用以解码视频块的参考图片为先前已经解码并存储 的参考图片。

在视频编码器20传信例如uni_pred_only语法元素等语法元素和/或例如相对于多个 参考图片编码的视频块的百分比等额外语法元素的实例中,视频解码器30可利用这些 语法元素用于解码。举例来说,如果视频编码器20指示uni_pred_only为1(例如,真), 那么视频解码器30可略过解码相对于一个以上参考图片编码的视频块可能需要的任何 初始化步骤。举例来说,视频解码器30可认识到,当uni_pred_only旗标对于包含视频 块的片段为真时,其不应等待单一参考图片列表内的两个索引值来解码所述视频块。以 此方式,uni_pred_only语法元素可增加视频解码器30的计算效率。

指示多少视频块(例如,预测单元)是相对于多个参考图片进行译码的语法元素可类 似地促进有效的视频解码器30处理。举例来说,通过此些语法元素,视频解码器30可 知道多少视频块需要单一参考图片列表内的两个或两个以上索引值(例如,相对于两个参 考图片编码的视频块的百分比)。此可增加视频解码器30的计算效率。举例来说,在一 些情况下,如上所述,双向预测可比单向预测在计算上更复杂。通过多少视频块需要单 一参考图片列表内的两个以上索引值的指示,视频解码器30可知道预测将多复杂,且 可能能够分配适当资源以用于解码双向预测和单向预测片段。

如上所述,JCT-VC正致力于开发HEVC标准,所述标准有时称为未来H.265标准。 以下为HEVC标准的更详细描述以辅助理解。然而,如上文所指示,本发明的技术并不 限于HEVC标准,且可大体上适用于视频译码。

HEVC标准化努力是基于视频译码装置的模型,其被称为HEVC测试模型(HM)。 HM假设视频译码装置相对于根据(例如)ITU-T H.264/AVC的现有装置的若干额外能力。 举例来说,尽管H.264提供九个帧内预测编码模式,但HM提供多达33个帧内预测编 码模式。

HM将视频数据的块称为译码单元(CU)。位流内的语法数据可界定最大译码单元 (LCU),其在像素数目方面为最大的译码单元。大体来说,CU具有与H.264标准的宏块 类似的目的,只是CU不具有大小区别。因此,CU可分裂成子CU。大体来说,本发明 中对CU的参考可指图片的最大译码单元或LCU的子CU。LCU可分裂成子CU,且每 一子CU可进一步分裂成子CU。位流的语法数据可界定LCU可被分裂的最大次数(称为 CU深度)。因此,位流还可界定最小译码单元(SCU)。

不再进一步分裂的CU可包含一个或一个以上预测单元(PU)。大体来说,PU表示所 有对应CU或对应CU的一部分,且包含用于检索用于PU的参考样本的数据。举例来 说,当PU是经帧内模式编码(即,帧内预测)时,PU可包含描述所述PU的帧内预测模 式的数据。作为另一实例,当PU是经帧间模式编码(即,帧间预测)时,PU可包含界定 所述PU的运动向量的数据。

界定PU的运动向量的数据可描述(例如)运动向量的水平分量、运动向量的垂直分 量、运动向量的分辨率(例如,四分之一像素精度或八分之一像素精度)、运动向量指向 的参考图片,和/或用于运动向量的参考图片列表。用于界定PU的CU的数据还可描述 (例如)CU到一个或一个以上PU的分割。分割模式可在CU是经跳过或直接模式编码、 经帧内预测模式编码还是经帧间预测模式编码之间不同。

具有一个或一个以上PU的CU还可包含一个或一个以上变换单元(TU)。在使用PU 进行预测之后,视频编码器20可计算对应于PU的CU部分的残余值。残余值对应于像 素差值,像素差值可变换成经量化的变换系数且经扫描以产生串行化变换系数以用于熵 译码。TU未必限于PU的大小。因此,TU可大于或小于相同CU的对应PU。在一些实 例中,TU的最大大小可为对应CU的大小。本发明使用术语“视频块”来指CU、PU 或TU中的任一者。

视频序列通常包含一系列视频图片。图片群组(GOP)大体包括一系列一个或一个以 上视频图片。GOP可将描述GOP中所包含的图片的数目的语法数据包含在GOP的标头、 GOP的一个或一个以上图片的标头中或其它处。每一图片可包含描述相应图片的编码模 式的图片语法数据。视频编码器20通常对个别视频图片内的视频块操作以便编码视频 数据。视频块可对应于译码单元(CU)或CU的分割单元(PU)。所述视频块可具有固定的 或变化的大小,且可根据指定的译码标准而大小不同。每一视频图片可包含多个片段。 每一片段可包含多个CU,所述CU可包含一个或一个以上PU。

作为一实例,HEVC测试模型(HM)支持以各种CU大小进行预测。LCU的大小可由 语法信息界定。假定特定CU的大小为2Nx2N,那么HM支持以2Nx2N或NxN的大小 进行帧内预测,及以2Nx2N、2NxN、Nx2N或NxN的对称大小进行帧间预测。HM还 支持以2NxnU、2NxnD、nLx2N及nRx2N进行帧间预测的不对称分裂。在不对称分裂 中,CU的一个方向未分裂,而另一方向分裂成25%和75%。CU的对应于25%分裂的 部分由“n”继之以“上”、“下”、“左”或“右”的指示来指示。因此,例如, “2NxnU”指代水平地分裂的2Nx2N CU,其中2Nx0.5N PU在顶部且2Nx1.5N PU在底 部。

在本发明中,“NxN”与“N乘N”可互换地使用以按照垂直和水平维度来指代视 频块(例如,CU、PU或TU)的像素维度,例如16x16像素或16乘16像素。大体来说, 16x16块在垂直方向中将具有16个像素(y=16)且在水平方向中将具有16个像素(x= 16)。同样地,NxN块通常在垂直方向上具有N个像素,且在水平方向上具有N个像素, 其中N表示非负整数值。一块中的像素可布置成若干行和若干列。此外,块未必需要在 水平方向中与在垂直方向中具有相同数目个像素。举例来说,块可包含NxM个像素, 其中M未必等于N。

在帧内预测式或帧间预测式译码以产生CU的PU之后,视频编码器20可计算残余 数据以产生CU的一个或一个以上变换单元(TU)。CU的PU可包括空间域(也称像素域) 中的像素数据,而CU的TU例如在应用变化之后可包括变换域中的系数,所述变换例 如离散余弦变换(DCT)、整数变换、小波变换,或对残余视频数据的概念上类似的变换。 残余数据可对应于未编码图片的像素与CU的PU的预测值之间的像素差。视频编码器 20可形成包含CU的残余数据的一个或一个以上TU。视频编码器20可接着变换所述 TU以产生变换系数。

在任何变换以产生变换系数之后,可执行变换系数的量化。量化通常是指如下过程: 将变换系数量化以可能地减小用以表示所述系数的数据量,从而提供进一步压缩。量化 过程可减少与系数中的一些或全部相关联的位深度。举例来说,在量化期间,可将n位 值向下舍入到m位值,其中n大于m。

在一些实例中,视频编码器20可利用预定义的扫描次序来扫描经量化的变换系数 来产生可进行熵编码的串行化向量。在其它实例中,视频编码器20可执行自适应性扫 描。在扫描经量化变换系数以形成一维向量之后,视频编码器20可熵编码所述一维向 量,例如根据上下文自适应性可变长度译码(CAVLC)、上下文自适应性二进制算数译码 (CABAC)、基于语法的上下文自适应性二进制算数译码(SBAC)或另一熵编码方法。

为了执行CABAC,视频编码器20可选择上下文模型以应用到特定上下文以编码待 发射的符号。上下文可能与(例如)相邻值是否为非零有关。为了执行CAVLC,视频编码 器20可选择可变长度码用于待发射的符号。VLC中的码字可经建构而使得相对较短的 码对应于概率较大的符号,而较长的码对应于概率较小的符号。以此方式,使用VLC 可经由例如对于每一待发射的符号使用相等长度码字来实现位节省。概率确定可基于指 派给符号的上下文。

视频解码器30可以与视频编码器20的方式实质上对称的方式操作。举例来说,视 频解码器30可接收表示视频图片的经编码CU的经熵编码数据。视频解码器30可利用 默认建构技术建构单一参考图片列表,以识别需要哪些参考图片来解码帧间预测的CU。

图2是说明按显示次序包含图片34、35A、36A、38A、35B、36B、38B和35C的 实例视频序列33的概念图。这些图片中的一者或一者以上可包含P片段、B片段或GPB 片段。在一些情况下,视频序列33可称为图片群组(GOP)。图片39按显示次序为在序 列33之后出现的序列的第一图片。图2大体表示视频序列的示范性预测结构,且仅意 欲说明用于编码不同帧间预测片段类型的图片参考。实际视频序列可能含有包含不同片 段类型且呈不同显示次序的更多或更少视频图片。

对于基于块的视频译码,可将包含于序列33中的视频图片中的每一者分割成视频 块或译码单元(CU)。视频图片的每一CU可包含一个或一个以上预测单元(PU)。使用相 对于同一图片中的相邻块的空间预测来编码帧内预测图片中的视频块或PU。帧间预测 图片中的视频块或PU可使用相对于同一图片中的相邻块的空间预测或相对于其它参考 图片的时间预测。

可使用双向预测式译码来编码B片段或GPB片段中的视频块以从在单一参考图片 列表中识别的两个参考图片计算两个运动向量。P片段的视频块,且在一些情况下,B 片段或GPB片段的视频块,可使用从在单一参考图片列表中识别的一个参考图片的单 向预测式译码来加以编码。根据本发明中描述的一个或一个以上实例,图2中说明的一 个或一个以上图片的帧间预测视频块可相对于在单一参考图片列表中指示的参考图片 进行帧间预测,而不管视频块被帧间预测的方式(例如,不管视频块是P片段、B片段还 是GPB片段的部分),且不管用以编码视频块的参考图片的数目(例如,不管视频块是经 单向预测还是双向预测)。

在图2的实例中,第一图片34经指定用于帧内模式译码为I图片。在其它实例中, 第一图片34可参考前一序列的第一图片而用帧间模式译码来译码为例如P图片、B图 片或GPB图片。视频图片35A到35C(统称“视频图片35”)经指定用于使用参考前一 图片和后一图片的双向预测来译码为B图片或GPB图片。在所说明实例中,图片35A 参考第一图片34和图片36A而编码为B图片或GPB图片,如由从图片34和图片36A 指向视频图片35A的箭头所指示。图片35B和35C经类似地编码。

视频图片36A到36B(统称“视频图片36”)可经指定用于使用参考前一图片的单向 预测来译码为P图片、B图片或GPB图片。在所说明实例中,图片36A参考第一图片 34而编码为P图片、B图片或GPB图片,如由从图片34指向视频图片36A的箭头所指 示。图片36B类似地参考图片38A而编码为P图片、B图片或GPB图片,如由从图片 38A指向视频图片36B的箭头所指示。

视频图片38A到38B(统称“视频图片38”)可经指定用于使用参考相同前一图片的 单向预测来译码为P图片、B图片或GPB图片。在所说明实例中,图片38A用对图片 36A的两个参考来编码,如由从图片36A指向视频图片38A的两个箭头所指示。图片 38B经类似地编码。

图3是说明可实施根据本发明的一个或一个以上方面的技术的视频编码器20的实 例的框图。视频编码器20还可任选地实施用于传信指示片段或图片的视频块是否被约 束于单向预测、指示多少视频块通过多个参考图片编码和/或指示图片有多少通过多个参 考图片编码的语法元素的技术。视频编码器20可执行视频图片内的视频块的帧内和帧 间译码。帧内译码依赖于空间预测以减少或移除给定视频图片内的视频中的空间冗余。 帧间译码依赖于时间预测以减少或移除视频序列的邻近图片内的视频中的时间冗余。帧 内模式(I模式)可指若干基于空间的压缩模式中的任一者。例如单向预测(P模式)、双向 预测(B模式)或广义的P和B预测等帧间模式可指若干基于时间的压缩模式中的任一者。

在图3的实例中,视频编码器20包含模式选择单元40、预测单元41、参考图片存 储器64、求和器50、变换单元52、量化单元54,和熵编码单元56。预测单元41包含 运动估计单元42、运动补偿单元44,和帧内预测单元46。对于视频块重建,视频编码 器20还包括反量化单元58、反变换单元60,和求和器62。还可包含解块滤波器(图3 中未展示)以将块边界滤波,以从经重建的视频移除成块假影。在需要时,解块滤波器通 常将对求和器62的输出进行滤波。

如图3中所示,视频编码器20接收待编码的视频图片或片段内的当前视频块。作 为一个实例,图片或片段可划分成多个视频块或CU,但也包含PU和TU。模式选择单 元40可基于错误结果针对当前视频块选择译码模式(帧内或帧间)中的一者,且预测单元 41可将所得帧内或帧间译码块提供到求和器50以产生残余块数据,且提供到求和器62 以重建经编码块以供用作参考图片。

预测单元41内的帧内预测单元46可相对于与待译码的当前块相同的图片或片段中 的一个或一个以上相邻块对当前视频块执行帧内预测式译码,以提供空间压缩。预测单 元41内的运动估计单元42和运动补偿单元44相对于一个或一个以上参考图片中的一 个或一个以上预测块对当前视频块执行帧间预测式译码,以提供时间压缩。所述一个或 一个以上参考图片可选自单一参考图片列表66。视频编码器20可基于存储在参考图片 存储器64中的经解码参考图片来建构单一参考图片列表66。

运动补偿单元42可经配置以根据视频序列的预定模式来确定视频图片的帧间预测 模式。所述预定模式可将序列中的视频图片或片段指定为P图片或P片段、B图片或B 片段,和GPB图片或GPB片段。运动估计单元42可确定将视频片段的视频块编码为P 片段、B片段还是GPB片段。

运动估计单元42与运动补偿单元44可高度集成,但出于概念上的目的而分开予以 说明。由运动估计单元42执行的运动估计是产生估计视频块的运动的运动向量的过程。 举例来说,运动向量可指示当前视频图片内的视频块相对于参考图片内的预测块的位 移。预测块是经发现在像素差方面密切地匹配待译码的视频块的块,其可通过绝对差总 和(SAD)、平方差总和(SSD)或其它差度量来确定。在一些实例中,视频编码器20可计 算存储在参考图片存储器64中的参考图片的子整数像素位置的值。举例来说,视频编 码器20可计算四分之一像素位置、八分之一像素位置或参考图片的其它分数像素位置 的值。因此,运动估计单元42可执行相对于全像素位置和分数像素位置的运动搜索, 且输出具有分数像素精度的运动向量。

运动估计单元42通过比较视频块的位置与单一参考图片列表66中的参考图片的预 测块的位置来计算帧间译码视频块的视频块的运动向量。举例来说,当视频块是经单向 预测时,运动估计单元42可针对视频块使用单向预测式译码,且从包含参考图片的识 别符(例如,参考图片的POC值或图片编号值)的单一参考图片列表66中指示的一个参 考图片来计算单一运动向量。在此实例中,视频块可为P片段、B片段或GPB片段的视 频块。在另一实例中,当视频块是经双向预测时,运动估计单元42可针对视频块使用 双向预测式译码,且从包含两个不同参考图片的识别符的单一参考图片列表66中指示 的所述两个参考图片计算两个运动向量。在此实例中,视频块可为B片段或GPB片段 的视频块。

换句话说,单一参考图片列表66可包含识别用以预测双向预测视频块的两个参考 图片的识别符,且单一参考图片列表66可包含识别用以预测单向预测视频块的参考图 片的识别符。以此方式,单一参考图片列表66可包含仅用于时间上在先的参考图片(例 如,在视频块经单向预测且属于P片段、B片段或GPB片段的情况下)、仅用于时间上 在后的参考图片(例如,在视频块经单向预测且属于B片段或GPB片段的情况下)或用于 时间上在后和时间上在先的参考图片两者(例如,在视频块经双向预测且属于B片段或 GPB片段的情况下)的识别符。在此实例中,时间上在后的参考图片是指在包含预测的 视频块的图片之后显示的参考图片。同样,在此实例中,时间上在先的参考图片是指先 于包含预测的视频块的图片显示的参考图片。

运动估计单元42将计算出的运动向量发送到熵编码单元56和运动补偿单元44。由 运动补偿单元44执行的运动补偿可涉及基于运动估计所确定的运动向量来提取或产生 预测块。更具体来说,在帧间预测块的情况下,运动补偿单元44可从存储在参考图片 存储器64中的经解码参考图片来建构单一参考图片列表66。在接收到用于当前视频块 的运动向量之后,运动补偿单元44可随即在单一参考图片列表66中定位运动向量所指 向的预测块。视频编码器20通过从正被译码的当前视频块的像素值减去预测块的像素 值来形成残余视频块,从而形成像素差值。所述像素差值形成所述块的残余数据,且可 包含亮度与色度差分量两者。求和器50表示执行此减法运算的组件。

在视频块是从两个参考图片预测(例如,双向预测)的一些实例中,运动补偿单元44 可编码各自使用运动预测符联合地指向其相应参考图片的两个运动向量。运动预测符的 使用并非在每一实例中都是必需的,且仅为说明目的而描述。为易于描述,指向其相应 参考图片的两个运动向量称为第一和第二运动向量。

运动补偿单元44可通过减少或消除按照惯例用以表示第二运动向量的语法元素来 减少用以传信运动向量的位。视频编码器20接着联合地编码第一和第二运动向量。举 例来说,视频编码器20可按照惯例相对于运动预测符来编码第一运动向量,且接着相 对于第一运动向量来编码第二运动向量。作为一个实例,视频编码器20在视频块层级 上连同用于每一双向预测视频块的其它预测语法来传信联合编码的运动向量到视频解 码器30。

运动补偿单元44从运动估计单元42接收用于当前视频块的第一和第二运动向量。 运动补偿单元44接着从相邻视频块的运动向量产生第一运动向量的第一运动预测符。 举例来说,当前视频块的第一运动向量可指向来自列表66的单一参考图片的预测块。 因此,可从与待编码的当前视频块相邻的相邻视频块的运动向量产生第一运动预测符, 所述运动向量指向来自列表66的相同单一参考图片中的另一块。

运动补偿单元44产生语法元素以相对于第一运动预测符来表示第一运动向量。举 例来说,运动补偿单元44产生经定义以指示第一运动向量与第一运动预测符之间的差 的第一语法元素(即,mvd)和经定义以指示供产生第一运动预测符的参考图片在单一参考 图片列表66中的索引的第二语法元素(即,ref_idx)。以此方式,视频编码器20可按照 惯例通过由运动补偿单元44产生的语法元素来相对于第一运动预测符编码第一运动向 量。

运动补偿单元44可能不从相邻视频块产生用于第二运动向量的第二运动预测符, 而改为使用第一运动向量作为第二运动预测符。视频编码器20接着相对于所述第一运 动向量编码视频块的第二运动向量。以此方式,第二运动向量可编码为第一运动向量与 第二运动向量之间的差。在一些实例中,运动补偿单元44可能不产生用于第二运动向 量的任何语法元素。在其它实例中,运动补偿单元44可仅产生经定义以指示第二运动 向量与第一运动向量之间的差的第一语法元素。

在一些情况下,视频编码器20可仅当第一和第二运动向量指向相同参考图片或实 质上类似的参考图片时才联合地编码所述运动向量。当第一与第二运动向量并不指向相 同参考图片时,可根据第一运动向量与第二运动向量之间的时间距离来按比例调整第一 运动向量,随后使用所述第一运动向量作为第二运动预测符。

在一些实例中,可从相邻块的多个运动向量来产生用于当前块的运动向量的运动预 测符。在此情况下,运动补偿单元44可从相邻视频块的多个候选运动向量产生用于当 前视频块的第一运动向量的第一运动预测符。运动补偿单元44还可从包含第一运动向 量或第一运动预测符的多个候选运动向量产生用于当前视频块的第二运动向量的第二 运动预测符。在此情况下,仍可相对于第一运动向量而并非排他性地基于第一运动向量 (例如,还可基于第一运动预测符)来编码第二运动向量。在运动补偿单元44从多个候选 运动向量产生运动预测符的实例中,这些多个候选运动向量可经处理(例如,求平均、中 值滤波、多数规则,或其它技术)以产生运动预测符。举例来说,运动补偿单元44可利 用经求平均以产生运动预测符的四个候选运动向量。

运动补偿单元44还可产生经定义以在视频序列层级、视频图片层级、视频片段层 级、视频译码单元层级或视频预测单元层级中的一者或一者以上表示预测信息的语法元 素。举例来说,运动补偿单元44可产生指示预测是否被约束于单向预测式译码的语法 元素。例如,运动补偿单元44可将P片段、B片段或GPB片段的视频块约束于仅从一 个参考图片进行预测(例如,单向预测)。对于这些情境,运动补偿单元44可产生称为 uni_pred_only的语法元素,其指示运动补偿单元44是否将预测约束于仅单向预测。 Uni_pred_only语法元素可被看作具有由一个位表示(例如,“1”表示真,且“0”表示 假)的两个状态的旗标:真和假。

当为真时,uni_pred_only指示预测被限于单向预测(例如,仅一个参考图片用于编 码或解码特定视频块)。在此情况下,片段的视频块是从一个参考图片预测的。然而,此 并不意味着所有视频块都是从同一参考图片预测的,但此可为可能的。确切地说,片段 的一个视频块可从一个参考图片预测,且片段的另一视频块可从另一参考图片预测,但 这些视频块两者都是从仅一个参考图片预测的。当为假时,uni_pred_only指示预测并不 限于单向预测。在此情况下,有可能片段的一些或所有块仍可相对于一个参考图片进行 预测。

运动补偿单元44还可任选地包含指示片段的视频块被预测的方式的额外语法元素。 举例来说,当uni_pred_only为假时,运动补偿单元44可指示片段(例如,B片段或GPB 片段)的视频块有多少是相对于一个以上参考图片而预测的。此指示可传信为百分比。作 为另一实例,当uni_pred_only为假时,运动补偿单元44可指示图片有多少是相对于一 个以上参考图片而预测的。此指示也可传信为百分比。

运动补偿单元44可将这些语法元素包含在片段或图片的标头中,或与片段和图片 分开。举例来说,如果序列参数集(SPS)或图片参数集(PPS)中的图片的所有视频块是经 单向预测,那么运动补偿单元44可将uni_pred_only语法元素包含为SPS或PPS的部分。 运动补偿单元44可类似地包含指示多少片段是相对于两个参考图片经帧间预测和图片 有多少是相对于两个参考图片经帧间预测的语法元素。在一些实例中,运动补偿单元44 还可包含指示视频块是使用双向预测还是单向预测来译码(例如,预测)的一个或一个以 上语法元素。

下表1到3提供伪码,其说明运动补偿单元44将uni_pred_only语法元素分别包含 为SPS、PPS和片段标头的部分的方式。

表1.序列参数集语法

seq_parameter_set_rbsp(){ C 描述符     num_ref_frames 0 ue(v)     uni_pred_only_flag 0 u(1)     rbsp_trailing_bits() 0   }    

表2.图片参数集语法

pic_parameter_set_rbsp(){ C 描述符 pic_parameter_set_id 1 ue(v) seq_parameter_set_id 1 ue(v) entropy_coding_mode_flag 1 u(1) num_ref_idx_default_active_minus1 1 ue(v) uni_pred_only_flag     pic_init_qp_minus26/*相对于26*/ 1 se(v) constrained_intra_pred_flag 1 u(1) for(i=0;i<15;i++){     numAllowedFilters[i] 1 ue(v) for(j=0;j<numAllowedFilters;j++){     filtIdx[i][j] 1 ue(v) }     }     rbsp_trailing_bits() 1   }    

表3.片段标头语法

slice_header(){ C 描述符 first_lctb_in_slice 2 ue(v) slice_type 2 ue(v) pic_parameter_set_id 2 ue(v) frame_num 2 u(v) if(IdrPicFlag)     idr_pic_id 2 ue(v) pic_order_cnt_lsb 2 u(v) if(slice_type!=I)     num_ref_idx_active_override_flag 2 u(1) if(num_ref_idx_active_override_flag){     num_ref_idx_active_minus1 2 ue(v) ref_pic_list_modification()     non_uni_predict_flag 2 u(1) if(nal_ref_idc!=0)     dec_ref_pic_marking() 2   if(entropy_coding_mode_flag){     pipe_multi_codeword_flag 2 u(1) if(!pipe_multi_codeword_flag)     Pipe_max_delay_shift_6 2 ue(v) else     Balanced_cpus 2 u(8) if(slice_type!=I)     cabac_init_idc 2 ue(v) }     slice_qp_delta 2 se(v) alf_param()     if(slice_type!=I){     mc_interpolation_idc 2 ue(v) mv_competition_flag 2 u(1) if(mv_competition_flag){     mv_competition_temporal_flag 2 u(1) }     }     if(!non_uni_predict_flag&&mv_competition_flag)     Collocated_from_l0_flag 2 u(1)       sifo_param()     edge_based_prediction_flag 2 u(1) if(edge_prediction_ipd_flag==1)     threshold_edge 2 u(8) }    

在表1到3的实例伪码中,当uni_pred_only旗标(例如,在表1和2中)等于1时, 或当non_uni_predict_flag(例如,在表3中)等于0时,帧间预测视频块是通过仅一个参 考图片来预测的。举例来说,uni_pred_only_flag可以是为“1”(表示真)或“0”(表示假) 的二进制值,且non_uni_predict_flag可为uni_pred_only_flag的布尔相反数(Boolean  opposite)。在表3的实例中,num_ref_idx_active_minus1指定视频解码器30可用以解码 片段的单一参考图片列表66的最大参考索引。在一些实例中,运动补偿单元44可进一 步包含指示用以编码片段的参考图片的数目的num_predictors_pu语法元素。

运动补偿单元44还可包含可指示运动补偿单元44帧间预测视频块的方式的额外语 法元素。举例来说,运动补偿单元44可包含指示图片的多少片段是相对于多个参考图 片进行预测(例如,双向预测)的语法元素。作为另一实例,运动补偿单元44可包含指示 图片的多少区域是相对于多个参考图片进行预测的语法元素。uni_pred_only语法元素和 这些额外语法元素可减少编码和/或解码片段或图片的复杂性,如上文所论述。

大体来说,运动补偿单元44传信供预测当前视频块的每一参考图片的运动向量信 息或运动预测符信息。仅为说明和简洁的目的,假定运动补偿单元44传信运动向量信 息。运动补偿单元44还传信由视频解码器30建构的单一参考图片列表的索引值的信息, 所述索引值指示参考图片的识别符位于所述单一参考图片列表中何处。

在视频块是相对于单一参考图片进行预测的实例中,运动补偿单元44传信所述视 频块与参考图片的匹配块之间的残差。在视频块是相对于两个参考图片进行预测的实例 中,运动补偿单元44可传信所述视频块与所述参考图片中的每一者的匹配块之间的残 差。运动补偿单元44可传信此(些)残差,视频解码器30根据所述残差解码视频块。

运动补偿单元44可建构用于任一片段类型的视频块的单一参考图片列表66。在替 代实例中,视频编码器20的单元而非运动补偿单元44可建构单一参考图片列表66。然 而,为说明的目的,相对于运动补偿单元44建构单一参考图片列表66来描述实例。

单一参考图片列表66可包含运动补偿单元44用以编码任一片段类型的视频块的一 个或一个以上参考图片的识别符。换句话说,存储在单一参考图片列表66中的参考图 片的识别符可为参考图片的识别符,而不管视频块为P片段、B片段还是GPB片段的部 分。同样,当B片段或GPB片段的视频块是相对于两个参考图片进行编码时,单一参 考图片列表66包含所述参考图片中的每一者的识别符。以此方式,可能仅需要单一参 考图片列表66来识别哪些参考图片用以编码任一片段类型的视频块,包含当视频块是 相对于一个以上参考图片进行编码时。

在一些实例中,运动补偿单元44可利用用以建构单一参考图片列表66的默认建构 技术。举例来说,对于当前图片的视频块,运动补偿单元44可确定当前图片与用以编 码视频块的一个或一个以上参考图片之间的时间差。在一个实例中,较之于在时间上距 当前图片较远的一个或一个以上参考图片的识别符,运动补偿单元44可将在时间上较 接近于当前图片的一个或一个以上参考图片的识别符包含在单一参考图片列表66中的 较前位置。作为一替代实例,较之于在时间上较接近于当前图片的一个或一个以上参考 图片的识别符,运动补偿单元44可将在时间上距当前图片较远的一个或一个以上参考 图片的识别符包含在单一参考图片列表66中的较前位置。

当前图片与所述一个或一个以上参考图片之间的时间距离可基于其相应POC值或 图片编号值。为说明和简洁的目的,相对于POC值描述技术,但所述技术可类似地改 为使用图片编号值。

作为一个实例,如果当前图片与第一参考图片之间的POC值的差的绝对值小于当 前图片与第二参考图片之间的POC值的差的绝对值,那么认为第一参考图片比第二参 考图片在时间上更接近。同样,在此实例中,第一与第二参考图片都是在时间上在先的 参考图片还是在时间上在后的参考图片,或是否一者为在时间上在先的参考图片而另一 者为在时间上在后的参考图片可能关系不大。运动补偿单元44在单一参考图片列表66 中所包含的识别符可为一个或一个以上参考图片的POC值或图片编号值。

在两个参考图片之间的时间距离相同的实例中,运动补偿单元44可首先将具有较 低POC值的参考图片的识别符包含在单一参考图片列表66中,且其次插入具有较高 POC值的参考图片。作为一替代实例,运动补偿单元44可首先将具有较高POC值的参 考图片的识别符包含在单一参考图片列表66中,且其次插入具有较低POC值的参考图 片。

对于每一视频块,运动补偿单元44可传信指示与每一参考图片相关联的运动向量 的信息,和向视频解码器30指示与每一运动向量相关联的参考图片位于视频解码器30 建构的单一参考图片中何处的索引值。举例来说,当视频块是相对于两个参考图片进行 译码时,运动补偿单元44可传信指示所述两个参考图片中的每一者的识别符位于视频 解码器30建构的仅有单一参考图片列表内何处的信息。运动补偿单元44可能不传信任 何其它参考图片列表的索引值,因为可能不需要此种其它参考图片列表来解码视频块。 索引值信息可由熵编码单元56编码,如下文更详细描述的。

在一些实例中,运动补偿单元44可能不需要包含指示视频解码器30建构其单一参 考图片列表所应采取的方式的语法元素。在视频解码器30侧建构的单一参考图片可包 含与用于给定视频块的单一参考图片列表66中的参考图片相同的参考图片的识别符。 通过不传信指示视频解码器30建构其单一参考图片列表所应采取的方式的语法元素, 运动补偿单元44可减少需要传信的信息量。

在一些实例中,由运动补偿单元44传信的语法元素还可包含经定义以表示应用到 单一参考图片列表66中的参考图片的预测权重和偏移的语法元素。表示预测权重和偏 移的语法元素可包括告知解码器30将特定权重和偏移值应用到相关联的参考图片列表 的每一参考图片的表。在一些情况下,预测权重和偏移表可针对参考图片的亮度与色度 部分提供不同权重和偏移。表4包含用于预测权重表语法的实例伪码。

表4.预测权重表语法

pred_weight_table(){ C 描述符 luma_log2_weight_denom 2 ue(v) chroma_log2_weight_denom 2 ue(v) for(i=0;i<=num_ref_idx_active_minus1;i++){     luma_weight_l0_flag 2 u(1) If(luma_weight_l0_flag){     luma_weight_l0[i] 2 se(v) luma_offset_l0[i] 2 se(v) }     chroma_weight_l0_flag 2 u(1) If(chroma_weight_l0_flag)     for(j=0;j<2;j++){     chroma_weight_l0[i][j] 2 se(v) chroma_offset_l0[i][j] 2 se(v) }     }     }    

在一些实例中,运动补偿单元44可包含致使视频解码器30重新排序其本地建构的 单一参考图片列表的语法元素。在这些实例中,运动补偿单元44可提供用以解码视频 块的参考图片位于经重新排序的单一参考图片列表中何处的索引值。视频解码器30的 单一参考图片的重新排序可能并非在每一实例中都是必需的。表5说明运动补偿单元44 可传信以告知视频解码器30重新排序其单一参考图片列表的实例伪码。

表5.参考图片列表重新排序语法

在表5的伪码中,ref_pic_list_reodering_flag指示视频解码器30是否应针对特定视 频块重新排序其建构的单一参考图片列表。举例来说,如果ref_pic_list_reordering_flag 等于“0”,那么视频解码器30被告知不要重新排序其建构的参考图片列表。

如果ref_pic_list_reordering_flag等于“1”,那么视频解码器30被告知重新排序其 建构的单一参考图片列表。要重建其单一参考图片列表,视频解码器30期望解码 reordering_of_pic_nums_idc,其为其值告知视频解码器30重新排序其单一参考图片列表 所应采取的方式的变量。在一些实例中,当ref_pic_list_reordering_flag等于“1”时, reordering_of_pic_nums_idc在ref_pic_list_reordering_flag之后不等于3的次数不可超过 num_ref_idx_active_minus1+1。

大体来说,重新排序语法元素可定义经重新排序的参考图片列表为单一参考图片列 表66的短期参考图片还是单一参考图片列表66的长期参考图片,以及如何重新排序参 考图片。举例来说,在短期参考图片重新排序的情况下,所述语法元素可定义从预测块 的图片的偏移,且在长期参考图片重新排序的情况下,可将新索引编号指派给图片。

表6提供视频解码器30可借以解码视频块的视频块的伪码。在表6的实例伪码中, 运动补偿单元44可能不需要包含指示帧间译码片段的特定类型的语法元素,因为任何 帧间译码片段类型的视频块都是基于在视频解码器30侧上建构的相同单一参考图片列 表来解码。运动补偿单元44可包含指示视频块是使用双向预测还是单向预测来译码(例 如,预测)的语法元素。此可允许视频解码器30确定其在开始解码预测的视频块之前是 否需要等待额外运动向量或索引值。

举例来说,如果视频块是经双向预测,那么视频解码器30可解码两个运动向量的 语法元素和两个参考图片的索引值以解码所述视频块。如果视频块是经单向预测,那么 视频解码器30可知道其可在解码参考图片的一个运动向量信息和一个索引值之后解码 所述视频块,此可促进处理效率。指示视频块是使用双向预测还是单向预测进行译码的 语法元素可促进此处理效率。同样,在图6的实例伪码中,运动补偿单元44可能不需 要区分不同参考图片列表(例如,常规列表0与列表1),因为视频解码器30仅使用单一 参考图片列表来解码相对于一个参考图片或两个参考图片编码的视频块。

表6.用于视频块的语法表

在表6的实例伪码中,bi_pred_flag可指示当前视频块是经单向预测还是经双向预 测。换句话说,bi_pred_flag可为指示视频块是使用双向预测还是单向预测来译码的语 法元素。举例来说,如果bi_pred_flag等于“1”,那么当前视频块是经双向预测式译码 (例如,相对于两个参考图片进行译码)。在此情况下,视频解码器30期望解码两个运动 向量的信息。如果bi_pred_flag等于“0”,那么当前视频块是经单向预测。在此情况下, 视频解码器30期望解码仅一个运动向量的信息,且可能不需要在解码视频块之前等待 另一运动向量。

结合本发明中所描述的技术,与常规技术相比,bi_pred_flag可实现需要传信的信 息量的减少。例如,在常规技术中,视频编码器将传信指示视频块是经双向预测还是经 单向预测的旗标,且当经单向预测时,视频编码器将传信视频块是从常规列表0还是列 表1中的参考图片进行预测。在本发明中描述的一个或一个以上实例技术中,当 bi_pred_flag等于“0”以指示视频块是经单向预测时,视频编码器20可能不需要传信 指示哪一图片列表包含用以预测所述视频块的图片的识别符的信息,因为可能仅需要单 一参考图片列表(而非常规列表0和列表1)来预测视频块。

在运动补偿单元44产生当前视频块的预测块之后,视频编码器20通过从当前视频 块减去预测块来形成残余视频块。变换单元52可从所述残余块形成一个或一个以上变 换单元(TU)。变换单元52将例如离散余弦变换(DCT)或概念上类似的变换等变换应用到 TU,从而产生包括残余变换系数的视频块。所述变换可将残余块从像素域转换到变换域, 例如频域。

变换单元52可将所得变换系数发送到量化单元54。量化单元54量化变换系数以进 一步减小位速率。量化过程可减少与系数中的一些或全部相关联的位深度。量化度可通 过调整量化参数来加以修改。在一些实例中,量化单元54可接着对包含经量化变换系 数的矩阵执行扫描。或者,熵编码单元56可执行所述扫描。

在量化之后,熵编码单元56熵译码经量化变换系数。举例来说,熵编码单元56可 执行上下文自适应性可变长度译码(CAVLC)、上下文自适应性二进制算数译码(CABAC) 或另一熵编码技术。在由熵编码单元56进行熵编码之后,可将经编码的位流发射到视 频解码器(例如视频解码器30)或存档以供稍后发射或检索。

熵编码单元56还可熵编码运动向量和正被译码的当前视频图片的其它预测语法元 素。举例来说,熵编码单元56可建构包含由运动补偿单元44产生的适当语法元素的标 头信息以供在经编码位流中发射。为熵编码语法元素,熵编码单元56可执行CABAC, 且基于上下文模型将语法元素二进制化为一个或一个以上二进制位。熵编码单元还可执 行CAVLC,且基于上下文根据概率将语法元素编码为码字。

在视频块是从两个参考图片预测的一些实例中,熵编码单元56可基于指向另一参 考图片的运动向量来编码指向所述参考图片中的一者的运动向量。熵编码单元56还可 基于另一参考图片位于由视频解码器30建构的单一参考图片列表中何处的信息来编码 指示参考图片中的一者位于由视频解码器30建构的单一参考图片列表中何处的信息。 然而,熵编码单元56可能不需要在每一实例中执行此编码,且此编码仅为说明目的而 提供。

反量化单元58和反变换单元60分别应用反量化和反变换以在像素域中重建残余 块,以供稍后用作参考图片的参考块。运动补偿单元44可通过将残余块相加到单一参 考图片列表66内的参考图片中的一者的预测块来计算参考块。运动补偿单元44还可将 一个或一个以上内插滤波器应用到重建的残余块以计算子整数像素值以供用于运动估 计中。求和器62将重建的残余块相加到由运动补偿单元44产生的经运动补偿的预测块, 以产生参考块供存储在参考图片存储器64中。参考块可由运动估计单元42和运动补偿 单元44用作用以对后续视频图片中的块进行帧间预测的参考块。

图4是说明可实施根据本发明的一个或一个以上方面的技术的实例视频解码器的框 图。在图4的实例中,视频解码器30包含熵解码单元80、预测单元81、反量化单元86、 反变换单元88、求和器90,和参考图片存储器92。预测单元81包含运动估计单元82 和帧内预测单元84。视频解码器30在一些实例中可执行大体与关于视频编码器20(图 3)所描述的编码遍次互逆的解码遍次。

在解码过程期间,视频解码器30从视频编码器(例如,视频编码器20)接收经编码 视频位流,其包含经编码视频块和表示译码信息的语法元素。视频解码器30的熵解码 单元80熵解码所述位流以产生经量化系数、运动向量和其它预测语法。熵解码单元80 将所述运动向量和其它预测语法转发到预测单元81。视频解码器30可在视频预测单元 层级、视频译码单元层级、视频片段层级、视频图片层级和/或视频序列层级来接收语法 元素。

当视频片段被译码为帧内译码(I)片段时,预测单元81的帧内预测单元84可基于经 传信的帧内预测模式和来自当前图片的先前经解码的块的数据产生当前视频图片的视 频块的预测数据。当视频块是经帧间预测时,预测单元81的运动补偿单元82基于从熵 解码单元80接收的运动向量和预测语法产生用于当前视频图片的视频块的预测块。预 测块可根据单一参考图片94而产生。可基于存储在参考图片存储器92中的参考图片来 建构单一参考图片列表94。如上所述,在实例技术中,运动补偿单元82可使用相同的 单一参考图片列表94来解码任何类型的视频块,且可能不需要任何其它参考图片列表。 同样,运动补偿单元82可使用相同的单一参考图片列表来解码视频块,而不管视频块 是相对于一个参考图片还是两个参考图片来编码。

运动补偿单元82通过剖析运动向量和预测语法来确定当前视频块的预测信息,且 使用所述预测信息来产生用于正被解码的当前视频块的预测块。举例来说,运动补偿单 元82使用所接收的语法元素中的一些来确定用以编码当前图片的CU的大小、描述图片 的每一CU如何分裂的分裂信息、指示如何对每一分裂进行编码的模式(例如,帧内预测 或帧间预测)、用于图片的每一帧间预测视频块的运动向量、用于图片的每一帧间预测视 频块的运动预测方向,和用以解码当前视频图片的其它信息。

运动补偿单元82还可基于内插滤波器执行内插。运动补偿单元82可使用如由视频 编码器20在视频块的编码期间所使用的内插滤波器来计算参考块的子整数像素的内插 值。运动补偿单元82可根据所接收的语法元素来确定由视频编码器20使用的内插滤波 器且使用所述内插滤波器来产生预测块。

根据本发明的技术,视频解码器30可通过仅建构单一参考图片列表94来减少译码 视频块的成本。举例来说,视频解码器30可实施用以建构单一参考图片列表94的默认 建构技术。同样,视频解码器30可能不需要建构任何其它参考图片列表。视频解码器 30可实施视频编码器20实施以建构视频编码器20的单一参考图片66的相同默认建构 技术。同样,视频解码器30可使用在单一参考图片列表94中指示的参考图片来解码经 帧间预测的视频块,而不管包含所述视频块的片段类型,且不管视频块是经单向预测还 是经双向预测(例如,分别从一个参考图片还是两个参考图片预测)。

例如,视频解码器30可确定当前图片的视频块与存储在参考图片存储器92中的一 个或一个以上参考图片之间的时间距离。存储在参考图片存储器92中的参考图片可为 先前经解码的参考图片。在一个实例中,较之于在时间上距当前图片较远的参考图片的 识别符,视频解码器30可将在时间上较接近于当前图片的参考图片的识别符(例如,POC 值或图片编号值)包含在单一参考图片列表94中的较前位置。在替代实例中,较之于在 时间上较接近于当前图片的参考图片的识别符,视频解码器30可将在时间上距当前图 片较远的参考图片的识别符包含在单一参考图片列表84中的较前位置。当前图片与一 个或一个以上参考图片之间的时间距离可基于当前图片的POC值或图片编号值与一个 或一个以上参考图片的POC值或图片编号值之间的差的绝对值。在这些实例中,参考 图片为在时间上在先还是在时间上在后的参考图片可能关系不大。

在两个参考图片与当前图片之间的时间距离相同的情况下,视频解码器30可将具 有较小POC或图片编号值的参考图片的识别符包含在单一参考图片列表94中的较前位 置,且将具有较大POC值或图片编号值的参考图片的识别符包含在单一参考图片列表 94中的较后位置。在一替代实例中,当两个参考图片与当前图片之间的时间距离相同时, 视频解码器30可将具有较大POC或图片编号值的参考图片的识别符包含在单一参考图 片列表94中的较前位置,且将具有较小POC或图片编号值的参考图片的识别符包含在 单一参考图片列表94中的较后位置。

如果由熵解码单元80解码的语法元素告知视频解码器30重新排序单一参考图片列 表94中的识别符,那么视频解码器可重新排序单一参考图片列表94。所接收的重新排 序语法元素可告知视频解码器30视频解码器30重新排序单一参考图片列表94中的参 考图片的识别符所应采取的方式,且视频解码器30可如被告知那样重新排序单一参考 图片列表94。

由熵解码单元80解码的语法元素可包含运动向量信息和用于与所述运动向量信息 相关联的参考图片的识别符的索引值。所述索引值可为单一参考图片列表94的索引值, 其指示参考图片的识别符位于单一参考图片列表94中何处。熵解码单元80可能不需要 解码不同于单一参考图片列表94的任何其它参考图片列表的索引值,因为可能不需要 利用任何其它参考图片列表用于解码。

通过索引值,运动补偿单元82可识别其解码来自单一参考图片列表94的视频块所 应使用的参考图片,且从参考图片存储器92检索那些参考图片。运动向量信息向运动 补偿单元82指示其应利用参考图片的哪一(哪些)块来解码视频块。运动补偿单元82可 接着产生用于最终解码视频块的预测块。

作为一说明性实例,熵解码单元80可解码信息以解码当前视频块,所述当前视频 块可能是相对于一个参考图片(例如,单向预测)或相对于两个参考图片(例如,双向预测) 进行编码的。在此实例中,假定当前视频块是相对于两个参考图片进行编码的。经解码 的信息可指示两个参考图片位于单一参考图片列表94中何处的索引值以及指示匹配块 (其匹配当前视频块)位于两个参考图片中何处的运动向量信息。

运动补偿单元82可接着基于所述索引值确定存储在单一参考图片列表94内的两个 参考图片的识别符。运动补偿单元82可基于所确定的识别符从参考图片存储器92接收 参考图片。运动补偿单元82可接着基于参考图片和运动向量信息来解码当前视频块。

作为另一说明性实例,假定当前视频块是仅相对于一个参考图片进行编码的。在此 实例中,经解码信息可指示仅一个参考图片的索引值和所述仅一个参考图片的运动向 量。运动补偿单元82可接着类似于先前实例而解码当前视频块;然而,运动补偿单元 82可利用仅一个参考图片来解码当前视频块。

在以上说明性实例中的任一者中,视频块为P片段、B片段还是GPB片段的部分可 能并非实质性的,因为运动补偿单元82可仅基于单一参考图片列表94中指示的参考图 片来解码视频块。在常规技术中,运动补偿单元82需要两个不同列表,且还需要关于 视频块是P片段、B片段还是GPB片段的部分的指示,以使得运动补偿单元82将知道 使用两个列表中的哪一者。

同样,在以上说明性实例中的任一者中,视频块是相对于一个参考图片还是两个参 考图片进行编码可能并非实质性的。当视频块是相对于一个参考图片进行编码时,运动 补偿单元82仅使用单一参考图片列表94来确定利用哪一参考图片来编码所述视频块。 当视频块是相对于两个参考图片进行编码时,运动补偿单元82还使用相同的单一参考 图片列表94来确定利用哪些参考图片来编码所述视频块。换句话说,在这些实例中, 运动补偿单元82用以确定将使用哪一(哪些)参考图片用于解码的经解码索引值可仅用 于单一参考图片列表94,而不用于其它参考图片列表。

视频解码器30还可使用指示参考图片的权重和偏移值的语法元素将预测权重和偏 移应用到单一参考图片列表94中的参考图片。表示预测权重和偏移的语法元素可包括 告知解码器30将特定权重和偏移值应用到单一参考图片列表94的每一参考图片的表。

反量化单元86反量化(即,解量化)在位流中提供且由熵解码单元80解码的经量化 的变化系数。反量化过程可包含使用由视频编码器20针对每一视频块或CU计算的量化 参数QPY来确定量化度以及(同样)应应用的反量化度。反变换单元88对变换系数应用反 变换(例如,反DCT、反整数变换,或概念上类似的反变换过程),以便产生像素域中的 残余块。

在运动补偿单元82基于运动向量和预测语法元素产生用于当前视频块的预测块之 后,视频解码器30通过对来自反变换单元88的残余块与由运动补偿单元82产生的对 应预测块进行求和来形成经解码视频块。求和器90表示执行此求和运算的组件。如果 需要,还可应用解块滤波器以对经解码块进行滤波,以便移除成块假影。接着将经解码 视频块存储在参考图片存储器92中,所述参考图片存储器92提供参考图片的参考块以 用于后续运动补偿。参考图片存储器92还产生经解码视频以供在显示装置(例如,图1 的显示装置32)上呈现。

在一些实例中,熵解码单元80还可解码指示视频块、视频片段、视频图片或图片 群组的编码是否被约束于单向预测(例如,通过uni_pred_only旗标)的语法元素。 uni_pred_only语法元素可提高运动补偿单元82的计算效率。例如,当uni_pred_only语 法元素为真时,运动补偿单元82可知道其不需要等待两个不同索引值来确定其应使用 哪些参考图片来用于解码。确切地说,当uni_pred_only语法元素为真时,运动补偿单元 82可在接收到单一参考图片的索引值和运动向量信息之后立即解码当前视频块。

图5是说明根据本发明的一个或一个以上方面的译码视频块的实例操作的流程图。 为易于理解,图5的流程图参考视频译码器。术语“视频译码器”可为对视频编码器20 或视频解码器30的共同参考。换句话说,图5的流程图中所说明的功能可由视频编码 器20或视频解码器30或视频编码器20与视频解码器30两者来执行。同样,如图5中 所使用的术语“译码”在视频译码器对应于视频编码器20时是指编码,且在视频译码 器对应于视频解码器30时是指解码。

视频译码器可建构包含用于一个或一个以上参考图片的识别符的单一参考图片列 表(100)。在一些实例中,视频译码器可将所述一个或一个以上参考图片存储在视频译码 装置(例如,源装置12或目的地装置14)的或在视频译码器内的存储器(例如,参考图片 存储器64或参考图片存储器92)中。视频译码器可实施如上所述且在图6和7中进一步 说明的用以建构单一参考图片列表的默认建构技术。在一些实例中,视频译码器可不建 构不同于所述单一参考图片列表(例如,不同于单一参考图片列表66或单一参考图片列 表94)的任何其它参考图片列表。

视频译码器可确定视频块是否是相对于一个参考图片进行译码的(102)。举例来说, 视频编码器20可确定P片段、B片段或GPB片段的视频块是否将相对于仅一个参考图 片进行编码,或B片段或GPB片段的视频块是否将相对于两个参考图片进行编码。类 似地,视频解码器30可确定P片段、B片段或GPB片段的视频块是否将相对于仅一个 参考图片进行解码,或B片段或GPB片段的视频块是否将相对于两个参考图片进行解 码。

当相对于两个参考图片进行译码(102的“否”分支)时,视频译码器可译码指示识 别符位于单一参考图片列表中何处的索引值(105)。举例来说,当视频块是相对于两个不 同参考图片进行译码时,视频解码器30可解码指示所述参考图片中的每一者的识别符 存储于单一参考图片列表94中何处的索引值。视频译码器可不译码用于任何其它参考 图片列表的索引值。再次,存储在由视频译码器建构的单一参考图片列表中的参考图片 的识别符可足以识别译码当前图片的视频块可能需要的所有参考图片。视频译码器可使 用仅有的单一参考图片列表中识别的至少两个参考图片来译码当前图片的视频块(106)。

当相对于仅一个参考图片进行译码(102的“是”分支)时,视频译码器可译码指示 识别符位于单一参考图片列表中何处的索引值(103)。举例来说,当视频块是相对于一个 参考图片进行译码时,视频解码器30可解码指示用来预测视频块的参考图片的识别符 存储于单一参考图片列表94中何处的索引值。视频译码器可不译码用于任何其它参考 图片列表的索引值。视频译码器可使用仅有的单一参考图片列表中识别的参考图片中的 一者来译码当前图片的视频块(104)。

举例来说,在任一情境(例如,图5中的块104或106)中,视频译码器可能不需要 使用常规列表0和列表1或列表0和列表0的副本来译码视频块。确切地说,当视频块 是相对于仅一个参考图片进行译码时,单一参考图片列表可能足以提供参考图片的识别 符,且当视频块是相对于两个不同参考图片进行译码时,单一参考图片列表足以提供参 考图片的识别符。同样,当相对于两个参考图片进行译码时,所述两个参考图片可能按 显示次序都在时间上先于当前图片、都在时间上晚于当前图片,以及在时间上先于与在 时间上晚于当前图片两者。以此方式,视频块为P片段、B片段还是GPB片段的视频块 可能并非实质性的。

图6和7是说明用于实施根据本发明的一个或一个以上方面的用以建构单一参考图 片列表的默认建构技术的实例操作的流程图。类似于图5,参考视频译码器来描述图6 和7的流程图。视频译码器的实例包含视频编码器20和视频解码器30。大体来说,在 图6和7的实例中,视频译码器可基于包含经译码视频块的当前图片与包含于单一参考 图片列表中的参考图片中的每一者之间的距离来建构单一参考图片列表。

在图6的实例中,视频译码器可按升序在单一参考图片列表中排序参考图片。举例 来说,较之于按显示次序或译码次序距当前图片较远的参考图片,所述视频译码器可将 按显示次序或译码次序较接近于所述当前图片的参考图片的识别符包含于单一参考图 片列表中的较前位置。

举例来说,视频译码器可确定当前图片与第一参考图片之间的第一时间距离(110), 且确定当前图片与第二参考图片之间的第二时间距离(112)。为确定所述时间距离,视频 译码器可确定当前图片与第一图片的POC或图片编号值之间的差或当前图片与第二图 片的POC或图片编号值之间的差的绝对值。

视频译码器可确定第一时间距离是否小于第二时间距离(114)。当所述第一时间距离 小于所述第二时间距离(114的“是”分支)时,视频译码器可将所述第一参考图片的识 别符包含于所述单一参考图片列表中的较前位置,且将所述第二参考图片的识别符包含 于所述单一参考图片列表中的较后位置(116)。

当所述第一时间距离不小于所述第二时间距离(114的“否”分支)时,视频译码器 可确定第一时间距离是否等于第二时间距离(118)。在此情况下,当所述第一时间距离不 等于所述第二时间距离(118的“否”分支)时,第二时间距离小于第一时间距离。当所 述第二时间距离小于所述第一时间距离时,视频译码器可将所述第二参考图片的所述识 别符包含于所述单一参考图片列表中的所述较前位置,且将所述第一参考图片的所述识 别符包含于所述单一参考图片列表中的所述较后位置(120)。

当所述第一时间距离等于所述第二时间距离(118的“是”分支)时,视频译码器可 基于第一参考图片与第二参考图片的相应POC或图片编号值确定第一参考图片按显示 次序或译码次序是否先于第二参考图片(122)。当所述第一参考图片按显示次序或译码次 序先于所述第二参考图片(122的“是”分支)时,较之于所述第二参考图片的所述识别 符,视频译码器可将所述第一参考图片的所述识别符包含于所述单一参考图片列表中的 较前位置(124)。当所述第二参考图片按显示次序或译码次序先于所述第一参考图片(122 的“否”分支)时,较之于所述第一参考图片的所述识别符,视频译码器可将所述第二参 考图片的所述识别符包含于所述单一参考图片列表中的较前位置(126)。

在图7的实例中,视频译码器可按降序在单一参考图片列表中排序参考图片。举例 来说,较之于按显示次序或译码次序较接近于当前图片的参考图片,所述视频译码器可 将按显示次序或译码次序距所述当前图片较远的参考图片的识别符包含于单一参考图 片列表中的较前位置。举例来说,类似于图6,视频译码器可确定当前图片与第一参考 图片之间的第一时间距离(130),且确定当前图片与第二参考图片之间的第二时间距离 (132)。

视频译码器可确定第一时间距离是否小于第二时间距离(134)。当所述第一时间距离 小于所述第二时间距离(134的“是”分支)时,视频译码器可将所述第二参考图片的识 别符包含于所述单一参考图片列表中的较前位置,且将所述第一参考图片的识别符包含 于所述单一参考图片列表中的较后位置(136)。

当所述第一时间距离不小于所述第二时间距离(134的“否”分支)时,视频译码器 可确定第一时间距离是否等于第二时间距离(138)。在此情况下,当所述第一时间距离不 等于所述第二时间距离(138的“否”分支)时,第二时间距离小于第一时间距离。当所 述第二时间距离小于所述第一时间距离时,视频译码器可将所述第一参考图片的所述识 别符包含于所述单一参考图片列表中的所述较前位置,且将所述第二参考图片的所述识 别符包含于所述单一参考图片列表中的所述较后位置(140)。

当所述第一时间距离等于所述第二时间距离(138的“是”分支)时,视频译码器可 基于第一参考图片与第二参考图片的相应POC或图片编号值确定第一参考图片按显示 次序或译码次序是否先于第二参考图片(142)。当所述第一参考图片按显示次序或译码次 序先于所述第二参考图片(142的“是”分支)时,较之于所述第一参考图片的所述识别 符,视频译码器可将所述第二参考图片的所述识别符包含于所述单一参考图片列表中的 较前位置(144)。当所述第二参考图片按显示次序先于所述第一参考图片(142的“否”分 支)时,较之于所述第二参考图片的所述识别符,视频译码器可将所述第一参考图片的所 述识别符包含于所述单一参考图片列表中的较前位置(146)。

在一个或一个以上实例中,所描述的功能可以硬件、软件、固件或其任何组合来实 施。如果以软件实施,那么功能可作为一个或一个以上指令或代码存储在计算机可读媒 体上或经由计算机可读媒体发射,且由基于硬件的处理单元执行。计算机可读媒体可包 含对应于例如数据存储媒体等有形媒体的计算机可读存储媒体,或包含促进计算机程序 例如根据通信协议从一处传送到另一处的任何媒体的通信媒体。以此方式,计算机可读 媒体通常可对应于(1)非暂时的有形计算机可读存储媒体,或(2)例如信号或载波等通信媒 体。数据存储媒体可为可由一个或一个以上计算机或者一个或一个以上处理器存取以检 索用于实施本发明中描述的技术的指令、代码和/或数据结构的任何可用媒体。计算机程 序产品可包含计算机可读媒体。

举例来说且并非限制,此类计算机可读存储媒体可包括RAM、ROM、EEPROM、 CD-ROM或其它光盘存储装置、磁盘存储装置或其它磁性存储装置、闪存存储器或可用 来以指令或数据结构的形式存储所要程序代码且可由计算机存取的任何其它媒体。同 样,可恰当地将任何连接称作计算机可读媒体。举例来说,如果使用同轴电缆、光纤电 缆、双绞线、数字订户线(DSL)或例如红外线、无线电及微波等无线技术从网站、服务 器或其它远程源发射指令,那么同轴电缆、光纤电缆、双绞线、DSL或例如红外线、无 线电及微波等无线技术包含于媒体的定义中。然而,应理解,计算机可读存储媒体和数 据存储媒体不包含连接、载波、信号或其它瞬时媒体,而是针对非暂时有形存储媒体。 如本文中所使用,磁盘及光盘包含紧密光盘(CD)、激光光盘、光学光盘、数字多功能光 盘(DVD)、软磁盘及蓝光光盘,其中磁盘通常以磁性方式再生数据,而光盘使用激光以 光学方式再生数据。上文的组合也应包含在计算机可读媒体的范围内。

可由例如一个或一个以上数字信号处理器(DSP)、通用微处理器、专用集成电路 (ASIC)、现场可编程逻辑阵列(FPGA)或其它等效集成或离散逻辑电路等一个或一个以上 处理器来执行指令。因此,如本文中所使用的术语“处理器”可指上述结构或适合于实 施本文中所描述的技术的任一其它结构中的任一者。另外,在一些方面中,本文描述的 功能性可提供于经配置以用于编码和解码的专用硬件和/或软件模块内,或并入在组合式 编解码器中。并且,可将所述技术完全实施于一个或一个以上电路或逻辑元件中。

本发明的技术可在广泛多种装置或设备中实施,包含无线手持机、集成电路(IC)或 一组IC(例如,芯片组)。本发明中描述各种组件、模块或单元以强调经配置以执行所揭 示技术的装置的功能方面,但不一定需要通过不同硬件单元来实现。确切地说,如上所 述,各种单元可在编解码器硬件单元中组合或由互操作硬件单元(包含如上所述的一个或 一个以上处理器)的集合结合合适软件和/或固件来提供。

已描述了各种实例。这些及其它实例属于所附权利要求书的范围内。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号