首页> 中国专利> 编码装置、编码方法、传输装置、解码装置、解码方法以及接收装置

编码装置、编码方法、传输装置、解码装置、解码方法以及接收装置

摘要

目标是为了允许交错图像数据的开放式GOP编码。图像编码单元在NAL单元结构中为每个图片编码图像数据,并且为每个图片生成编码图像数据的视频流,所述交错图像数据利用所述图像数据形成。所述图像编码单元将与构成随机访问点的帧内图片形成字段对的图片的编码图像数据的切片的NAL单元类型设置为独特类型,所述独特类型表示图片依赖于所述帧内图片并且与所述帧内图片形成字段对。

著录项

  • 公开/公告号CN105340277A

    专利类型发明专利

  • 公开/公告日2016-02-17

    原文格式PDF

  • 申请/专利权人 索尼公司;

    申请/专利号CN201480035550.5

  • 发明设计人 塚越郁夫;

    申请日2014-08-08

  • 分类号H04N19/70(20060101);

  • 代理机构11240 北京康信知识产权代理有限责任公司;

  • 代理人田喜庆;吴孟秋

  • 地址 日本东京

  • 入库时间 2023-12-18 14:26:07

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2019-02-15

    授权

    授权

  • 2016-08-10

    实质审查的生效 IPC(主分类):H04N19/70 申请日:20140808

    实质审查的生效

  • 2016-02-17

    公开

    公开

说明书

技术领域

本技术涉及一种编码装置、编码方法、传输装置、解码装置、解码方 法以及接收装置。更具体而言,本技术涉及一种编码装置,其在NAL单 元结构中编码交错方式的图像数据。

背景技术

在相关技术中已知在NAL单元结构中编码图像数据的编码方式。例 如,非专利文献1公开了高效率视频编码(HEVC)方式的编码。

引用列表

非专利文献

非专利文献1:作者为GaryJ.Sullivan、Jens-RainerOhm、Woo-JinHan 以及ThomasWiegand的“OverviewoftheHighEfficiencyVideoCoding (HEVC)Standard”,IEEETRANSACTIONSONCIRCUITSAND SYSTEMSFORVIDEOTECNOROGY,2012年12月、第22卷、第12 号、第1649-1668页。

发明内容

技术问题

以HEVC方式编码交错方式的图像数据时,如果将与构成随机访问点 的帧内图片形成字段对的图片设置为尾部图片(TP),那么没有方法插入 前导图片(LP)。因此,在这种情况下,不能编码开放式图片组(开放式 GOP)。

本技术的一个目标在于,使交错方式的图像数据经受开放式GOP的 编码。

问题的解决方式

本技术的一个概念在于一种编码装置,包括:图像编码单元,其被配 置为在NAL单元结构中编码构成交错方式的图像数据的每个图片的图像 数据,并且生成具有各图片的编码图像数据的视频流。所述图像编码单元 将与构成随机访问点的帧内图片形成字段对的图片的编码图像数据的切 片的NAL单元类型设置为独特类型,所述独特类型表示依赖于所述帧内 图片并且与所述帧内图片形成字段对的图片。

在本技术中,所述图像编码单元在NAL单元结构中编码构成交错方 式的图像数据的每个图片的图像数据,从而生成具有每个图片的图像数据 的视频流。例如,所述图像编码单元将构成交错方式的图像数据的每个图 片的图像数据分类成多层,从而生成具有编码后的各层的图片的图像数据 的视频流。此外,例如,所述图像编码单元以HEVC方式编码交错方式的 图像数据。

在此处,将与构成随机访问点的帧内图片形成字段对的图片的编码图 像数据的切片的NAL单元类型设置为独特类型,所述独特类型表示依赖 于所述帧内图片并且与所述帧内图片形成字段对的图片。为此,可以插入 LP,作为后续图片,从而能够编码开放式GOP。

本技术的另一个概念在于一种解码装置,包括:图像解码单元,其被 配置为解码视频流,所述视频流具有通过在NAL单元结构中编码构成交 错方式的图像数据的每个图片的图像数据所获得的各图片的编码图像数 据,以获得交错方式的图像数据。在所述视频流中,将与构成随机访问点 的帧内图片形成字段对的图片的编码图像数据的切片的NAL单元类型设 置为独特类型,所述独特类型表示依赖于所述帧内图片并且与所述帧内图 片形成字段对的图片。

在本技术中,图像解码单元解码视频流,从而获得交错方式的图像数 据。这个视频流具有通过在NAL单元结构中编码构成交错方式的图像数 据的每个图片的图像数据所获得的各图片的编码图像数据。

在视频流中,将与构成随机访问点的帧内图片形成字段对的图片的编 码图像数据的切片的NAL单元类型设置为独特类型,所述独特类型表示 依赖于所述帧内图片并且与所述帧内图片形成字段对的图片。为此,视频 流可以经受包括LP的开放式GOP的编码。

在本技术中,例如,所述视频流可以具有通过编码每层的图片的图像 数据所获得的每层的图片的图像数据,通过将构成交错方式的图像数据的 每个图片的图像数据分类成多层,获得所述图像数据。所述图像解码单元 可以解码在层指定信息中指定的层的图片的编码图像数据,并且获得等于 或低于预定层的层的图片的图像数据。在这种情况下,例如,能够具有与 装置的解码能力相当的解码。

此外,在本技术中,例如,可以进一步提供:方式转换单元,其将由 所述图像解码单元获得的交错方式的图像数据转换成渐进方式的图像数 据;以及后处理单元,其促使由所述方式转换单元获得的每个图片的图像 数据的帧速率与显示能力匹配。在这种情况下,甚至在解码能力较低时, 可以获得与高显示能力相当的帧速率的图像数据。

本发明的有利效应

根据本技术,还可以给交错方式的图像数据执行开放式GOP的编码。 应注意的是,在本文中描述的效应不必具有限制性,并且可以显示在本公 开中描述的任何效应。

附图说明

图1是示出一个实施方式的传输和接收系统的一个配置实例的方框 图;

图2是示出由编码器执行的交错方式的图像数据的分层编码的一个实 例的示图;

图3是示出NAL单元报头的结构实例(语法)以及在结构实例中的 主要参数的内容(语义)的示图;

图4是用于描述基于HEVC的各图片的编码图像数据的配置的示图;

图5是示出由编码器执行的交错方式的图像数据的分层编码的一个实 例的示图;

图6是示出由编码器执行的交错方式的图像数据的分层编码的一个实 例的示图;

图7是用于描述关闭式GOP和开放式GOP的示图;

图8是示出在与IRAP的图片形成字段对的图片的编码图像数据的切 片的NAL单元类型设置为RAP_dependent时的分层编码的一个实例的示 图;

图9是示出由编码器执行的交错方式的图像数据的编码的一个实例的 示图;

图10是示出由编码器执行的交错方式的图像数据的编码的另一个实 例的示图;

图11是示出传输装置的一个配置实例的方框图;

图12是示出编码器的一个配置实例的方框图;

图13是示出接收装置的一个配置实例的方框图;

图14是示出解码器的一个配置实例的方框图;

图15是示出后处理单元的一个配置实例的示图。

具体实施方式

在后文中,描述用于实现本技术的实施方式(在后文中称为“实施方 式”)。要注意的是,按照以下顺序提供描述。

1、实施方式

2、修改实例

<1、实施方式>

【传输和接收系统】

图1示出一个实施方式的传输和接收系统10的一个配置实例,作为 一个实施方式。这个传输和接收系统10被配置为具有传输装置100和接 收装置200。

传输装置100通过促使在广播波上传送流,来传输作为容器的传输流 TS。传输流TS包括具有各图片的编码图像数据的视频流,通过编码在 NAL单元结构内构成交错方式的图像数据的图片的图像数据,获得所述 视频流。在这个实施方式中,以高效率视频编码(HEVC)方式编码交错 方式的图像数据。

此外,这个视频流设置为具有每层的图片的图像数据的编码数据,通 过将构成交错方式的图像数据的每个图片的图像数据分类成多层,获得所 述视频流。在这种情况下,例如,进行编码,以便参考源图片附属于其自 身的层和/或比其自身的层更低的层。

将用于识别每个图片的附属层的层识别信息加入每层的图片的编码 图像数据中。在每个图片的NAL单元(nal_unit)的报头部分内设置层识 别信息(“nuh_temporal_id_plus1”,其表示temporal_id)。通过这种方式加 入层识别信息,接收侧可以选择性取出等于或低于预定层的层的编码图像 数据,并且在其上执行解码工艺。

图2示出由编码器102执行的分层编码的一个实例。在这个实例中, 层分成0到3这4层,并且在每个层的图片的图像数据上进行编码。垂直 轴表示层。0到3分别设置为temporal_id(层识别信息),其设置在构成 在层0到3内的图片的编码图像数据的NAL单元(nal_unit)的报头部分 内。水平轴表示显示顺序(成分的图片顺序(POC)),按照这个顺序,其 左边表示更早的显示位置,其右边表示更晚的显示位置。

图3(a)示出NAL单元的报头的结构实例(语法),并且图3(b) 示出在结构实例中的主要参数的内容(语义)。一位字段 “forbidden_zero_bit”应具有0。6位字段“nal_unit_type”表示NAL单元 的类型。假设6位字段“nuh_layer_id”具有0。3位字段 “nuh_temporal_id_plus1”表示temporal_id,并且具有通过加上1所获得 的值(1到7)。

返回图2,每个矩形帧表示图片,并且在其内的数字表示编码的图片 的位置,即,按照编码顺序(在接收侧上的解码顺序)。实线箭头表示在 图片之间的编码参考关系。图片结构(SOP)由从“1”到“17”(不包括 “2”和“3”)这16个图片构成,并且“0”是前导图片。“2”是下一个 SOP的前导图片。交替地,不包括“0”和“1”,图片结构(SOP)由从 “2”到“3”直到“17”这16个图片构成,并且在这种情况下,“2”是 SOP的前导图片。由虚线椭圆形包围的两个图片表示字段对,“F”表示第 一字段(顶部字段),并且“S”表示第二字段(底部字段)。应注意的是, 形成字段对的两个图片的层相同。

“1”的图片可以是图片组(GOP)的前导图片。如图4中所示,GOP 的前导图片的编码图像数据由NAL单元构成,即, AUD、VPS、SPS、PPS、PSEI、SLICE、SSEI以及EOS。另一方面,除 了GOP的前导图片以外的图片由NAL单元构成,即, AUD、PPS、PSEI、SLICE、SSEI以及EOS。VPS可以与SPS一起在序 列(GOP)中传输一次,并且可以给每个图片传输PPS。

在本实施方式中,能够编码开放式GOP。换言之,与IRAP的图片形 成字段对的图片的编码图像数据的切片的NAL单元类型设置为独特类 型,所述独特类型表示依赖于IRAP的图片并且与IRAP的图片形成字段 对的图片。

以HEVC方式编码时,帧内随机访问点(IRAP)、尾部图片(TP)以 及前导图片(LP)限定为切片的NAL单元类型。“IRAP”表示构成随机 访问点的帧内图片,并且包括每种类型的“BLA_W_LP”、 “BLA_W_RADL”、“BLA_N_LP”、“IDR_W_RADL”、“IDR_N_LP” 以及“CRA_NUT”。

“TP”表示按照解码顺序比IRAP更晚并且按照显示顺序比IRAP更 晚的图片,并且包括每种类型的“TRAIL_N”和“TRAIL_R”。“LP”表 示按照解码顺序比IRAP更晚并且按照显示顺序比IRAP更晚的图片,并 且包括每种类型的“RADL_N”、“RADL_R”、“RASL_N”以及 “RASL_R”。

最初,与IRAP的图片构成字段对的图片变成按照解码顺序比IRAP 更晚并且按照显示顺序比IRAP更晚的TP。在这种情况下,仅仅TP用作 后续图片,如图5中所示,未留下插入LP的空间,从而不能解码开放式 GOP。

在这个实施方式中,最近限定称为“RAP_dependent”的类型。这个 类型表示并非IRAP图片但是依赖于IRAP图片的图片,并且与IRAP图 片构成字段对。因此,与IRAP的图片形成字段对的图片的编码图像数据 的切片的NAL单元类型设置为RAP_dependent。在这种情况下,可以插 入LP,作为后续图片,从而能够编码开放式GOP。

描述关闭式GOP和开放式GOP的概念。图7(a)示意性示出关闭式 GOP。关闭式GOP是GOP,其中,按照解码顺序的前导I图片是即时解 码更新(IDR)图片。图7(b)示意性示出开放式GOP。开放式GOP是 GOP,其中,按照解码顺序的前导I图片是非IDR图片。

如在图中所示,假设第N个GOP是第N个GOP,并且第N-1个GOP 是第N-1个GOP。在第N个GOP中,IDR图片按照解码顺序首先出现, LP下一个出现,并且随后,TP下一个出现。此外,在第N个GOP中, LP按照解码顺序首先出现,非IDR图片的IDR图片下一个出现,并且随 后,TP下一个出现。

在关闭式GOP的情况下,在解码从第N个GOP的开头开始时,保证 解码包含在第N个GOP内的所有图片。换言之,首先解码IDR图片,然 后,解码LP。禁止这个LP按照解码顺序超越IDR图片,以表示第N-1 个GOP。为此,在具有LP时,仅仅允许LP表示包含在第N个GOP内 的图片,因此,可以解码,无需第N-1个GOP的信息。同样,由于也禁 止TP表示第N-1个GOP,所以可以解码,无需第N-1个GOP的信息。

另一方面,在开放式GOP的情况下,在解码从第N个GOP的开头开 始时,允许按照解码顺序比非IDR图片更早的LP表示第N-1个GOP,因 此,可以不可解码。应注意的是,由于也禁止TP表示第N-1个GOP,所 以可以解码,无需第N-1个GOP的信息。

通过这种方式,在解码从第N个GOP的开头开始时,在关闭式GOP 的情况下,包含在第N个GOP内的图片可以解码,但是在开放式GOP 的情况下,不能解码LP。另一方面,由于在关闭式GOP的情况下不允许 表示第N-1个GOP,所以其位速率高于开放式GOP,以获得相同的图像 质量。为此,根据在过去的情况下,单独使用关闭式GOP和开放式GOP。

图8示出在与IRAP的图片形成字段对的图片的编码图像数据的切片 的NAL单元类型设置为RAP_dependent时的分层编码的一个实例。垂直 轴表示层。水平轴表示显示顺序(成分的图片顺序或POC),其左边表示 更早的显示时间,其右边表示更晚的显示时间。在这个实例中,层分成0 到3这4层,并且在每层的图片的图像数据上进行编码,如上面在图2的 实例上中所述。

在这个实例中,每个矩形帧表示图片,并且在其内的数字表示编码的 图片的位置,即,按照编码顺序(在接收侧上的解码顺序)。实线箭头表 示在图片之间的编码参考关系。由虚线椭圆形包围的两个图片表示字段 对,“F”表示第一字段(顶部字段),并且“S”表示第二字段(底部字段)。

在这个实例中,编码在层0中的图片“0”,作为IRAP的图片。接下 来,编码与图片“0”形成字段对的图片“1”,作为RAP_dependent的图 片。然后,编码在层1到3中的图片“2”到“15”,作为LP,然后,编 码在层0中的图片“16”和“17”以及在层1到3中的图片“18”到“31”, 作为TP。

在这个实例中,通过编码与作为图片IRAP的图片“0”形成字段对的 图片“1”,作为RAP_dependent的图片,随后,能够插入LP。为此,能 够编码开放式GOP。

应注意的是,通过将与IRAP的图片形成字段对的图片的编码图像数 据的切片的NAL单元类型设置为RAP_dependent,能够插入LP,作为后 续图片,这不在分层解码中限制。

图9示出按照流顺序和显示顺序编码的一个实例。在这个实例中,假 设第N个GOP是第N个GOP,并且第N-1个GOP是第N-1个GOP。此 外,每个实线矩形帧表示图片,并且在其内的数字表示编码的图片的位置, 即,按照编码顺序(在接收侧上的解码顺序)。由虚线椭圆形帧包围的两 个图片表示与第一字段(顶部字段)和第二字段(底部字段)的字段对。

在这个实例中,如下编码第N个GOP的每个图片,从而生成视频流。 换言之,编码图片“0”,作为IRAP的图片。接下来,编码与图片“0”形 成字段对的图片“1”,作为RAP_dependent的图片。然后,编码按照显示 顺序放在图片“0”之前的图片“2”到“5”,作为LP,然后,编码按照 显示顺序放在图片“1”之后的图片“6”到“9”,作为TP。

在这个实例中,通过如上所述编码图片“1”,作为RAP_dependent的 图片,随后,能够插入LP。因此,能够编码开放式GOP。

图10示出按照流顺序和显示顺序编码的一个实例。这个实例显示了 以下情况:与IRAP的图片形成字段对的图片的编码图像数据的切片的 NAL单元类型设置为TP,而非RAP_dependent。

在这个实例中,如下编码第N个GOP的相应图片,从而生成视频流。 换言之,编码图片“0”,作为IRAP的图片。接下来,编码与图片“0”形 成字段对的图片“1”,作为TP。然后,编码按照显示顺序放在图片“1” 之后的图片“2”到“9”,作为TP。

在这个实例中,通过如上所述编码图片“1”,作为TP,后续图片仅 仅变成TP。为此,不能编码基于插入LP的前提的开放式GOP。

返回图1,接收装置200从传输装置100中接收通过在广播波上传送 并且由广播波发送的传输流TS。接收装置200根据其自身的解码能力, 从包含在这个传输流TS内的视频流中选择性取出并且解码等于或低于预 定层的层的编码图像数据,获取每个图片的图像数据,从而获得交错方式 的图像数据。

此外,接收装置200将通过上述解码所获得的交错方式的图像数据转 换成渐进方式的图像数据,并且进一步执行后处理,以促使其帧速率与显 示能力匹配。通过这个后处理,例如,甚至在解码能力较低时,能够获得 与高显示能力相当的帧速率的图像数据。

【传输装置的配置】

图11示出传输装置100的一个配置实例。传输装置100具有编码器 102、压缩数据缓冲器(编码图片缓冲器或cpb)103、多路复用器104以 及传输单元105。

编码器102以交错方式接收未压缩的图像数据的输入,并且以HEVC 方式执行分层编码。编码器102将构成交错方式的图像数据的每个图片的 图像数据分类成多层,并且生成具有每层的图片的图像数据的编码数据的 视频流。在这种情况下,编码器102编码数据,以便要参考的图片(参考 源图片)附属于其自身的层和/或比其自身的层更低的层(见图2)。

此时,编码器102编码每个图片,以便能够编码开放式GOP。换言之, 编码器102将与IRAP的图片形成字段对的图片的编码图像数据的切片的 NAL单元类型设置为独特类型,所述独特类型表示依赖于IRAP的图片并 且与IRAP的图片形成字段对的图片。在这个实施方式中,如上所述,这 个独特类型是最近限定的“RAP_dependent”(见图8和图9)。

图12示出编码器102的一个配置实例。这个编码器102具有参数组 /SEI编码单元121、切片编码单元122、NAL包格式化单元123以及暂时 ID生成单元124。

参数组/SEI编码单元121根据要编码的流的数量,生成参数组(例如, VPS、SPS、PPS等)和每层的图片的SEI。切片编码单元122通过解码每 层的图片的编码图像数据,获得切片数据。

NAL包格式化单元123根据由参数组/SEI编码单元121生成的参数 组和SEI以及由切片编码单元122生成的切片数据,生成每层的图片的编 码图像数据,并且输出视频流(编码流)。

暂时ID生成单元124根据图片的层信息,为要编码的图片生成 temporal_id,并且将数据发送给NAL包格式化单元123。NAL包格式化 单元123接收要编码的每个图片的NAL单元类型的信息。NAL包格式化 单元123将对应于每层的图片的temporal_id插入构成图片的编码图像数 据的NAL单元的报头内,并且进一步设置NAL单元类型(见图3)。

返回图11,压缩的数据缓冲器(cpb)103暂时累积视频流,包括由 编码器102获得的每层的图片的编码数据。多路复用器104读取在压缩的 数据缓冲器103内累积的视频流,将视频流制造成PES数据包,进一步将 视频流制造成传输数据包并且多路复用视频流,从而获得传输流TS,作 为多路复用流。

这个传输流TS包括具有每层的图片的编码图像数据的单个视频流或 者通过将多层分成预定数量的层组所获得的具有每个层组的图片的编码 图像数据的预定数量的视频流,所述数量等于或大于2。多路复用器104 将层信息和流配置信息插入传输流TS内。

作为节目专用信息(PSI),传输流TS包括节目映射表(PMT)。这个 PMT具有视频基本回路(视频ES1回路),具有与每个视频流相关的信息。 在这个视频基本回路中,流类型的信息、数据包标识符(PID)等以及描 述与视频流相关的信息的描述符设置为对应于每个视频流。

传输单元105在适合于广播的调制方式(例如,QPSK-OFDM)中调 制传输流TS,并且从传输天线中传输RF调制信号。

简单描述在图11中显示的传输装置100的操作。编码器102以交错 方式接收未压缩的图像数据的输入。编码器102以HEVC方式在这个图像 数据上执行分层编码。换言之,编码器102将构成图像数据的相应图片的 图像数据分类成多层,并且编码该数据,从而生成具有编码后的各层的图 片的图像数据的视频流。此时,编码器102进行编码,以便要参考的图片 附属于其自身的层和/或比其自身的层更低的层。

此外,此时,编码每个图片,以便能够编码开放式GOP。换言之,将 与IRAP的图片形成字段对的图片的编码图像数据的切片的NAL单元类 型设置为作为独特类型的“RAP_dependent”,所述独特类型表示依赖于 IRAP的图片并且与IRAP的图片形成字段对的图片。

包括每层的图片的编码数据的由编码器102生成的视频流供应给压缩 的数据缓冲器(cpb)103,并且暂时储存在其内。在多路复用器104中, 读取在压缩的数据缓冲器103内累积的视频流,将视频流进行PES包格式 化,进一步将视频流进行传输包格式化并且多路复用视频流,从而获得传 输流TS,作为多路复用流。

将由多路复用器104获得的传输流TS发送给传输单元105。在传输 单元105中,在适合于广播的调制方式(例如,QPSK-OFDM)中调制传 输流TS,并且从传输天线中传输RF调制信号。

<接收装置的配置>

图13示出接收装置200的一个配置实例。这个接收装置200具有接 收单元202、多路分用器203以及压缩数据缓冲器(编码图片缓冲器或cpb) 204。进一步,接收装置200具有解码器205、未压缩数据缓冲器(解码图 片缓冲器或dpb)206以及后处理单元207。

接收单元202解调由接收天线接收的RF调制信号,以获取传输流TS。 多路分用器203通过在传输流TS上执行拆包工艺,取出视频流(编码流), 并且将流发送给压缩数据缓冲器(编码图片缓冲器或cpb)204。

压缩数据缓冲器(cpb)204暂时累积由多路分用器203取出的视频流。 解码器205从在压缩数据缓冲器204中累积的视频流中取出指定为要解码 的层的层的图片的编码图像数据。然后,解码器205在图片的各解码定时, 解码每个图片的取出的编码图像数据,并且将该数据发送给未压缩数据缓 冲器(dpb)206。在解码各图片的编码图像数据时,必要时,解码器205 从未压缩数据缓冲器206中读取并且使用参考源图片的图像数据。

图14示出解码器205的一个配置实例。这个解码器205具有暂时ID 分析单元251、目标层选择单元252以及解码单元253。暂时ID分析单元 251读取在压缩数据缓冲器204内累积的视频流(编码流),并且分析插入 各图片的编码图像数据的NAL单元报头内的temporal_id。

目标层选择单元252根据暂时ID分析单元251的分析结果,从压缩 数据缓冲器204中读取的视频流中取出指定为要解码的层的层的各图片的 编码图像数据,并且将数据发送给解码单元253。解码单元253在解码定 时依次解码由目标层选择单元252获取的各图片的编码图像数据,并且将 数据发送给未压缩数据缓冲器(dpb)206。

在这种情况下,解码单元253分析VPS和SPS,以确定每个子层 “sublayer_level_idc”的位速率的等级指定值,并且检查在解码能力内是 否能够解码。此外,在这种情况下,解码单元253分析SEI,以确定(例 如)“initial_cpb_removal_time”和“cpb_removal_delay”,并且检查解码定 时是否合适。交替地,在从由多路分用器203获得的DTS(解码时间戳) 中获得的解码定时,解码开始。此外,在从由多路分用器203获得的PTS (呈现时间戳)中获得的显示时间,执行显示。

在切片解码,以进行时间方向预测时,解码单元253从切片报头中获 取表示在时间方向的预测目的地的信息。此外,在解码切片时,在为在 NAL单元报头的NAL单元类型中描述的每种类型的IRAP、 RAP_dependent、LP以及TP进行解码之后,解码单元253管理读取顺序。

返回图13,未压缩数据缓冲器(dpb)206暂时累积由解码器205解 码的每个图片的图像数据。后处理单元207将在显示时间依次从未压缩数 据缓冲器(dpb)206中读取的交错方式的图像数据转换成渐进方式的图像 数据。而且,后处理单元207执行工艺,以促使转换成渐进式方式的每个 图片的图像数据的帧速率与显示能力匹配。

例如,在图片的解码图像数据的帧速率是120fps并且显示能力是120 fps时,后处理单元207照原样将图片的解码图像数据传输给显示器。此 外,例如,在图片的解码图像数据的帧速率是120fps并且显示能力是60 fps时,后处理单元207执行二次采样处理,以便时间方向分辨率变成图 片的解码图像数据的一半,并且将该数据作为60fps的图像数据发送给显 示器。

此外,在每个图片的解码图像数据的帧速率具有60fps的交错场速率 并且其显示能力是120fps的渐进帧速率时,后处理单元207在每个图片 的解码图像数据上进行I-P转换,以将渐进帧速率设置为60fps,进一步 执行插入工艺,以将时间方向分辨率设置为60fps的图片的分辨率的两倍, 并且将该数据作为120fps的图像数据发送给显示器。此外,例如,在解 码之后的每个图片的图像数据具有60fps的帧速率并且其显示能力是60 fps时,后处理单元207将每个图片的解码图像数据直接发送给显示器。

图15示出后处理单元270的一个配置实例。这是可以处理上述情况 的实例,其中,图片的解码图像数据的帧速率是120fps或60fps并且显 示能力是120fps或60fps。

后处理单元207具有I-P转换单元271、插入单元272、二次采样单元 273以及切换单元274。I-P转换单元271将未压缩数据缓冲器206的在解 码之后的每个图片的图像数据转换成渐进方式的图像数据。

插入单元272在由I-P转换单元271获得的图像数据上在时间方向直 行插入工艺,以具有两倍的帧速率。二次采样单元273在由I-P转换单元 271获得的图像数据上在时间方向直行二次采样工艺,以具有一半的帧速 率。切换单元274根据选择信息选择性输出I-P转换单元271、插入单元 272以及二次采样单元273的任何输出图像数据。

例如,由未显示的控制单元或者根据用户操作自动生成选择信息。因 此,在显示时间依次从未压缩数据缓冲器(dpb)206中读取的每个图片的 图像数据转换成渐进方式,并且帧速率与显示能力匹配。

简单描述在图15中显示的接收装置200的操作。接收单元202解调 由接收天线接收的RF调制信号,以获取传输流TS。将这个传输流TS发 送给多路分用器203。多路分用器203通过在传输流TS上执行拆包工艺, 取出视频流(编码流)。将这个视频流发送给压缩数据缓冲器(cpb)204 并且在其内暂时累积。

解码器205从在压缩数据缓冲器204中累积的视频流中取出指定为要 解码的层的层的图片的编码图像数据。然后,解码器205在图片的解码定 时,解码每个取出的图片的编码图像数据,并且将该数据发送给未压缩数 据缓冲器(dpb)206,以促使暂时储存数据。在这种情况下,在相应图片 的编码图像数据要解码时,从要使用的未压缩数据缓冲器206中读取参考 源图片的图像数据。

将在显示时间依次从未压缩数据缓冲器(dpb)206中读取的图片的图 像数据发送给后处理单元207。后处理单元207将交错方式的图像数据转 换成渐进方式的图像数据,并且在转换成渐进方式的每个图片的图像数据 上进一步执行插入工艺或者二次采样工艺,以促使其帧速率与显示能力匹 配。将由后处理单元207处理的图片的图像数据供应给显示器,并且显示 图片的图像数据的动态图像。

如上所述,在图1中显示的传输和接收系统10内的接收侧上,以 HEVC方式编码交错方式的图像数据时,传输侧将与构成随机访问点的帧 内图片形成字段对的图片的编码图像数据的切片的NAL单元类型设置为 独特类型(设置为“RAP_dependent),所述独特类型表示依赖于所述帧 内图片并且与所述帧内图片形成字段对的图片。因此,能够插入LP,作 为后续图片,从而能够编码开放式GOP。

<2、修改实例>

应注意的是,虽然上述实施方式显示了由传输装置100和接收装置 200构成的传输和接收系统10,但是可以应用本技术的传输和接收系统的 配置不限于此。例如,接收装置200部分可以配置有与数字接口(例如, 高清晰度多媒体接口(HDMI)和显示器)连接的机顶盒等。要注意的是, “HDMI”是注册商标。

此外,虽然在以上实施方式中描述了交错型图像的情况,但是也在渐 进型图像的情况下,由于RAP_dependent类型,以按照其解码顺序和显示 顺序,也允许比IRAP更晚设置图片,因此,可以配置灵活地设置LP和 RP的流。

此外,上述实施方式显示了容器是传输流(MPEG-2TS)的实例。然 而,本技术还可以同样应用于系统中,该系统被配置为使用网络(例如, 互联网)将数据分布给接收终端。在互联网上分布时,具有使用具有MP4 或其他格式的容器来分布的多种情况。换言之,包括在数字广播标准中使 用的传输流(MPEG-2TS)、用于互联网分布内的MP4等的各种格式等同 于容器。

此外,本技术还可以如下配置。

(1)一种编码装置,包括:

图像编码单元,其被配置为在NAL单元结构中编码构成交错方式的 图像数据的每个图片的图像数据,并且生成具有各图片的编码图像数据的 视频流,

其中,所述图像编码单元将与构成随机访问点的帧内图片形成字段对 的图片的编码图像数据的切片的NAL单元类型设置为独特类型,所述独 特类型表示依赖于所述帧内图片并且与所述帧内图片形成字段对的图片。

(2)根据(1)所述的编码装置,其中,所述图像编码单元将构成交 错方式的图像数据的各图片的图像数据分类成多层,编码分类后的各层的 图片的图像数据,并且生成具有编码后的各层的图片的图像数据的视频 流。

(3)根据(1)或(2)所述的编码装置,其中,所述图像编码单元 以HEVC方式编码交错方式的图像数据。

(4)一种编码方法,包括:

图像编码步骤,由图像编码单元在NAL单元结构中编码构成交错方 式的图像数据的每个图片的图像数据,并且生成具有各图片的编码图像数 据的视频流,

其中,在所述图像编码步骤中,将与构成随机访问点的帧内图片形成 字段对的图片的编码图像数据的切片的NAL单元类型设置为独特类型, 所述独特类型表示依赖于所述帧内图片并且与所述帧内图片形成字段对 的图片。

(5)一种传输装置,包括:

图像编码单元,其被配置为在NAL单元结构中编码构成交错方式的 图像数据的每个图片的图像数据,并且生成具有各图片的编码图像数据的 视频流;以及

传输单元,其被配置为传输包括所生成的视频流的具有预定格式的容 器,

其中,所述图像编码单元将与构成随机访问点的帧内图片形成字段对 的图片的编码图像数据的切片的NAL单元类型设置为独特类型,所述独 特类型表示依赖于所述帧内图片并且与所述帧内图片形成字段对的图片。

(6)一种解码装置,包括:

图像解码单元,其被配置为解码视频流以获得交错方式的图像数据, 所述视频流具有通过在NAL单元结构中编码构成交错方式的图像数据的 每个图片的图像数据所获得的各图片的编码图像数据,

其中,在所述视频流中,将与构成随机访问点的帧内图片形成字段对 的图片的编码图像数据的切片的NAL单元类型设置为独特类型,所述独 特类型表示依赖于所述帧内图片并且与所述帧内图片形成字段对的图片。

(7)根据(6)所述的解码装置,

其中,所述视频流具有通过编码每层的图片的图像数据所获得的每层 的图片的图像数据,通过将构成交错方式的图像数据的每个图片的图像数 据分类成多层,获得所述图像数据,并且

其中,所述图像解码单元解码在层指定信息中指定的层的图片的编码 图像数据,并且获得等于或低于预定层的层的图片的图像数据。

(8)根据(6)或(7)所述的解码装置,进一步包括:

方式转换单元,其被配置为将由所述图像解码单元获得的交错方式的 图像数据转换成渐进方式的图像数据;以及

后处理单元,其被配置为促使由所述方式转换单元获得的每个图片的 图像数据的帧速率与显示能力匹配。

(9)一种解码方法,包括:

图像解码步骤,由图像解码单元解码视频流以获得交错方式的图像数 据,所述视频流具有通过在NAL单元结构中编码构成交错方式的图像数 据的每个图片的图像数据所获得的各图片的编码图像数据,

其中,在所述视频流中,将与构成随机访问点的帧内图片形成字段对 的图片的编码图像数据的切片的NAL单元类型设置为独特类型,所述独 特类型表示依赖于所述帧内图片并且与所述帧内图片形成字段对的图片。

(10)一种接收装置,包括:

接收单元,其被配置为接收包括视频流的具有预定格式的容器,所述 视频流具有通过在NAL单元结构中编码构成交错方式的图像数据的每个 图片的图像数据所获得的各图片的编码图像数据;以及

图像解码单元,其被配置为通过解码包含在所接收的容器内的视频 流,来获得交错方式的图像数据,

其中,在所述视频流中,将与构成随机访问点的帧内图片形成字段对 的图片的编码图像数据的切片的NAL单元类型设置为独特类型,所述独 特类型表示依赖于所述帧内图片并且与所述帧内图片形成字段对的图片。

本技术的主要特征在于,通过以NAL单元的形式编码交错方式的图 像数据时,将与构成随机访问点的帧内图片形成字段对的图片的编码图像 数据的切片的NAL单元类型设置为独特类型,所述独特类型表示依赖于 所述帧内图片并且与所述帧内图片形成字段对的图片,能够插入LP作为 后续图片并且能够编码开放式GOP(见图8和图9)。

参考符号列表

10:传输和接收系统

100:传输装置

102:编码器

103:压缩数据缓冲器(cpb)

104:多路复用器

105:传输单元

121:参数组/SEI编码单元

122:切片编码单元

123:NAL包格式化单元

124:暂时ID生成单元

200:接收装置

202:接收单元

203:多路分用器

204:压缩数据缓冲器(cpb)

205:解码器

206:未压缩数据缓冲器(dpb)

207:后处理单元

251:暂时ID分析单元

252:目标层选择单元

253:解码单元

271:I-P转换单元

272:插入单元

273:二次采样单元

274:切换单元

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号