首页> 中国专利> 使用基于块的混合分辨率数据修剪的视频编码

使用基于块的混合分辨率数据修剪的视频编码

页面导航

摘要
著录项
法律信息
说明书
相似文献

摘要

一种用于编码视频序列中的画面的装置，包括用于识别画面的原始版本中一个或更多要修剪的原始块的待修剪块识别器（410）。所述装置还包括用于通过分别为一个或更多要修剪的原始块生成一个或更多替换块来生成画面的已修剪版本的块替换器（415）。所述装置还包括用于生成恢复画面的已修剪版本的元数据的元数据生成器（410）。所述元数据包括一个或更多替换块的位置信息。所述装置额外地包括用于编码画面的已修剪版本和元数据的编码器。

著录项

公开/公告号CN103098468A

专利类型发明专利
公开/公告日2013-05-08

原文格式PDF
申请/专利权人汤姆逊许可公司;
展开▼

申请/专利号CN201180043595.3
发明设计人张冬青;
展开▼

申请日2011-09-09
分类号H04N7/26(20060101);H04N7/50(20060101);
代理机构11105 北京市柳沈律师事务所;
代理人吕晓章
地址法国伊西莱穆利诺
入库时间 2024-02-19 19:50:28

法律信息

法律状态公告日

法律状态信息

法律状态
2019-06-18

专利权的转移 IPC(主分类):H04N19/176 登记生效日:20190530 变更前: 变更后: 申请日:20110909

专利申请权、专利权的转移
2017-02-15

授权

授权
2013-10-09

实质审查的生效 IPC(主分类):H04N7/26 申请日:20110909

实质审查的生效
2013-05-08

公开

公开

说明书

相关申请的交叉引用

本申请要求提交于2010年9月10日的标题为BLOCK-BASED MIXED-RESOLUTION DATA PRUNING FOR IMPROVING VIDEO COMPRESSION EFFICIENCY的美国临时申请序列号为第61/403087的权益（Technicolor卷号PU100194）。

本申请涉及以下待审、共同拥有的专利申请：

（1）国际（PCT）专利申请序列号第PCT/US11/000107号，标题为A SAMPLING-BASED SUPER-RESOLUTION APPROACH FOR EFFIECENT VIDEO COMPRESSION，提交于2011年1月20日（Technicolor卷号PU100004）；

（2）国际（PCT）专利申请序列号第PCT/US11/000117号，标题为DATA PRUNING FOR VIDEO COMPRESSION USING EXAMPLE-BASED SUPER-RESOLUTION，提交于2011年1月21 日（Technicolor卷号PU100014）；

（3）国际（PCT）专利申请序列号第XXXX号，标题为METHODS AND APPRATUS FOR ENCODING VIDEO SIGNALS USING MOTION COMPENSATED EXAMPLE-BASED SUPER-RESOLUTION FOR VIDEO COMPRESSION，提交于2011年9月XX日（Technicolor卷号PU100190）；

（4）国际（PCT）专利申请序列号第XXXX号，标题为METHODS AND APPRATUS FOR DECODING VIDEO SIGNALS USING MOTION COMPENSATED EXAMPLE-BASED SUPER-RESOLUTION FOR VIDEO COMPRESSION，提交于2011年9月XX日（Technicolor卷号PU100266）；

（5）国际（PCT）专利申请序列号第XXXX号，标题为METHODS AND APPRATUS FOR ENCODING VIDEO SIGNALS USING EXAMPLE-BASED DATA PRUNING FOR IMPROVED VIDEO COMPRESSION EFFICIENCY，提交于2011年9月XX日（Technicolor卷号PU100193）；

（6）国际（PCT）专利申请序列号第XXXX号，标题为METHODS AND APPRATUS FOR DECODING VIDEO SIGNALS USING EXAMPLE-BASED DATA PRUNING FOR IMPROVED VIDEO COMPRESSION EFFICIENCY，提交于2011年9月XX日（Technicolor卷号PU100267）；

（7）国际（PCT）专利申请序列号第XXXX号，标题为METHODS AND APPRATUS FOR DEODING VIDEO SIGNALS FOR BLOCK-BASED MIXED-RESOLUTION DATA PRUNING，提交于 2011年9月XX日（Technicolor卷号PU100268）；

（8）国际（PCT）专利申请序列号第XXXX号，标题为METHODS AND APPRATUS FOR EFFICIENT REFERENCE DATA ENCODING FOR VIDEO COMPRESSION BY IMAGE CONTENT BASED SEARCH AND RANKING，提交于2011年9月XX日（Technicolor 卷号PU100195）；

（9）国际（PCT）专利申请序列号第XXXX号，标题为METHODS AND APPRATUS FOR EFFICIENT REFERENCE DATA DECODING FOR VIDEO COMPRESSION BY IMAGE CONTENT BASED SEARCH AND RANKING，提交于2011年9月XX日（Technicolor 卷号PU100106）；

（10）国际（PCT）专利申请序列号第XXXX号，标题为METHODS AND APPRATUS ENCODING VIDEO SIGNALS FOR EXAMPLE-BASED DATA PRUNING USING INTRA-FRAME PATCH SIMILARITY，提交于2011年9月XX日（Technicolor卷号PU100196）；

（11）国际（PCT）专利申请序列号第XXXX号，标题为METHODS AND APPRATUS DECODING VIDEO SIGNALS FOR EXAMPLE-BASED DATA PRUNING USING INTRA-FRAME PATCH SIMILARITY，提交于2011年9月XX日（Technicolor卷号PU100269）；以及

（12）国际（PCT）专利申请序列号第XXXX号，标题为PRUNING DECISION OPTIMIZATION IN EXAMPLE-BASED DATA PRUNING COMPRESSION，提交于2011年9月XX日（Technicolor 卷号PU100197）。

技术领域

本发明原理一般地涉及视频编码和解码，并且尤其涉及用于提升视频压缩效率的基于块的混合分辨率数据修剪（pruning）的方法和装置。

背景技术

已经存在用于数据修剪来提升视频编码效率的若干不同方法。例如，第一种方法是垂直和水平线去除。第一种方法在编码之前去除视频帧中的垂直和水平线，并且在解码之后以非线性内插来恢复这些线。去除了哪个线是通过该线是否包括高频信号来确定的。第一种方法的问题在于第一种方法缺少选择性地去除像素的灵活性。即，第一种方法可能去除包括不能轻易恢复的重要像素的线，尽管整体上该线包括少量的具有高频的信号。

相对于以上提及的第一种方法的另一类别的方法是基于块去除的，其去除并恢复块而不是线。但是，其它类别的方法使用环路（in-loop）方法，这意味着必须修改编码器架构来适应块去除。因此，因为必须修改编码器，其它类别的方法不严格地是基于预处理的方法。

发明内容

本发明解决了这些方法的这些和其它缺陷和缺点，本发明针对用于提升视频压缩效率的基于块的混合分辨率数据修剪的方法和装置。

根据本发明的一个方面，提供了一种用于编码视频序列中的画面的装置。所述装置包括：用于识别画面的原始版本中要修剪的一个或更多原始块的待修剪块识别器。所述装置还包括：用于通过分别为一个或更多要被修剪的原始块生成一个或更多替换块来生成画面的修剪版本的块替换器。所述装置还包括：用于生成恢复画面的修剪版本的元数据的元数据生成器。所述元数据包括一个或更多替换块的位置信息。所述装置额外地包括用于编码画面的修剪版本和元数据的编码器。

根据本原理的另一个方面，提供了一种用于编码视频序列中的画面的方法。所述方法包括：识别画面的原始版本中要修剪的一个或更多原始块。所述方法还包括：通过分别为一个或更多要被修剪的原始块生成一个或更多替换块来生成画面的修剪版本。所述方法还包括：生成恢复画面的修剪版本的元数据。所述元数据包括一个或更多替换块的位置信息。所述方法额外地包括使用至少一个编码器来编码画面的修剪版本和元数据。

根据本原理了另一个方面，提供了一种用于恢复视频序列中画面的修剪版本的装置。所述装置包括：用于识别画面的修剪版本中一个或更多已修剪块的已修剪块识别器。所述装置还包括：用于解码用来恢复画面的修剪版本的元数据的元数据解码器。所述元数据包括一个或更多替换块的位置信息。所述装置还包括：用于分别为一个或更多已修剪块生成一个或更多替换块的块还原器。

根据本原理的另一个方面，提供了一种用于恢复视频序列中画面的修剪版本的方法。所述方法包括：识别画面的修剪版本中一个或更多已修剪块。所述方法还包括：使用解码器来解码用来恢复画面的修剪版本的元数据。所述元数据包括一个或更多替换块的位置信息。所述方法还包括：分别为一个或更多已修剪块生成一个或更多替换块。

根据本原理的另一个方面，提供了一种用于编码视频序列中的画面的装置。所述装置包括用于识别画面的原始版本中要修剪的一个或更多原始块的部件。所述装置还包括：用于通过分别为一个或更多要被修剪的原始块生成一个或更多替换块来生成画面的修剪版本的部件。所述装置还包括：用于生成恢复画面的修剪版本的元数据的部件。所述元数据包括一个或更多替换块的位置信息。所述装置额外地包括用于编码画面的修剪版本和元数据的部件。

根据本原理的另一个方面，提供了一种用于恢复视频序列中画面的修剪版本的装置。所述装置包括：用于识别画面的修剪版本中一个或更多已修剪块的部件。所述装置还包括：用于解码用来恢复画面的修剪版本的元数据的部件。所述元数据包括一个或更多替换块的位置信息。所述装置还包括：用于分别为一个或更多已修剪块生成一个或更多替换块的部件。

附图说明

结合附图阅读以下示例性实施例的具体描述，本原理的这些和其它方面、特征和优点将变得明显。

根据以下示例性附图，将更好地理解本原理，附图中：

图1是示出根据本原理的实施例的基于块的混合分辨率的数据修剪系统/ 方法的高级框图的框图；

图2是示出根据本原理的实施例的可以应用本原理的示例性视频编码器的框图；

图3是示出根据本原理的实施例的可以应用本原理的示例性视频解码器的框图；

图4是示出根据本原理的实施例的基于块的混合分辨率数据修剪的示例性系统的框图；

图5是示出根据本原理的实施例的用于视频压缩的基于块的混合分辨率数据修剪的示例性方法的流程图；

图6是示出根据本原理的实施例的用于基于块的混合分辨率数据修剪的数据恢复的示例性系统的框图；

图7是示出根据本原理的实施例的用于视频压缩的基于块的混合分辨率数据修剪的数据恢复的示例性方法的流程图；

图8是示出根据本原理的实施例的示例性混合分辨率帧的图；

图9是示出根据本原理的实施例的在空间频率空间中示出的基于块的混合分辨率数据修剪处理的示例的图；

图10是示出根据本原理的实施例的用于元数据编码的示例性方法的流程图；

图11是示出根据本原理的实施例的用于元数据解码的示例性方法的流程图；以及

图12是示出根据本原理的实施例的示例性块ID的图。

具体实施方式

本原理针对用于提升视频压缩效率的基于块的混合分辨率数据修剪的方法和装置。

本说明书对本发明原理进行示例性说明。因此，将认识到：本领域技术人员将能够设计出实施本原理并被包括在本原理的精神和范围内的各种布置，尽管在这里没有明确地描述或示出所述布置。

在此叙述的所有示例和条件性语言意欲用于教导的目的以便帮助读者理解本原理以及由本发明人贡献以促进现有技术的构思，并且应该被解释为不限制为这些具体叙述的示例和条件。

另外，在这里叙述本原理的原理、方面和实施例及其特定示例的所有陈述意欲包括其结构和功能等效物。另外，意图是：这样的等效物包括当前已知的等效物以及将来开发的等效物二者，即所开发的执行相同功能的任何元件，而不论其结构如何。

因此，例如，本领域技术人员将认识到：在此呈现的框图表示实施本原理的示例性电路的概念性视图。类似地，将认识到：任何流程图示(flow chart)、流程图(flow diagram)、状态转换图、伪代码等表示实质上可以表示在计算机可读介质中并因此由计算机或处理器执行的各种过程，而不管是否明确地示出这样的计算机或处理器。

可以通过使用专用硬件以及与适当的软件相关联的能够执行软件的硬件来提供图中示出的各种元件的功能。当利用处理器来提供所述功能时，可以利用单个专用处理器、利用单个共享处理器、或者利用其中一些可被共享的多个独立处理器来提供所述功能。另外，术语“处理器”或“控制器”的明确使用不应该被解释为排他性地指代能够执行软件的硬件，而是可以隐含地无限制地包括数字信号处理器(“DSP”)硬件、用于存储软件的只读存储器 (“ROM”)、随机存取存储器(“RAM”)、和非易失性存储器。

还可以包括其它传统的和/或定制的硬件。类似地，图中示出的任何开关只是概念性的。它们的功能可以通过程序逻辑的运行、通过专用逻辑、通过程序控制和专用逻辑的交互、或者甚至手动地来执行，实施者可以根据对上下文更具体的理解选择特定的技术。

在其权利要求中，被表示为用于执行指定功能的部件的任何元件意欲包含执行那个功能的任何方式，例如包括：a)执行那个功能的电路元件的组合或者b)与用于执行该软件的适当电路相组合以执行所述功能的任何形式的软件，所述软件因此包括固件或微代码等。由这种权利要求限定的本发明在于如下事实，即，以权利要求所要求保护的方式将由各种所叙述的部件提供的功能组合和集合到一起。因此认为可以提供那些功能的任何部件与在此示出的那些部件等效。

在本说明书中提到的本原理的“一个实施例”或“实施例”以及其变型是指结合所述实施例描述的特定特征、结构、特性等被包括在本原理的至少一个实施例中。因此，在说明书各处出现的短语“在一个实施例中”和“在实施例中”以及任何其他的变型不一定都指代相同的实施例。

应当认识到，对于术语“/”、“和/或”和“中的至少一个”的使用，例如在“A/B”、“A和/或B”和“A和B中的至少一个”的情况中意欲包括只选择第一个列出的选项(A)、只选择第二个列出的选项(B)或者同时选择两个选项(A和B)。作为另一示例，在“A、B和/或C”和“A、B和C中的至少一个”的情况中，这种措辞意欲包括只选择第一个列出的选项(A)、只选择第二个列出的选项(B)、只选择第三个列出的选项(C)、只选择第一个和第二个列出的选项(A和B)、只选择第一个和第三个列出的选项(A和C)、只选择第二个和第三个列出的选项(B和C)或者同时选择三个选项(A和B和C)。如本领域和相关领域普通技术人员容易认识到的，这可以被扩展为很多列出的项目。

此外，如在此使用的，词语“画面”和“图像”可互换地使用并且指代视频序列中的静止图像或画面。如已知的，画面可以是帧或半帧（field）。

此外，应该认识到词语“恢复（recovery）”和“还原（restoration）”在此可互换地使用。

如以上所提到的，本原理针对用于提升视频压缩效率的基于块的混合分辨率数据修剪。数据修剪是通过在输入视频数据编码之前去除输入视频数据的一部分来达到更好的视频编码效率的视频预处理技术。在解码器侧通过从已解码数据推断来恢复所去除的视频数据。数据修剪的一个示例是图像线去除，其去除输入视频中的一些水平和垂直扫描线。

根据本原理公开了一种用来修剪视频的混合分辨率数据修剪方案的框架，其中通过低分辨率（low-res）块或平坦块（flat block）来替代视频中的高分辨率（high-res）块。根据本原理还公开了一种编码已修剪块的位置的元数据编码方案，其使用图像处理技术和熵编码的组合。

根据本发明的实施例，将视频帧划分成若干非重叠块，并且这些块中的一些被低分辨率块或简单平坦块替代。然后将已修剪视频发送到视频编码器来压缩。修建处理将导致更高效的视频编码，因为以具有更少高频信号的低分辨率或平坦块替代了视频帧中的一些块。可以使用各种现有算法（诸如，图像修复（inpainting）、纹理综合等）来恢复被替代的块。根据本原理，公开了怎样编码和发送恢复处理所需的元数据。

与先前提及的用来改善视频压缩的数据修剪的其它类别的方法不同，本原理提供了严格的环外（out-of-loop）方法，其中编码器和解码器保持完整并且被对待为黑箱并且可以被任何编码（或解码）标准或实施方式替代。这种环外方法的优点在于，用户不需要改变编码或解码工作流程，改变编码或解码工作流程在某些环境下是不可行的。

转到图1，参考标号100整体表示基于块的混合分辨率数据修剪系统/方法的高级框图。提供输入视频并且其在步骤110（通过编码器侧预处理器151）经历编码器侧预处理以便获得预处理帧。在步骤115编码（通过编码器152）预处理帧。在步骤120解码（通过解码器153）编码帧。已解码帧经历后处理（通过解码器侧后处理器154）以便在步骤125提供输出视频。

在编码器侧预处理器151中进行数据修剪处理。将已修剪视频随后发送到编码器152。然后将已编码视频连同恢复所需的元数据发送到解码器153。解码器153解压缩已修剪视频，并且解码器侧后处理器154使用或不使用接收到的元数据从已修剪视频恢复原始视频（因为在一些情况下，有可能恢复不需要并且因此不使用元数据）。

转到图2，参考标号200整体表示可以应用本原理的示例性视频编码器。视频编码器200可以被用作，例如图1中所示的视频编码器152。视频编码器200包括具有输出端的帧排序缓冲器210，该输出端与组合器285的非反相输入端信号通信。组合器285的输出端与变换器和量化器225的第一输入端信号通信连接。变换器和量化器225的输出端与熵编码器245的第一输入端和逆变换器和逆量化器250的第一输入端信号通信连接。熵编码器245的输出端与组合器290的第一非反相输入端信号通信连接。组合器290的输出端与输出缓冲器235的第一输入端信号通信连接。

编码器控制器205的第一输出端与帧排序缓冲器210的第二输入端、逆变换器和逆量化器250的第二输入端、画面类型判定模块215的输入端、宏块类型（MB类型）判定模块220的第一输入端、帧内预测模块260的第二输入端、去块滤波器265的第二输入端、运动补偿器270的第一输入端、运动估计器275的第一输入端以及参考画面缓冲器280的第二输入端信号通信连接。

编码器控制器205的第二输出端与辅助增强信息（SEI）插入器230的第一输入端、变换器和量化器225的第二输入端、熵编码器245的第二输入端、输出缓冲器235的第二输入端以及序列参数集（SPS）和画面参数集（PPS）插入器240的输入端信号通信连接。

SEI插入器230的输出端与组合器290的非反相输入端信号通信连接。

画面类型判定模块215的第一输出端与帧排序缓冲器210的第三输入端信号通信连接。画面类型判定模块215的第二输出端与宏块类型判定模块220 的第二输入端信号通信连接。

序列参数集（SPS）和画面参数集（PPS）插入器240的输出端与组合器 290的第三非反相输入端信号通信连接。

逆量化器和逆变换器250的输出端与组合器219的第一非反相输入端信号通信连接。组合器219的输出端与帧内预测模块260的第一输入端和去块滤波器265的第一输入端信号通信连接。去块滤波器265的输出端与参考画面缓冲器280的第一输入端信号通信连接。参考画面缓冲器280的输出端与运动估计器275的第二输入端和运动补偿器270的第三输入端信号通信连接。运动估计器275的第一输出端与运动补偿器270的第二输入端信号通信连接。运动估计器275的第二输出端与熵编码器245的第三输入端信号通信连接。

运动补偿器270的输出端与开关297的第一输入端信号通信连接。帧内预测模块260的输出端与开关297的第二输入端信号通信连接。宏块类型判定模块220的输出端与开关297的第三输入端信号通信连接。开关297的第三输入端确定开关的“数据”输入端（与控制输入端相比，即，第三输入）是否由运动补偿器270提供还是由帧内预测模块260提供。开关297的输出端与组合器219的第二非反相输入端和组合器285的反相输入端信号通信连接。

帧排序缓冲器210的第一输入端和编码器控制器205的输入端可用作编码器200的输入端，用于接收输入画面。此外，辅助增强信息（SEI）插入器 230的第二输入端可以用作编码器200的输入端，用于接收元数据。输出缓冲器235的输出端可以用作编码器200的输出端，用于输出比特流。

转到图3，参考标号300整体表示可以应用本原理的示例性视频解码器。视频解码器300可以被用作例如图1所示的视频解码器153。视频解码器300 包括具有输出端的输入缓冲器310，该输出端与熵解码器345的第一输入端信号通信连接。熵解码器345的第一输出端与逆变换器和逆量化器350的第一输入端信号通信连接。逆变换器和逆量化器350的输出端与组合器325的第二非反相输入端信号通信连接。组合器325的输出端与去块滤波器365的第二输入端和帧内预测模块360的第一输入端信号通信连接。去块滤波器365 的第二输出端与参考画面缓冲器380的第一输入端信号通信连接。参考画面缓冲器380的输出端与运动补偿器370的第二输入端信号通信连接。

熵解码器345的第二输出端与运动补偿器370的第三输入端、去块滤波器365的第一输入端、和帧内预测器360的第三输入端信号通信连接。熵解码器345的第三输出端与解码器控制器305的输入端信号通信连接。解码器控制器305的第一输出端与熵解码器345的第二输入端信号通信连接。解码器控制器305的第二输出端与逆变换器和逆量化器350的第二输入端信号通信连接。解码器控制器305的第三输出端与去块滤波器365的第三输入端信号通信连接。解码器控制器305的第四输出端与帧内预测模块360的第二输入端、运动补偿器370的第一输入端和参考画面缓冲器380的第二输入端信号通信连接。

运动补偿器370的输出端与开关397的第一输入端信号通信连接。帧内预测模块360的输出端与开关397的第二输入端信号通信连接。开关397的输出端与组合器325的第一非反相输入端信号通信连接。

输入缓冲器310的输入端可用作解码器300的输入端，用于接收输入比特流。去块滤波器365的第一输出端可以用作解码器300的输出端，用于输出输出画面。

转到图4，参考标号400整体表示基于块的混合分辨率数据修剪的示例性系统。系统400包括具有输出端的划分器405，该输出端与待修剪块识别器410的输入端信号通信连接。待修剪块识别器410的第一输出端与块替换器415的输入端信号通信连接。待修剪块识别器410的第二输出端与元数据编码器420的输入端信号通信连接。划分器405的输入端可用作系统400的输入端，用于接收要划分成若干非重叠块的原始视频。块替换器415的输出端可用作系统400的输出端，用于输出混合分辨率视频。元数据编码器的输出端可以用作系统400的输出端，用于输出已编码元数据。

转到图5，参考标号500整体表示用于视频压缩的基于块的混合分辨率数据修剪的示例性方法。在步骤505，输入视频帧。在步骤510，将视频帧划分成若干非重叠块。在步骤515，对每个块执行循环。在步骤520，确定是否修剪当前块。如果是，则方法前进到步骤525。否则，方法返回步骤515。在步骤525，将块修剪并且保存对应的元数据。在步骤530，确定是否完成了（正在被处理的）所有块。如果是，则将控制传递到功能块535。否则，方法返回到步骤515。在步骤530，输出已修剪帧和对应的元数据。

参照图4和图5，在修剪处理期间，首先将输入帧划分成若干非重叠块。然后进行待修剪块识别处理以便识别可以修剪的可恢复块。将已修剪块的坐标保存为元数据，将元数据编码并发送到解码器侧。使用低分辨率块或简单平坦块来替代准备好修剪的块。结果是视频帧的一些块具有高分辨率，一些块具有低分辨率（即，混合分辨率帧）。

转到图6，参考标号600整体表示用于基于块的混合分辨率数据修剪的数据恢复的示例性系统。系统600包括具有输出端的划分器605，该输出端与已修剪块识别器610的第一输入端信号通信连接。元数据解码器615的输出端与已修剪块识别器610的第二输入端和块还原器620的第二输入端信号通信连接。已修剪块识别器610的输出端与块还原器620的第一输入端信号通信连接。划分器605的输入端可以用作系统600的输入端，用于接收要划分成若干非重叠块的已修剪混合分辨率视频。元数据编码器615的输入端还可以用作系统600的输入端，用于接收已编码元数据。块还原器620的输出端可用作系统600的输出端，用于输出恢复的视频。

转到图7，参考标号700整体表示用于用于视频压缩的基于块的混合分辨率数据修剪的数据恢复的示例性方法。在步骤705，输入已修剪混合分辨率帧。在步骤710，将帧划分成若干非重叠块。在步骤715，对每个块执行循环。在步骤720，确定当前块是否是已修剪块。如果是，则方法前进到步骤 725。否则，方法返回到步骤715。在步骤725，将块还原。在步骤730，确定是否所有块都已经完成（正在被处理）。如果是，则方法前进到步骤735。否则，方法返回到步骤715。在步骤715，输出恢复的帧。

参照图6和图7，在恢复处理期间，借助于元数据识别已修剪块。此外，使用各种算法（诸如，修复）借助于或不借助于元数据使用块还原处理恢复已修剪块。可以使用不是本原理所关注的不同的插入（plug-in）方法来替换块还原或识别。即，本原理不基于任何特定的块还原和识别处理，并且因此，在保持本原理的精神的同时，根据本原理的教导可以使用任何适当的块还原和识别处理。

修剪处理

首先将输入视频帧划分成若干非重叠块。块大小可以变化，例如16乘 16像素或8乘8像素。但是，期望块划分与编码器所使用的相同，这样可以达到最大压缩效率。例如，在根据国际标准化组织/国际电工委员会（ISO/IEC）移动画面专家组4（MPEG-4）第10部分高级视频编码（AVC）标准/国际电信联盟电信标准化部门（ITU-T）H.264建议书（下文中“MPEG-4AVC标准”）的编码中，宏块是16乘16像素。因此，在涉及MPEG-4AVC标准的实施例中，用于数据修剪的块大小优选地选择为16乘16像素。

对于每个块，块识别处理将确定该块是否应该修剪。虽然这可以基于各种标准，但应该根据还原处理确定该准则。例如，如果使用修复方法来还原块，那么准则应该为该块是否可以使用特定的修复处理来还原。如果可以通过该修复处理恢复该块，那么将该块标记为待修剪块。

在识别待修剪块之后，将使用低分辨率块或平坦块来替代待修剪块，得到混合分辨率帧。转到图8，参考标号800整体表示示例性混合分辨率帧。从图8中可见，帧的一些部分具有高分辨率，而以平坦块替代了帧的一些部分。在修剪过程中低分辨率或平坦块中的高频信号被除去。因此，可以更加高效地编码低分辨率或平坦块。转到图9，参考标号900整体表示在空间频率空间中示出的基于块的混合分辨率数据修剪处理的示例。平坦块基本上是仅保留其DC分量的块，而低分辨率块是去除一些AC分量的块。实践中，如果决定以平坦块替代已修剪块，则首先可能计算输入块的平均颜色，然后将块内的所有像素的颜色设置成平均颜色。该处理等同于仅保留块的DC分量。如果决定以低分辨率块替代已修剪块，将低通滤波器应用于输入块，并且以低通滤波版本替代该块。无论使用平坦块还是低分辨率块，应该根据使用什么类型的还原算法来确定低通滤波器的参数。

元数据编码和解码

为了正确还原已修剪块以便恢复处理，必须将如元数据所表示的块的位置发送到解码器侧。一种简单方法是使用通用无损数据压缩算法来压缩位置数据。但是，对于本系统，由于以下事实，有可能达到更好的压缩效率，即：已修剪块为低分辨率或平坦块，并且低分辨率和平坦块可以通过检测该已修剪块是否包括高频信号来识别。

假设已修剪块的最大频率是通过修剪和还原算法预定的Fm，那么有可能计算大于最大频率Fm的信号分量的能量。如果能量小于阈值，那么该块是潜在的已修剪块。这可以通过以下来达到，首先对块图像应用低通滤波器，然后从输入块图像中减去已过滤的块图像，接着计算高频信号的能量。数学上，存在以下：

E=|B-HB| （1）

其中，E是高频信号的能量，B是输入块图像，H是具有带宽Fm的低通滤波器，并且HB是B的低通滤波的版本。|.|是计算图像的能量的函数。

但是，以上描述的处理并不是百分之百可靠的，因为未修剪块也可能是平坦或平滑的。因此，还有必要向解码器发送“残差”，即，假阳性（false positive）块的坐标和被识别处理遗漏的块的坐标。

理论上，有可能向解码器侧发送那3个分量，即，阈值、假阳性块的坐标以及遗漏块的坐标。但是，为了更加简化处理，在编码器侧，阈值可能变化，以识别所有已修剪块。因此，没有遗漏的块。这个处理可能导致一些是具有较低的高频能量的未修剪块的假阳性块。因此，如果假阳性块的数量大于已修剪块的数量，那么仅发送所有已修剪块的坐标并且将信令标志设置为 0。否则，发送假阳性块的坐标并且将信令标志设置为1。

转到图10，参考标号1000整体表示用于元数据编码的示例性方法。在步骤1005，输入已修剪帧。在步骤1010，进行低分辨率块识别。在步骤1015，确定在低分辨率识别中是否存在任何遗漏。如果是，则方法前进到步骤1020。否则，方法前进到步骤1050。在步骤1020，确定假阳性块是否比已修剪块多。如果是，则方法前进到步骤1040。否则，方法前进到步骤1045。在步骤1040，使用已修剪块序列，并且将标志设置为零。在步骤1025，进行差分。在步骤 1030，进行无损编码。在步骤1035，输出已编码元数据。在步骤1045，使用假阳性序列，并且将标志设置为一。在步骤1050，调整阈值。

因此，提供了以下示例性元数据序列：

该“标志”分段是指示接下来的序列是假阳性块还是已修剪块的坐标的二进制数。数值“阈值”用于使用公式（1）进行的低分辨率或平坦块识别。

转到图11，参考标号1100整体表示用于元数据解码的示例性方法。在步骤1105，输入已编码元数据。在步骤1110，进行无损解码。在步骤1115，进行逆差分。在步骤1120，确定是否标志=0。如果是，则方法前进到步骤1125。否则，方法前进到步骤1130。在步骤1125，输出坐标序列。在步骤1130，进行低分辨率块识别。在步骤1135，去除假阳性。在步骤1140，输出坐标序列。

继续参照图11，使用块坐标而不是像素坐标来发送块坐标到解码器侧。如果帧中有M个块，则坐标序号范围应该从1到M。此外，如果块在还原处理期间没有依赖关系，可以对块的坐标序号进行排序以使得它们成为序号递增序列，使用差分编码方案来首先计算某个坐标序号与它前面一个序号之间的差，并且编码该差序列。例如，假设坐标序列是3、4、5、8、13、14，差分序列变成3、1、1、3、5、1。差分处理使数值接近1，因此导致数值分布具有更小的熵。如果数据具有更小的熵，则根据信息论数据可以被编码成具有更小的码长。得到的差分序列可以通过无损压缩方案（诸如，霍夫曼编码）进一步编码。如果块在还原处理期间存在依赖关系，那么可以简单地跳过差分处理。是否存在块的依赖关系实际是由还原算法的性质确定的。

在元数据解码处理期间，解码器侧处理器将首先使用接收到的阈值运行低分辨率块识别处理。根据接收到的“标志”分段，元数据解码处理确定接下来的序列是假阳性块序列还是已修剪块序列。如果块在还原处理期间没有依赖关系，那么接下来的序列首先将被逆差分以生成坐标序列。如果，根据 “标志”，序列是已修剪块序列的坐标，则处理直接输出该序列作为结果。如果是假阳性序列，则处理器侧处理将首先接收由低分辨率识别处理识别得到的块序列，然后去除假阳性序列中包括的所有坐标。

应该理解的是，可以使用不同的元数据编码方案，诸如例如，直接发送块ID到解码器侧。本领域一般技术人员在被给予本发明在此提供的教导的情况下，可以轻易地构思出这些和其他变型。

还原处理

在解码已修剪视频之后进行还原处理。在还原之前，通过如在本说明书中描述的解码元数据来获得已修剪块的位置。

对于每个块，进行还原处理以便恢复已修剪块中的内容。各种算法可用于还原。还原的一个示例是图像修复，其通过从相邻像素内插来恢复缺失的像素。在所提出的方法中，由于使用低分辨率块或平坦块替代了每个已修剪块，并且可以将低分辨率块或平坦块传递的信息用作边信息来帮助恢复处理，因此使得可以达到更高的恢复精度。块恢复模块可以被任何恢复方案取代，诸如，基于传统修复和纹理综合的方法。转到图12，参考标号1200整体表示示例性块ID。

基于这里的教导，相关领域的普通技术人员可以容易地确定本原理的这些和其它特征及优点。应当理解，可以以硬件、软件、固件、专用处理器或它们的组合的各种形式来实现本原理的教导。

最优选地，本原理的教导实施为硬件和软件的组合。此外，所述软件可以实施为有形地实施在程序存储单元上的应用程序。所述应用程序可以被上载到包括任何适当架构的机器并由其执行。优选地，在具有诸如一个或多个中央处理单元(“CPU”)、随机存取存储器(“RAM”)和输入/输出(“I/O”) 接口之类的硬件的计算机平台上实现所述机器。该计算机平台还可以包括操作系统和微指令代码。在此描述的各种处理和功能可以是可由CPU执行的微指令代码的一部分或应用程序一部分或者它们的任何组合。此外，诸如附加的数据存储单元和打印单元之类的各种其它外围单元可以连接到该计算机平台。

还应当理解，因为优选地用软件来实现在附图中示出的一些组成系统组件和方法，所以这些系统组件或处理功能块之间的实际连接可以根据本原理被编程的方式的不同而有所不同。给出这里的教导，相关领域的普通技术人员将能够想到本原理的这些和类似的实现或配置。

尽管在这里参照附图描述了说明性实施例，但是应当理解，本原理不限于那些精确的实施例，并且相关领域的普通技术人员可以在其中进行各种改变和修改，而不背离本原理的范围或精神。所有这样的改变和修改都意欲被包括在如所附权利要求阐述的本原理的范围内。

去获取专利，查看全文>

相似文献

专利
中文文献
外文文献

1. 使用基于块的混合分辨率数据修剪的视频编码 [P] . 中国专利： CN103098468B . 2017.02.15
2. 使用基于块的混合分辨率数据修剪的视频解码 [P] . 中国专利： CN103210648B . 2017.06.09
3. VIDEO ENCODING USING BLOCK-BASED MIXED-RESOLUTION DATA PRUNING [P] . 韩国专利： KR101885633B1 . 2018-08-06

机译：使用基于块的混合分辨率数据修剪进行视频编码
4. Video encoding using data pruning of mixed-resolution, based on the block [P] . 日本专利： JP6067563B2 . 2017-01-25

机译：基于块使用混合分辨率数据修剪的视频编码
5. VIDEO ENCODING USING BLOCK-BASED MIXED-RESOLUTION DATA PRUNING [P] . 韩国专利： KR20130139261A . 2013-12-20

机译：使用基于块的混合分辨率数据修剪进行视频编码