首页> 中国专利> 一种基于运动估计和时空域相关性的快速帧间预测方法

一种基于运动估计和时空域相关性的快速帧间预测方法

摘要

本发明公开了一种基于运动估计和时空域相关性的快速帧间预测方法,其包括有:1、在运动估计方面,以中值MV为起始搜索点,进行步长为1和2的两轮菱形搜索,若得到的最优MV为起始中值MV,则终止运动估计,否则,以新得到的最优MV代替中值MV进行TZSearch过程;2、在PU模式选择和CU深度抉择方面,利用当前编码单元空间和时间邻域的9个相邻块的编码模式和率失真代价信息,若有一定量的邻域编码单元采用了skip模式,且当前编码单元的率失真代价小于某个阈值,则认为当前块处于运动平缓区域,提前终止PU模式的遍历过程和提前终止CU划分。本发明大大减少了高清视频编码的时间,并且不局限于特定特征的视频序列,对于图像的分辨率,纹理等特征不过分依赖。

著录项

  • 公开/公告号CN105959699A

    专利类型发明专利

  • 公开/公告日2016-09-21

    原文格式PDF

  • 申请/专利权人 西安电子科技大学;

    申请/专利号CN201610300137.8

  • 申请日2016-05-06

  • 分类号

  • 代理机构北京科亿知识产权代理事务所(普通合伙);

  • 代理人汤东凤

  • 地址 710071 陕西省西安市太白南路2号西安电子科技大学

  • 入库时间 2023-06-19 00:31:36

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2019-02-26

    授权

    授权

  • 2016-10-19

    实质审查的生效 IPC(主分类):H04N19/56 申请日:20160506

    实质审查的生效

  • 2016-09-21

    公开

    公开

说明书

技术领域

本发明涉及HEVC高清视频编码技术领域,具体涉及一种不影响视频编码质量、可大大减少了高清视频编码的时间、不过分依赖图像的分辨率和纹理特征的基于运动估计和时空域相关性的快速帧间预测方法。

背景技术

视频是一种形象、具体、有效的信息传递媒体。视频序列可以表示为三维矩阵,其中NxM这两个维度表示每幅图像的像素值,形成视频的空间域,另一个维度代表视频的时间域,为了使人眼能够有平滑连续的感受,视频的帧率需要达到25fps(帧/每秒)。然而原始视频的数据量是十分巨大的,在存储和传输方面受到很大的限制,因此需要采用视频编码技术对视频进行压缩处理,最新的视频编码技术是JCT-VC会议公布的新一代视频编码标准——H.265/HEVC(High Efficiency Video Coding高效视频编码)。

HEVC采用混合编码框架,包括帧内预测、帧间预测、变换、量化、熵编码、环路滤波等模块。其中帧间预测模块包含运动估计、运动补偿、帧间预测模式选择和CU深度抉择等子模块,目的是最大限度的利用空域-时域预测来消除时域上的信息冗余,以达到压缩视频的目的。帧间预测中花费大量的时间在运动估计,PU模式选择和编码单元(CU)深度抉择三个方面,下面将分别介绍在HEVC中三个模块的实现算法。

1、运动估计。TZSearch算法是HEVC中出现的运动搜索新技术,它包含以下步骤:(1)确定起始搜索点。在当前预测单元(PU)的左、上以及右上PU的运动向量(MV),中值预测MV和零运动向量中选择匹配误差最小的点作为起始搜索点。(2)以步长1开始,按照如图1所示的菱形模板在搜索范围内进行搜索,其中步长以2的整数次幂的形式递增,选出率失真代价最小的点作为该步骤的搜索结果。(3)若步骤2得到的最优点对应的步长为1,则需在该最优点周围做两点搜索;若得到的最优点对应步长大于某个阈值,则以该最优点为中心,在一定范围内进行全搜索。选择率失真代价最小的点作为该步骤的最优点。 (4)以步骤3得到的最优点为新的起始搜索点,重复步骤2~3,细化搜索,当两次相邻的细化搜索得到的最优点一致时停止细化搜索,此时得到的MV即为最优的MV。

2、帧间PU模式判别。每一预测单元PU都有一系列的运动参数,包括运动矢量、参考图像索引等。一个CU可以使用以下编码模式中的一种来进行编码:包括跳过模式(Skip)、帧间模式(Mode_Inter)和帧内模式(Mode_Intra)。当CU块采用skip模式进行编码时,当前CU的运动参数全部由运动合并技术(Merge)来得到。在这种情况下的运动参数是通过检查所有可能的Merge候选运动矢量,并选择其中能使率失真代价最小的运动参数。对于跳过模式,任何对于PU的进一步划分都是不允许的,即PU的大小同当前CU尺寸相同。当CU块采用帧间模式编码时,要遍历PU的8种划分方式(2N×2N、2N×N、N×2N、N×N、2N×nU、2N×nD、nL×2N、nR×2N),率失真代价最小的PU模式即为最优PU模式。

3、CU深度抉择策略。当HEVC中最大编码单元大小为64x64,最大编码深度为3时,CU最佳划分方式选择过程可描述如下:(1)对整个最大编码单元LCU(64x64)直接遍历各种预测模式,得到率失真代价最小的预测模式,此时编码深度为0;(2)将当前编码单元按四叉树方式分割成4个更小的CU单元,并对每个CU进行第1步的计算;(3)若当前块编码深度小于3,则转到步骤2,若编码深度等于3,直接跳到第4步;(4)对所有划分方式进行率失真代价的比较,选出最优划分方式,存储其率失真代价。

由以上相关技术可以知道,HEVC在CU深度划分方面采用不停递归的方法来确定最佳的CU划分方式;而在这递归调用过程中又要每次都计算最佳的PU划分模式;在此过程中每块PU又要进行运动估计以得到最优的MV。HEVC的帧间预测过程计算量非常大,高清视频编码的时间较长。

综上可见,需要一种快速的帧间预测方法,在保证不过分依赖于视频的自身特征和保证编码质量不会大幅下降的前提下,能够有效减少视频序列编码所需时间。

发明内容

本发明针对上述现有技术的不足,提供了一种基于运动估计和时空域相关性 的快速帧间预测方法,其分别在运动估计、PU模式选择,CU深度抉择三个方面对帧间预测过程进行了改进,充分利用了编码过程中得到的邻域的编码模式及相对应的率失真代价信息,其帧间预测技术计算方法简单、大大缩短了编码时间,本发明适用于所有的标准测试序列,尤其对变化平缓的序列效果明显。

在运动估计方面,通过提前统计运动估计最终得到的最优MV的概率信息,发现最终MV为中值MV的概率占很大的比例,依据此概率信息,在TZSearch算法中首先以中值MV为起始搜索点,进行步长为1和2的两轮菱形搜索,如果此时得到的最优MV仍然为中值MV,则提前终止运动估计,最优MV即为中值MV,否则,以新得到的最优MV代替中值MV进行标准的TZSearch过程。

在PU模式选择和CU深度抉择方面,利用当前编码单元空间邻域和时间邻域的9个相邻块的编码信息,来提前终止PU模式的遍历过程和提前终止CU划分。

为解决现有技术中存在的问题,本发明采用的具体技术方案是:

一种基于运动估计和时空域相关性的快速帧间预测方法,其包括以下步骤:

步骤一、在HM16.0模型xTZSearch函数中添加功能,首先以中值MV(MPX,MPY)为起始搜索点,分别进行步长为1和2的两轮菱形搜索,共搜索13个点,获取此时的最佳匹配点P(x,y);

步骤二、判断此最佳匹配点P是否与中值MV相等,如果相等则认为本次TZSearch得到的最终MV即为中值MV,否则在当前预测PU的左、上以及右上PU的运动向量,P(x,y)和零运动向量中选择匹配误差最小的点作为起始搜索点,进行标准的TZSearch搜索过程;

步骤三、为当前CU进行PU为2Nx2N模式和skip模式的率失真代价计算,并保存此时较小的率失真代价为D0;

步骤四、判断当前CU空间和时间9块邻域的编码模式,统计采用skip模式的邻域块的个数为N,这N块编码单元的率失真代价求和为D1;

步骤五、根据视频序列的运动相关性,如果9块邻域中采用skip模式的编码单元超过n块,即满足条件

NnD0<D1×1N×α

其中取n=5,α=0.1,α为可调节的阈值加权系数,实验得出,取α=0.1时,编码性能下降较少;

则跳过其余PU模式的遍历过程;

步骤六、同理,根据运动相关性,如果当前CU的邻域块中较多的采用skip模式,并且当前块的率失真代价D2较小,则认为视频序列此处的运动平缓,CU不必再进行更大深度的划分。如果邻域块中有超过m块采用了skip模式,即满足条件

NmD2<D1×1N×β

其中取m=8,β=0.1,β为可调节的阈值加权系数,实验得出取β=0.1时编码性能下降较少;

则认为当前CU不必再进行下一个深度的四叉树划分。

优选的,S2步骤中判断P(x,y)和中值MV(MPX,MPY)是否相等的方法是,必须同时满足横坐标和纵坐标均相等,即

x=MPXy=MPY.

进一步优选的,步骤五和步骤六中,将采用skip模式的邻域块编码单元的率失真代价之和进行平均加权后作为阈值。

需要说明的是,步骤一和步骤二是在减少运动估计过程的计算复杂度,步骤三、四、五是在PU模式选择方面减少编码时间,步骤四和步骤六是在提前终止CU划分方面减少编码时间。

需要说明的是,步骤四中邻域块的率失真代价不用额外计算,在步骤三中,HM模型中邻域块的编码模式信息和率失真代价都已保存,直接获取即可,不用增添过多计算量。

需要说明的是,步骤五和步骤六所需已知条件均在步骤四中已计算得出,所以不需要重复获取邻域块的率失真代价之和。

需要说明的是,在获取采用skip模式的邻域块的率失真代价前,首先要确认此邻域块是已被编码过的。

进一步需要说明的是,用BD-rate和BD-PSNR来表征编码质量的变化情况,为了保证编码性能不会大幅下降,步骤五中取n=5,α=0.1,步骤六中取m=8,β=0.1对所有标准测试序列的效果都较好。

更需要进一步说明的是,变化越是平缓的视频序列,越容易满足本发明中的提前跳过条件,其时间减少更加明显。

通过采用以上技术方案,本发明一种基于运动估计和时空域相关性的快速帧间预测方法与现有技术对比,其技术效果在于:

1、本发明在几乎不影响视频编码质量的条件下减少了高清视频编码的时间,并且不局限于特定特征的视频序列,对于图像的分辨率,纹理等特征不过分依赖。

2、相比HM16.0测试模型,本发明在保证编码性能几乎不变的情况下,减少了计算复杂度。本发明经过了多次实验测试,设置了合适的参数,使得视频序列不依赖于自身特性,大大降低了编码时间。

3、本发明根据运动相关性,充分利用了当前编码单元空间邻域和时间邻域的编码信息,缩短了编码时间。

4、本发明应用广泛,其适用于所有视频序列,尤其对于变化平缓的视频序列效果显著。

5、本发明即使在不满足使用条件时,仍能依照标准帧间预测算法正确进行编码。

附图说明

图1是TZSearch算法的菱形搜索模板;

图2是本发明实施例提供的快速帧间预测方法流程图;

图3是本发明当前编码单元时空域上的9个相邻块。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白,结合附图和实施例对本发明进行作进一步详细说明,应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。

本发明在几乎不影响视频编码质量的条件下减少了高清视频编码的时间,并且不局限于特定特征的视频序列,对于图像的分辨率,纹理等特征不过分依赖。为说明本发明不过分依赖于视频自身特征,并且几乎不影响视频编码质量,发明人对部分HM标准测试序列在如下表1的环境下进行了实验,具体实验数据和分析数据由表2给出。

表1实验环境

表2实验数据及分析数据

表2中,T0表示HM16.0测试模型的编码时间,T1表示HM16.0加入本发明算法后的编码时间,TS表示时间减少的百分比,其计算公式为:

TS=T0-T1T0×100%

由表中结果可知,以上测试序列的编码时间平均减少24.26%,而BD-rate只增加0.844%,BD-PSNR损失0.026dB。可见编码时间大幅下降,而编码质量损失甚微。同时发现对FourPeople_1280x720_60.yuv等变化平缓的序列时间减少更加明显。

如图2所示,使用本发明的方法对其进行编码,其具体步骤如下:

S101:在HM16.0模型TZSearch函数中添加功能,首先以中值MV(MPX,MPY)为起始搜索点进行步长为1和2的两轮菱形搜索,如图共搜索13个点,获取此时的最佳匹配点P(x,y)。

S102:判断此最佳匹配点P(x,y)的是否与中值MV(MPX,MPY)相等,如果满足

x=MPXy=MPY

则终止本次TZSearch算法,得到的最终MV即为中值MV。

S103:首先为当前CU进行PU为2Nx2N模式和skip模式的率失真代价计算,并保存此时较小的率失真代价为D0。

S104:判断当前CU空间和时间9块邻域的编码模式,如图3所示,统计采用skip模式的邻域块的个数为N,这N块编码单元的率失真代价求和为D1。

S105:如果9块邻域中采用skip模式的编码单元超过n块,即满足条件

NnD0<D1×1N×α

其中取n=5,α=0.1,则采用率失真代价D0对应的PU模式。终止遍历其余PU模式的过程。

S106:如果邻域块中有超过m块采用了skip模式,即满足条件

并且此深度CU的率失真代价D2满足条件

NmD2<D1×1N×β

其中取m=8,β=0.1,则终止CU下一层深度的递归过程。本编码单元帧间预测过程结束。

不难理解,变化越是平缓的视频序列,越容易满足本发明中的提前跳过条件,其时间减少更加明显。

将以上步骤嵌入HM测试模型后,将编码结果进行解码,可以得到正确的视频图像。

以上所述仅为本发明的实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号