首页> 中国专利> 一种基于纹理分析的HEVC帧内预测快速模式选择方法

一种基于纹理分析的HEVC帧内预测快速模式选择方法

摘要

本发明公布了一种基于纹理分析的HEVC帧内预测快速模式选择方法,该方法在对编码树单元进行帧内预测之前,根据水平、垂直、左下、右下等四个方向上的梯度绝对值和确定编码树单元中每一个4×4单元的主纹理方向和纹理复杂度,并根据纹理平滑区域采用较大编码单元,纹理复杂区域采用较小编码单元的原则确定当前编码树单元的划分。在预测时,根据预测单元的主纹理方向,排除掉最不可能的若干预测模式,然后按照HEVC编码标准进行粗略模式选择和率失真优化模式选择。本发明所提出的基于纹理分析的HEVC帧内预测快速模式选择方法能够在保证编码质量的前提下,显著提高编码速度。

著录项

  • 公开/公告号CN103517069A

    专利类型发明专利

  • 公开/公告日2014-01-15

    原文格式PDF

  • 申请/专利权人 北京航空航天大学;

    申请/专利号CN201310445775.5

  • 发明设计人 张永飞;李哲;李波;

    申请日2013-09-25

  • 分类号H04N19/103(20140101);H04N19/50(20140101);

  • 代理机构11251 北京科迪生专利代理有限责任公司;

  • 代理人杨学明;顾炜

  • 地址 100191 北京市海淀区学院路37号

  • 入库时间 2024-02-19 22:18:46

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2019-05-07

    专利权的转移 IPC(主分类):H04N19/103 登记生效日:20190417 变更前: 变更后: 申请日:20130925

    专利申请权、专利权的转移

  • 2016-10-26

    授权

    授权

  • 2014-02-19

    实质审查的生效 IPC(主分类):H04N19/103 申请日:20130925

    实质审查的生效

  • 2014-01-15

    公开

    公开

说明书

技术领域

本发明属于多媒体编码领域,具体涉及一种针对HEVC视频编码标准的帧内预测快速模 式选择方法,是一种根据图像纹理分析进行编码单元划分和预测方向快速模式选择的方法。

背景技术

随着新一代视频编码标准HEVC(High Efficiency Video Coding)的发布,视频的编码效 率进一步提升。相比于以前的视频编码标准H.264/AVC,在相同编码质量的情况下,可以节 省近一半的码率,然而这是以牺牲编码复杂度为代价的。如何在不改变码流结构和保持原有 码率的前提下,最大程度的降低算法复杂度,显著提高编码速度,是HEVC大规模推广与应 用的关键所在。

帧内编码可以为帧间编码提供参考信息,并且可以阻止由误码引起的错误漂移,因此在 视频编码中帧内编码是必不可少的。影响HEVC帧内编码耗时的主要有两个部分:编码单元 的划分和预测方向的选择。

针对编码单元的快速划分主要有两种方法,一是根据已编码单元的率失真代价利用贝叶 斯等统计学习的方法确定编码单元的划分,然而离线的学习结果不能很好的通用于所有的视 频序列,在线的学习方式又会引入额外的计算复杂度;二是根据当前编码单元的图像内容复 杂度确定编码单元的划分,这种方法的关键在于计算图像复杂度以及选择合适的阈值。

针对预测方向的快速模式选择主要有三种方法,一是根据相邻区域或者相邻帧间具有较 强的相关性,利用周围编码单元的信息减少当前编码单元的预测方向候选集,然而实际应用 中,经常出现场景切换或纹理丰富的视频,这种情况下时空相关性较弱,导致编码性能明显 下降;二是利用最佳的预测方向与编码单元的纹理方向间较高的相关性,减少候选预测方向 的数量;三是通过一种低复杂度的方式估计每一种预测模式的码率和失真降低率失真代价的 计算复杂度,这种方法保留了所有的预测方向,并且没有增加额外的计算复杂度,但是由于 自然图像视频序列的随机性较强,很难构造一个适用于所有视频序列的率失真估计模型,相 比于第二种方法,这种方法的编码性能下降比较明显。

在新一代视频编码标准中,HEVC引入了新的编码树单元(Coding Tree Unit,CTU)概 念,用于替代现有视频编码标准中的宏块概念,另外还有编码单元、预测单元、变换单元等 概念。编码树单元是一个递归的四叉树结构,深度可以从0到3,即编码单元的大小可以从 64×64到8×8。对于最小的编码单元来说,HEVC的帧内编码又可以将其划分为4×4的预 测单元,预测单元的大小可以从64×64到4×4。而对于帧内预测来说,HEVC对每一个预 测单元都提供了35种预测模式。相比于现有视频编码标准H.264/AVC,编码单元划分和预 测方向选择的优化问题更为复杂。本发明根据纹理分析构造当前编码树单元的图像复杂度描 述,并据此快速确定编码单元的划分;利用纹理分析获得的纹理方向与预测方向间较强的相 关性,减少预测模式的数量。

发明内容

为了克服现有技术的上述缺陷,本发明提出了一种基于纹理分析的HEVC帧内预测快速 模式选择方法,该方法根据视频内容的复杂度确定编码树单元的划分,并根据图像的纹理方 向减小预测方向的候选集。实验证明本方法能够很好的适应高清视频图像的实时压缩应用, 大大提高了编码速度。

为实现上述目的,本发明采用的技术方案为:

一种基于纹理分析的HEVC帧内预测快速模式选择方法,该方法步骤如下:

步骤(1)、对当前编码树单元,计算每个可能的编码单元的图像复杂度和主纹理方向;

步骤(2)、对当前编码树单元,按照Z扫描顺序从上往下重复执行步骤(3)至步骤(6), 直至扫描完当前编码树单元;

步骤(3)、若当前编码单元的图像复杂度小于或等于阈值,则判定该编码单元为平滑单 元,否则判定为复杂单元;

步骤(4)、对于平滑的编码单元,利用步骤(5)计算当前编码单元的率失真代价;

步骤(5)、对于当前编码单元中的每一个预测单元,保留该单元主纹理方向周围的8个 预测方向以及planar预测和DC预测模式,按照HEVC视频编码标准进行粗略模式选择和率 失真优化选择;

步骤(6)、对于复杂的编码单元,按照步骤(3)至步骤(6)依次递归扫描四个子单元, 若四个子单元都判定为平滑单元,则利用步骤(5)计算当前编码单元的率失真代价,并根 据率失真代价最小原则判定当前编码单元是否划分,同时更新阈值。

所述步骤(1)具体包括如下步骤:

步骤(11)、对当前编码树单元中的每一个4×4的单元,分别沿水平、垂直、左下、右 下四个方向计算梯度并计算梯度的绝对值和SAG;

步骤(12)、将最小梯度绝对值和的梯度方向作为该单元的主纹理方向,所述主纹理方 向是指该单元大部分像素的纹理方向;

步骤(13)、将主纹理方向与其正交方向上SAG差的绝对值定义为该单元的纹理复杂度, 并利用量化步长与该单元大小的乘积作为初始阈值。

所述步骤(5)具体包括如下步骤:

步骤(51)、定义一个候选预测模式数组;

步骤(52)、根据步骤(1)获取当前预测单元的主纹理方向,并将主纹理方向及其周围 的8个预测方向作为候选预测方向;

步骤(53)、将候选预测方向映射到HEVC编码标准中的角度预测模式,并将选择的角 度预测模式和planar以及DC模式添加到候选预测模式数组;

步骤(54)、对候选预测模式数组中的每一个预测模式,按照HEVC编码标准进行粗略 模式选择和率失真优化模式选择。

所述步骤(6)具体包括如下步骤:

步骤(61)、按照步骤(3)至步骤(6)依次递归扫描四个子单元,若四个子单元都判 定为平滑单元,则利用步骤(5)计算当前编码单元的率失真代价Costcoarse,否则继续递归 扫描下一层次的子单元;

步骤(62)、若当前编码单元的率失真代价Costcoarse小于或等于四个子单元的率失真代 价和Costfine,则将阈值调大,否则将阈值调小。

所述步骤(62)中阈值调大的更新策略为:

TH′=TH+α×(Costfine-Costcoarse)/2

式中TH为更新前的阈值,TH′为更新后的阈值,α为纹理复杂度与率失真代价间的线 性模型的乘法因子。

所述步骤(62)中阈值调小的更新策略为:

TH′=TH-a

式中TH为更新前的阈值,TH′为更新后的阈值,a为常数。

本发明与现有技术相比的优点在于:

1、本发明从纹理分析的角度出发,将编码树单元的划分与预测方向的选择结合考虑, 利用梯度既能够提取纹理复杂度又可以提取纹理的方向,在保证编码质量的前提下,可以节 省更多的编码时间。

2、本发明根据最终的率失真代价及时更新决定编码单元是否划分的阈值,能够充分利 用编码树单元内相邻区域的强相关性,以减弱阈值选取对编码质量的影响。

附图说明

图1为基于纹理分析的HEVC帧内预测快速模式选择方法流程图;

图2为HEVC视频编码标准中的编码树单元划分结构图;

图3为方向梯度计算方法示意图;

图4为基于梯度的编码单元快速划分详细流程图。

具体实施方式

下面结合附图和具体实施方式对本发明作进一步的说明。

为了满足高清视频图像的实时压缩应用需求,提高HEVC视频编码器的编码速度,本发 明提出了一种基于纹理分析的HEVC帧内预测快速模式选择方法。该方法主要包括两部分: 基于纹理复杂度的编码单元快速划分和基于纹理方向的预测模式快速选择,编码单元的快速 划分涉及发明内容中的步骤(1)至步骤(4)以及步骤(6),预测模式的快速选择涉及发明 内容中的步骤(5)。首先利用梯度算子计算当前编码树单元中各子单元的复杂度,确定一个 较细的编码单元划分,再根据该划分确定一个较粗的编码单元划分,最终根据后续帧内预测 的率失真代价确定最终的编码单元划分;在选择最佳预测方向的过程中,排除掉与主纹理方 向相差较远的预测模式,以节省帧内预测的时间。下面展开具体说明。

1.基于纹理复杂度的编码单元快速划分

新一代视频编码标准HEVC引入了编码树单元(Coding Tree Unit,CTU)概念,一帧视频 由多个互不重叠的编码树单元组成。默认情况下,编码树单元的大小为64×64。编码树单 元是一个四叉树形式的递归结构,它可以灵活的划分为多个层次的编码单元,如图1所示。 编码单元的大小可以从64×64到8×8。在HEVC标准的参考编码器中,利用率失真优化选 择的方法对每一种可能的划分都进行一次预测、变换、量化、熵编码、反量化、反变换、重 建等过程,相比于H.264/AVC,编码复杂度大幅提升,严重制约了HEVC的实际应用。

通过实验统计发现,编码单元的大小与图像内容的纹理复杂度密切相关。纹理简单的区 域采用较大的编码单元,而纹理复杂的区域采用较小的编码单元。纹理复杂度的度量方式有 多种,如方差、梯度、熵等。梯度不仅包含图像的纹理复杂度信息,还包含了图像的纹理方 向信息,可以协助快速确定预测单元的预测模式。基于此,本发明提出一种基于梯度的编码 单元快速划分方法。

在介绍编码单元快速划分的实施方式之前,首先给出本发明中所使用的梯度的计算方法 以及主纹理方向、纹理复杂度的定义。本发明中的梯度是指像素亮度值沿水平、垂直、左下、 右下等方向获得的方向导数,如图3所示。计算公式如(1)—(4)式所示。

gh(x,y)=p(x,y)-p(x+2,y)gh(x+1,y)=p(x+1,y)-p(x+3,y)gh(x,y+1)=p(x,y+2)-p(x+2,y+2)gh(x+1,y+1)=p(x+1,y+2)-p(x+3,y+2)---(1)

gv(x,y)=p(x,y)-p(x,y+2)gv(x+1,y)=p(x+2,y)-p(x+2,y+2)gv(x,y+1)=p(x+1,y+1)-p(x+1,y+3)gv(x+1,y+1)=p(x+3,y+1)-p(x+3,y+3)---(2)

gld(x,y)=2[p(x,y)-p(x+2,y+2)]gld(x+1,y)=2[p(x+1,y)-p(x+3,y+2)]gld(x,y+1)=2[p(x,y+1)-p(x+2,y+3)]gld(x+1,y+1)=2[p(x+1,y+1)-p(x+3,y+3)]---(3)

grd(x,y)=2[p(x+2,y)-p(x,y+2)]grd(x+1,y)=2[p(x+3,y)-p(x+1,y+2)]grd(x,y+1)=2[p(x+2,y+1)-p(x,y+3)]grd(x+1,y+1)=2[p(x+3,y+1)-p(x+1,y+3)]---(4)

式中gh(·)、gv(·)、gld(·)、grd(·)分别表示水平、垂直、左下、右下方向上的梯度滤波 器,p(·)表示当前编码树单元中的亮度分量像素值,(x,y)表示每个4×4单元左上角像素的 坐标。本发明中利用SAG表示沿某一方向的梯度绝对值和,计算公式如(5)式所示。

SAGdir=∑|gdir(x,y)|,dir∈{h,v,ld,rd}  (5)

将最小梯度绝对值和的方向作为主纹理方向,主纹理方向的梯度绝对值和记作SAGmin, 其正交方向的梯度绝对值和记作SAGorg。纹理复杂度complexity定义为SAGorg与SAGmin间 的差值,即:

complexity=SAGorg-SAGmin  (6)

划分的详细流程如图4所示。对每一个编码树单元,首先将其划分为N×N个4×4的单 元,对每一个单元分别计算水平、垂直、左下、右下方向上的梯度值。然后对编码树单元从 64×64到8×8递归的计算各编码单元的纹理复杂度以及划分,最终确定整个编码树单元的 划分。递归过程描述如下:

(1)对当前编码单元,利用(5)式分别计算四个方向上的梯度绝对值和SAGh、SAGv、 SAGld、SAGrd,并获取当前编码单元的主纹理方向和纹理复杂度complexity。

(2)若当前编码单元的纹理复杂度complexity小于阈值TH,直接将当前编码单元设置 为平滑区域,并计算率失真代价,不再进行划分,返回上一层递归。

(3)否则,检查当前编码单元是否可以划分,若不可以划分,则计算率失真代价并返 回上一层递归。

(4)否则,将当前编码单元划分为四个子单元,依次进入下一层递归。

(5)检查四个子单元是否都被确定为平滑区域,如是平滑区域则计算当前编码单元的 率失真代价,否则转步骤(8)。

(6)若当前编码单元的率失真代价小于或等于四个子单元的率失真代价和,则当前编 码单元不划分,同时将阈值TH调大。

(7)若当前编码单元的率失真代价大于四个子单元的率失真代价和,则当前编码单元 划分,同时将阈值TH微调小。

(8)检测是否有未编码单元,若有则返回上一层递归,否则退出递归。

一般说来,现有视频编码标准所对应的编码器产生的失真主要是由量化引起的,若相邻 像素间的差异小于量化步长,则说明这一差异经过量化后就不存在了。因此可以通过量化步 长设定纹理复杂度的阈值,然而视频编码标准中的量化步长是针对变换域的。本发明根据空 域和变换域间的能量守恒定律,将递归过程中的初始阈值定义为当前编码单元的大小与量化 步长的乘积,即TH=CUsize×QPstep。

阈值TH调大的更新策略为:TH′=TH+α×(Costfine-Costcoarse)/2,这里的α为纹理 复杂度与率失真代价间的线性模型的乘法因子。

阈值TH微调小的更新策略为:TH′为TH′=TH-a,这里的a为常数。

这样就可以根据纹理复杂度以及率失真代价获得编码树单元的划分。

2.基于纹理方向的预测模式快速选择

相比于H.264/AVC,新一代视频编码标准HEVC引入了预测单元(Prediction Unit,PU)的 概念。对于帧内预测来说,预测单元有两种划分方式。对于最小的编码单元,预测单元可以 与编码单元相同,也可以在编码单元基础上进一步四叉分;而对于其余的编码单元,预测单 元只能与编码单元相同。同时HEVC还提供了更为精细的预测方向,每一个预测单元都有 35种预测模式,大大增加了编码复杂度。

提高编码效率的根本在于在保证编码质量的前提下,尽量减少候选预测模式。通常情况 下,最终选择的预测模式与纹理方向相近。表1给出了各种预测单元中最佳预测模式与纹理 方向相近的概率。从表中可以看出,最佳预测模式与纹理方向相近的概率可以达到80%以上。 另外,在本发明的第一步编码单元的快速划分中,已经获得了每一个编码单元的主纹理方向。 因此,可以利用这一中间结果尽量减少候选预测模式的数量,从而提高编码效率。需要说明 的是,对于所有的预测单元,HEVC所提供的planar和DC预测模式都保留,本发明只考虑 减少角度预测的候选预测方向。

表1 各预测单元在不同量化步长下最佳预测模式与纹理方向相近的概率

量化步长 64×64 32×32 16×16 8×8 4×4 22 100% 79.63% 80.76% 84.32% 87.45% 27 86.36% 78.80% 83.64% 87.67% 89.24% 32 80.43% 82.21% 89.47% 88.88% 89.86% 37 78.67% 86.53% 89.83% 89.20% 89.06% 平均 86.37% 81.79% 85.93% 87.52% 88.90%

由于最佳预测模式与纹理方向相近的概率较高,本发明利用主纹理方向周围的几个预测 方向进行角度预测。具体实施方式如下:

(1)定义一个大小为11的候选预测模式数组,用于存储筛选的候选预测模式,其中包 括planar模式、DC模式、主纹理方向以及主纹理方向周围的若干预测方向。在本发明的具 体实施中,在主纹理方向两侧各取了4个预测方向。

(2)获取当前预测单元的主纹理方向所对应的预测模式编号modetexture,并利用公式(7) 计算出角度预测范围[modeleft,moderight]。

modeleft=modetexture-4moderight=modetexture+4---(7)

(3)利用公式(8)获取主纹理方向左侧的预测模式。

modeIdx=mode+33mode<2modeIdx=modemode2,mode[modeleft,modetexture-1]---(8)

(4)利用公式(9)获取主纹理方向右侧的预测模式。

modeIdx=mode-33mode>34modeIdx=modemode34,mode[modetexture+1,moderight]---(9)

(5)对筛选的候选预测模式集合{modeIdx},存储到候选预测模式数组中。按照HEVC 标准中的粗略模式选择和率失真优化选择从中选取最佳的预测模式。

以上公开的仅为本发明的具体实施例。根据本发明提供的技术思想,本领域的技术人员 所能思及的变化,都应落入本发明的保护范围内。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号