公开/公告号CN103888762A
专利类型发明专利
公开/公告日2014-06-25
原文格式PDF
申请/专利权人 西南交通大学;
申请/专利号CN201410062559.7
申请日2014-02-24
分类号H04N19/103(20140101);H04N19/134(20140101);H04N19/61(20140101);H04N7/015(20060101);
代理机构51200 成都信博专利代理有限责任公司;
代理人张澎
地址 610031 四川省成都市二环路北一段111号西南交通大学科技处
入库时间 2023-12-17 00:15:55
法律状态公告日
法律状态信息
法律状态
2017-01-11
授权
授权
2014-07-16
实质审查的生效 IPC(主分类):H04N19/103 申请日:20140224
实质审查的生效
2014-06-25
公开
公开
技术领域:
本发明属于视频编码和处理领域,具体涉及基于HEVC标准的一种视频编 码实现框架。
背景技术:
传统视频编码技术,如H.264等在高清(1080P)及超高清(2K、4K)视 频编码需求下,其编码生成的数据率急剧增长,这给视频数据的存储、网络传 输带来了巨大冲击,现有的编码技术已经难以适应。因此具有更好压缩率的编 码技术的提出势在必行。为解决这一问题,JCT-VC(Joint Collaborative Team on Video Coding)工作组制定了具有更高的压缩效率的新一代视频压缩标准 HEVC(High Efficiency Video Coding)。与现有编码标准H.264/AVC相比,在 重建图像客观质量相同的情况下,HEVC的编码码率可以节省50%左右。
HEVC标准提供了更好的压缩效率,但其代价是必须在更多的编码参数中 进行优化选择,才能充分发挥HEVC的压缩效率。这使得基于HEVC标准的 编码器可能因编码复杂度的大幅提高而阻碍其实际应用与推广。
另一方面,虽然HEVC与H.264/AVC相比可以节省50%左右的码率,但 高清视频图像的数据量仍是普通视频的2倍以上,且视频的数据量是随着图像 分辨率的提高而增加的。然而,根据人眼视觉感知特性,当图像质量或分辨率 达到增加到一定程度时,人眼能接收的视觉信息会逐渐趋于饱和。
对此,从编码复杂度与率失真性能优化的角度设计一种基于HEVC标准 的视频编码框架,可以最大限度降低HEVC编码的复杂度;提高HEVC编码 的率失真性能,从而满足实用化需求。同时,此框架可以结合人眼视觉感知特 性,在相同编码条件下进一步优化高清视频的主观质量。因此,相关研究有着 广阔的应用前景和巨大的经济价值。
发明内容
本发明要解决的技术问题是提供一种编码复杂度与率失真性能联合优化 的基于HEVC标准的视频编码框架。
本发明采用的技术方案如下:
A.建立内容自适应的编码复杂度、编码失真度和编码码率的估计模型, 及编码复杂度代价模型和编码率失真代价模型。
B.利用步骤A的估计模型,对当前视频帧中每个编码树单元(CTU), 进行编码复杂度与率失真性能联合优化的空时域预测;
C.利用步骤A的估计模型,对步骤B中编码树单元(CTU)的预测残 差,进行编码复杂度与率失真性能联合优化的变换与量化;
D.利用步骤A的估计模型,以最小化编码率失真代价为准则,从步骤B 和C的编码结果中选择当前CTU的最佳编码结果;
E.对步骤D的最佳编码结果,进行解码重建和熵编码输出;
F.根据步骤B和C的编码结果,更新步骤A的估计模型。
所述步骤A的具体方法为:根据当前编码图像的空时域特征及编码参数, 建立内容自适应的编码复杂度T估计模型、编码失真度D估计模型和编码码率 R估计模型。并根据编码复杂度-编码失真度建立编码复杂度代价模型 JD&T(D,T);根据编码失真度-编码码率建立编码率失真代价模型JD&R(D,R)。其 中,编码参数包括:预测单元(PU)尺寸、变化单元(TU)尺寸、帧内/帧间 预测模式、参考帧数、运动搜索范围、量化参数;编码失真估计模型既可采用 常见的MSE、SAD等失真度量模型,也可采用基于人眼视觉感知特性的失真 估计模型,如恰可感知失真模型(JND),结构相似模型(SSIM)等。
所述步骤B的具体步骤为:1)根据编码配置参数,得到当前CTU允许的 四叉树编码单元(CU)划分层次和空时域预测模式;2)采用模型定量计算的 方法,以最小化编码复杂度代价为准则,计算当前CTU不同CU划分条件下 的候选空时域预测模式;其中,对于帧间非Skip预测,计算其运动搜索的参 考帧数和搜索范围;3)按照遍历择优选择的方法,以最小化编码率失真代价 为准则,遍历步骤2)的候选空时域预测模式,得到当前CTU不同CU划分条 件下的最佳空时域预测结果。其中,空时域预测模式包括:帧内预测模式和帧 间预测模式、预测单元(PU)划分;帧间预测包括:帧间Skip模式和帧间非 Skip模式。
所述步骤C的具体步骤为:a)根据编码配置参数,得到当前CTU允许的 变换模式;b)采用模型定量计算的方法,以最小化编码复杂度代价准则,计 算当前CTU不同CU划分条件下的候选变换模式;并以最小化编码率失真代 价为准,计算候选变换模式的量化参数;c)按照遍历择优选择的方法,以最 小化编码率失真代价为准,遍历步骤b)的候选变换模式,得到当前CTU不同 CU划分条件下的最佳变换量化结果;其中,变换模式包括:正弦变换和余弦 变换、变换单元(TU)划分;变换模式选择和参数计算时,是基于步骤3)中 各CU划分条件下的最佳空时域预测图像。
所述步骤2)的具体方法为:分别计算每个编码单元(CU)在不同预测模 式条件下的编码复杂度代价JD&T(D,T),选择编码复杂度代价小于 的预测模式为当前CU的候选模式。其中,κ为大于1的经验阈 值;为候选模式中的最小编码复杂度代价。对于帧间非Skip预测, 根据最小化编码复杂度代价JD&T(D,T),计算运动搜索的参考帧数和搜索范围。
所述步骤b)的具体方法为:分别计算每个编码单元(CU)在不同变换模 式条件下的编码复杂度代价JD&T(D,T),选择编码复杂度代价小于的变换测模式为当前CU的候选模式。其中,κ为大于1的经验阈值;为候选模式中的最小编码复杂度代价。根据最小化编码率失真代价JD&R(D,R), 计算候选变换模式的量化参数。
所述的一种基于HEVC标准的视频编码框架,采用编码复杂度代价模型和 编码率失真代价模型,可以提供基于图像内容和人眼视觉感知特性的编码复杂 度/率失真性能的联合优化,从而达到更好的视频编码性能。
所述的一种基于HEVC标准的视频编码框架,在遍历择优选择之前,采用 模型定量计算候选编码模式、运动搜索参数和量化参数,既避免了大量复杂的 遍历择优过程又提高了编码的率失真性能。
与现有技术相比,本发明的有益效果是:采用基于模型的编码模式选择和 编码参数定量计算既可以避免大量复杂的遍历择优过程又可以提高视频编码 的率失真性能;编码失真计算可选择与人眼视觉感知一致性好的度量模型,在 相同编码条件下,改善视频图像的主观质量。同时本发明方法可兼容现有提高 HEVC视频编码性能的研究成果,并在其基础上进一步改善视频编码的性能与 效率,实现更为高效的HEVC视频编码策略。
附图说明:
图1为本发明的一种基于HEVC标准的视频编码框架。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实 施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅 用以解释本发明,并不用于限定本发明。
本说明书公开的任一特征,除非特别叙述,均可被其他等效或者具有类似 目的的替代特征加以替换。即,除非特别叙述,每个特征只是一系列等效或类 似特征中的一个例子而已。
如图1所示,一种基于HEVC标准的视频编码框架,具体方法为:
A.建立内容自适应的编码复杂度、编码失真度和编码码率的估计模型, 及编码复杂度代价模型和编码率失真代价模型。
B.利用步骤A的估计模型,对当前视频帧中每个编码树单元(CTU), 进行编码复杂度与率失真性能联合优化的空时域预测;
C.利用步骤A的估计模型,对步骤B中编码树单元(CTU)的预测残 差,进行编码复杂度与率失真性能联合优化的变换与量化;
D.利用步骤A的估计模型,以最小化编码率失真代价为准则,从步骤B 和C的编码结果中选择当前CTU的最佳编码结果;
E.对步骤D的最佳编码结果,进行解码重建和熵编码输出;
F.根据步骤B和C的编码结果,更新步骤A的估计模型。
所述步骤A的具体方法为:根据当前编码图像的空时域特征及编码参数, 建立内容自适应的编码复杂度T估计模型、编码失真度D估计模型和编码码率 R估计模型。并根据编码复杂度-编码失真度建立编码复杂度代价模型 JD&T(D,T);根据编码失真度-编码码率建立编码率失真代价模型JD&R(D,R)。
本实施例中,根据当前编码图像的空时域相关性,综合考虑PU和TU的 尺寸、帧内/帧间编码模式及编码参数,建立基于图像内容的编码复杂度T的估 计模型:
a.空时域预测阶段的计算复杂度模式为:
其中,TPU表示给定PU的计算复杂度,计算复杂度以单个像素点进行一次预 测失真计算为基本单位。mIntra和mInter表示给定编码配置时的所有可能的帧内 预测模式集和帧间预测模式集;SPU是给定PU的面积;ref,ms分别表示帧 内预测的参考帧个数和运动搜索范围;FIntra和FInter分别表示给定PU、模式和 编码参数的条件下,帧内和帧间的计算复杂度,其值是定值可直接测量;σIntra和σInter是基于空时域相关性的经验修正值,分别用于表示帧内和帧间预测快速 算法对编码复杂度的影响。注,TCTU或TCU的计算复杂度是累加其所有PU的 计算复杂度
b.变换量化阶段的计算复杂度模型为:
TTU=FTU(FlagTU,STU)
其中,TTU表示给定TU的计算复杂度,计算复杂度以单个像素点进行一次变 换量化为基本单位。FlagTU变换方式,可以为正弦变换或余弦变换;STU是给 定TU的面积;
编码失真估计模型既可采用常见的MSE、SAD等失真度量模型,也可采 用基于人眼视觉感知特性的失真估计模型,如恰可感知失真模型(JND),结 构相似模型(SSIM)等。本实施例中,以JND模型为基础,建立编码失真度D 的估计模型:
D(i,j)=P(I(i,j)-I'(i,j)|ω(i,j))
其中,(i,j)表示像素点的坐标;ω表示当前像素点的视觉敏感度;JND和分别表示当前像素点的JND值和当前图像的平均JND值;I表示当前像素点 的原始值;I'表示当前像素点的编码预测值或解码重建值;a,b,c,d,e是 经验常数;
给定PU的编码失真度计算模型为
由于在编码前不能得到准确的I',本实施例中采用基于块的误差ΔI估计实现 失真度计算:
a.空时域预测阶段的编码失真度计算模型为
其中,和分别表示当前PU原始图像的像素均值和预测图像的像素均 值;表示原始图像与预测图像的误差值;表示当前PU的视觉敏感度 均值。注,DCTU或DCU的编码失真度是累加其所有PU的失真度
b.变换量化阶段的编码失真度计算模型为
其中,和分别表示当前PU原始图像的像素均值和解码重建图像的 像素均值;表示原始图像与解码重建图像的误差值;表示当前TU的 视觉敏感度均值。
本实施例中,采用传统的编码码率估计模型。编码复杂度-编码失真度建 立编码复杂度代价和编码失真度-编码码率建立编码率失真代价模型分别为:
JD&T(D,T)=D+λD&T·T
JD&R(D,R)=D+λD&R·R
所述步骤B的具体步骤为:
1)根据编码配置参数,得到当前CTU允许的四叉树编码单元(CU)划 分层次和空时域预测模式;
本实施例中,CTU的参数为64x64,最大划分深度为4。此时CTU的可依 次划分为32x32、16x16、8x8大小的CU。每个CU需依次进行帧内/帧间预测, 其中帧间预测的PU包括2Nx2N,2NxN,Nx2N,2NxnU,2NxnD,nLx2N, nRx2N,NxN多种尺寸。
2)采用模型定量计算的方法,以最小化编码复杂度代价为准则,计算当 前CTU不同CU划分条件下的候选空时域预测模式。其中,预测模式包括: 帧内预测模式和帧间预测模式、预测单元(PU)划分;帧间预测包括:帧间 Skip模式和帧间非Skip模式。
根据步骤A的模型,分别计算每个编码单元(CU)在不同预测模式条件 下的编码复杂度代价JD&T(D,T)
其中,每个CU可允许多种PU划分方式,记为PUx,x∈{1,2,…,n}。nPU表示 允许的PU划分个数,当CU为8x8,nPU=4;否则,nPU=8。每种PU划分方 式的编码感知失真度D与计算复杂度T,分别对应于和中的一个 元素。选择编码复杂度代价小于的预测模式为当前CU的候选模 式。其中,κ为大于1的经验阈值;对于帧间非Skip预测,根据最小化编码复 杂度代价JD&T(D,T),计算运动搜索的参考帧数ref和搜索范围sr
3)按照遍历择优选择的方法,以最小化编码率失真代价为准则,遍历步 骤2)的候选空时域预测模式,得到当前CTU不同CU划分条件下的最佳空时 域预测结果。
其最优化过程依次是:从帧间Skip和非Skip模式及PU划分中选择最优;从 帧内候选预测模式及PU划分中选择最优;从帧内和帧间模式中选择最优。
最终,得到当前CTU的各CU的最佳预测模式、编码参数及预测图像。
所述步骤C的具体步骤为:
a)根据编码配置参数,得到当前CTU允许的变换模式;
本实施例中CTU的参数为64x64,CTU和TU最大划分深度均为4,TU 仅允许正方形变换:32x32、16x16、8x8和4x4。
b)采用模型定量计算的方法,以最小化编码复杂度代价准则,计算当前 CTU不同CU划分条件下的候选变换模式;并以最小化编码率失真代价为准, 计算候选变换模式的量化参数;
分别计算每个编码单元(CU)在不同变换模式条件下的编码复杂度代价 JD&T(D,T)
选择编码复杂度代价小于的变换测模式为当前CU的候选模式。 其中,κ为大于1的经验阈值;根据最小化编码率失真代价JD&R(D,R),计算 候选变换模式的量化参数Q
其中,FRec和FR分别表示视频编码中通用的误差计算模型和码率计算模型。
c)按照遍历择优选择的方法,以最小化编码率失真代价为准,遍历步骤b) 的候选变换模式,得到当前CTU不同CU划分条件下的最佳变换量化结果; 其中,变换模式包括:正弦变换和余弦变换、变换单元(TU)划分;变换模 式选择和参数计算时,是基于步骤3)中各CU划分条件下的最佳空时域预测 图像。
所述步骤D的具体步骤为:以最小化编码率失真代价为准,从步骤B和C 的编码结果中选择当前CTU的最佳编码结果
所述步骤E的具体步骤为:按照标准HEVC标准,对步骤D的最佳编码 结果进行解码重建和熵编码输出。
所述步骤F的具体步骤为:根据步骤B和C的编码结果,更新步骤A编码复 杂度估计模型中σIntra和σInter的计算参数;编码失真估计模型中ΔI和P(·)的计算 参数。
机译: 用高效视频编码(HEVC)标准的操作点信号处理视频数据的设备和方法
机译: 低复杂度算法集,用于根据H.265 / HEVC标准对参与视频编码的单位进行编码
机译: 使用移动图像专家组(MPEG)-2系统的高效视频编码(HEVC)标准和缓冲模型的比特流传输