首页> 中国专利> 用于可伸缩视频编码的层间运动向量缩放

用于可伸缩视频编码的层间运动向量缩放

摘要

本发明提供一种利用层间运动向量缩放因子来降低计算复杂性的层间运动向量缩放方法。在一个实施方式中,关于视频序列的增强层图片和基本层图片的图像大小信息被接收。层间运动向量缩放因子基于图像大小信息来确定。被缩放的运动向量基于基本层运行向量和层间运动向量缩放因子来确定。然后,被缩放的运动向量被提供以用于增强层图片的层间编码。在另一实施方式中,层间位置映射缩放因子基于关于增强层图片和基本层图片的图像大小信息来确定。对应于增强层像素位置的基本层映射位置基于增强层像素位置和层间位置映射缩放因子来确定。然后,在基本层映射位置的上采样基本层图片被提供以用于增强层图片的层间编码。

著录项

  • 公开/公告号CN105052144A

    专利类型发明专利

  • 公开/公告日2015-11-11

    原文格式PDF

  • 申请/专利权人 联发科技股份有限公司;

    申请/专利号CN201480014067.9

  • 发明设计人 庄子德;陈庆晔;黄毓文;

    申请日2014-03-12

  • 分类号H04N19/33;

  • 代理机构北京万慧达知识产权代理有限公司;

  • 代理人白华胜

  • 地址 中国台湾新竹科学工业园区新竹市笃行一路一号

  • 入库时间 2023-12-18 11:52:23

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2019-01-01

    授权

    授权

  • 2016-10-05

    专利申请权的转移 IPC(主分类):H04N19/33 登记生效日:20160908 变更前: 变更后: 申请日:20140312

    专利申请权、专利权的转移

  • 2015-12-09

    实质审查的生效 IPC(主分类):H04N19/33 申请日:20140312

    实质审查的生效

  • 2015-11-11

    公开

    公开

说明书

交叉引用

本发明主张在2013年3月12日提出的申请号为61/777,250、标题为“Methods ofMotionVectorScalingwithFrameCroppingforScalableVideoCoding”的美国临 时专利申请案的优先权;主张在2013年3月19日提出的申请号为61/803,222、 标题为“MethodsofMotionVectorScalingandPixelPositionMappingwithFrame CroppingforScalableVideoCoding”的美国临时申请案的优先权;主张在2013 年4月22日提出的申请号为61/814,591、标题为“Methodsofsimplifiedmotion vectorscalingandpixelpositionmappingforscalablevideocoding”的美国临时申 请案的优先权;以及主张在2013年7月15日提出的申请号为61/846,128、标题 为“MethodsofInter-layerMotionVectorScalingandInter-layerPixelPosition MappingwithPhaseShiftforScalableVideoCoding”的美国临时申请案的优先权。 因此在全文中合并参考这些美国临时专利申请案。

技术领域

本发明是有关于可伸缩视频编码,特别是有关于层间(inter-layer)运动向量缩 放和层间像素位置映射。

背景技术

压缩的数字视频已经广泛地应用于各种应用中。例如,对于数字网络的视频 流和对于数字通道的视频传输。通常,单一的视频内容可以通过不同特性的网 络来传输。举例来说,现场直播的体育赛事可以载入高宽带数据流格式,并通 过收费视频服务的宽带网络传输。在这样的应用中,压缩的视频通常保存高分 辨率和高品质,以使得视频内容适合于高清晰度设备,例如,高清晰度电视或 高清晰度显示器。相同的内容也可以载入蜂窝数据网络,以使得该内容可以在 便携式设备(例如,智能手机或通过网络连接的便携式媒体设备)上进行观看。 在此应用中,由于网络带宽问题和在智能手机或便携式设备上的低分辨率显示, 视频内容通常被压缩为低分辨率和低比特率。因此,对于不同的网络环境和不 同的应用,视频分辨率和视频品质的要求是完全不同的。即使对于相同类型的 网络,用户可能由于不同的网络基础设施和网络流量状况而感受到不同的可用 带宽。因此,用户可能希望当可用带宽较宽时,接收高品质视频,当网络拥塞 发生时,接收较低品质但是很流畅的视频。在另一种情况下,高端媒体播放器 可以处理的高分辨率和高比特率的已压缩视频,然而由于限制的计算资源,低 成本的媒体播放器仅能够处理低分辨率和低比特率的已压缩视频。相应地,需 要以可伸缩的方法构造压缩的视频,以使得可以从相同的已压缩比特流处得到 不同的时空分辨率及/或不同品质的视频。

ISO/IECMPEG和ITU-TVCEG的联合视频工作组(jointvideoteam,JVT) 标准化对于H.264/AVC标准的可伸缩视频编码扩展。H.264/AVC可伸缩视频编 码比特流包括从低帧率、低分辨率、和低品质到高帧率、高清晰度和高品质的 视频信息。此种单一的比特流能够适应各种应用并能够在不同配置的设备上显 示。相应地,H.264/AVC可伸缩视频编码适用于各种视频应用,例如,视频广 播、视频数据流、以及视频监控,以适合网络基础设施,交通条件,用户偏好 等。

在可伸缩视频编码中,提供三种可伸缩类型,即时间可伸缩,空间可伸缩 和品质可伸缩。可伸缩视频编码采用多层编码结构来实现三维可伸缩。可伸 缩视频编码的主要目标是产生一个可伸缩比特流,以容易和迅速地适应各种传 输信道、不同的显示能力、和不同的计算资源相关的比特率要求,而无需反式 编码(trans-coding)或重编码(re-encoding)。可伸缩视频编码设计的一个重要 特征是,在比特流层(bitstreamlevel)提供这种可伸缩性。换言之,对于取得缩减 空间及/或时间分辨率的视频的比特流,可以简单地通过从需要打算解码的视频 的可伸缩比特流中提取网络抽象层(以下简称为NAL)单元(或网络数据包) 而获得。可另外减小用于品质精化的NAL单元从而减小比特率及/或降低相应视 频品质。在可伸缩视频编码中,时间可伸缩通过层级B图片编码结构来提供。 信噪比(以下简称为SNR)可伸缩通过编码较高品质的、包括细化系数(refinement coefficients)的增强层来实现。

如图1所示,在可伸缩视频编码中,基于金字塔编码(pyramidcoding)方 案支持空间可伸缩。在具有空间可伸缩性的可伸缩视频编码系统中,首先下采 样视频序列,以获得不同的空间分辨率(层)的较小图片。例如,原始分辨率 的图片110可以通过空间抽取120处理,而获得分辨率降低的图片111。如图1 所示,分辨率降低的图片111可进一步通过空间抽取121处理,而获得分辨率 进一步减小的图象112。除二阶(dyadic)空间分辨率之外,该空间分辨率在每 一层减小一半,可伸缩视频编码还支持任意分辨率的比率,这被称为扩展空间 可缩放(extendedspatialscalability,ESS)。图1中的可伸缩视频编码系统描述 了三层空间可伸缩系统的示意图,其中第0层对应于具有最低空间分辨率的图 片,第2层对应于具有最高空间分辨率的图片。不需要参考其他层,可以编码 第0层,即单层的编码。例如,使用编码运动补偿和帧内预测130编码最底层 图片112。

运动补偿和帧内预测130将生成语法元素和编码相关信息(例如,运动信 息),以进一步用于熵编码140。图1实际上描述了一个联合可伸缩视频编码系 统,该系统提供空间可伸缩和品质可伸缩(也称为SNR可伸缩)。该系统也可 提供时间可伸缩,这并没有明确显示出来。对于每一个单层编码,编码残差 (residualcodingerrors)可以使用SNR增强层编码150而改善。图1中SNR 增强层可以提供多个品质层(level)(品质可伸缩)。支持分辨率层的每一个品 质层,可以由各自的单层运动补偿和帧内预测进行编码,例如非可伸缩编码系 统。基于一个或多个的较低空间层,也可以使用层间编码来编码每个较高空间 层。举例来说,在宏块或其他区块单元的基础上,使用根据第0层视频的层间 预测或者使用单层编码,来自适应编码第1层视频。同样地,使用基于重构的 第1层视频的层间预测或使用单层编码,来自适应编码第2层视频。如图1所 示,第1层图片111可以通过运动补偿和帧内预测131、基本层熵编码141和SNR 增强层编码151来编码。如图1所示,运动补偿和帧内预测131也利用重建的 基本层视频数据,其中在空间第1层中的编码块可使用重建的基本层视频数据 作为附加的帧内预测数据(即,不涉及运动补偿)。相似地,第2层图片110可 以通过运动补偿和帧内预测132、基本层熵编码142和SNR增强层编码152来 编码。来自所有空间层的基本层比特流和SNR增强层比特流通过复用器160复 用产生可伸缩的比特流。由于层间编码,可以提高编码效率。此外,编码空间 第1层需要的信息取决于重建的第0层(层间预测)。可伸缩视频编码系统中较 高层被称为增强层。H.264可伸缩视频编码提供三种类型的层间预测工具:层 间运动预测、层间纹理预测(也称为层间帧内预测)、以及层间残差预测。

在可伸缩视频编码中,增强层(EL)可以重新使用在基本层(BL)中的运 动信息,以减少层间运动数据冗余。例如,增强层宏块编码可以使用一个标志, 例如在mb_type之前的标志base_mode_flag被确定为指示增强层运动信息是否 是直接来自于基本层。如果标志base_mode_flag等于1时,增强层宏块的分割 数据以及相关的参考索引和运动向量来自基本层中同一位置的8×8区块相应的 数据。基本层的参考图片索引直接用于增强层。增强层的运动向量是自与基本 层相关的数据来进行缩放的。此外,已缩放的基本层运动向量可以被用作增强 层的附加的运动向量预测子(predictor)。

层间残差预测使用上采样的基本层残差信息,以减少所需编码增强层残差 的信息。可使用双线性滤波器来区块式(block-wise)上采样基本层的同一位置 的残差,以及基本层的同一位置的残差可用作在增强层中对应宏块的残差的预 测。参考层残差的上采样以变换区块为基础来完成,以确保滤波没有穿越变换 区块的边界。

层间帧内预测降低增强层的冗余纹理信息。通过区块式上采样同一位置的 基本层重建信号,来产生增强层的预测。在层间纹理预测上采样过程中,分别 将4抽头和2抽头FIR滤波器应用于亮度和色度组分。不同于层间残差预测, 层间帧内预测的滤波总是穿越子区块的边界。为简化解码,层间帧内预测可以 仅应用基本层中的帧内编码宏块。

在可伸缩视频编码中,增强层中的区块的运动信息可利用基本层中对应区 块的运动信息。举例来说,如图2所示,与在基本层中对应的位置a~h相关的 运动信息可用于推导层间预测。在图2中,区块210对应于增强层中的当前区 块以及区块220为基本层中对应的区块。在基本层中位置a、位置b、位置g和 位置h处的运动信息为在增强层中位置A、位置B、位置G和位置H处对应的 运动信息。位置c、位置d、位置e、位置f处的运动信息为在增强层中位置C、 位置D、位置E和位置F处对应的运动信息。位置A、位置B、位置G和位置 H为在增强层中的当前区块的四个角的像素,以及位置C、位置D,位置E和 位置F和在增强层中的当前区块的四个中心像素。

不仅在基本层中对应区块的运动信息而且在基本层中对应区块的相邻区块 的运动信息可以用作增强层的层间候选,而包括于合并/先进运动向量预测候选 清单中。如图2所示,在基本层中的相邻候选,包括相邻基本层区块的t(右下)、 a0(左下)、a1(左)、b0(右上)、b1(上),和b2(左上),可用作增强层的候 选,而包括在合并/先进运动向量预测候选的导出中。同一位置的增强层相邻区 块分别对应于相邻增强层区块的T(右下),A0(左下)、A1(左),B0(右上), B1(顶部)和B2(左上)。

高效率视频编码(High-EfficiencyVideoCoding,HEVC)为由联合视频编码 组(JCT-VC)开发的新的国际视频编码标准。HEVC的可伸缩扩展(即,SHVC) 也在开发中。在HEVC中,空间和时间范围内的相邻区块的运动信息用于推导 合并和运动向量预测候选。运动信息包括帧间预测方向(inter_pred_idc)、参考 索引(refIdx)、运动向量、运动向量预测子、运动向量预测子索引、合并索引、 合并候选等。在空间运动向量预测子的推导过程中,运动向量预测子可自指向 作为目标参考图片的相同参考图片的运动向量来得到,或自指向不同参考图片 的运动向量来得到。当运动向量预测子自指向不同参考图片的运动向量而得到 时,该运动向量被缩放至目标参考图片并作为最终运动向量预测子。在空间和 时间运动向量预测子的推导过程中,需要运用除法(division)来缩放运动向量。 基于当前图片和目标图片之间的距离和在同位图片和对于同位区块的参考图片 之间的距离的比例来计算缩放因子。在运动向量缩放过程中,由公式(1)来定 义缩放因子:

ScalingFactor=(POCcurr–POCref)/(POCcol–POCcol_ref)=tb/td,(1)

其中,td为在同位图片和由同位区块的运动向量指向的参考图片之间的图 片顺序计数距离,以及tb为当前图片和目标参考图片之间的图片顺序计数距离。 用于空间运动向量预测子推导的缩放因子可用相似的方法来得到。在HEVC中, 缩放因子按如下所示公式来计算:

X=(2^14+|td/2|)/td,以及(2)

ScalingFactor=clip(-4096,4095,(tb×X+32)>>6)。(3)

然后,被缩放的运动向量按如下所示的公式来得到:

ScaledMV=sign(ScalingFactor×MV)×

((abs(ScalingFactor×MV)+127))>>8(4)

在SHVC测试模型1.0(SHM-1.0)中,层间纹理预测可在两个方案中实现。 第一方案使用编码单元级信令(signaling)来指示此编码单元预测子是否来自已 上采样的基本层纹理。其中,帧内基本层模式Intra_BLmode用于发送选择。第 二方案将已上采样的基本层纹理包括于参考帧清单中。换句话说,与已上采样 的基本层纹理相关的参考图片被分配一个参考图片索引,即参考图片索引RefIdx。 此方案被称为参考图片索引RefIdx模式。与参考图片相关的运动向量也被存储 并用于帧间预测。相应地,对于被放大的(up-scaled)的基本层参考图片,相关 的运动向量也需被放大。RefIdx模式对现有的HEVC语法影响较小。

在SHM-1.0帧内基本层模式Intra_BLmode中,在基本层中对应的区块的中 心运动向量(即,图2中位置f处的运动向量)被缩放,并设置为增强层合并候 选清单中的第一合并候选以作为层间合并候选。层间合并候选的运动向量缩放 过程与在HEVC过程中的运动向量缩放过程不同。在SHM-1.0中,基本层运动 向量基于在增强层和基本层之间的视频分辨率的比率来缩放。被缩放的运动向 量通过如下公式得到:

mvEL_X=(mvBL_X×picEL_W+(picBL_W/2-1)×

sign(mvBL_X))/picBL_W,以及(5)

mvEL_Y=(mvBL_Y×picEL_H+(picBL_H/2-1)×

sign(mvBL_Y))/picBL_H,(6)

其中,(mvEL_X,mvEL_Y)为增强层中被缩放的运动向量,(mvBL_X,mvBL_Y) 为基本层中对应区块的中心运动向量,picEL_W和picEL_H为增强层图片的图 片宽度和高度,以及picBL_W和picBL_H为基本层中图片的宽度和高度。

在SHM-1.0中,对于具有像素位置等于(xEL,yEL)的增强层中的像素, 像素位置映射用于得到对应增强层像素的基本层参考像素,该像素位置映射可 通过如下公式得到:

xBL=(xEL×picBL_W+picEL_W/2)/picEL_W,以及(7)

yBL=(yEL×picBL_H+picEL_H/2)/picEL_H,(8)

其中,(xBL,yBL)为在基本层中的参考像素的像素位置,picEL_W和picEL_H 为在增强层图片的图片宽度和高度,以及picBL_W和picBL_H为基本层图片的 图片宽度和高度。

在SHM-1.0纹理上采样中,基本层中参考像素的基本层像素位置以1/16个 采样像素单位来输出。1/16个采样像素单位的基本层像素位置的推导描述如下:

通过如下公式得到变量xBL16:

xBL16=(xEL×picBL_W×16+picEL_W/2)/picEL_W。

通过如下公式得到变量yBL16:

若cIdx等于0,则变量yBL16通过如下公式得到:

yBL16=(yEL×picBL_H×16+picEL_H/2)/picEL_H,

否则,变量yBL16通过如下公式得到:

yBL16=(yEL×picBL_H×16+picEL_H/2)/picEL_H-offset,

其中,cIdx为颜色组分索引,以及通过如下描述得到偏移offset:

若(picEL_H==picBL_H)

offset=0;

否则若(picEL_H==1.5*picBL_H)

offset=1;以及

否则若(picEL_H==2.0*picBL_H)

offset=2。

在通过SHVC测试模型1.0(SHM-1.0)支持的参考图片索引RefIdx模式中, 已解码的基本层图片被上采样并被包括于长期参考图片清单中,以作为层间参 考图片。对于层间参考图片来说,不仅纹理自基本层图片上采样,而且运动场 (motionfield)根据增强层和基本层之间的空间比率而自基本层图片上采样和映 射,图3为具有1.5倍空间可伸缩的运动场映射的示例。在此示例中,基本层(即, b0~b3)中的四个最小预测单元(SPUs)被映射至增强层(即,e0~e8)中的九 个最小预测单元。在增强层中的九个预测单元的运动场自基本层的运动场来得 到。

为降低运动数据缓冲器的尺寸,增强层中的运动场在运动映射后被压缩为 具有16x16区块的单元大小。如图4所示,在SHM-1.0中,在压缩后,16x16 区块的中心运动向量(由C表示)用于代表此16x16区块的运动向量。

如公式(5)和公式(6)所示,运动向量缩放涉及每一个运动向量的一些 操作。在这些操作之间,推导过程最花时间或最复杂。此情况与公式(7)和公 式(8)所示的层间像素位置映射相同。因此,需要开发一种简化用于层间编码 的运动向量缩放和像素位置映射的方法。

发明内容

本发明提供一种用于可伸缩视频编码的层间运动向量缩放方法。其中运动 向量缩放利用层间运动向量缩放因子来降低计算复杂性。视频序列数据被配置 为基本层和增强层,以及在该增强层中的增强层图片具有比在该基本层中的基 本层图片更高的空间分辨率。根据本发明的实施方式接收关于视频序列的增强 层图片和基本层图片的图像大小信息;并基于关于增强层图片和基本层图片的 图像大小信息,确定层间运动向量缩放因子;接收与基本层图片相关的基本层 运动向量;基于基本层运动向量和层间运动向量缩放因子,确定被缩放的运动 向量;并且被缩放的运动向量被提供以用于增强层图片的层间预测编码。

在一个实施方式中,层间运动向量缩放因子与增强层图片的已裁剪的增强 层图片分辨率和基本层图片的已裁剪的基本层图片分辨率相关。层间运动向量 缩放因子自已偏差预缩放的已裁剪增强层图片分辨率至已裁剪基本层图片分辨 率的比率来确定,其中已偏差预缩放的已裁剪增强层图片分辨率通过将偏差值 与预缩放的已裁剪增强层图片分辨率相加来得到,以及其中该预缩放的已裁剪 增强层图片分辨率通过应用算术左移K比特至该已裁剪的增强层图片分辨率来 得到,以及K为非负整数。该比率进一步剪切至具有最低值和最高值之间的范 围内。

在另一实施方式中,单个层间运动向量缩放因子被确定以用于水平方向和 垂直方向。用于水平方向和垂直方向的单个层间运动向量缩放因子在序列级、 图片级、或切片级中被发送出去。用于该水平方向和该垂直方向的该单个层间 运动向量缩放因子在序列参数级、图片参数级、切片头、序列参数级扩展、图 片参数级扩展或切片段头扩展中被发送出去。一个标志用于指示该单独的层间 运动向量缩放因子是否相等。

在又一实施方式中,层间运动向量缩放因子被确定一次,以用于增强层图 像单元,以及在增强层图像单元中的所有区块共享层间运动向量缩放因子,其 中图像单元对应于一个视频序列、一个图片、一个切片、一个编码树单元、一 个编码树区块、一个编码单元、或一个预测单元。在又一实施方式中,基于层 间运动向量缩放因子,确定层间位置映射缩放因子,其中层间位置映射缩放因 子用于确定对应于增强层像素位置的基本层映射位置,以及其中基本层映射位 置基于增强层像素位置和层间位置映射缩放因子来确定。

本发明提供一种用于可伸缩视频编码的层间位置映射方法。其中,像素位 置映射利用层间位置映射缩放因子以降低计算复杂性。根据本发明的实施方式 接收关于视频序列的增强层图片和基本层图片的图像大小信息;并基于关于增 强层图片和基本层图片的图像大小信息,确定层间位置映射缩放因子。对应于 增强层像素位置的基本层映射位置基于增强层像素位置和层间位置映射缩放因 子被确定,并且基本层映射位置被提供以用于增强层图片的层间预测编码。

在一个实施方式中,层间位置映射缩放因子与基本层图片的已裁剪的基本 层图片分辨率和增强层图片的已裁剪的增强层图片分辨率相关。层间位置映射 缩放因子自已偏差预缩放的已裁剪基本层图片分辨率至已裁剪增强层图片分辨 率的比率来确定,其中已偏差预缩放的已裁剪基本层图片分辨率通过将偏差值 与预缩放的已裁剪基本层图片分辨率相加来得到,以及其中预缩放的已裁剪基 本层图片分辨率通过应用算术左移N比特至已裁剪的基本层图片分辨率来得到, 以及N为非负整数。

用于给定增强层像素位置的基本层映射位置通过将第一偏移项加至第一乘 积来确定,其中该第一偏移项对应于基本层图片的剪切起始位置,第一乘积通 过将层间位置映射缩放因子与第一距离相乘来得到,该第一距离为从给定增强 层像素位置至基本层图片剪切起始位置的距离。第一乘积进一步与偏差值相加, 而得到已偏差的第一乘积,并应用算术右移N比特至已偏差的第一乘积,以及 N为非负整数。用于给定的增强层像素位置的基本层映射位置通过将第二偏移 项与第一偏移项和第一乘积相加来确定,其中第二偏移项对应于与应用于增强 层图片和基本层图片的上采样和下采样相关的相移。增强层像素位置和基本层 像素位置可被剪切至一个范围。

在另一实施方式中,基于层间位置映射缩放因子,确定层间运动向量缩放 因子,其中层间运动向量缩放因子基于该基本层运动向量和层间运动向量缩放 因子,确定被缩放的运动向量。

附图说明

图1为由三层组成的可伸缩视频编码系统的预测结构的示意图。

图2为基于对应的基本层区块和基本层区块的相邻区块的运动信息的用于 增强层区块的多个候选的推导的示意图。

图3描述了对应于1.5倍空间可伸缩的运动场映射的示意图。

图4描述了在压缩后用于表示16x16区块的运动向量的16x16区块的中心 运动向量(由C表示)的示意图。

图5描述了自基本层图片得到用于增强层图片的层间同一位置运动向量的 示意图。

图6为包括在被缩放的运动向量推导中的层间运动向量缩放因子的可伸缩 视频编码系统的示范性流程图。

图7描述了包括在基本层像素位置映射中的层间位置映射缩放因子的可伸 缩视频编码系统的示范性流程图。

具体实施方式

如上所述,在基于AVC/H.264(可伸缩视频编码)或基于HEVC(SHVC)的可 伸缩视频编码中,处理过程涉及运动向量缩放和层间像素位置映射的适当计算。 本发明揭示了降低需要的计算复杂性的各种实施方式。

层间运动向量缩放

如公式(5)和公式(6)所示,除法需要被执行以用于每一个层间运动向 量,即使增强层至基本层的图片分辨率比率为固定值。另外,公式(5)和公式 (6)没有考虑帧的裁剪问题。本发明的实施方式揭示了用于SHVC的层间运动 信息的推导,以降低需要的计算复杂性。

在一个实施方式中,首先,两个层间运动向量缩放因子被得到,以用于层 间运动向量缩放。如公式(4)所示的在HEVC中的运动向量缩放过程被重使用。 一个缩放因子被用于水平方向(MV_x),以及另一个缩放因子被用于垂直方向 (MV_y)。对于层间运动向量缩放因子来说,裁剪因子也被考虑。根据本发明 实施方式,根据如下内容得到在X方向上的层间运动向量缩放因子:

ILScalingFactor_x=(((picELCropWidth)<<K1)+offset1_x)/(picBLCropWidth),

(9)

其中,picELCropWidth=picEL_W-picELCropLeftOffset-picELCropRightOffset 以及picBLCropWidth=picBL_W-picBLCropLeftOffset-picBLCropRightOffset。 增强层图片在左侧根据picELCropLeftOffset像素而裁剪,以及在右侧根据 picELCropRightOffset像素而裁剪。基本层图片在左侧根据picBLCropLeftOffset 像素而裁剪,以及在右侧根据BLCropRightOffset像素而裁剪。偏移offset1_x 可以为0,或可以导出为(picBLCropWidth)>>1或((picBLCropWidth)>>1)-1。K1 为整数,以及举例来说,K1可为8。

如公式(9)所示,缩放因子ILScalingFactor_x与已裁剪的增强层图片宽度 (即,picELCropWidth)至已裁剪的基本层图片宽度(即,picBLCropWidth)的 比率相关,以及ILScalingFactor_x为整数。然而,picELCropWidth通过应用算 术左移K1比特来预缩放。此外,偏差值(即,offset1_x)与预缩放的 picELCropWidth相加。然后,已相加偏差的、预缩放的picELCropWidth除以 picBLCropWidth,以得到缩放因子ILScalingFactor_x。

根据本发明的实施方式,根据如下内容得到在y方向上的层间运动向量缩 放因子:

ILScalingFactor_y=(((picELCropHeight)<<K1)+offset1_y)/(picBLCropHeight),

(10)

其中,picELCropHeight=picEL_H-picELCropTopOffset- picELCropBottomOffset以及picBLCropHeight=picBL_H-picBLCropTopOffset- picBLCropBottomOffset。增强层图片在顶部根据picELCropTopOffset像素而裁 剪,以及在底部根据picELCropBottomOffset像素而裁剪。基本层图片在顶部根 据picBLCropTopOffset像素而裁剪,以及在底部根据picBLCropBottomOffset像 素而裁剪。偏移offset1_y可以为0,或可以导出为(picBLCropHeight)>>1或 ((picBLCropHeight)>>1)-1。

如公式(10)所示,缩放因子ILScalingFactor_y与已裁剪的增强层图片高 度(即,picELCropHeight)至已裁剪的基本层图片高度(即,picBLCropHeight) 的比率相关,以及缩放因子ILScalingFactor_y为整数。然而,picELCropHeight 通过应用算术左移K1比特来预缩放。此外,偏差值(即,offset1_y)与预缩放 的picELCropHeight相加。然后,已相加偏差的、预缩放的picELCropHeight除 以picBLCropHeight,以得到缩放因子ILScalingFactor_y。

为求方便,在本揭露书中,picELCropLeftOffset和picELCropTopOffset被称 为增强层图片第一边缘。相似地,在本揭露书中,picBLCropLeftOffset和 picBLCropTopOffset被称为基本层图片第一边缘。

尽管相同的参数K1用于公式(9)和公式(10)所示的ILScalingFactor_x 和ILScalingFactor_y的推导,但是也可以使用两个不同的参数。若增强层图片 没有水平地裁剪,则picELCropLeftOffset和picELCropRightOffset将为0。若基 本层图片没有水平地裁剪,则picBLCropLeftOffset和picBLCropRightOffset将为 0。若增强层图片没有垂直地裁剪,则picELCropTopOffset和 picELCropBottomOffset将为0。若基本层图片没有垂直地裁剪,则 picBLCropTopOffset和picBLCropBottomOffset将为0。

层间运动向量缩放因子可进一步剪切于一定的范围内。根据本发明实施方 式的具有剪切的层间运动向量缩放因子的推导如下所示:

ILScalingFactor_x=clip(clip_floor1_x,clip_ceiling1_x,(((picELCropWidth)<<K1)

+offset1_x)/(picBLCropWidth)),以及(11)

ILScalingFactor_y=clip(clip_floor1_y,clip_ceiling1_y,(((picELCropHeight)<<K1)

+offset1_y)/(picBLCropHeight))(12)

其中,clip_floor1_x,clip_ceiling1_x,clip_floor1_y以及clip_ceiling1_y为整数。 举例来说,clip_floor1_x和clip_floor1_y可为(2^O1)或0。clip_ceiling1_x和 clip_ceiling1_y可为(2^P1-1)。其中,O1和P1为整数。举例来说,O1和P1为 14。在公式(11)和公式(12)中,尽管clip_floor1_x和clip_floor1_y使用相同 的值,他们也可以使用不同的值。相似地,尽管clip_ceiling1_x和clip_ceiling1_y 使用相同的值,他们也可以使用不同的值。clip(x,y,z)为剪切函数,其定义为:

在上述推导中,参数picELCropLeftOffset,picELCropRightOffset, picELCropTopOffset和picELCropBottomOffset指定在已编码视频序列中的已裁 剪的增强层图片的采样。增强层图片的采样自解码过程产生以及已剪切的增强 层图片的采样通过已裁剪的增强层图片周围的四个偏移量在矩形区域中指定。 另一方面,参数picBLCropLeftOffset,picBLCropRightOffset,picBLCropTopOffset 以及picBLCropBottomOffset指定在已编码视频序列中的已裁剪的基本层图片的 采样。已裁剪的基本层图片的采样自解码过程而产生,以及基本层图片的采样 通过已裁剪的基本层图片周围的偏移量在矩形区域中指定。

层间被缩放的运动向量的最终步骤可重使用HEVC的运动向量的缩放过程。 可通过如下内容得到:

层间运动向量缩放方法-1:

mvEL_X=sign(ILScalingFactor_x×mvBL_X)×

((abs(ILScalingFactor_x×mvBL_X)+add2_x)>>K2,以及(13)

mvEL_Y=sign(ILScalingFactor_y×mvBL_Y)×

((abs(ILScalingFactor_y×mvBL_Y)+add2_y))>>K2,(14)

被缩放的运动向量可进一步剪切于一定范围内。具有剪切的运动向量推导 如下所示:

具有剪切的层间运动向量缩放方法-2:

mvEL_X=clip(clip_floor2_x,clip_ceiling2_x,sign(ILScalingFactor_x×mvBL_X)

×((abs(ILScalingFactor_x×mvBL_X)+add2_x))>>K2),以及(15)

mvEL_Y=clip(clip_floor2_y,clip_ceiling2_y,sign(ILScalingFactor_y×mvBL_Y)

×((abs(ILScalingFactor_y×mvBL_Y)+add2_y))>>K2),(16)

其中,add2_x和add2_y可为0,2^(K2-1)或(2^(K2-1)-1),clip_floor2_x和 clip_floor2_y可为(2^O2),clip_ceiling2_x和clip_ceiling2_y可为(2^P2-1),其 中,K2,O2和P2为任意正整数。举例来说,K2可为8、O2和P2可为15。

可简化如上所示的层间运动向量缩放方法-1。符号部分可分别自mvBL_X 和mvBL_Y而确定。相应地,层间被缩放的运动向量的推导可简化为:

mvEL_X=sign(mvBL_X)×

((abs(ILScalingFactor_x×mvBL_X)+add2_x)>>K2,以及(17)

mvEL_Y=sign(mvBL_Y)×

((abs(ILScalingFactor_y×mvBL_Y)+add2_y))>>K2,(18)

对应于公式(17)和公式(18)的具有剪切的运动向量的简化推导如下所 示:

mvEL_X=clip(clip_floor2_x,clip_ceiling2_x,sign(mvBL_X)×

((abs(ILScalingFactor_x×mvBL_X)+add2_x))>>K2),以及(19)

mvEL_Y=clip(clip_floor2_y,clip_ceiling2_y,sign(mvBL_Y)×

((abs(ILScalingFactor_y×mvBL_Y)+add2_y))>>K2),(20)

因此,对于一个增强层来说,对于所有的编码区块ILScalingFactor_x和 ILScalingFactor_y相同。因此,ILScalingFactor_x和ILScalingFactor_y的计算可 执行一次,以及结果可重使用以用于在增强层中的所有编码区块。相应地,当 基本层中的运动向量被缩放时,上述揭示的实施方式可降低增强层中的运动向 量缩放的计算复杂性。

在一个实施方式中,ILScalingFactor_x和ILScalingFactor_y可在序列/图片/ 切片级中被发送出去。举例来说,ILScalingFactor_x和ILScalingFactor_y可在序 列参数级(sequenceparameterset,SPS)、图片参数级(pictureparameterset,PPS)、 切片头、序列参数级扩展(SPSextension)、图片参数级扩展(PPSextension)或切 片头段扩展(slicesegmentheaderextension)中被发送出去。一个标志可被发送以 指示ILScalingFactor_x和ILScalingFactor_y是否相同。若ILScalingFactor_x等 于ILScalingFactor_y,仅它们中间的一个需要被发送出去。

层间像素位置映射方法

如公式(7)和公式(8)所示,除法需要被执行以用于每一个层间像素位 置映射,即使增强层至基本层的图片分辨率比率为固定值。另外,公式(7)和 公式(8)没有考虑帧的裁剪问题。本发明的实施方式揭示了用于SHVC的层间 基本层像素位置映射的推导,以降低需要的计算复杂性。

相似于层间运动向量缩放,两个层间位置映射缩放因子先被得到以用于层 间像素位置映射。然后,缩放因子被重使用以得到在基本层中的参考像素位置。 一个缩放因子被用于水平方向(x-方向),以及另一个缩放因子被用于垂直方向 (y-方向)。对于层间位置映射缩放因子来说,裁剪因子也被考虑。根据本发明 实施方式,根据如下内容得到在X方向上的层间位置映射缩放因子:

ILPosScalingFactor_x=(((picBLCropWidth<<N1)+offset_x)/(picELCropWidth),

(21)

其中,picELCropWidth=picEL_W-picELCropLeftOffset-picELCropRightOffset 以及picBLCropWidth=picBL_W-picBLCropLeftOffset-picBLCropRightOffset。 偏移offset_x可以为0,或可以导出为(picELCropWidth)>>1或((picELCropWidth) >>1)-1。N1为整数,以及举例来说,N1可为8、10、12、14或16。如公式(21) 所示,缩放因子ILPosScalingFactor_x与已裁剪的基本层图片宽度(即, picBLCropWidth)至已裁剪的增强层图片宽度(即,picELCropWidth)的比率相 关,以及ILPosScalingFactor_x为整数。然而,picBLCropWidth通过应用算术左 移N1比特来预缩放。此外,偏差值(即,offset_x)与预缩放的picBLCropWidth 相加。然后,已相加偏差的、预缩放的picBLCropWidth除以picELCropWidth, 以得到缩放因子ILPosScalingFactor_x。

相似地,根据本发明的实施方式,根据如下内容得到在y方向上的层间位 置映射缩放因子:

ILPosScalingFactor_y=(((picBLCropHeight<<N1)+offset_y)/(picELCropHeight)

(22)

其中,picELCropHeight=picEL_H-picELCropTopOffset-picELCropBottomOffset 以及picBLCropHeight=picBL_H-picBLCropTopOffset-picBLCropBottomOffset。 偏移offset_y可以为0,或可以导出为(picELCropHeight)>>1或 ((picELCropHeight)>>1)-1。如公式(22)所示,缩放因子ILPosScalingFactor_y 与已裁剪的基本层图片高度(即,picBLCropHeight)至已裁剪的增强层图片高 度(即,picELCropHeight)的比率相关,以及ILPosScalingFactor_y为整数。然 而,picBLCropHeight通过应用算术左移N1比特来预缩放。此外,偏差值(即, offset_y)与预缩放的picBLCropHeight相加。然后,已相加偏差的、预缩放的 picBLCropHeight除以picELCropHeight,以得到缩放因子ILPosScalingFactor_y。 尽管使用相同的参数N1以用于ILPosScalingFactor_x和ILPosScalingFactor_y的 推导,但是也可以使用不同的参数。

在上述推导中,参数picELCropLeftOffset,picELCropRightOffset, picELCropTopOffset和picELCropBottomOffset指定在已编码视频序列中的已裁 剪的增强层图片的采样。已裁剪的增强层图片的采样自解码过程产生以及增强 层图片的采样通过已裁剪的增强层图片周围的四个偏移量在矩形区域中指定。 另一方面,参数picBLCropLeftOffset,picBLCropRightOffset,picBLCropTopOffset 以及picBLCropBottomOffset指定在已编码视频序列中的已裁剪的基本层图片的 采样。基本层图片的采样自解码过程而产生,以及基本层图片的采样通过已裁 剪的基本层图片周围的四个偏移量在矩形区域中指定。如上所示,若增强层图 片没有裁剪,则picELCropLeftOffset,picELCropRightOffset,picELCropTopOffset 和picELCropBottomOffset将为0。若基本层图片没有裁剪,则 picBLCropLeftOffset,picBLCropRightOffset,picBLCropTopOffset和 picBLCropBottomOffset将为0。

根据本发明的实施方式,对于具有像素位置等于(xEL,yEL)的增强层中 的像素,基本层中参考像素位置可通过如下内容得到:

xBL=(((xEL-picELCropLeftOffset)×ILPosScalingFactor_x+add3_x)>>N1)+

picBLCropLeftOffset,以及(23)

yBL=(((yEL-picELCropTopOffset)×ILPosScalingFactor_y+add3_y_)>>N1)+

picBLCropTopOffset,(24)

其中,(xBL,yBL)为在基本层中的参考像素的像素位置,add3_x和add3_y等 于0、(2^(N1-1))或(2^(N1-1))-1。如公式(23)中所示,项(xEL picELCropLeftOffset)对应于在当前增强层像素位置(即,eEL)和在x方向上 的增强层图片第一边缘之间的水平距离。然后,该水平距离乘以 ILPosScalingFactor_x以获得第一乘积项。将偏差(即,add3_x)与第一乘积相 加。然后将结果通过应用算术右移N1比特来预缩放。在x方向上的基本层映射 位置通过将picBLCropLeftOffset与预缩放结果相加来确定。如公式(24)所示, 在y方向上的基本层映射位置的确定方法相似。

由于增强层和基本层的相位可能没有对齐。举例来说,上采样和下采样滤 波器使用不同的相位。由于基本层图片通过利用下采样而自原始的高分辨率图 片来得到。对于层间预测来说,基本层图片必须上采样以匹配增强层图片的分 辨率。若下采样滤波和上采样滤波没有适当完成,在上采样和下采样数据中将 发生相位移。根据本发明的实施方式,为补偿相位移,对于在增强层中具有像 素方向等于(xEL,yEL)的像素,在基本层中的参考像素位置可自如下内容得到:

xBL=(((xEL-picELCropLeftOffset)×ILPosScalingFactor_x+add3_x)>>N1)+

picBLCropLeftOffset-horizontal_phase_offset,以及(25)

yBL=(((yEL-picELCropTopOffset)×ILPosScalingFactor_y+add3_y)>>N1)+

picBLCropTopOffset-vertical_phase_offset,(26)

其中,horizontal_phase_offset和vertical_phase_offset为在基本层和增强层之间的 相位移。在增强层和基本层的相位对齐的情况下,horizontal_phase_offset和 vertical_phase_offset将为0。

在层间像素位置映射中,在像素映射之前或之后(xEL,yEL)和(xBL,yBL)可 被剪切于有效的范围内。举例来说,(xEL,yEL)和(xBL,yBL)可被剪切于图片帧 中。

在一个示例中,在层间像素位置映射之前,(xEL,yEL)可被剪切。随后的剪 切函数可在公式(23)和公式(24)之前应用。

xEL=clip(0,picEL_W,xEL),以及

yEL=clip(0,picEL_H,yEL).(27)

可选地,根据以下内容也可完成剪切:

xEL=clip(0+picELCropLeftOffset,picEL_W-picELCropRightOffset,xEL),

以及

yEL=clip(0+picELCropTopOffset,picEL_H-picELCropBottomOffset,yEL).(28)

用于(xBL,yBL)的剪切函数可在层间像素位置映射之后(即,在公式(23) ~公式(24)之后)添加:

xBL=clip(0,picBL_W,xBL)

yBL=clip(0,picBL_H,yBL)(29)

可选地,根据以下内容也可完成剪切:

xBL=clip(0+picBLCropLeftOffset,picBL_W-picBLCropRightOffset,xBL)

yBL=clip(0+picBLCropTopOffset,picBL_H-picBLCropBottomOffset,yBL)

(30)

进一步,对于每一个增强层来说,ILPosScalingFactor_x和 ILPosScalingFactor_y对于所有像素均相同。因此,ILPosScalingFactor_x和 ILPosScalingFactor_y的计算可执行一次,以及结果可重使用以用于增强层中的 所有像素。相应地,本发明的实施方式可实质上降低用于层间像素位置映射的 计算复杂性。

ILPosScalingFactor_x和ILPosScalingFactor_y可在序列级、图片级、或切片 级中被发送出去。举例来说,ILPosScalingFactor_x和ILPosScalingFactor_y可在 序列参数级、图片参数级、切片头中被发送出去。一个标志可被发送以指示 ILPosScalingFactor_x和ILPosScalingFactor_y是否相同。若ILPosScalingFactor_x 等于ILPosScalingFactor_y,则仅ILPosScalingFactor_x和ILPosScalingFactor_y 中间的一个被发送出去。

此外,若ILScalingFactor_x和ILScalingFactor_y已存在,则 ILPosScalingFactor_x和ILPosScalingFactor_y可分别自ILScalingFactor_x和 ILScalingFactor_y而得到。举例来说,根据本发明的实施方式,若 ILScalingFactor_x和ILScalingFactor_y已存在,则ILPosScalingFactor_x和 ILPosScalingFactor_y可根据如下内容来得到:

ILPosScalingFactor_x=((1<<M2)/ILScalingFactor_x+(1<<(N2-1)))>>N2,以及

(31)

ILPosScalingFactor_y=((1<<M2)/ILScalingFactor_y+(1<<(N2-1)))>>N2,

(32)

其中,M2和N2为任意整数。尽管相同参数M2用于ILPosScalingFactor_x和 ILPosScalingFactor_y的推导,但是也可以使用不同的参数。相似地,相同参数 N2用于ILPosScalingFactor_x和ILPosScalingFactor_y的推导,也可以使用不同 的参数。

另一方面,ILScalingFactor_x可自ILPosScalingFactor_x来推导,以及 ILScalingFactor_y可自ILPosScalingFactor_y来推导,当ILPosScalingFactor_x和 ILPosScalingFactor_y已存在时。举例来说,根据本发明的实施方式,若 ILPosScalingFactor_x和ILPosScalingFactor_y已存在,则ILScalingFactor_x和 ILScalingFactor_y可根据如下内容来得到:

ILScalingFactor_x=((1<<M3)/ILPosScalingFactor_x+(1<<(N3-1)))>>N3,以及

(33)

ILScalingFactor_y=((1<<M3)/ILPosScalingFactor_y+(1<<(N3-1)))>>N3,

(34)

其中,M3和N3可为任意整数。

在层间位置映射缩放因子和基本层推导中参考像素位置的推导中,因子N3 和P3可依赖于增强层的图片大小、基本层的图片大小、增强层的已裁剪的图片 大小、基本层的已裁剪的图片大小的信息、增强层的级索引(levelindex)/信息、 基本层的级索引/信息。

可选地,ILScalingFactor_x和ILScalingFactor_y可根据如下内容推导:

Factor_X=(2^I3+|wBL/2|)/wBL,以及(35)

ILScalingFactor_x=clip(K3,L3,(wEL×Factor_X+(1<<(J3-1))>>J3),

(36)

其中,wBL=(picBL_W-picBLCropLeftOffset-picBLCropRightOffset),wEL= (picEL_W-picELCropLeftOffset-picELCropRightOffset)。I3,J3,K3和L3为整 数。举例来说,I3可为14,J3可为6,K3可为-4096或0,以及L3可为4095。

Factor_Y=(2^I3+|hBL/2|)/hBL,以及(37)

ILScalingFactor_Y=clip(K3,L3,(hEL×Factor_Y+(1<<(J3-1))>>J3),(38)

其中,hBL=(picBL_H-picBLCropTopOffset-picBLCropBottomOffset),hEL= (picEL_H-picELCropTopOffset-picELCropBottomOffset)。虽然ILScalingFactor_Y 的推导可使用相同的参数,I3,J3,K3和L3可以与ILScalingFactor_Xderivation 一样,但是也可以使用不同的参数。

层间像素位置映射可以如下所示更一般的形式来推导:

xBL=(((xEL+factor_EL_x)×ILPosScalingFactor_x+add5_x)>>N4)

+factor_BL_x,以及(39)

yBL=(((yEL+factor_EL_y)×ILPosScalingFactor_y+add5_y)>>N4)

+factor_BL_y,(40)

其中,add5_x和add5_y可为0,(2^(N4-1))或(2^(N4-1))-1。factor_EL_x可自 picELCropLeftOffset,picELCropRightOffset,增强层的水平相位移,增强层的颜 色格式,或增强层的颜色组分的信息来推导。factor_BL_x可自 picBLCropLeftOffset,picBLCropRightOffset,基本层的水平相位移,基本层的颜 色格式,或基本层的颜色组分的信息来推导。factor_EL_y可自 picELCropTopOffset,picELCropBottomOffset,增强层的垂直相位移,增强层的 颜色格式,或增强层的颜色组分的信息来推导。factor_BL_y可自 picBLCropTopOffset,picBLCropBottomOffset,基本层的垂直相位移,基本层的 颜色格式,或基本层的颜色组分的信息来推导。尽管相同参数N4用于xBL和 yBL的推导,但是也可以使用不同的参数。

对于纹理上采样过程来说,基本层像素位置在1/M5个像素的单元中得到。 ILPosScalingFactor_x和ILPosScalingFactor_y可被替换为 ILPosScalingFactor_x*M5和ILPosScalingFactor_y*M5以用于得到对应的 (collocated)基本层像素位置。factor_BL_x,factor_BL_y,factor_EL_x, factor_EL_y可根据M4的值而改变。举例来说,

xBL_M5=(((xEL+factor_EL_x)×ILPosScalingFactor_x*M5+add6_x)>>N5)

+factor_BL_x,以及

(41)

yBL_M5=(((yEL+factor_EL_y)×ILPosScalingFactor_y*M5+add6_y)>>N5)

+factor_BL_y,

(42)

其中,add6_x,add6_y,M5和N5为整数。尽管相同的参数M5用于xBL和yBL 的推导,但是也可以使用不同的参数。相似地,相同的参数N5用于xBL和yBL 的推导,也可以使用不同的参数。

在其他示例中,纹理上采样像素位置考虑在增强层和基本层中采样之间的 相位移。推导如下所示:

xBL_M6=((xEL×ILPosScalingFactor_x*M6+add7_x)>>N6)

-BL_phase_offset_x(43)

变量yBL_M6可根据如下内容来得到:

若cIdx等于0,则变量yBL_M6的推导如下:

yBL_M6=((yEL×ILPosScalingFactor_y*M6+add7_y)>>N6)

-BL_phase_offset_y(44)

否则,变量yBL_M6的推导如下:

yBL_M6=((yEL×ILPosScalingFactor_y*M6)>>N6)

-offset-BL_phase_offset_y(45)

其中,cIdx为颜色组分索引,add7_x,add7_y,M6和N6为整数, BL_phase_offset_x和BL_phase_offset_y为相位移并可为0。当 BL_phase_offset_x和BL_phase_offset_y为0以及M6为16时,偏移值可以与 SHM-1.0相同的方式来得到。

在又一实施方式中,基本层像素位置在1/M5个像素单元(例如,用于纹理 上采样)中来得到,如下所示:

ILPosScalingFactorM5_x=

(((picBL_W-picBLCropLeftOffset-picBLCropRightOffset)<<N5)*M5+offset_x)

/(picEL_W-picELCropLeftOffset-picELCropRightOffset),(46)

其中,offset_x可为0,((picEL_W-picELCropLeftOffset-picELCropRightOffset) >>1)或((picEL_W–picELCropLeftOffset-picELCropRightOffset)>>1)-1。

ILPosScalingFactorM_y=

(((picBL_H-picBLCropTopOffset-picBLCropBottomOffset)<<N5)*M5+offset_y) /(picEL_H-picELCropTopOffset-picELCropBottomOffset),(47)

其中,offset_y可为0,((picEL_H–picELCropTopOffset-picELCropBottomOffset) >>1)或((picEL_H-picELCropTopOffset-picELCropBottomOffset)>>1)-1。

在1/M5个像素单元中的基本层中的参考像素位置(xBL_M5,yBL_M5)通过 如下内容得到:

xBL_M5=((xEL×ILPosScalingFactor_x+add6_x)>>N5)–BL_phase_offset_x

(48)

对于基本层中的像素位置yBL_M5来说,可通过如下内容来得到:

若cIdx等于0,则

yBL_M5=((yEL×ILPosScalingFactor_y+add6_y)>>N5)–BL_phase_offset_y;(49)

否则,

yBL_M5=((yEL×ILPosScalingFactor_y)>>N5)–offset–BL_phase_offset_y;(50)

其中,cIdx为颜色组分索引,BL_phase_offset_y和BL_phase_offset_x可为0。 当BL_phase_offset_x和BL_phase_offset_y为0以及M6为16时,偏移值可以 与SHM-1.0相同的方式来得到。

在又一实施方式中,基本层像素位置在1/M5像素单元(例如,用于纹理上 采样)中来得到,如下所示:

ILPosScalingFactorM_x=

(((picBL_W–picBLCropLeftOffset–picBLCropRightOffset)<<N5)+offset_x)

/(picEL_W–picELCropLeftOffset–picELCropRightOffset),(51)

其中,offset_x可为0,((picEL_W–picELCropLeftOffset–picELCropRightOffset) >>1)或((picEL_W–picELCropLeftOffset–picELCropRightOffset)>>1)–1。

ILPosScalingFactorM_y=

(((picBL_H–picBLCropTopOffset–picBLCropBottomOffset)<<N5)+offset_y)

/(picEL_H–picELCropTopOffset–picELCropBottomOffset),(52)

其中,offset_y可为0,((picEL_H–picELCropTopOffset-picELCropBottomOffset) >>1)或((picEL_H-picELCropTopOffset-picELCropBottomOffset)>>1)-1。

在1/M5个像素单元中的基本层中的参考像素位置(xBL_M5,yBL_M5)通过 如下内容得到:

xBL_M5=((xEL×ILPosScalingFactor_x+add6_x)>>(N5-Ceil(Log2(M5))))

–BL_phase_offset_x(53)

对于基本层中的像素位置yBL_M5来说,可通过如下内容来得到:

若cIdx等于0,则

yBL_M5=((yEL×ILPosScalingFactor_y+add6_y)>>(N5-Ceil(Log2(M5))))

–BL_phase_offset_y;(54)

否则,

yBL_M5=((yEL×ILPosScalingFactor_y)>>(N5-Ceil(Log2(M5))))–offset

–BL_phase_offset_y(55)

其中,cIdx为颜色组分索引,add6_x和add6_y可为0、(2^(N5-1- Ceil(Log2(M5))))或(2^(N5-1-Ceil(Log2(M5))))-1,BL_phase_offset_y和 BL_phase_offset_x可为0。当相同像素M5和N5用于xBL_M5和yBL_M5的 推导,也可以使用不同的参数。当BL_phase_offset_y和BL_phase_offset_x为0, 以及M5和N5为16时,偏移值可以与SHM-1.0相同的方式来得到。

在层间位置映射缩放因子和基本层推导中参考像素位置的推导中,因子N (即,公式(39)-公式(55)中的N4-N6)可依赖于增强层的图片大小、基本 层的图片大小、增强层的已裁剪的图片大小、基本层的已裁剪的图片大小的信 息、增强层的级索引(levelindex)/信息、基本层的级索引/信息。

运动场映射

如图2所示,在HEVC时间运动向量预测(以下简称为TMVP)的推导中, 对应于预测向量的位置T的运动向量可被使用。换句话说,在右下方的方向向 上的运动向量在TMVP推导中更重要。

由于在SHVC中的已映射的运动场用于TMVP的推导,在本发明的一个实 施方式中,右下的预测单元的运动向量用于运动场映射。对于层间参考图片来 说,16x16区块的右下运动向量(属于16x16区块的右下像素的运动向量)用于 在运动映射之后表示此16x16区块的运动向量。

基本层像素位置整化(Rounding)

在SHVC运动场映射中,16x16区块的中心点的同一位置的基本层运动向量 用于表示16x16区块的运动向量。为与HEVC兼容,基本层运动场被压缩为具 有16x16区块的单元。16x16区块的左上运动向量用于表示此16x16区块的运动 向量。由于在基本层运动场中被压缩,得到的基本层运动向量可为最佳运动向 量。图5描述了得到的基本层运动向量不是最佳运动向量的情形,其中,点P 的运动向量被映射值区块1的运动向量。然而,由于区块4的运动向量更接近 点P的运动向量,区块4可提供点P更优的运动向量。

因此,本发明的另一实施方式整化基本层像素位置映射以得到最接近的运 动向量。对于在增强层(xEL,yEL)中的某一点,在基本层(xBL,yBL)中对应的 像素位置可通过层间像素位置映射来得到。对于层间对应的运动向量推导来说, 整化偏移(roundingoffset)与(xBL,yBL)相加以得到最近的已压缩的基本层运动 向量。相应地,若运动场被压缩为具有NxN单元,则(N/2–1)偏移被添加以用 于(xBL,yBL)。

在SHVC中,N等于16。因此,(7,7)偏移被添加至(xBL,yBL)以用于层间 同一位置的运动向量的推导。

差分层间参考图片

在SHVC参考索引refIdx模式中,当前帧的已上采样的基本层图片被插入 参考帧清单。为改善编码效率,本发明的另一实施方式插入另一差分层间参考 图片于参考图片清单中。此差分层间参考图片通过将当前帧(帧C)的已上采样 的基本层图片与一个增强层参考帧(帧B)相加,并通过减去一个增强层参考帧 (帧D)的已上采样的基本层图片来产生。在差分层间参考图片中的点(x,y)的像 素值由如下公式所示:

DIRP(x,y)=clip(pixel_min_value,pixel_max_value,(B(x,y)+C(x,y)–D(x,y)))(56)

其中,DIRP(x,y)为在差分层间参考图片中的点(x,y)处的像素值,B(x,y)为在一个 增强层参考帧中的点(x,y)的像素值,C(x,y)为当前帧的已上采样的基本层图片的 点(x,y)处的像素值,D(x,y)为一个增强层参考帧的已上采样的基本层图片的点 (x,y)处的像素值。此差分层间参考图片可被插入以作为参考帧清单中的最后一个。

图6为根据本发明实施方式的包括层间运动向量缩放因子的可伸缩视频编 码系统的示范性流程图。视频数据被配置为基本层和增强层,其中基本层视频 数据具有比基本层视频数据更高的分辨率。如步骤610所示,系统接收关于视 频序列的增强层图片和基本层图片的图像大小信息。对于编码端来说,图像大 小信息可通过编码器来确定。对于解码端来说,图像大小信息可自已编码的比 特流来确定。如步骤620所示,层间运动向量缩放因子可基于关于增强层图片 和基本层图片的图像大小信息来确定。如步骤630所示,然后与基本层图片相 关的基本层运动向量被确定。在编码端,基本层运动向量利用运动估计来确定 以及已推导的基本层运动向量可包括于比特流中。在解码端,基本层运动向量 可自已编码的比特流来确定。如步骤640和步骤650所示,被缩放的运动向量 可基于基本层运动向量和层间运动向量缩放因子来确定,以及被缩放的运动向 量可被提供以用于增强层图片的层间编码。

图7为根据本发明实施方式的包括层间位置映射缩放因子的可伸缩视频编 码系统的示范性流程图。如步骤710所示,系统接收关于视频序列的增强层图 片和基本层图片的图像大小信息。如步骤720所示,层间位置映射缩放因子基 于关于增强层图片和基本层图片的图像大小信息来确定。如步骤730所示,对 应于增强层像素位置的基本层映射位置基于增强层像素位置和层间位置映射缩 放因子来确定。如步骤740所示,在基本层映射位置处上采样的基本层图片被 提供以用于增强层图片的层间编码。

如上所示流程图用于解释可伸缩视频编码的示例。本领域技术人员可修改 每一个步骤、重新排列步骤、差分步骤、或合并步骤以在不脱离本发明精神的 范围内实现本发明。

在提供特定应用和其需求的情况下,以上描述使得本领域技术人员能够实 现本发明。对本领域技术人员来说,各种修饰是清楚的,以及在此定义的基本 原理可以应用与其他实施方式。因此,本发明并不限于描述的特定实施方式, 而应与在此公开的原则和新颖性特征相一致的最广范围相符合。在上述详细描 述中,为全面理解本发明,描述了各种特定细节。然而,本领域技术人员能够 理解本发明可以实现。

以上描述的本发明的实施方式可在各种硬件、软件编码或两者组合中进行 实施。例如,本发明的实施方式可为集成入视频压缩芯片的电路或集成入视频 压缩软件以执行上述过程的程序代码。本发明的实施方式也可为在数据信号处 理器(DigitalSignalProcessor,DSP)中执行上述程序的程序代码。本发明也可涉及 计算机处理器、数字信号处理器、微处理器或现场可编程门阵列(Field ProgrammableGateArray,FPGA)执行的多种功能。可根据本发明配置上述处理 器执行特定任务,其通过执行定义了本发明揭示的特定方法的机器可读软件代 码或固件代码来完成。可将软件代码或固件代码发展为不同的程序语言与不同 的格式或形式。也可为了不同的目标平台编译软件代码。然而,根据本发明执 行任务的软件代码与其他类型配置代码的不同代码样式、类型与语言不脱离本 发明的精神与范围。

在不脱离本发明精神或本质特征的情况下,可以其他特定形式实施本发明。 描述示例被认为仅在所有方面进行说明并且不是限制性的。因此,本发明的范 围由权利要求书指示,而非前面描述。所有在权利要求等同的方法与范围中的 变化都属于本发明的涵盖范围。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号