首页> 中国专利> 仿射的MERGE与MVD

仿射的MERGE与MVD

页面导航

摘要
著录项
说明书
相似文献

摘要

本公开涉及仿射模式与其他帧间编码工具之间的协调。一种用于视频处理的方法，包括：在当前块与当前块的比特流表示之间的转换期间，获取当前块的指示，其中所述指示指示是否应当修改所述当前块的Merge仿射模型；以及至少基于所述指示，执行所述当前块与所述当前块的比特流表示之间的所述转换。

著录项

公开/公告号CN113170192A

专利类型发明专利
公开/公告日2021-07-23

原文格式PDF
申请/专利权人北京字节跳动网络技术有限公司;字节跳动有限公司;
展开▼

申请/专利号CN201980075595.8
发明设计人张凯;张莉;刘鸿彬;王悦;
展开▼

申请日2019-11-15
分类号H04N19/56(20060101);
代理机构11105 北京市柳沈律师事务所;
代理人张亮
地址 100041 北京市石景山区实兴大街30号院3号楼2层B-0035房间
入库时间 2023-06-19 11:55:48

说明书

相关申请的交叉引用

根据适用专利法和/或适用于巴黎公约的规则，本申请及时要求2019年11月15日提交的国际专利申请No.PCT/CN2018/115633号的优先权和权益。通过引用将上述申请的全部公开并入，作为本申请公开的一部分。

技术领域

本专利文档涉及视频编码和解码技术、设备和系统。

背景技术

尽管视频压缩有所进步，数字视频在互联网和其他数字通信网络上仍占最大的带宽使用量。随着能够接收和显示视频的连接用户设备的数量增加，预计数字视频使用所需的带宽将继续增长。

发明内容

描述了与数字视频编解码有关的设备、系统和方法，并且具体地，描述了与仿射预测与其他编解码工具的协调有关的设备、系统和方法。所描述的方法可以应用于现有视频编解码标准(例如，高效视频编解码(HEVC))和未来视频编解码标准或视频编解码器。

在一个代表性方面，所公开的技术可以用于提供视频处理的方法。该方法包括基于当前视频块的比特流表示中的用信令通知的参数，通过修改Merge仿射模型来生成修改的Merge仿射模型，以及基于修改的Merge仿射模型重构当前视频块。

在另一代表性方面，所公开的技术可以用于提供视频处理的方法。该方法包括确定当前视频块是用子块编解码工具进行编解码的，以及基于确定，使用帧间-帧内预测来重构当前视频块。

在又一代表性方面，所公开的技术可以用于提供视频处理的方法。该方法包括为当前视频块生成第一预测，为当前视频块生成第二预测，以及基于第一预测和第二预测的加权和，重构当前视频块。

在一个代表性方面，所公开的技术可以用于提供视频处理的方法。该方法包括：确定当前块；以及通过使用帧间-帧内预测、以及子块编解码技术和运动矢量差Merge模式(MMVD)技术中的至少一种，执行当前块和当前块的比特流表示之间的转换。

在一个代表性方面，所公开的技术可以用于提供视频处理的方法。该方法包括：根据当前块的划分，确定所述当前块对应位置的多个加权值，其中，从所述当前块划分的至少一个分割是非矩形和非正方形分割；通过至少使用至少一个子块Merge候选来确定所述至少一个分割的预测结果；以及通过使用所述预测结果执行所述当前块和所述当前块的比特流表示之间的转换。

在一个代表性方面，所公开的技术可以用于提供视频处理的方法。该方法包括：确定当前块的多个分割，其中，多个分割中的至少一个分割是非矩形和非正方形分割；通过使用帧内预测来确定第一预测；通过使用帧间预测来确定第二预测；根据第一预测和第二预测确定预测结果；以及通过使用预测结果执行当前块和当前块的比特流表示之间的转换。

在一个代表性方面，所公开的技术可以用于提供视频处理的方法。该方法包括：在当前块和当前块的比特流表示之间的转换期间，获取当前块的指示，其中，该指示指示是否应当修改当前块的Merge仿射模型；以及至少基于指示，执行当前块与当前块的比特流表示之间的转换。

在又一代表性方面，上述方法以处理器可执行代码的形式体现并存储在计算机可读程序介质中。

在又一代表性方面，公开了一种配置或可操作以执行上述方法的设备。该设备可以包括被编程为实现该方法的处理器。

在又一代表性方面，视频解码器装置可实现如本文中所描述的方法。

在附图、说明书和权利要求中更详细地描述了所公开技术的上述和其他方面和特征。

附图说明

图1示出了基于子块的预测的示例。

图2A和2B分别示出了简化的4参数仿射模型和简化的6参数仿射模型的示例。

图3示出了每个子块的仿射运动矢量场(MVF)的示例。

图4A和图4B示出了AF_MERGE仿射运动模式的示例候选。

图5示出了仿射Merge模式的候选位置的示例。

图6A和图6B示出了将编解码单元(CU)划分为两个三角预测单元(PU)的示例。

图7示出了临近块的位置的示例。

图8示出了应用第一加权因子组的CU的示例。

图9示出了运动矢量存储的示例。

图10示出了用于示例基于历史的运动矢量预测(HMVP)方法的解码流程图。

图11示出了在HMVP方法中更新表的示例。

图12示出了当前帧的最终运动矢量表达(UMVE)搜索过程的示例。

图13A和13B示出了UMVE搜索点的示例。

图14示出了距离索引和距离偏移量之间的示例性映射。

图15示出了根据所公开的技术的用于视频处理的示例方法的流程图。

图16示出了根据所公开的技术的用于视频处理的另一示例方法的流程图。

图17示出了根据所公开的技术的用于视频处理的又一示例方法的流程图。

图18是用于实现本文档中描述的视频解码或视频编码技术的硬件平台的示例的框图。

图19示出了根据所公开的技术的用于视频处理的示例方法的流程图。

图20示出了根据所公开的技术的用于视频处理的示例方法的流程图。

图21示出了根据所公开的技术的用于视频处理的示例方法的流程图。

图22示出了根据所公开的技术的用于视频处理的示例方法的流程图。

具体实施方式

由于对更高分辨率视频的需求的增加，在现代技术中普遍存在视频编解码方法和技术。视频编解码器通常包括压缩或解压缩数字视频的电子电路或软件，并且不断改进以提供更高的编解码效率。视频编解码器将未压缩视频转换为压缩格式，反之亦然。视频质量、用于表示视频的数据量(由比特率确定)、编码和解码算法的复杂度、对数据丢失和错误的敏感性、编辑的简易性、随机访问和端到端延迟(时延)之间存在复杂的关系。压缩格式通常符合标准视频压缩规范，例如，高效视频编解码(HEVC)标准(也称为H.265或MPEG-H第2部分)、待定的通用视频编解码标准、或其他当前和/或未来的视频编解码标准。

首先，通过高效视频编解码(HEVC)标准将基于子块的预测引入视频编解码标准。利用基于子块的预测，将诸如编解码单元(CU)或预测单元(PU)之类的块划分为几个非重叠的子块。可以为不同的子块分配不同的运动信息，诸如参考索引或运动矢量(MV)，并且针对每个子块分别执行运动补偿(MC)。图1示出了基于子块的预测的示例。

所公开的技术的实施例可以应用于现有视频编解码标准(例如，HEVC、H.265)和未来标准以改进运行性能。在本文档中使用章节标题以提高描述的可读性，并且不以任何方式将讨论或实施例(和/或实现)限制于仅相应的部分。

1.联合探索模型(JEM)的示例

在一些实施例中，使用称为联合探索模型(JEM)的参考软件来探索未来的视频编解码技术。在JEM中，在几种编解码工具中采用基于子块的预测，诸如仿射预测、可选时域运动矢量预测(ATMVP)、空时运动矢量预测(STMVP)、双向光流(BIO)、帧速率上转换(FRUC)。仿射预测也已被用于VVC。

1.1仿射预测的示例

在HEVC中，仅将平移运动模型应用于运动补偿预测(MCP)。而在现实世界中，有多种运动，例如放大/缩小、旋转、透视运动和其他不规则运动。在VVC中，应用了简化的仿射变换运动补偿预测。如图2A和2B所示，分别通过两个(在4参数仿射模型中)或三个(在6参数仿射模型中)控制点运动矢量来描述块的仿射运动场。

块的运动矢量场(MVF)分别通过以下等式分别由4参数仿射模型和6参数仿射模型来描述：

这里，(mv

在免于除法的设计中，等式(1)和(2)被实现为：

对于等式(1)中所示的4参数仿射模型：

对于等式(2)中所示的6参数仿射模型：

因此，运动矢量可以推导为：

Off＝1<<(S-1)

这里，S表示计算精度。例如，在VVC中，S＝7。在VVC中，用等式(6)在x＝xs+2和y＝ys+2的情况下，计算MC中用于左上角样点为(xs，ys)的子块的MV。

如图3所示，为了导出每个4×4子块的运动矢量，根据等式(1)或(2)计算每个子块的中心样点的运动矢量，并取整至1/16分数精度。然后，将运动补偿插值滤波器应用于生成具有导出运动矢量的每个子块的预测。

仿射模型可以从空间临近的仿射编码块继承，诸如图4A所示的左、上方、右上、左下和左上的邻近块。例如，如果图4A中的临近左下块A以仿射模式编码，如图4B中的A0所示，则获取包含块A的临近CU/PU的左上角、右上角和左下角的控制点(CP)运动矢量mv

在一些实施例中，如果当前块是仿射编码的，则子块(例如，VTM中的4×4块)LT存储mv0，RT存储mv1。如果当前块使用6参数仿射模型进行编码，则LB存储mv2；否则(使用4参数仿射模型进行编码)，LB存储mv2’。其他子块存储用于MC的MV。

在一些实施例中，当CU以仿射Merge模式编码时，例如在AF_MERGE模式下，它从有效的临近重构块中获得以仿射模式编码的第一块。并且如图4A所示，候选块的选择顺序是从左、上、右上、左下到左上。

在仿射Merge模式下，当前块的导出的CP MV mv

2.示例性实施例

与VTM不同，在VTM中，仅一个仿射空域临近块可用于导出块的仿射运动，在一些示例性实施例中，它提出构造针对AF_MERGE模式的仿射候选的单独列表。

(1)将继承的仿射候选插入候选列表中

在示例中，继承的仿射候选是指候选是从以仿射模式编码的有效邻居重构块中导出的。

如图5所示，候选块的扫描顺序是A

(a)首先，使用覆盖块的CU的三个角运动矢量来导出当前块的两个/三个控制点；和

(b)基于当前块的控制点来导出当前块内的每个子块的子块运动。

(2)插入构造的仿射候选

在一些实施例中，如果仿射Merge候选列表中的候选的数量小于MaxNumAffineCand，则将构造的仿射候选插入到候选列表中。

构造的仿射候选是指通过组合每个控制点的邻居运动信息来构造候选。

首先，从图5所示的指定的空域邻居和时域邻居导出控制点的运动信息。CPk(k＝1，2，3，4)表示第k个控制点。A

CP1，CP2，CP3和CP4的坐标分别是(0，0)，(W，0)，(H，0)和(W，H)，其中W和H是当前块的宽度和高度。

根据以下优先级顺序获得每个控制点的运动信息：

ο对于CP1，检查优先级为B

ο对于CP2，检查优先级为B1→B0；

ο对于CP3，检查优先级为A1→A0；

ο对于CP4，使用T。

其次，使用控制点的组合来构造运动模型。

需要三个控制点的运动矢量来计算6参数仿射模型中的变换参数。可以从以下四个组合({CP1，CP2，CP4}，{CP1，CP2，CP3}，{CP2，CP3，CP4}、{CP1，CP3，CP4})中的一个中选择三个控制点。例如，使用CP1，CP2和CP3控制点来构造6参数仿射运动模型，表示为仿射(CP1，CP2，CP3)。

需要两个控制点的运动矢量来计算4参数仿射模型中的变换参数。可以从以下六个组合({CP1,CP4}，{CP2,CP3}，{CP1,CP2}，{CP2,CP4}，{CP1,CP3}，{CP3,CP4})中的一个中选择两个控制点。例如，使用CP1和CP2控制点来构造4参数仿射运动模型，表示为仿射(CP1，CP2)。

按照以下顺序将构造的仿射候选的组合插入到候选列表中：

{CP1，CP2，CP3}，{CP1，CP2，CP4}，{CP1，CP3，CP4}，{CP2，CP3，CP4}，{CP1，CP2}，{CP1，CP3}，{CP2，CP3}，{CP1，CP4}，{CP2，CP4}，{CP3，CP4}

(3)插入零运动矢量

如果仿射Merge候选列表中的候选数量小于MaxNumAffineCand，则将零运动矢量插入候选列表中，直到列表已满。

3.仿射Merge候选列表的示例性实施例

3.1实施例

在仿射Merge模式中，仅第一可用仿射邻居可以用于导出仿射Merge模式的运动信息。在一些实施例中，通过搜索有效的仿射邻居并组合每个控制点的邻居运动信息来构造仿射Merge模式的候选列表。

仿射Merge候选列表被构造为以下步骤：

(1)插入继承的仿射候选

继承的仿射候选是指从其有效的邻居仿射编码块的仿射运动模型中导出的候选。如图5所示，在共同的基础上，候选位置的扫描顺序是：A1，B1，B0，A0和B2。

在导出候选之后，执行完整修剪过程以检查是否已将相同候选插入到列表中。如果存在相同的候选，则丢弃导出的候选。

(2)插入构造的仿射候选

如果仿射Merge候选列表中的候选数量小于MaxNumAffineCand(在此示例中设置为5)，则将构造的仿射候选插入到候选列表中。构造仿射候选是指通过组合每个控制点的邻居运动信息来构造的候选。

首先，从图5所示的指定的空域邻居和时域邻居导出控制点的运动信息。CPk(k＝1，2，3，4)表示第k个控制点。A

CP1，CP2，CP3和CP4的坐标分别是(0，0)，(W，0)，(H，0)和(W，H)，其中W和H是当前块的宽度和高度。

根据以下优先级顺序获得每个控制点的运动信息：

ο对于CP1，检查优先级为B

ο对于CP2，检查优先级为B1→B0；

ο对于CP3，检查优先级为A1→A0；

ο对于CP4，使用T。

其次，使用控制点的组合来构造运动模型。

需要三个控制点的运动信息来构造6参数仿射候选。可以从以下四个组合({CP1，CP2，CP4}，{CP1，CP2，CP3}，{CP2，CP3，CP4}，{CP1，CP3，CP4})中的一个中选择三个控制点。组合{CP1，CP2，CP3}，{CP2，CP3，CP4}，{CP1，CP3，CP4}将转换为由左上、右上和左下控制点表示的6参数运动模型。

需要两个控制点的运动信息来构造4参数仿射候选。可以从以下六个组合({CP1,CP4}，{CP2,CP3}，{CP1,CP2}，{CP2,CP4}，{CP1,CP3}，{CP3,CP4})中的一个中选择两个控制点。组合{CP1，CP4}，{CP2，CP3}，{CP2，CP4}，{CP1，CP3}，{CP3，CP4}将转换为由左上和右上控制点表示的4参数运动模型点。

按照以下顺序将构造的仿射候选的组合插入到候选列表中：

{CP1，CP2，CP3}，{CP1，CP2，CP4}，{CP1，CP3，CP4}，{CP2，CP3，CP4}，{CP1，CP2}，{CP1，CP3}，{CP2，CP3}，{CP1，CP4}，{CP2，CP4}，{CP3，CP4}

对于组合的参考列表X(X为0或1)，选择控制点中使用率最高的参考索引作为列表X的参考索引，并且将缩放指向差异参考图片的运动矢量。

在导出候选之后，执行完整修剪过程以检查是否已将相同候选插入到列表中。如果存在相同的候选，则丢弃导出的候选。

(3)填充零运动矢量

如果仿射Merge候选列表中的候选数量小于5，则将具有零参考索引的零运动矢量插入候选列表中，直到列表已满。

3.2仿射Merge模式的实施例

在现有的实现中，建议仿射Merge模式的以下简化：

(1)通过比较覆盖临近位置的编解码单元而不是比较导出的仿射候选，简化了对继承的仿射候选的修剪过程。最多将2个继承的仿射候选插入到仿射Merge列表中。构造的仿射候选的修剪过程被完全移除。

(2)移除在构造的仿射候选中的MV缩放操作。如果控制点的参考索引不同，则将构造的运动模型丢弃。

(3)构造的仿射候选的数量从10减少到6。

(4)还提出将具有子块预测的其他Merge候选(诸如ATMVP)也放入仿射Merge候选列表中。在那种情况下，仿射Merge候选列表可以用诸如子块Merge候选列表的一些其他名称重命名。

4.控制点运动矢量(CPMV)偏移量的示例

基于第一仿射Merge候选的CPMV偏移量生成新的仿射Merge候选。如果第一仿射Merge候选启用4参数仿射模型，则通过偏移量第一仿射Merge候选的2个CPMV，可以为每个新的仿射Merge候选导出2个CPMV。否则(启用6参数仿射模型)，然后通过偏移量第一仿射Merge候选的3个CPMV，为每个新的仿射Merge候选导出3个CPMV。在单向预测中，将CPMV偏移量应用于第一个候选的CPMV。在具有相同方向的列表0和列表1的双向预测中，将CPMV偏移量应用于第一候选，如下所示：

在具有相反方向的列表0和列表1的双向预测中，将CPMV偏移量应用于第一候选，如下所示：

在该实施例中，具有各种偏移量的各种偏移量方向被用于生成新的仿射Merge候选。测试了两种实现：

(1)生成具有8个不同偏移量方向、具有2个不同偏移量的16个新的仿射Merge候选，如以下偏移量集所示：

偏移量集＝{(4，0)，(0，4)，(-4，0)，(0，-4)，(-4，-4)，(4，-4)，(4，4)，(-4，4)，(8，0)，(0，8)，(-8，0)，(0，-8)，(-8，-8)，(8，-8)，(8，8)，(-8，8)}。

对于该设计，仿射Merge列表增加到20。潜在的仿射Merge候选总数为31。

(2)生成具有4个不同偏移量方向、具有1个偏移量量的4个新的仿射Merge候选，如以下偏移量集所示：

偏移量集＝{(4，0)，(0，4)，(-4，0)，(0，-4)}。

仿射Merge列表保持为5。移除四个时域构造的仿射Merge候选，以保持潜在的仿射Merge候选的数量不变，即总数为15。假设CPMV1、CPMV2、CPMV3和CPMV4的坐标为(0，0)，(W，0)，(H，0)和(W，H)。注意，如图5所示，从时域MV导出CPMV4。移除的候选是以下四个时域相关的构造的仿射Merge候选：{CP2，CP3，CP4}，{CP1，CP4}，{CP2，CP4}，{CP3，CP4}。

5.广义双向预测改进(GBi)的示例

在一些实施例中采用了提出的广义双向预测改进(GBi)。

在一些实施例中提出了GBi。GBi的增益复杂度折衷得到改善，并且在一些实施例中被采用。在一些实施例中，GBi在双向预测模式中将不相等的权重应用于来自L0和L1的预测器。在帧间预测模式中，基于速率失真优化(RDO)评估包括相等权重对(1/2，1/2)的多个权重对，并将选择的权重对的GBi索引用信令通知给解码器。在Merge模式下，从临近的CU继承GBi索引。在一些实施例中，下面示出了双向预测模式下的预测器生成。

PGB

这里，PGB

对于非低延迟图片，权重设置尺寸从五减小为三，其中w

在该实施例中，提出了一种组合解决方案以进一步提高GBi性能。具体地，在现有GBi设计的基础上进行以下修改。

6.三角预测模式的示例

三角预测单元模式的概念是引入用于运动补偿预测的新三角分割。如图6A和6B所示，三角预测单元模式沿对角线方向或对角线反方向将CU划分为两个三角预测单元。CU中的每个三角预测单元使用从单向预测候选列表中导出的参考帧索引和其自己的单向预测运动矢量来进行帧间预测。在预测三角预测单元之后，对对角线边缘执行自适应加权处理。然后，将变换和量化过程应用于整个CU。注意，该模式仅应用于跳过和Merge模式。

6.1单向预测候选列表

单向预测候选列表由五个单向预测运动矢量候选组成。如图7所示，它是从包括五个空域临近块(1到5)和两个时域上并置的块(6到7)的七个临近块导出的。根据单向预测运动矢量、双预测运动矢量的L0运动矢量、双预测运动的L1运动矢量、双向预测运动矢量的L0和L1运动矢量的平均运动矢量的顺序，收集七个临近块的运动矢量并将其放入单向预测候选列表中。如果候选数量少于五个，则将零运动矢量添加到列表中。

6.2自适应加权处理

在预测每个三角预测单元之后，将自适应加权处理应用于两个三角预测单元之间的对角线边缘，以导出整个CU的最终预测。以下列出了两个加权因子组：

·第一加权因子组：{7/8,6/8,4/8,2/8,1/8}和{7/8,4/8,1/8}用于亮度，并且色度样点；以及

·第二加权因子组：{7/8,6/8,5/8,4/8,3/8,2/8,1/8}和{6/8,4/8,2/8}分别用于亮度和色度样点。

基于两个三角预测单元的运动矢量的比较来选择一个加权因子组。当两个三角预测单元的参考图片彼此不同或者它们的运动矢量差大于16个像素时，使用第二加权因子组。否则，使用第一加权因子组。图8示出了该自适应加权处理的示例。

6.3运动矢量存储

三角预测单元的运动矢量(图9中的Mv1和Mv2)存储在4×4网格中。对于每个4×4网格，基于4×4网格在CU中的位置，存储单向预测或双预测运动矢量两者。如图9所示，针对位于非加权区域中的4×4网格存储单向预测运动矢量Mv1或Mv2。另一方面，针对位于加权区域中的4×4网格存储双向预测运动矢量。根据以下规则，从Mv1和Mv2中导出双向预测运动矢量：

1)在Mv1和Mv2具有来自不同方向(L0或L1)的运动矢量的情况下，简单地将Mv1和Mv2组合以形成双向预测运动矢量。

2)在Mv1和Mv2都来自相同的L0(或L1)方向的情况下：

2a)如果Mv2的参考图片与L1(或L0)参考图片列表中的图片相同，则将Mv2缩放到该图片。Mv1和缩放的Mv2组合以形成双向预测运动矢量。

2b)如果Mv1的参考图片与L1(或L0)参考图片列表中的图片相同，则将Mv1缩放到该图片。缩放的Mv1和Mv2组合以形成双向预测运动矢量。

2c)否则，针对加权区域仅存储Mv1。

7.基于历史的运动矢量预测(HMVP)的示例

提出了基于历史的MVP(HMVP)方法，其中将HMVP候选定义为先前编码的块的运动信息。在编码/解码过程中维护具有多个HMVP候选的表。遇到新的条带时，将清空该表。每当存在帧间编码的非仿射块时，相关联的运动信息就会作为新的HMVP候选被添加到表的最后一个条目。总体编码流程在图10中示出。

在此示例中，表尺寸S设置为6，这表示最多可以将6个HMVP候选添加到表中。当将新的运动候选插入到表中时(如图11所示)，利用约束的FIFO规则，其中首先应用冗余检查以发现表中是否存在相同的HMVP。如果找到，则从表中移除相同的HMVP，然后将所有HMVP候选向前移动，即索引减少1。

HMVP候选可以在Merge候选列表构造过程中使用。按顺序检查表中最新的几个HMVP候选，并将其插入到TMVP候选之后的候选列表中。对排除子块运动候选(例如，ATMVP)的空域或时域Merge候选的HMVP候选进行修剪。

为了减少修剪操作的数量，引入了三个简化：

由L表示的待检查的HMPV候选的数量设置如下：

L＝(N<＝4)？M:(8-N)

这里，N表示表中的可用非子块Merge候选的数量，M表示表中的可用HMVP候选的数量。

另外，一旦可用Merge候选的总数达到用信令通知的最大允许Merge候选减去1，就终止来自HMVP列表的Merge候选列表构造过程。

此外，用于组合的双向预测Merge候选推导的对的数量从12减少到6。

类似地，HMVP候选也可以在AMVP候选列表构造过程中使用。将表中最后K个HMVP候选的运动矢量插入到TMVP候选之后。仅将具有与AMVP目标参考图片相同的参考图片的HMVP候选用于构造AMVP候选列表。修剪应用于HMVP候选。在此贡献中，将K设置为4，同时AMVP列表尺寸保持不变，即等于2。

8.最终运动矢量表达(UMVE)的示例

在一些实施例中，提出了最终运动矢量表达(UMVE)。UMVE可通过提出的运动矢量表达方法用于跳过或Merge模式。

UMVE重复使用Merge候选，与在VVC中使用的相同。在Merge候选中，可以选择候选，并通过提出的运动矢量表达方法进一步扩展候选。UMVE也称为具有合并运动矢量差的Merge(MMVD)。

UMVE提供具有简化信令的新运动矢量表达。表达方法包括起点、运动幅度和运动方向。所提出的技术按原样使用Merge候选列表。但是，只有默认合并类型(MRG_TYPE_DEFAULT_N)的候选才会考虑UMVE的扩展。

基本候选索引(IDX)定义起点。基本候选索引表示列表中候选的最佳候选，如下所示。

如果基本候选的数量等于1，则不用信令通知基本候选索引的信号。

距离索引是运动幅度信息。距离索引表示距起点信息的预定义距离。预定义的距离如下：

方向索引表示MVD相对于起点的方向。方向索引可以代表四个方向，如下所示：

图12示出了针对当前帧的UMVE搜索过程的示例。

图13A和图13B分别示出了参考列表0和参考列表1中参考图片的UMVE搜索点的示例。

在用信令通知跳过标志和Merge标志之后立即用信令通知UMVE标志。如果跳过和Merge标志为真(true)，则解析UMVE标志。如果UMVE标志等于1，则解析UMVE语法。但是，如果不是1，则解析AFFINE标志。如果AFFINE标志等于1，则为AFFINE模式；但是，如果不等于1，则为VTM的跳过/Merge模式解析跳过/Merge索引。

由于UMVE候选，不需要额外的行缓冲器。因为软件的跳过/Merge候选直接用作基本候选。使用输入的UMVE索引，在运动补偿之前立即确定MV的补充。无需为此保留长行缓冲区。

9.帧间-帧内模式的示例

在帧间-帧内模式下，多假设预测结合了一个帧内预测和一个Merge索引预测。在Merge CU中，当标志为真时，用信令通知一个标志用于Merge模式，以从帧内候选列表中选择帧内模式。对于亮度分量，帧内候选列表是从包括DC、平面、水平和垂直模式的4种帧内预测模式导出的，基于块形状，帧内候选列表的尺寸可以为3或4。当CU宽度大于CU高度的两倍时，水平模式不包括帧内模式列表，并且当CU高度大于CU宽度的两倍时，垂直模式将从帧内模式列表中移除。使用加权平均将通过帧内模式索引选择的一种帧内预测模式和通过Merge索引选择的一种Merge索引预测进行组合。对于色度分量，始终应用DM，而无需额外的信令。组合预测的权重描述如下。当选择DC或平面模式、或CB宽度或高度小于4时，将应用相等的权重。对于CB宽度和高度大于或等于4的CB，当选择水平/垂直模式时，首先将一个CB垂直/水平划分为四个等面积区域。每个权重集，表示为(w_intra

10.仿射Merge模式与预测偏移量的示例

在一些实施例中，UMVE被扩展到仿射Merge模式，此后我们将其称为UMVE仿射模式。所提出的方法选择第一可用的仿射Merge候选作为基础预测器。然后，它将运动矢量偏移量从基础预测器应用于每个控制点的运动矢量值。如果没有可用的仿射Merge候选，则不会使用所提出的方法。

所选择的基础预测器的帧间预测方向以及每个方向的参考索引均保持不变。

在当前实现中，假设当前块的仿射模型是4参数模型，仅需要导出2个控制点。因此，仅基础预测器的前两个控制点将用作控制点预测器。

对于每个控制点，zero_MVD标志用于指示当前块的控制点是否具有与对应的控制点预测器相同的MV值。如果zero_MVD标志为真，则该控制点不需要其他信令。否则，为控制点用信令通知距离索引和偏移量方向索引。

使用尺寸为5的距离偏移量表，如下表所示。

用信令通知距离索引以指示使用哪个距离偏移量。距离索引和距离偏移量值的映射在图14中示出。

方向索引可以表示四个方向，如下所示，其中只有x或y方向可能具有MV差，但在两个方向上却没有MV差。

如果帧间预测是单向的，则将信令通知的距离偏移量应用于每个控制点预测器的偏移量方向。结果将是每个控制点的MV值。

例如，当基础预测器是单向时，控制点的运动矢量值为MVP(v

MV(v

如果帧间预测是双向的，则对控制点预测器的L0运动矢量在用信令通知的偏移量方向上应用用信令通知的距离偏移量；并且将相反方向的相同距离偏移量应用于控制点预测器的L1运动矢量。结果将是每个帧间预测方向上每个控制点的MV值。

例如，当基础预测器是单向时，L0上的控制点的运动矢量值为MVP

提出了一种简化的方法，以通过用信令通知每个块的距离偏移量索引和偏移量方向索引来减少信令开销。相同的偏移量将以相同的方式应用于所有可用的控制点。在这种方法中，控制点的数量由基础预测器的仿射类型、6参数类型的3个控制点和4参数类型的2个控制点确定。

由于对块的所有控制点一次完成了信令通知，因此在该方法中不使用zero_MVD标志。

11.仿射运动数据的表示的示例

建议存储仿射参数而不是CPMV，以预测后续编码块的仿射模型。

12.Merge列表设计的示例

VVC支持三种不同的Merge列表构造过程：

(1)子块Merge候选列表：其包括ATMVP和仿射Merge候选。仿射模式和ATMVP模式连两者共享一个Merge列表构造过程。在此，可以按顺序添加ATMVP和仿射Merge候选。子块Merge列表的尺寸在条带头中用信令通知，并且最大值为5。

(2)单向预测TPM Merge列表：对于三角预测模式，即使两个分割可以选择它们自己的Merge候选索引，也共享两个分割的一个Merge列表构造过程。当构造该Merge列表时，检查该块的空域临近块和两个时域块。从空域邻居和时域块导出的运动信息在我们的IDF中称为常规运动候选。这些常规运动候选进一步被用来导出多个TPM候选。请注意，变换是在整个块级执行的，即使两个分割可能使用不同的运动矢量来生成自己的预测块。

在一些实施例中，单向预测TPM Merge列表尺寸被固定为5。

(3)常规Merge列表：对于剩余的编码块，共享一个Merge列表构造过程。在此，可以按顺序插入空域/时域/HMVP、成对组合的双向预测Merge候选和零运动候选。在条带标头中用信令通知常规Merge列表的尺寸，并且常规Merge列表尺寸的最大值为6。

建议将除了用于非子块Merge候选的常规Merge列表之外的所有与子块相关运动候选放入单独的Merge列表中。

将被放入单独的Merge列表中的与子块相关的运动候选命名为“子块Merge候选列表”。

在一个示例中，子块Merge候选列表包括仿射Merge候选、ATMVP候选和/或基于子块的STMVP候选。

12.1实施例

在一些实施例中，将正常Merge列表中的ATMVP Merge候选移动到仿射Merge列表的第一位置。这样，新列表中的所有Merge候选(即，基于子块的Merge候选列表)都基于子块编解码工具。

通过以下步骤构造仿射Merge候选列表：

继承的仿射候选是指从其有效的邻居仿射编码块的仿射运动模型中导出的候选。从临近块的仿射运动模型中导出最多两个继承的仿射候选，并将其插入到候选列表中。对于左预测器，扫描顺序为{A0，A1}；对于上述预测器，扫描顺序为{B0，B1，B2}。

如果仿射Merge候选列表中的候选数量小于MaxNumAffineCand(设置为5)，则将构造的仿射候选插入到候选列表中。构造仿射候选是指通过组合每个控制点的邻居运动信息来构造的候选。

首先，从图7所示的指定的空域邻居和时域邻居中导出控制点的运动信息。CPk(k＝1,2,3,4)表示第k个控制点。A0,A1,A2,B0,B1,B2和B3是用于预测CPk(k＝1,2,3)的空域位置；T是用于预测CP4的时域位置。

CP1，CP2，CP3和CP4的坐标分别是(0，0)，(W，0)，(H，0)和(W，H)，其中W和H是当前块的宽度和高度。

根据以下优先级顺序获得每个控制点的运动信息：

对于CP1，检查优先级为B2→B3→A2。如果B2可用，则使用B2。否则，如果B2不可用，则使用B3。如果B2和B3都不可用，则使用A2。如果这三个候选都不可用，则无法获得CP1的运动信息。

对于CP2，检查优先级为B1→B0；

对于CP3，检查优先级为A1→A0；

对于CP4，使用T。

其次，使用控制点的组合来构造仿射Merge候选。

需要两个控制点的运动信息来构造4参数仿射候选。可以从两个组合({CP1，CP2}，{CP1，CP3})中的一个中选择两个控制点。这两个组合将转换为由左上和右上控制点表示的4参数运动模型。

按照以下顺序将构造的仿射候选的组合插入到候选列表中：

{CP1，CP2，CP3}，{CP1，CP2，CP4}，{CP1，CP3，CP4}，{CP2，CP3，CP4}，{CP1，CP2}，{CP1，CP3}

当CP具有相同的参考索引时，仅将CP的运动信息的可用组合添加到仿射Merge列表中。

如果仿射Merge候选列表中的候选数量小于5，则将具有零参考索引的零运动矢量插入候选列表中，直到列表已满。

13.组合仿射Merge候选的现有方法的缺点

在一些现有的实现中，如何将仿射预测与诸如帧间-帧内预测、三角预测模式和UMVE(或MMVD)之类的其他新的编解码工具协调起来仍然不清楚。

14.仿射预测与其他编解码工具协调的示例性方法

在以下针对各种实现描述的示例中阐明了使得仿射预测与其他编解码工具能够协调、可以以更灵活的方式控制仿射预测所需的带宽、并且可以进一步提高视频编解码效率并增强现有和未来的视频编解码标准的所公开技术的实施例，不应将其解释为限制性的。

尽管以下示例是在“仿射Merge候选列表”的上下文中描述的，但是它们同样适用于其他Merge候选列表，例如，“子块Merge候选列表”，并且适用于当诸如ATMVP候选的其他种类的子块Merge候选也被放入Merge候选列表时。

(a)在一个示例中，是否用信令通知标志取决于当前块的宽度(w)和高度(h)。

(i)如果w>Tw且h>Th，则不用信令通知标志。例如Tw＝Th＝32；

(ii)如果w>Tw或h>Th，则不用信令通知标志。例如Tw＝Th＝32；

(iii)如果w*h>Ts，则不用信令通知标志。例如Ts＝1024；

(iv)如果w

(v)如果w

(vi)如果w*h

(b)在一个示例中，用旁路编码对标志进行编码；

(c)在一个示例中，用(一个或多个)上下文模型对标志进行编码。

(i)在一个示例中，临近块的标志可以用于导出使用哪个上下文模型。

(1)例如，假设上临近块的标志是flagA，左临近块的标志是flagB，则使用flagA+flagB来指示使用哪个上下文模型。

(2)如果临近块不可用或未进行仿射Merge编码，则该标志被视为零。

(d)在一个示例中，用于常规Merge模式的UMVE标志被重新使用。可替换地，可以基于仿射标志使用上下文模型对标志进行编码。

(a)可替换地，如果指示对仿射Merge编码块修改Merge仿射模型，则用信令通知一个或多个方向索引和一个或多个距离索引。

(b)在一个示例中，修改索引(或方向索引或距离索引)被二值化为定长码。

(i)例如，用(一个或多个)上下文模型对定长码的前K个(例如，K＝0或1或2)二进制位进行编码，而对其他二进制位进行旁路编码。

(c)在一个示例中，修改索引(或方向索引或距离索引)被二值化为一元码。

(i)例如，用(一个或多个)上下文模型对一元码的前K个(例如，K＝0或1或2)二进制位进行编码，而对其他二进制位进行旁路编码。

(d)在一个示例中，修改索引(或方向索引或距离索引)被二值化为截断的一元码。

(i)例如，用(一个或多个)上下文模型对被截断的一元码的前K个(例如，K＝0或1或2)二进制位进行编码，而对其他二进制位进行旁路编码。

(e)在一个示例中，修改索引(或方向索引或距离索引)被二值化为X阶指数哥伦布(Exp-Golomb，EGx)码。例如x＝0或1。

(i)例如，用(一个或多个)上下文模型对EGx码的前K个(例如K＝0或1或2)二进制位进行编码，而对其他二进制位进行旁路编码。

(f)在一个示例中，修改索引(或方向索引或距离索引)被二值化为截断的X阶指数哥伦布(EGx)码。例如x＝0或1。

(i)例如，用(一个或多个)上下文模型对被截断的EGx码的前K个(例如，K＝0或1或2)二进制位进行编码，而对其他二进制位进行旁路编码。

(g)在一个示例中，修改索引(或方向索引或距离索引)被二值化为莱斯(Rice)码。

(i)例如，用(一个或多个)上下文模型对莱斯码的前K个(例如，K＝0或1或2)二进制位进行编码，而对其他二进制位进行旁路编码。

(h)在一个示例中，修改索引(或方向索引或距离索引)被二值化为截断的莱斯码。

(i)例如，用(一个或多个)上下文模型对被截断的莱斯码的前K个(例如，K＝0或1或2)二进制位进行编码，而对其他二进制位进行旁路编码。

(a)在一个示例中，Off0，Off1和Off2可以不相同。

(i)在一个示例中，用信令通知M个修改索引(或M个方向索引和M个距离索引)以分别表示M个CPMV的M个偏移量。

(ii)在一个示例中，可以将Off1+Off0用作MV1的偏移量，并且将Off2+Off0用作MV2的偏移量。

(iii)可替换地，用信令通知一个修改索引(或一个方向索引和一个距离索引)，并且从中导出CPMV的偏移量。在一个示例中，使用查找表来导出偏移量。

(b)在一个示例中，Off1和Off2始终等于零。Off0是从修改索引(或方向索引和距离索引)导出的。

(c)在一个示例中，Off0和Off2始终等于零。Off1是从修改索引(或方向索引和距离索引)导出的。

(d)在一个示例中，Off0和Off1始终等于零。对于6参数仿射模型，Off2是从修改索引(或方向索引和距离索引)中导出的。

(e)偏移量的推导可取决于当前块的宽度和高度。

(f)在一个示例中，可以用信令通知索引以指示哪些CPMV被修改。

(g)在一个示例中，可以为每个CU/PU/块用信令通知索引，以指示如果允许多于一个的修改索引时将如何用信令通知修改索引。

(h)在一个示例中，仅允许一个修改索引，但是，可以用信令通知索引以指示哪个控制点使用这种修改索引。

(i)在一个示例中，用信令通知多少修改索引可取决于块尺寸或仿射类型。

(1)在一个示例中，对于小于MxN的块尺寸，例如M＝N＝16，仅允许一个修改索引。

(2)在一个示例中，对于4参数仿射模型，仅允许一个修改索引。

(3)在一个示例中，对于6参数仿射模型，仅允许一个或两个修改索引。

(a)在一个示例中，Offa、Offb、Offc、Offd、Offe和Offf可以相同或可以不同。

(i)在一个示例中，用信令通知M个修改索引(或M个符号标志和M个距离索引)以分别表示M个参数的M个偏移量。

(ii)可替换地，用信令通知一个修改索引(或一个符号标志和一个距离索引)，并从中导出参数的偏移量。在一个示例中，使用查找表来导出偏移量。

(b)在一个示例中，Offe和Offf始终等于零。Offa和Offb是从4参数仿射模型的修改索引(或符号标志和距离索引)中导出的。

(c)在一个示例中，Offe和Offf始终等于零。Offa、Offb、Offc和Offd是从6参数仿射模型的修改索引(或符号标志和距离索引)中导出的。

(a)在一个示例中，从4参数仿射模型的修改索引(或符号标志、方向索引和距离索引)中导出Off0、Offa和Offb。

(b)在一个示例中，从6参数仿射模型的修改索引(或符号标志、方向索引和距离索引)中导出Off0、Offa、Offb、Offc和Offd。

(a)在一个示例中，子块Merge技术可以是仿射、ATMVP、平面Merge模式或STMVP。

(b)在一个示例中，当当前块是仿射Merge编码的时，用信令通知帧间-帧内预测标志。

(i)可替换地，当当前块是仿射Merge编码的且子块Merge索引大于T(例如，T＝3)时，用信令通知帧间-帧内预测标志。

(ii)可替换地，当当前块是仿射Merge编码的且所选择的子块Merge索引小于T时(例如，T＝3)，用信令通知帧间帧内预测标志。

(c)当帧间-帧内预测应用于以子块技术编码的块时，帧内预测和基于子块的帧间预测均被应用到当前块，并且对这两个预测加权求和以获得当前块的最终预测。

(a)在一个示例中，通过基于子块的帧间预测从子块Merge候选(诸如仿射Merge候选)中生成一个预测。通过正常帧间预测从常规Merge候选中生成其他预测。然后，对这两个预测进行加权求和，如图15所示。

(b)在一个示例中，通过基于子块的帧间预测从一个或两个子块Merge候选(诸如仿射Merge候选)中生成两个预测。然后，对这两个预测进行加权求和，如图15所示。

(a)在一个示例中，生成三角预测，并且生成帧内预测，并且对两个预测进行加权求和以获得最终预测。

可以将上述示例并入下面描述的方法(例如方法1500、1600和1700)，上述方法可以在视频解码器和/或视频编解码器处实现。

图15示出了用于视频编解码的示例性方法的流程图。方法1500包括，在步骤1510，基于当前视频块的比特流表示中的用信令通知的参数，通过修改Merge仿射模型来生成修改的Merge仿射模型。在一些实施例中，修改Merge仿射模型包括修改当前视频块的仿射模型的至少一个控制点运动矢量(CPMV)，或改变仿射模型的一个或多个控制点，或在四个参数和六个参数之间切换仿射模型。

方法1500包括，在步骤1520，基于修改的Merge仿射模型重构当前视频块。

在一些实施例中，并且在示例1的上下文中，用信令通知的参数包括标志。在一个示例中，该标志基于当前视频块的高度(h)或宽度(w)。例如，h≤Th和/或w≤Tw，其中Th和Tw是整数，Th＝Tw且Th＝16或32。在另一示例中，w×h

在一些实施例中，并且在示例2的上下文中，用信令通知的参数包括修改索引、方向索引或距离索引中的至少一个。在示例中，用信令通知的参数被二值化为代码。在另一示例中，该代码是定长码、一元码、截断的一元码、X阶指数哥伦布(EGx)码、截断的X阶指数哥伦布(EGx)码、莱斯码或截断的莱斯码。在又一示例中，用上下文模型对代码的第一数量二进制位进行编码，而对代码的剩余数量的二进制位进行旁路编码。

在一些实施例中，并且在示例3的上下文中，控制点运动矢量(CPMV)的一个或多个偏移量的推导是基于用信令通知的参数，并且其中修改Merge仿射模型是基于CPMV或一个或多个偏移量。在示例中，用信令通知的参数包括一个或多个修改索引、一个或多个方向索引或一个或多个距离索引，其表示一个或多个偏移量中的对应偏移量。在另一示例中，一个或多个偏移量的推导是基于单个修改索引、单个方向索引或单个距离索引。在又一示例中，一个或多个偏移量的推导还基于当前视频块的高度或宽度。

在一些实施例中，并且在示例3的上下文中，修改索引、方向索引或距离索引中的至少一个的数量是基于当前视频块的尺寸或仿射模型类型。在示例中，当前视频块的尺寸小于M×N，其中至少一个修改索引的数量为1，并且其中M＝N＝16。在另一示例中，仿射模型类型为4参数仿射模型，并且其中至少一个修改索引的数量是1。在又一示例中，仿射模型类型是6参数仿射模型，并且其中至少一个修改索引的数量是1或2。

图16示出了用于视频编解码的示例性方法的流程图。方法1600包括，在步骤1610，确定当前视频块是用子块编解码工具进行编码的。在一些实施例中，并且在示例6的上下文中，子块编解码工具包括仿射预测模式、可选时域运动矢量预测(ATMVP)模式、平面Merge模式或空时运动矢量预测(STMVP)模式。

方法1600包括，在步骤1620中，基于确定，使用帧间-帧内预测来重构当前视频块。在一些实施例中，并且在示例6的上下文中，重构还基于在当前视频块的比特流表示中用信令通知的帧间-帧内预测标志。在示例中，当前视频块是仿射Merge编码的。在另一示例中，重构还基于当前视频块的最终预测，并且最终预测是帧内-帧间预测和基于子块编解码工具的预测的加权和。在一些实施例中，并且在示例7的上下文中，当前视频块是使用UMVE进行编码的。

图17示出了用于视频编解码的示例性方法的流程图。方法1700包括，在步骤1710，为当前视频块生成第一预测。

方法1700包括，在步骤1720，为当前视频块生成第二预测。在一些实施例中，并且在示例8的上下文中，第一预测是基于来自子块Merge候选的基于子块的帧间预测，并且其中第二预测是基于来自常规Merge候选的常规帧间预测。在示例中，第一预测是仿射Merge预测。

在一些实施例中，并且在示例8的上下文中，第一预测根据基于第一子块的帧间预测，并且其中，第二预测根据基于第二子块的帧间预测。在示例中，第一预测或第二预测是仿射Merge预测。

在一些实施例中，并且在示例9的上下文中，第一预测是三角预测，并且其中第二预测是帧间-帧内预测。

方法1700包括，在步骤1730中，基于第一预测和第二预测的加权和，重构当前视频块。

在一些实施例中，方法1500、1600和1700可以进一步包括以下步骤：在与当前视频块相同的图片中重构或解码其他视频块。

15.所公开技术的示例实现

图18是视频处理装置1800的框图。设备1800可以用于实现本文描述的一种或多种方法。装置1800可以体现在智能手机，平板电脑，计算机，物联网(IoT)接收器等中。装置1800可以包括一个或多个处理器1802、一个或多个存储器1804和视频处理硬件1806。(一个或多个)处理器1802可以被配置为实现在本文档中描述的一种或多种方法(包括但不限于方法1500、1600和1700)。(一个或多个)存储器1804可以用于存储用于实现本文描述的方法和技术的数据和代码。视频处理硬件1806可以用于在硬件电路中实现本文档中描述的一些技术。

图19示出了用于视频编解码的示例性方法的流程图。方法1900包括，在步骤1910，确定当前块；在步骤1920，通过使用帧间-帧内预测、以及子块编解码技术和运动矢量差Merge模式(MMVD)技术中的至少一种，执行当前块和当前块的比特流表示之间的转换。

图20示出了用于视频编解码的示范性方法的流程图。方法2000包括，在步骤2010，根据当前块的划分，确定当前块的对应位置的多个加权值，其中，从当前块划分的至少一个分割是非矩形和非正方形的分割；在步骤2020，通过至少使用至少一个子块Merge候选来确定所述至少一个分割的预测结果；在步骤2030，通过使用预测结果执行当前块和当前块的比特流表示之间的转换。

图21示出了用于视频编解码的示例性方法的流程图。方法2000包括，在步骤2110，确定当前块的多个分割，其中，多个分割中的至少一个分割是非矩形和非正方形分割；在步骤2120，通过使用帧内预测来确定第一预测；在步骤2130，通过使用帧间预测来确定第二预测；在步骤2140，根据第一预测和第二预测确定预测结果；在步骤2150，通过使用预测结果执行当前块和当前块的比特流表示之间的转换。

图22示出了用于视频编解码的示例性方法的流程图。方法2200包括，在步骤2210，在当前块和当前块的比特流表示之间的转换期间，获取当前块的指示，其中，该指示指示是否应当修改当前块的Merge仿射模型；在步骤2220，至少基于指示，执行当前块与当前块的比特流表示之间的转换。

现在以基于条款的格式公开优选地由一些实施例实现的一些特征。

1.一种视频处理方法，包括：

确定当前块；以及

通过使用帧间-帧内预测、以及子块编解码技术和运动矢量差Merge模式(MMVD)技术中的至少一种，来执行当前块和当前块的比特流表示之间的转换。

2.根据条款1的方法，其中，子块编解码技术包括仿射预测模式、基于子块的可选时域运动矢量预测(ATMVP)模式、平面Merge模式和空时运动矢量预测(STMVP)模式中的至少一种。

3.根据条款1或2的方法，其中，响应于确定用仿射Merge预测模式对当前块进行编码，用信令通知帧间-帧内预测标志。

4.根据条款1-3中的任一项的方法，其中，响应于确定用仿射Merge预测模式对当前块进行编码并且当前块的子块Merge索引大于第一阈值，用信令通知帧间-帧内预测标志。

5.根据条款1-3中的任一项的方法，其中，响应于确定用仿射Merge预测模式对当前块进行编码并且当前块的所选子块Merge索引小于第二阈值，用信令通知帧间-帧内预测标志。

6.根据条款4或5的方法，其中，第一阈值和第二阈值为3。

7.根据条款1-6中的任一项的方法，其中，通过使用帧间-帧内预测、以及子块编解码技术和运动矢量差Merge模式(MMVD)技术中的至少一种，执行当前块和当前块的比特流表示之间的转换包括：

通过使用帧内预测对当前块执行第一预测，得到第一预测结果；

通过使用基于子块的帧间预测对当前块执行第二预测，得到第二预测结果；

对第一预测结果和第二预测结果执行加权求和，得到最终预测结果；

基于最终预测结果，执行当前块与当前块的比特流表示之间的转换。

8.一种用于视频处理的方法，包括：

根据当前块的划分，确定当前块对应位置的多个加权值，其中，从当前块划分的至少一个分割是非矩形和非正方形分割；

通过至少使用至少一个子块Merge候选来确定至少一个分割的预测结果；以及

通过使用预测结果执行当前块和当前块的比特流表示之间的转换。

9.根据条款8的方法，其中，通过至少使用至少一个子块Merge候选来确定至少一个分割的预测结果包括：

通过使用基于子块的帧间预测对当前块执行第一预测，以从子块Merge候选中得到第一预测结果；

通过使用帧间预测对当前块执行第二预测，以从Merge候选中得到第二预测结果；

根据多个加权值对第一预测结果和第二预测结果执行加权求和，以得到预测结果。

10.根据条款8的方法，其中，通过至少使用至少一个子块Merge候选来确定至少一个分割的预测结果包括：

通过使用基于子块的帧间预测对当前块执行第一预测，以从一个或两个子块Merge候选中得到两个第一预测结果；

根据多个加权值对两个第一预测结果执行加权求和，以得到预测结果。

11.根据条款9或10的方法，其中，当前块被划分成两个三角形。

12.一种用于视频处理的方法，包括：

确定当前块的多个分割，其中，多个分割中的至少一个分割是非矩形和非正方形分割；

通过使用帧内预测来确定第一预测；

通过使用帧间预测来确定第二预测；

根据第一预测和第二预测确定预测结果，以及

通过使用预测结果执行当前块和当前块的比特流表示之间的转换。

13.根据条款12的方法，其中

通过使用帧内预测对当前块执行第一预测，以得到第一预测结果；

通过使用帧间预测对当前块进行第二预测，以根据分区从Merge候选中得到第二预测结果；

对第一预测结果和第二预测结果执行加权和以得到预测结果。

14.根据条款12或13中任一项的方法，其中，当前块被划分为两个三角形。

15.一种视频处理装置，包括被配置为实现条款1至14中的任何一项的方法的处理器。

16.根据条款15的装置，其中装置是视频编解码器。

17.根据条款15的装置，其中装置是视频解码器。

18.一种计算机可读记录介质，其上记录有包括代码的程序，程序用于处理器进行条款1至17中任一项的方法。

现在以基于条款的格式公开优选地由一些实施例实现的一些特征。

1.一种视频处理方法，包括：

在当前块与当前块的比特流表示之间的转换期间，获取当前块的指示，其中指示指示是否应当修改当前块的合并仿射模型；以及

至少基于指示，执行当前块与当前块的比特流表示之间的转换。

2.根据条款1的方法，其中修改合并仿射模型包括以下的至少一个：

修改当前块的仿射模型的至少一个控制点运动矢量(CPMV)，

更改当前块的仿射模型的一个或多个控制点，

修改当前块的仿射模型的至少一个仿射参数，

以及

在四个仿射参数和六个仿射参数之间切换当前块的仿射模型。

3.根据条款1或2的方法，其中，是否用信令通知指示基于当前块的高度(h)和/或宽度(w)。

4.根据条款3的方法，其中，响应于h≤Th1且w≤Tw1，用信令通知指示，其中，Th1和Tw1是整数。

5.根据条款3的方法，其中，响应于h≤Th1或w≤Tw1，用信令通知指示，其中，Th1和Tw1是整数。

6.根据条款4或5的方法，其中，Th1＝Tw1＝32。

7.根据条款3的方法，其中，响应于w×h≤Ts1，用信令通知指示，其中，Ts1是整数。

8.根据条款7的方法，其中，Ts1＝1024。

9.根据条款3的方法，其中，响应于h≥Th2且w≥Tw2，用信令通知指示，其中，Th2和Tw2是整数。

10.根据条款3的方法，其中，响应于h≥Th2或w≥Tw2，用信令通知指示，其中，Th2和Tw2是整数。

11.根据条款9或10的方法，其中，Th2＝Tw2＝16。

12.根据条款3的方法，其中，响应于w×h≥Ts2，用信令通知指示，其中，Ts2是整数。

13.根据条款12的方法，其中，Ts2＝256。

14.根据条款1至13中的任一项的方法，其中，指示用旁路编码进行编码。

15.根据条款1至13中任一项的方法，其中，指示用一个或多个上下文模型进行编码。

16.根据条款15的方法，其中一个或多个上下文模型基于当前块的一个或多个临近块的临近指示而推导。

17.根据条款16的方法，其中，基于左临近块的第一临近指示与上临近块的第二临近指示之和推导一个或多个上下文模型。

18.根据条款1至17中的任一项的方法，其中，将用于常规Merge模式的运动矢量差Merge模式(MMVD)标志用作指示。

19.根据条款18的方法，其中，基于仿射标志用上下文模型对MMVD标志进行编码。

20.根据条款1至19中的任一项的方法，其中，响应于指示应当修改当前块的合并仿射模型的指示，用信令通知至少一个索引。

21.根据条款20的方法，其中，至少一个索引包括一个或多个修改索引。

22.根据条款20的方法，其中，索引包括方向索引和距离索引中的至少一个。

23.根据条款20-22中的任一项的方法，其中，索引是方向索引和距离索引的组合。

24.根据条款20-23中的任一项的方法，其中，至少一个索引的部分或全部被二进制化为代码。

25.根据条款24的方法，其中，代码是定长码、一元码、截断的一元码、X阶Exp-Golomb(EGx)码、截断的X阶Exp-Golomb(EGx)码、莱斯码或截断的莱斯码中的任何一个。

26.根据条款24或25的方法，其中，用上下文模型对代码的第一数量的二进制位进行编码，并且对代码的剩余数量的二进制位进行旁路编码。

27.根据条款1-26中任一项的方法，其中，对当前块的控制点运动矢量(CPMV)添加偏移量。

28.如条款27的方法，其中，响应于指示应当修改当前块的合并仿射模型的指示，在比特流表示中用信令通知用于推导偏移量的至少一个第一索引。

29.根据条款28的方法，其中，不同CPMV的偏移量彼此不同。

30.根据条款28或29的方法，其中，将至少一个第一索引中的一个或多个第一索引分别用于推导对应的一个或多个CPMV的一个或多个偏移量。

31.根据条款28-30中的任一项的方法，其中，与右上CPMV对应的偏移量是与左上CPMV对应的偏移量与由第一索引用信令通知的差的和。

32.根据条款28-30中的任一项的方法，其中，与左下CPMV对应的偏移量是与左上CPMV对应的偏移量与由第一索引用信令通知的差的和。

33.根据条款28或29的方法，其中，将至少一个第一索引中的一个或多个第一索引用于推导对应的一个或多个CPMV的一个或多个偏移量，并且将一个或多个偏移量进一步用于推导其他CMVP的其他偏移量。

34.根据条款28-33中的任一项的方法，其中，用信令通知第三指示以指示要用信令通知的第一索引的数量。

35.根据条款28-34中任一项的方法，其中，用信令通知第四指示以指示使用第一索引的控制点(CP)。

36.根据条款28-35中的任一项的方法，其中，要用信令通知的第一索引的数量基于当前块的尺寸或仿射模式。

37.根据条款27-36中的任一项的方法，其中，用表来推导对应的一个或多个CPMV的一个或多个偏移量。

38.根据条款27-37中的任一项的方法，其中，两个CPMV的两个偏移量是零，并且从至少一个索引推导第三CPMV的偏移量。

39.根据条款27-38中任一项的方法，其中，一个或多个偏移量基于当前块的高度和/或宽度。

40.根据条款27-39中的任一项的方法，其中，用信令通知第二指示以指示要被修改的一个或多个CPMV。

41.根据条款40的方法，其中，当当前块的尺寸小于M×N时，将用信令通知一个第一索引。

42.根据条款41的方法，其中，M＝N＝16。

43.根据条款40-42中任一项的方法，其中，当当前块的仿射模型是4参数仿射模式时，将用信令通知一个第一索引。

44.根据条款40-43中任一项的方法，其中，当当前块的仿射模型是6参数仿射模式时，将用信令通知一个或两个修改索引。

45.根据条款1-44中任一项的方法，其中，对当前块的仿射参数添加偏移量。

46.根据条款45的方法，其中，不同仿射参数的偏移量彼此不同。

47.根据条款45的方法，其中至少两个仿射参数的偏移量是相同的。

48.根据条款45-47中的任一项的方法，其中，响应于指示应当修改当前块的合并仿射模型的指示，在比特流表示中用信令通知用于推导偏移量的至少一个第二索引。

49.根据条款48的方法，其中，至少一个第二索引包括一个或多个修改索引。

50.根据条款48的方法，其中，至少一个索引包括符号标志和距离索引中的至少一个。

51.根据条款48的方法，其中，第二索引是符号标志和距离索引的组合。

52.根据条款48-51中的任一项的方法，其中，将至少一个第二索引的一个或多个第二索引分别用于推导对应的一个或多个仿射参数的一个或多个偏移量。

53.根据条款48-52中的任一项的方法，其中，将至少一个第二索引的一个或多个第二索引用于推导对应的一个或多个仿射参数的一个或多个偏移量，并且将一个或多个偏移量进一步用于推导其他仿射参数的其他偏移量。

54.根据条款45-53中的任一项的方法，其中，从查找表推导对应的一个或多个仿射参数的一个或多个偏移量。

55.根据条款45-54中的任一项的方法，其中，仿射参数e和f的两个偏移量为零，并且将至少一个第二索引用于推导其他仿射参数的一个或多个偏移量。

56.根据条款1-55中任一项的方法，其中，响应于指示应当修改当前块的合并仿射模型的指示，对当前块的CPMV添加偏移量，偏移量量由修改索引、方向索引和距离索引中的一个或多个指示，并且对当前块的仿射参数添加偏移量，偏移量由修改索引、符号标志和距离索引中的一个或多个指示。

57.根据条款56的方法，其中，对左上CPMV添加从修改索引、方向索引和距离索引中的一个或多个推导出的偏移量。

58.根据条款56或57的方法，其中，对仿射参数a、b、c和d中的至少一个添加从修改索引、符号标志和距离索引中的一个或多个推导出的偏移量。

59.一种视频处理装置，包括被配置为实现条款1至58中的任何一项的方法的处理器。

60.根据条款59的装置，其中装置是视频编解码器。

61.根据条款59的装置，其中装置是视频解码器。

62.一种计算机可读记录介质，其上记录有包括代码的程序，程序用于处理器进行条款1至58中任一项的方法。

从前述内容可以理解，本文已经出于说明的目的描述了当前所公开的技术的具体实施例，但是在不脱离本发明的范围的情况下可以做出各种修改。因此，除了所附权利要求之外，当前所公开的技术不受限制。

本专利文档中描述的主题的实现方式和功能性操作可以在各种系统、数字电子电路中实施，或者在计算机软件、固件或硬件中实施，包括本说明书中公开的结构及其结构等同物，或者以他们的一个或多个的组合实施。本说明书中描述的主题的视线方式可以被实施为一个或多个计算机程序产品，即，在计算机可读介质上编码的一个或多个暂时性和非暂时性计算机程序指令模块，用于由数据处理装置运行或控制数据处理装置的操作。计算机可读介质可以是机器可读存储设备、机器可读存储基板、存储器设备、影响机器可读传播信号的物质的合成、或者它们中的一个或多个的组合。术语“数据处理单元”和“数据处理装置”包括用于处理数据的所有装置、设备和机器，包括例如可编程处理器、计算机或者多个处理器或计算机。除了硬件之外，装置可以包括为所讨论的计算机程序创建运行环境的代码，例如，构成处理器固件、协议栈、数据库管理系统、操作系统及其一个或多个的组合的代码。

计算机程序(也称为程序、软件、软件应用、脚本或代码)可以用任何形式的编程语言(包括编译语言或解释语言)编写，并且可以以任何形式部署，包括作为独立程序或作为模块、组件、子程序或其他适合在计算环境中使用的单元。计算机程序不一定与文件系统中的文件相对应。程序可以存储在保存其他程序或数据的文件的部分中(例如，存储在标记语言文档中的一个或多个脚本)、专用于所讨论的程序的单个文件中、或多个协调文件(例如，存储一个或多个模块、子程序或部分代码的文件)中。计算机程序可以部署在一台或多台计算机上来执行，这些计算机位于一个站点或分布在多个站点并通过通信网络互连。

本说明书中描述的处理和逻辑流可以由一个或多个可编程处理器执行，该一个或多个处理器运行一个或多个计算机程序，通过对输入数据进行操作并生成输出来执行功能。处理和逻辑流也可以由专用逻辑电路来执行，并且装置也可以实施为专用逻辑电路，例如，FPGA(现场可编程门阵列)或ASIC(专用集成电路)。

例如，适用于运行计算机程序的处理器包括通用和专用微处理器、以及任何类型的数字计算机的任何一个或多个处理器。通常，处理器将从只读存储器或随机存取存储器或两者接收指令和数据。计算机的基本元件是执行指令的处理器和存储指令和数据的一个或多个存储设备。通常，计算机还将包括一个或多个用于存储数据的大容量存储设备，例如，磁盘、磁光盘或光盘，或可操作地耦合到一个或多个大容量存储设备，以从其接收数据或向其传送数据，或两者兼有。然而，计算机不一定需要具有这样的设备。适用于存储计算机程序指令和数据的计算机可读介质包括所有形式的非易失性存储器、介质和存储器设备，包括例如半导体存储器设备，例如EPROM、EEPROM和闪存设备。处理器和存储器可以由专用逻辑电路来补充，或合并到专用逻辑电路中。

旨在将说明书与附图一起仅视为示例性的，其中示例性意味着示例。另外，除非上下文另有明确说明，否则“或”的使用旨在包括“和/或”。

虽然本专利文档包含许多细节，但不应将其解释为对任何发明或要求保护的范围的限制，而应解释为特定于特定发明的特定实施例的特征的描述。本专利文档在分离的实施例的上下文描述的某些特征也可以在单个实施例中组合实施。相反，在单个实施例的上下文中描述的各种功能也可以在多个实施例中单独地实施，或在任何合适的子组合中实施。此外，虽然特征可以被描述为在某些组合中起作用，甚至最初这样要求保护，但在某些情况下，可以从要求保护的组合中移除组合中的一个或多个特征，并且要求保护的组合可以指向子组合或子组合的变体。

同样，尽管在附图中以特定顺序描述了操作，但这不应理解为要获得期望的结果必须按照所示的特定顺序或次序顺序来执行这些操作，或执行所有示出的操作。此外，本专利文档所述实施例中的各种系统组件的分离不应理解为在所有实施例中都需要这样的分离。

仅描述了一些实施方式和示例，其他实施方式、增强和变体可以基于本专利文档中描述和说明的内容做出。

去获取专利，查看全文>

相似文献

专利
中文文献
外文文献

1. 仿射的MERGE与MVD [P] . 中国专利： CN113170192A . 2021-07-23
2. 对于Merge仿射模式和非Merge仿射模式的统一约束 [P] . 中国专利： CN110636298A . 2019-12-31
3. MVD precision for affine [P] . GB2590222A . 2021-06-23

机译：仿射的MVD精度
4. Inter modes with weighting-averaged prediction, symmetric MVD or affine motion in video coding [P] . US11202064B2 . 2021-12-14

机译：具有加权平均预测，对称MVD或视频编码的仿射运动的帧间模式
5. AFFINE BASED MERGE WITH MVD [P] . US2021352293A1 . 2021-11-11

机译：基于仿射的MVD合并