首页> 中国专利> 用于估算用于数字视频代码转换的运动矢量的系统和方法

用于估算用于数字视频代码转换的运动矢量的系统和方法

页面导航

摘要
著录项
法律信息
说明书
相似文献

摘要

本发明公开了一种用于估算用于数字视频代码转换的运动矢量的系统和方法。该方法包括：选择用于在搜索区域内估算运动矢量的调整矢量的方向，和选择在搜索区域内具有最小绝对差值和(SAD)的调整矢量。该方法进一步包括：通过将调整矢量和基础运动矢量求和来估算运动矢量。在一个实施例中，调整矢量的方向是沿着搜索区域的任意的轴线方向。在另一个实施例中，调整矢量的方向是沿着搜索区域的任意的象限方向。在又一个实施例中，调整矢量的方向是最佳调整矢量的方向。

著录项

公开/公告号CN1622630A

专利类型发明专利
公开/公告日2005-06-01

原文格式PDF
申请/专利权人 LG电子株式会社;
展开▼

申请/专利号CN200410095712.2
发明设计人徐光德;
展开▼

申请日2004-11-24
分类号H04N7/26;H03M13/00;H04B1/38;
代理机构中原信达知识产权代理有限责任公司;
代理人樊卫民
地址韩国汉城
入库时间 2023-12-17 16:08:21

法律信息

法律状态公告日

法律状态信息

法律状态
2016-01-06

未缴年费专利权终止 IPC(主分类):H04N7/26 授权公告日:20080206 终止日期:20141124 申请日:20041124

专利权的终止
2008-02-06

授权

授权
2005-08-03

实质审查的生效

实质审查的生效
2005-06-01

公开

公开

说明书

技术领域

本发明涉及数字视频，并且更为具体的说涉及一种用于估算用于数字视频代码转换的运动矢量的方法。

背景技术

数字视频代码转换的需要的视频标准和接收视频的终端的显示器分辩率以及用于传送视频的网络变化，正在逐渐地增加。

代码转换是一种，例如变换视频流的格式或者大小以便在不同的终端上再现的技术。第一类型的代码转换将以一种视频标准编码的比特流变换为不同的视频标准。第二类型的代码转换变换视频的分辩率使其与接收终端的显示器可兼容。第三类型的代码转换变换视频的传输比特率，以便适于用于传送视频的网络的带宽。

参考图1，现有的视频代码转换器包括用于解码输入比特流的解码器10，用于处理信号以代码转换从解码器10输出的信号的信号处理器20，和用于估算和编码从信号处理器20输出的信号的运动矢量的编码器30。通过运动估算设置最佳运动矢量。在视频编码和代码转换的过程中运动矢量的估算是很复杂的过程。

按照现有的视频解码，代码转换器从输入的比特流接收，该输入的比特流是压缩的视频流。代码转换器从输入的比特流中获得的运动矢量中选择基础运动矢量(BMV)。为了估算运动矢量，在基础运动矢量周围设置搜索区域。该搜索区域具有围绕该基础运动矢量近似两个像素的窗口宽度。

搜索是在搜索区域内执行的，以获得在基础运动矢量和搜索区域的每个像素之间的总和-和-差值(SAD，sum-and-difference)。该运动矢量是通过使用完全搜索方法估算的。选择在计算的SAD之中具有最小的SAD的像素的运动矢量。基础运动矢量和具有最小的SAD的像素的运动矢量求和，以生成估算的运动矢量。根据在搜索区域中计算的像素的数目，计算复杂性增加。在这个例子中，计算与25个像素有关的SAD需要25个计算。

因此，存在对改进的用于估算运动矢量的系统和方法的需要，其可以克服以上所述的问题并且提供相比现有的编码系统的优点。

发明内容

本发明的其它优点、和特征将在随后的说明中部分地描述，经过以下检验或从本发明的实践中学习，上述优点、目的和特征对于本领域的普通技术人员来说是显而易见的。本发明的目的和优点可以如所附说明书及其权利要求书和附图中所特别指出的来实现和获得。

在一个实施例中，提供了一种用于估算用于数字视频代码转换的运动矢量的方法。该方法包括：选择用于在搜索区域内估算运动矢量的调整矢量的方向，和选择在搜索区域内具有最小SAD的调整矢量。该方法进一步包括通过将调整矢量和基础运动矢量求和来估算运动矢量。

调整矢量的方向是沿着搜索区域的任意的轴线方向。在又一个实施例中，调整矢量的方向是沿着搜索区域的任意的象限方向。在另一个实施例中，例如，调整矢量的方向是最佳调整矢量的方向。

该方法可以进一步包括选择搜索区域为以基础运动矢量为中心。在另一个实施例中，该方法进一步包括从输入视频流计算基础运动矢量。最小SAD是基于与多个SAD有关的选择过程的，该多个SAD的在搜索区域内具有调整矢量。

在另一个实施例中，该方法进一步包括选择调整矢量的方向，进一步包括：关于以运动矢量为中心的调整矢量计算SAD；选择在多个SAD之中具有最小值的第一调整矢量；和选择在多个SAD之中具有第二小的值的第二调整矢量。该方法进一步包括：相加第一调整矢量和第二调整矢量以生成第三调整矢量，和按照第三调整矢量确定调整矢量的方向。

本发明的其它优点、目的和特征将在随后的说明中部分地描述，经过以下检验或从本发明的实践中学习，或从说明书中，上述优点、目的和特征是显而易见的。应该明白，上文的概述和下面的本发明的详细说明是示范性和说明性的，并且作为权利要求意欲对发明提供进一步的说明。

对于那些本领域技术人员来说，从下列与附图有关的实施例的详细说明中，这些和其他的实施例也将变得显而易见，本发明不局限于公开的任何特定的实施例。

附图说明

附图是为了能进一步了解本发明而包含的，并且被纳入本说明书中构成本说明书的一部分，这些附图示出了本发明的实施例，并用于与本说明书一起对本发明的原理进行说明。

在不同的附图中，由相同的数字涉及的本发明的特征、元件和方面表示按照一个或多个实施例的相同、等效或者类似的特征、元件或方面。

图1是举例说明现有的视频代码转换器的框图。

图2是按照本发明的实施例的用于估算用于数字视频代码转换的运动矢量的流程图。

图3是举例说明按照本发明的实施例的用于使用图2的运动矢量估算方法的搜索图形的框图。

图4是示出在本发明的运动矢量估算方法和现有的估算方法之间的峰值信噪比性能的视图。

图5是举例说明使用本发明的方法的移动通信设备的框图。

具体实施方式

本发明涉及实现移动终端的信噪比可伸缩性的视频处理。本发明的系统和方法提供了一种改进的运动矢量估算算法。使用绝对差值和算法(SAD，sum absolute difference)描述了本发明。SAD算法限定用于在x坐标和y坐标之间最小非标准化绝对误差的位置的匹配。

本发明的SAD搜索用于估算运动矢量的最佳调整矢量的方向。在一个实施例中，取决于x和y坐标的值，最佳矢量的方向是沿着搜索区域的任意的轴线方向的。在另一个实施例中，例如，取决于x和y坐标的值，最佳矢量的方向是沿着搜索区域的任意的象限方向的。

虽然关于用于处理视频的移动终端举例说明了本发明，期待本发明可以在其他的设备或者系统中使用，该其他的设备或者系统存在对从一个位置到另一个位置发射、接收或者处理音频和/或视频的需要。现在将详细地介绍本发明的优选实施例，其例子被在伴随的附图中举例说明。

参考图2，用于估算离基础运动矢量(V_n⁰)距离为δ的搜索点的SAD可以表示为：

$>>SAD>>(>δ>)>>=>>Σ>>p>∈>>Ω>n>>>>|>>f>k>>>(>p>)>>->>f>>k>->1>>>>(>p>+sup>>V>n>0sup>>+>δ>)>>|>->->->>(>1>)>>>s>$

在等式(1)中，基础运动矢量(V_n⁰)是从输入给代码转换器的比特流中计算的，f_k是第K个帧，Ω_n是f_k的第n个宏模块，‘p’是用于图像或者视频的具有矢量坐标[x，y]^T的位置向量，且‘δ’是调整矢量。

最佳调整矢量(δ_n)是如上所述在等式(1)中在搜索区域[-2，+2]中最小化SAD来计算的。由等式(2)表示的最佳调整矢量(δ_n)是：

$>>>δ>n>>=>arg>>min>>δ>∈>>S>D>>×>>S>D>>>>SAD>>(>δ>)>>->->->>(>2>)>>>s>$

在等式(2)中，SD是围绕基础运动矢量近似在[-2，+2]像素区域中的搜索区域。SAD是为在搜索区域内的矢量坐标计算的。在一个例子中，SAD是为关于调整矢量(S11)的矢量坐标(SAD(0，0)，SAD(0，1)，SAD(0，-1)，SAD(1，0)，SAD(-1，0)计算的。在这个例子中，具有第一搜索点(1)的调整矢量是(0，0)、(0，1)、(0，-1)、(1，0)、(-1，0)(参见图3)。

在计算的SAD之中具有最小值的SAD(δ)被定义为SAD1。在剩余的SAD之中具有最小值的SAD(δ)被定义为SAD2(S12)。SAD1利用被识别为δ¹的调整矢量。SAD2利用被识别为δ²的调整矢量。δ’¹是从SAD1和SAD2求和获得的调整矢量(S13)。

如果运动矢量的x坐标和y坐标的至少一个被设置为零(S14)，对于δ’进行判定。如果因为两个x坐标和y坐标是零而δ’是零，δ’的位置在或者沿着任意的轴线方向(S15)。沿着相同的轴线放置的调整矢量被加到坐标(0，0)。否则，如果x坐标和y坐标的至少一个是0，δ’的位置在其上或者沿着运动矢量域的任意的轴线方向。在这个状态下，具有最小的SAD的轴线方向沿着运动矢量域的方向存在。

当δ¹设置运动矢量域的方向的时候，SAD(δ)大致位于从δ¹朝着搜索区域的外边缘一个像素的位置上(S16)。δ具有被表示为第二搜索点(2)的位置。第二搜索点(2)被定义为δ＝2×δ¹。

最佳调整矢量δ_n是从下面的等式(3)和(4)计算的：

如果(SAD(δ)＜SAD(δ¹))δ_n＝δ---------(3)

否则，δ_n＝δ¹-----------(4)

SAD(δ)的值与SAD(δ¹)的值相比较(S17)。如果SAD(δ)的值小于SAD(δ¹)的值，最佳调整矢量δ_n是δ(S18)。但是，如果SAD(δ¹)的值小于SAD(δ)的值，最佳调整矢量δ_n是δ¹(S19)。具有最小值SAD的调整矢量是最佳调整矢量。

如果x坐标和y坐标两者都不是零(S14)，其中δ’所在的任意的象限对应于运动矢量域的方向(S20)。调整矢量被加到相邻的轴。在这个例子中，调整矢量被加到相邻的轴(0，1)和(1，0)；(0，1)和(-1，0)；(0，-1)和(1，0)；以及(0，-1)和(-1，0)。δ’的位置在第三搜索点(3)上。

确定δ’的位置在四个象限的一个中(S21)。在δ’被放置的象限内，在第四搜索点(4)上的SAD与设置在第三搜索点(3)上的SAD相比较。比较的结果是最佳调整矢量δ_n(S22)。

如果δ’的位置在第一象限上，最佳调整矢量δ_n是使用等式(5)至(9)计算的：

如果(SAD(δ′)＜SAD(δ′+(1，0))){

如果(SAD(δ′)＜SAD(δ′+(0，-1)))δ_n＝δ′；--------(5)

否则{

如果(SAD(δ′+(0，-1))＜SAD(δ′+(1，-1)))δ_n＝δ′+(0，-1)；-------(6)

否则δ_n＝δ′+(1，-1)；-----------(7)

}

否则{

如果(SAD(δ′+(1，0))＜SAD(δ′+(1，-1)))δ_n＝δ′+(1，0)；---------(8)

否则δ_n＝δ′+(1，-1)；----------(9)

}

如果δ’的位置在第二象限上，该最佳调整矢量δ_n被使用等式(10)至(14)计算：

如果(SAD(δ′)＜SAD(δ′+(-1，0))){

如果(SAD(δ′)＜SAD(δ′+(0，-1)))δ_n＝δ′；--------(10)

否则{

如果(SAD(δ′+(0，-1))＜SAD(δ′+(-1，-1)))δ_n＝δ′+(0，-1)；-------(11)

否则δ_n＝δ′+(-1，-1)；----------(12)

}

否则{

如果(SAD(δ′+(-1，0))＜SAD(δ′+(-1，-1)))δ_n＝δ′+(-1，0)；--------(13)

否则δ_n＝δ′+(-1，-1)；----------(14)

}

如果δ’的位置在第三象限内，该最佳调整矢量δ_n被使用在下面示出的等式(15)至(19)计算：

如果(SAD(δ′)＜SAD(δ′+(-1，0))){

如果(SAD(δ′)＜SAD(δ′+(0，1)))δ_n＝δ′；--------(15)

否则{

如果(SAD(δ′+(0，1))＜SAD(δ′+(-1，1)))δ_n＝δ′+(0，1)；-------(16)

否则δ_n＝δ′+(-1，1)；----------(17)

}

否则{

如果(SAD(δ′+(-1，0))＜SAD(δ′+(-1，1)))δ_n＝δ′+(-1，0)；------(18)

否则δ_n＝δ′+(-1，1)；--------(19)

如果δ’的位置在第四象限上，该最佳调整矢量δ_n被使用等式(20)至(24)计算：

如果(SAD(δ′)＜SAD(δ′+(1，0))){

如果(SAD(δ′)＜SAD(δ′+(0，1)))δ_n＝δ′；--------(20)

否则{

如果(SAD(δ′+(0，1))＜SAD(δ′+(1，1)))δ_n＝δ′+(0，1)；-------(21)

否则δ_n＝δ′+(1，1)；--------(22)

}

否则{

如果(SAD(δ′+(1，0))＜SAD(δ′+(1，1)))δ_n＝δ′+(1，0)；--------(23)

否则δ_n＝δ′+(1，1)；----------(24)

}

由等式(25)分配给第n个宏模块的最后的运动矢量(V_n⁰)是加到基础运动矢量的最佳调整矢量δ_n。

$>>>V>n>>=sup>>V>n>0sup>>+>>δ>n>>->->->>(>25>)>>>s>$

与现有的完全搜索运动矢量的计算相比，本发明在选择的点上估算运动矢量，从而导致减少计算的复杂性、节省处理步骤。在本发明中，如果最佳调整矢量在确定的轴上存在，例如，SAD被计算6次。如果最佳调整矢量出现在任意的象限中，SAD被计算8次或者9次。从等式(5)、(7)、(8)和(9)中获得的最佳调整矢量，例如，SAD被计算8次。对于计算从等式(6)获得的最佳调整矢量，例如，SAD被计算9次。

假定最佳调整矢量在确定的轴上存在的概率和最佳调整矢量在任意的象限上存在的概率是相等的，对于一个宏单元，例如，SAD被平均计算7次。

具有搜索区域超出[-2，2]窗口的参考资料将增加计算复杂性，和降低估算的运动矢量的精确度。考虑计算搜索区域[-2，+2]是最优选的(参见T.Shanableh和M.Ghanbari撰写的“Heterogeneous videotranscoding to lower spatial-temporal resolutions and different encodingformats”，(IEEE Trans.多媒体，Vol.2，No.2，pp.101-110，2000年6月)。

参考图4，将图像从高比特速率MPEG-1图像代码转换为低比特速率MPEG-1图像。测试图像是“足球”。测试图像的50个帧被使用MPEG-1编码。在这个例子中，GOP的长度是12，并且没有出现B-帧。试验结果示出使用本发明估算的运动矢量改善峰值信噪比(PSNR)性能。本发明也示出与采用完全搜索方法的现有的运动矢量估算方法相比PSNR性能几乎相同。

本发明的运动估算方法通过减少估算运动矢量需要的搜索点的数目提供了多达70％的计算复杂度降低。本发明的运动估算方法提供了与采用完全搜索方法的现有矢量估算方法几乎相同的PSNR性能。

以下是包括使用本发明的方法的移动通信设备和移动通信网络的例子。

参考图5，该移动通信设备500包括：诸如微处理器或者数字信号处理器的处理单元510，RF模块535，功率管理模块506，天线540，电池555，显示器515，键盘520，诸如闪存、ROM或者SRAM的存储单元630，扬声器545和麦克风550。

用户，例如，通过按压键盘520的按键，或者通过使用麦克风550的语音激活来输入指令信息。处理单元510接收和处理指令信息，以执行适宜的功能。可以从存储单元630中检索操作数据以执行功能。此外，处理单元510可以在显示器515上显示指令和操作信息，以便用户参考和方便性。

处理单元510发出指令信息给RF模块535，以启动通信，例如，发射包括话音通信数据的无线信号。RF模块535包括接收机和发射机，以接收和发射无线电信号。天线540便于无线电信号的发射和接收。一旦接收到无线信号，RF模块535可以转发信号，并变换信号为基频，用于由处理单元510处理。处理的信号将被转换为经由扬声器645输出的可听或者可读的信息。

处理单元510执行该方法，并提供如在图2-4中举例说明的系统。作为一个例子，处理单元510用于估算用于数字视频代码转换的运动矢量，该方法包括：选择用于在搜索区域内估算运动矢量的调整矢量的方向；和选择在搜索区域内具有最小SAD的调整矢量。

如上在图2-4中所述的其他的特征也可以完全包括在处理单元510之内。

处理单元510在存储单元530中存储从其他的用户接收的消息和发送给其他的用户的消息，接收用于由用户输入的消息的条件请求，处理条件请求以从存储单元中读出对应于条件请求的数据。处理单元510输出消息数据给显示单元515。存储单元530适合于存储接收的和发送的消息的消息数据。

虽然在移动终端的范围中描述了本发明，本发明还可以在任何一种使用移动设备的有线或者无线通信系统中使用，诸如PDA和配备有有线和无线通信性能的便携式计算机。此外，对于描述本发明所使用的某些术语不应该限制于本发明范围的某些类型的无线通信系统，诸如UMTS。本发明还可适用于其他的使用不同的空中接口和/或物理层的无线通信系统，例如，TDMA、CDMA、FDMA、WCDMA等等。

该优选实施例可以作为方法、系统或者使用标准程序和/或工程技术的制造产品来实施，以产生软件、固件、硬件或者其任意的组合。在此处使用的术语“制造产品”指的是以硬件逻辑(例如，集成电路芯片、现场可编程门阵列(FPGA)、特定用途集成电路(ASIC)等等)实现的代码或逻辑，或者计算机可读介质(例如，磁存储介质(例如，硬盘驱动器、软盘、磁带等等)，光存储(CD-ROM、光盘等等)，易失的和非易失性存储器设备(例如，EEPROM、ROM、PROM、RAM、DRAM、SRAM、程序包、可编程逻辑器件等等)。

在计算机可读介质中的代码是由处理器访问和执行的。其中优选实施例执行的代码可以进一步是经由传输介质或者可经网络从文件服务器访问的。在此情况下，其中实现代码的制造产品可以包括传输介质，诸如网络传输线、无线传输介质，经空间传播的信号、无线电波、红外信号等等传送。当然，那些本领域技术人员将理解，不脱离本发明的范围可以对这些结构进行很多的修改，而且制造产品可以包括在本领域已知的承载介质的任意信息。

在附图中示出的逻辑实施例描述了作为以特定的顺序发生的特定的操作。在供选择的实施例中，某些逻辑操作可以以不同的顺序实施、修改或者除去，并且仍然实现本发明的优选实施例。此外，步骤可以被添加给以上所述的逻辑过程，并且仍然符合本发明的实施例。此外，对于该权利要求，应该明白，可以为了本发明的目的组合在下面进行描述的任何一个权利要求。

上述的实施例和优点仅仅是示范性的，并且不应被理解为限制本发明。当前的教导可以容易地应用于其他类型的系统。本发明的描述意图是说明性的，而不是限制该权利要求的范围。对于那些本领域技术人员来说许多的替换、修改和变化将是显而易见的。因此，本发明不局限于在上文中详细描述那些明确的实施例。

去获取专利，查看全文>

相似文献

专利
中文文献
外文文献

1. 用于估算用于数字视频代码转换的运动矢量的系统和方法 [P] . 中国专利： CN100367801C . 2008.02.06
2. 用于估算用于数字视频代码转换的运动矢量的系统和方法 [P] . 中国专利： CN1622630A . 2005-06-01
3. METHOD AND MOTION ESTIMATION SYSTEM FOR OBTAINING A MOTION VECTOR, COMPUTER PROGRAM PRODUCT, AND METHOD AND SYSTEM FOR CONVERTING A FRAME OF DIGITAL VIDEO DATA [P] . 韩国专利： KR100648596B1 . 2006-11-23

机译：用于获得运动矢量，计算机程序产品的方法和运动估计系统以及用于转换数字视频数据的帧的方法和系统
4. CODE CONVERSION DEVICE FOR IMAGE INFORMATION, A CODE CONVERSION METHOD FOR THE IMAGE INFORMATION, A SYSTEM FOR PROVIDING IMAGE RELATED INFORMATION USING AN IMAGE CODE, A CODE CONVERSION PROGRAM FOR THE IMAGE INFORMATION, AND A RECORDING MEDIUM IN WHICH THE PROGRAM IS RECORDED [P] . 美国专利： US2015043814A1 . 2015-02-12

机译：用于图像信息的代码转换设备，用于图像信息的代码转换方法，用于使用图像代码提供图像相关信息的系统，用于图像信息的代码转换程序以及用于记录该程序的记录介质
5. Methods and transcoders that estimate an output macroblock and motion vector for video transcoding [P] . 美国专利： US7903731B2 . 2011-03-08

机译：估计用于视频代码转换的输出宏块和运动矢量的方法和代码转换器