首页> 中国专利> 用于分割压缩的活动图像的活动对象的方法

用于分割压缩的活动图像的活动对象的方法

页面导航

摘要
著录项
法律信息
说明书
相似文献

摘要

一种用于对压缩的活动图像编码的方法，其包括从压缩的活动图像中分割局部运动块，处理局部运动块的外部块，从处理的外部块恢复局部运动块的最终轮廓，并且恢复最终轮廓内的颜色。

著录项

公开/公告号CN1592420A

专利类型发明专利
公开/公告日2005-03-09

原文格式PDF
申请/专利权人 LG电子株式会社;
展开▼

申请/专利号CN200410064452.2
发明设计人金真熙;
展开▼

申请日2004-08-26
分类号H04N7/30;
代理机构11219 中原信达知识产权代理有限责任公司;
代理人樊卫民;袁炳泽
地址韩国汉城
入库时间 2023-12-17 15:55:48

法律信息

法律状态公告日

法律状态信息

法律状态
2018-08-17

未缴年费专利权终止 IPC(主分类):H04N7/26 授权公告日:20070516 终止日期:20170826 申请日:20040826

专利权的终止
2007-05-16

授权

授权
2005-05-11

实质审查的生效

实质审查的生效
2005-03-09

公开

公开

说明书

技术领域

本发明涉及对压缩的移动图像的编码，并且具体的说涉及分割压缩的活动图像的活动对象和根据运动图象专家组4(MPEG-4)标准对压缩的活动图像进行转换和编码。

背景技术

通常，多媒体数据具有大容量但是在通信带宽上受限。因此，使用数据压缩来发送/接收多媒体数据。数据压缩意味着采用用于以较小尺寸表示信息的方法，并且恢复意味着采用用于解压数据的方法。

MPEG-4标准是为多媒体通信创建的基于内容的编码压缩方法。另外，因为MPEG-4具有高压缩效率并且以非常低的比特速率发送数据，所以移动多媒体应用使用MPEG-4。此外，使用MPEG-4来发送或存储大容量数字音频/视频数据。但是，MPEG-4标准仍然处于起步阶段。

基于对象的编码是MPEG-4的一个特性。基于对象的编码处理分割对象，并且分配一些比特给较为重要的对象，由此高效地压缩视频数据。

现有的压缩/解压方法恢复整个图像，并且组合运动信息和颜色及亮度信息。但是，解压整个图像需要很长时间。另外，处理整个图像需要的计算量被不利地增加了。

发明内容

因此，本发明的一个目的是解决上述问题和其它的问题。

本发明的另一目的是自动分割压缩的活动图像的活动对象，从而使用MPEG-4对压缩的活动图像进行转换和编码。

为了这些这些和其它优点并与本发明的目的一致，如在这里体现和广泛地描述的，本发明提供了一种用于分割压缩的活动图像的活动对象的新颖方法，其包括从压缩的活动图像分割出局部运动块，处理该局部运动块的外部块，从该处理的外部块确定该局部运动块的最终轮廓并且恢复该最终轮廓内的颜色。

本发明的其它优点、目的和特征将在随后的说明中部分地描述，经过以下检验或从本发明的实践中学习，上述优点、目的和特征对于本领域的普通技术人员来说是显而易见的。本发明的目的和优点可以如所附权利要求书中所特别指出的来实现和获得。

附图说明：

将参考附图详细描述本发明，在附图中相似的数字表示相似的元素，其中：

图1是一流程图，示出了用于根据本发明分割压缩的活动图像的活动对象的方法；

图2是一总体视图，示出了由图1的方法处理的图像；

图3是一详细流程图，示出了用于根据本发明分割压缩的活动图像的活动对象的方法；

图4是一总体视图，示出了在根据本发明的多个块之间的连接。

具体实施方式

下面将详细描述本发明的优选实施例，在附图中示出了其实例。

图像的对象分割信息，即，在不同对象之间的边界表面或对象轮廓的信息可以产生三维模型表示单元。根据在对象之间的同质性或异质性来分割图像的对象可以从该图像中获得目标对象。另外，可以对包括多种信息的活动图像编码。例如，可以合成多种对象-单元多媒体元素来组成活动图像。

根据本发明，首先以特定间隔使用帧的运动向量来确定活动对象的轮廓，并且之后对部分运动块解码。

更为详细地说，图1是一流程图，示出了用于根据本发明分割压缩的活动图像的活动对象的方法。如图所示，分割局部运动块(步骤S10)，处理外部块(步骤S20)，确定最终轮廓(步骤S30)，并且恢复在最终轮廓内的颜色(步骤S40)。图3更详细地示出了这些特征。

现在转到图2，其示出了由图1的方法处理的图像。

如图2所示，通过在一图像中将预先确定尺寸的运动区域分割为局部运动块来形成第一图像10，其中通过从压缩的活动图像解码特定帧来获得该图像。随着分割该运动区域的开始，分割出无运动的背景块和活动的人物(对象)块。

之后，通过从该局部运动块中提取外部块而获得第二图像20。根据外部块处理指定多个外部块之间的连接，比如垂直的、水平的、上右下左对角的、以及上左下右对角的连接。结果，以阶梯的形状显示外部块。第三图像30是从外部块提取的轮廓。该轮廓指示人物(对象)的形状。

第四图像40是最终对象，即，通过恢复轮廓内的颜色获得的目标活动对象。该人物实际上除了无运动的背景以外从第一图像中提取出来的。

接下来，图3是一详细流程图，示出了用于根据本发明分割压缩的活动图像的活动对象的方法。

如图所示，通过以特定间隔来解码帧的方式，从压缩的活动图像提取运动向量(S100)。之后，通过对提取的运动向量进行预处理和照相机运动补偿处理来提取运动区域(S110)。

预处理过程限制了过度分割并且使用例如高斯滤波或由Perona和Malik提出的各向异性扩散来平滑图像，以减少噪声。高斯滤波是用于平滑图像以减少噪声的预处理过程。但是，高斯滤波还平滑边沿，使得可以移去边沿或改变它的位置。Perona和Malik的各向异性扩散平滑内部区域并且移去噪声而不平滑边沿。补偿过程区分照相机的运动与对象的运动，以改进向量的可靠性。

另外，将预先确定尺寸的运动区域确定为局部运动块(S120)并且提取该局部运动块的外部块(S130)。此外，恢复提取的外部块的原始图像并且描述多个块之间的连接(S140)。这里，将连接描述为链条形式的垂直的、水平的、上右下左对角的和上左下右对角的连接。

使用链条链接组合多个块并设置多个外部块之间的连接，并且提取对应于连接方向的边缘。实质上通过外部块处理来显示对象的形状。

为了描述在多个块之间的连接，检查和相应块相邻的八个块的连接方向。如果如图4所示的外部运动块存在，则通过组合四个比特值来描述每个块的连接信息。

如果相邻块的数量和方向大于二，则可以通过比特组合来设置多个块连接方向。仅使用所描述的信息来检测相应块在所描述方向上的边缘。例如，当多个块之间的连接是0×06(00000110)时，意味着该块和相邻的块在垂直和上右下左对角方向上连接。当检测到块内的边缘时，仅在垂直和上右下左对角方向上提取该边缘。

根据在多个外部块之间的连接来提取对应于多个块的连接方向的方向边缘(directional edge)(S150)。之后通过选择提取的边缘作为ACM(主动轮廓模型)理论的起始点并且对对象轮廓做ACM逼近(ACM-approximating)来确定最终轮廓(S160)。通过以解码最终轮廓内的块来恢复最终轮廓内的颜色，确定并分割具有完整形状和颜色的活动对象(S170)。

ACM被称为蛇形模型，因为它的搜索形状类似于蛇的运动。它是可以跟踪对象的轮廓的可变形模型。此外，ACM是平衡内部力和外部力的能量函数类型，并且使用公式将对象的轮廓显示为一组表示图像的轮廓的点。在起始阶段预先指定搜索区域。

因此，根据本发明，通过分割活动对象和通过以特定间隔解码帧中的运动向量以及通过处理部分获得的块的图像，该用于分割压缩的活动图像的活动对象的方法减少了对象分割时间。

此外，对于提取边缘以选择ACM起始点，在多个块的连接方向上提取方向边缘，从而改进了对象轮廓提取的精确性。

对于计算机领域的普通技术人员来说很明显，可以使用通用数字计算机或根据本说明书的教导而编程的微处理器来实现本发明。对于软件领域的普通技术人员来说很明显，根据本公开的教导，熟练的编程者可以很容易的制备合适的软件编码。

对于本领域的普通技术人员来说很明显，还可以通过制备特定用途集成电路或通过互联现有组成电路的合适网络来实现本发明。本发明包括计算机程序产品，该计算机程序产品是包括用于对计算机编程以执行本发明的处理的指令的存储介质。该存储介质可以包括(但是不限于)任意类型的盘，包括软盘、光盘、CD-ROM以及磁-光盘、ROM、RAM、EPROM、EEPROM、磁或光卡，或任意类型的适于存储电子指令的介质。

前述实施例和优点仅是示例性的并且不是限制本发明。本教导可以很容易的应用到其它类型的设备。本发明的说明只是示意性的，并且不限制权利要求的范围。对于本领域普通技术人员来说很明显可以有很多替代、修改和变更。

去获取专利，查看全文>

相似文献

专利
中文文献
外文文献

1. 用于分割压缩的活动图像的活动对象的方法 [P] . 中国专利： CN1316828C . 2007.05.16
2. 用于移动设备的活动图像压缩方法 [P] . 中国专利： CN101141638A . 2008-03-12
3. SYSTEM FOR REPRODUCING A MOVING PICTURES FILE AND PROVIDING A MOVING PICTURES INFORMATION SERVICE FOR OPENING THE MOVING PICTURES FILE TO OTHER BUSINESS PERSON AND SUPPLYING THE MOVING PICTURES INFORMATION SERVICE IN VARIOUS PLATFORMS [P] . 韩国专利： KR20130015436A . 2013-02-14

机译：用于复制活动图像文件并提供活动图像信息服务以向其他业务人员打开活动图像文件并在各种平台中提供活动图像信息服务的系统
4. METHOD FOR PRODUCING MOVING PICTURE CONTENT USING SCREEN CAPTURE CAPABLE OF CAPTURING A SCREEN AND TRANSMITTING A COMPRESSED MOVING PICTURE BY A WIRED/WIRELESS COMMUNICATION NETWORK IN REAL TIME AND A DEVICE THEREOF [P] . 韩国专利： KR20120032084A . 2012-04-05

机译：利用能够捕捉屏幕的画面捕捉来生产活动图像内容并通过有线/无线通信网络实时传输压缩的活动图像的方法及其装置
5. MOVING IMAGE DISTRIBUTION SYSTEM FOR LIVE DISTRIBUTION OF MOVING IMAGE INCLUDING ANIMATION OF CHARACTER OBJECT GENERATED ON THE BASIS OF MOTION OF ACTOR [P] . 日本专利： JP2019205176A . 2019-11-28

机译：活动图像实时分发的活动图像分发系统，包括基于角色移动生成的角色对象动画