首页> 中国专利> 使用逆离散余弦变换调整图像大小的方法

使用逆离散余弦变换调整图像大小的方法

页面导航

摘要
著录项
法律信息
说明书
相似文献

摘要

提供了使用逆离散余弦变换(IDCT)调整图像大小的一种方法和设备。在宏块的编码类型经过转换以使宏块和原始源图像具有相同编码类型之后，使用逆离散余弦变换将原始源图像的宏块放大至任意尺寸。从而原始源图像总是在诸如数字广播接收机或HD－TV这样的数字视频设备中被自然地放大。

著录项

公开/公告号CN1501688A

专利类型发明专利
公开/公告日2004-06-02

原文格式PDF
申请/专利权人数码士有限公司;
展开▼

申请/专利号CN200310102592.X
发明设计人姜中庸;
展开▼

申请日2003-10-24
分类号H04N1/393;H04N1/41;H04N7/24;H04N7/30;
代理机构中原信达知识产权代理有限责任公司;
代理人陆弋
地址韩国京畿道
入库时间 2023-12-17 15:18:03

法律信息

法律状态公告日

法律状态信息

法律状态
2007-06-20

授权

授权
2004-08-11

实质审查的生效

实质审查的生效
2004-06-02

公开

公开

说明书

技术领域

本发明通常涉及一种使用逆离散余弦变换(IDCT)调整图像大小的方法，更特别但不作为限定地，涉及通过在使原始源图像和宏块的编码类型相同之后执行IDCT操作而将原始图像放大为任意分辨率的方法。

背景技术

通用的放大图像的方法是在空间频域使用离散余弦变换(DCT)处理图像。原始图像被分为二维图像块，例如8×8象素大小的图像块，并且在每一图像块上执行DCT操作以生成具有低和高空间频率成分的DCT系数块。

众所周知，由于原始图像中大部分能量通常集中在低空间频率，所以DCT和量化相结合使得许多频率成分为零，特别是高空间频率的系数。

一种利用该特征的常用方法将为零的行和列添加至DCT系数块中的高频区域，以将DCT系数块的尺寸增加至8×8的整数倍，例如16×16或24×24。对于尺寸得到增加的DCT系数块的反DCT操作得到放大的图像块。

因为算法相对简单并且不破坏放大的图像的质量，所以频域方法有望使调整图像大小更为普及。在例如1998年4月7日公开的专利号为5,737,019的美国专利、1999年7月25日公开的申请号为1999-64158的韩国专利申请和2001年6月15日公开的申请号为2001-49039的韩国专利申请中公开了用于在空间频域内调整图像大小的方法。

尽管在参考的专利和出版物中公开的方法显示了良好的结果，但是存在一个主要局限，即图像不能放大至任意尺寸并且只能放大至其原始尺寸的整数倍。而且，没有提到用于避免在图像被放大至任意尺寸后在放大的图像中可能的失真的恰当方案。

同时，在2002年10月17日提交的申请号为2002-63600的韩国专利申请中提出了一种新的调整图像大小的方法。图1描述了使用该方法的诸如图像比例放大器这样的调整图像大小的设备的结构。该设备包括离散余弦变换(DCT)单元10、零添加单元11、k系数倍增单元12、和逆离散余弦变换(IDCT)单元13。

DCT单元10将原始源图像分割为大小为M×N象素的宏块，并对于每一宏块执行DCT操作，以生成相应的DCT系数块。零添加单元11按照需要将为零的行和列添加到各DCT系数块内的高频区域。

k系数倍增单元12计算添加了零的DCT系数块的k系数，并将添加了零的DCT系数块的每一元素乘以该k系数。通过IDCT单元13对于乘以k系数的添加了零的DCT系数块进行IDCT操作，得到尺寸为P×Q象素的放大的图像块。

上述步骤使得图像被放大至任意分辨率而没有使得到的放大后的图像失真。

根据源内容，通过数字广播而接收或复制的来自诸如DVD这样的光盘的原始源图像可以编码为帧类型或域类型。例如，通过逐行扫描显示的电影被编码为帧类型，而通过隔行扫描显示的摄影图像被编码为域类型。

宏块是MPEG格式的基本图像单元，宏块的编码方式使得可以得到高压缩率，并且通过参考宏块内的视频数据而编码为帧类型或域类型。结果，宏块的编码类型往往不与原始源图像的编码类型一致，如图2和3所示。

当宏块在诸如机顶盒这样的数字广播接收机或诸如DVD播放器这样的光盘驱动器中得到放大时，放大的图像变得失真，除非宏块的编码类型与原始源图像的相同，下面结合附图详细进行解释。

在图4中，帧类型的原始图像得到放大，其中原始图像具有与8条白色水平线交替的8条黑色水平线，并且包含具有8条黑色水平线的经过离散余弦变换的奇域宏块以及具有8条白色水平线的经过离散余弦变换的偶域宏块。对于宏块的放大使得奇域宏块具有16条黑色水平线并且偶域宏块具有16条白色水平线。

如果放大的宏块合并入帧类型画面，则放大的图像包含与16条白色水平线相交替的16条黑色水平线，这不是放大所希望的。结果，如果放大的画面是通过逐行扫描机制显示的，则得到了完全不同的图像，其具有16条黑线而非8条黑线，这是一个问题。

在图5中，域类型的原始图像得到放大，其中原始图像具有与8条白色水平线交替的8条黑色水平线，并且包含经过离散余弦变换的帧类型宏块，每一帧类型宏块都具有与4条白色水平线相交替的4条黑色水平线。对于宏块的放大使得每一宏块都具有16条线，其中黑、灰、白和灰线以此顺序重复显示。如果这些放大的宏块合并入域类型画面，则放大的图像包含具有重复的黑、灰、白和灰线的32条水平线。结果，如果放大的画面是通过逐行扫描机制显示的，则奇域图像具有交替的黑色和白色线，并且偶域图像仅具有灰线，这与原始图像完全不同。

发明内容

本发明的一个目的是提供一种用于放大图像的方法和设备，能够克服现有技术的问题和局限。

本发明的另一个目的是提供一种方法和设备，用于通过使宏块的编码类型与原始图像的编码类型相同并且使用逆离散余弦变换放大宏块，而不导致失真地放大图像。

根据本发明的实施例的使用逆离散余弦变换(IDCT)调整图像大小的方法包括以下步骤：(a)检查原始源图像的编码类型和经过离散余弦变换的宏块的编码类型，(b)如果检查的两个编码类型不同则将宏块的编码类型转换为帧类型或域类型，和(c)使用逆离散余弦变换放大经过转换的宏块。

根据本发明的实施例的使用逆离散余弦变换(IDCT)调整图像大小的设备包括：检测单元，用于检测宏块的编码类型；转换单元，用于将宏块的编码类型转换为域类型或帧类型；控制单元，用于根据检测的宏块的编码类型和原始源图像的编码类型控制转换单元；和放大单元，用于使用逆离散余弦变换放大从转换单元接收的宏块。

从下面给出的具体描述可以更清楚地理解本发明的这些和其它目的。然而，应当理解，尽管详细说明和特定例子说明了发明的优选实施例，但是它们仅是作为描述性而给出的，对于本领域熟练技术人员可以理解，在不脱离本发明的精神和范围的前提下可以由该详细说明得到多种变化和改型。

附图说明

附图用于提供对于本发明的进一步理解，附图说明了本发明的优选实施例，并且与说明书一起用于解释本发明的原理。

在附图中：

图1说明了使用IDCT的通用的调整图像大小的设备的结构；

图2说明了通用的域类型宏块；

图3说明了通用的帧类型宏块；

图4说明了一个例子，其中以不正常方式放大了域类型宏块；

图5说明了一个例子，其中以不正常方式放大了帧类型宏块；

图6说明了数字广播接收机的框图，其中本发明在该数字广播接收机中方便地实施；

图7-9说明了本发明的优选实施例搜索的信息；

图10-11说明了几个例子，其中域类型和帧类型宏块根据本发明而正常地放大；和

图12说明了光盘驱动器的框图，其中方便地实施了本发明。

具体实施方式

为了更好地理解本发明，参考附图说明本发明的优选实施例。

图6说明了数字广播接收机的框图，其中本发明在该数字广播接收机中实施。数字广播接收机包括调谐器30、去复用器31、音频缓冲器32、视频缓冲器33、数据缓冲器34和解码器36，其中解码器36包括上面参考图1解释的零添加单元11、k系数倍增单元12和IDCT单元13。

数字广播接收机进一步包含宏块类型转换单元35和宏块类型检测单元37。宏块类型转换单元35将由去复用器31输出后暂时存储在视频缓冲器33中的源图像的宏块的编码类型从帧类型转换为域类型或从域类型转换为帧类型。宏块类型检测单元37检测宏块的编码类型。

而且，数字广播接收机进一步包括控制单元38，其使用与视频缓冲器34中暂时存储的视频数据有关的信息来检查源图像的编码类型，比较源图像的编码类型和宏块类型检测单元37检测的宏块的编码类型，并控制宏块类型转换单元35的操作，以使宏块的编码类型与源图像的一致。数字广播接收机的所有部件都操作连接。

假设以传送服务(TS)形式传输的数字广播流被调谐器30接收，并由去复用器31作为分组单元流(PES)而处理并输出。在这种情况中，控制单元38扫描progressive_frame域的画面编码扩展信息，以确定接收的数字广播的源图像的编码类型，如图7所示。

例如，如果接收的TS的画面编码扩展信息中的1比特progressive_frame域被设置为“1”，则确定源图像是帧类型编码的。如果画面编码扩展信息中的1比特progressive_frame域被设置为“0”且接收的TS的顺序扩展信息的progressive_sequence域为“1”，则确定源图像也是帧类型编码的，如图8所示。

即使对于帧类型的源图像，progressive_sequence域的值也不总是被设置为“1”。于是控制单元38检查画面编码扩展信息中的picture_structure域的值。

因为在现实中假定隔行显示，所以可以传送帧类型的图像，并且相关的信息被设置为好像图像是域类型的。电影内容是代表性的帧类型图像，它需要通过2∶3的下拉处理。这种2∶3下拉的图像有时具有如域类型而设置的相关信息。但是，通过检查画面编码扩展信息中的top_field_first和repeat_first_field域可以容易地确认准确的编码类型。

如图9所示，宏块类型检测单元37通过检查宏块头中包含的dct_type域而确认宏块的编码类型。例如，如果1比特的dct_type域被设置为“1”，则相应的宏块被作为域类型而进行离散余弦变换。如果不是，则相应的宏块作为帧类型而进行离散余弦变换。在另一例子中，宏块类型检测单元37可以包括在控制单元38中。

宏块类型转换单元35在控制单元38控制下，在转换了宏块的编码类型或保持原始编码类型不变之后，将通过视频缓冲器33接收的宏块输出至解码器36。

解码器36使用零添加单元11、k系数倍增单元12和IDCT单元13将输入宏块的大小调整为任意分辨率。下面详细说明该图像大小调整操作。

在从去复用器31接收的数据是如图10所示的帧类型画面的情况下，如上面参考图7和8解释的，控制单元38通过检查progressive_frame、progressive_sequence和picture_structure信息，发现输入的图像是帧类型画面。

如图10所示，由宏块类型转换单元35接收的宏块或者是帧类型宏块或者是域类型宏块。如果宏块类型检测单元37将1比特的dct_type域证实为“1”，则控制单元38发现相应的宏块被作为帧类型而得到离散余弦变换。

如果源画面和宏块都是帧类型的，则宏块类型转换单元35不进行转换操作而将宏块输出至解码器36，该操作由控制单元38管理。

如果宏块类型检测单元37将1比特的dct_type域证实为“0”，则控制单元38发现相应的宏块被作为域类型而得到离散余弦变换，这说明源图像和相应宏块具有不同的编码类型。在这种情况下，控制单元38通过令宏块类型转换单元35将宏块的编码类型转换为帧类型，而使得宏块的编码类型与源图像的一致。

结果，具有与8条白色水平线交替的8条黑色水平线的帧类型原始图像成为由经过离散余弦变换的宏块构成，每一宏块具有与4条白色水平线交替的4条黑色水平线，如图10所示。解码器36将这些宏块放大为每一个都具有16条线的宏块，其中黑、灰、白和灰线以此顺序重复显示。

如果经放大的宏块合并入帧类型画面，则经放大的画面包含具有重复的黑、灰、白和灰线的32条水平线。结果，如果经放大的画面以逐行扫描机制显示，则得到自然放大的图像。

另一方面，在从去复用器31接收的数据是如图11所示的域类型画面的情况下，如上面参考图7和8所解释的，控制单元38通过检查progressive_frame、progressive_sequence和picture_structure信息而发现输入的画面是奇域还是偶域画面。

如图11所示，宏块类型转换单元35接收的宏块或者是帧类型宏块或者是域类型宏块。如果宏块类型检测单元37将1比特的dct_type域证实为“0”，则控制单元38发现相应的宏块被作为域类型而得到离散余弦变换。

如果源画面和宏块都是域类型，则宏块类型转换单元35不进行转换操作而将宏块输出至解码器36，该操作由控制单元38管理。

如果宏块类型检测单元37将1比特的dct_type域证实为“1”，则控制单元38发现相应的宏块被作为帧类型而得到离散余弦变换，这说明源图像和相应宏块具有不同的编码类型。在这种情况下，控制单元38通过令宏块类型转换单元35将宏块的编码类型转换为域类型，而使得宏块的编码类型与源图像的一致。

结果，具有与8条白色水平线交替的8条黑色水平线的帧类型原始图像成为由经过离散余弦变换的宏块构成，每一宏块具有8条黑色水平线或者8条白色水平线，如图11所示。解码器36将这些宏块放大为具有16条黑色水平线或16条白色水平线的宏块。

如果经放大的宏块合并入域类型画面，则合并的经放大的画面包含与16条白色水平线相交替的16条黑色水平线。结果，如果经放大的画面以隔行扫描机制显示，则奇域显示黑线，偶域显示白线，从而呈现自然放大的图像。

图12显示的是诸如DVD播放器这样的光盘装置的框图。光盘装置包括光拾取器51、数字信号处理单元52、分析器53、音频缓冲器54、视频缓冲器55、数据缓冲器56和解码器58，解码器58包括零添加单元11、k系数倍增单元12和IDCT单元13。

光盘装置进一步包括宏块类型转换单元57、宏块类型检测单元59和控制单元60。光盘装置的所有部件都操作相连。

参考图12，光拾取器51读取在光盘50(或其它记录介质)上记录的信号，并且数字信号处理单元52处理从光拾取器51接收的信号以生成节目流(PS)。

分析其53将节目流转换为分组包基本流(PES)并从分组包基本流中分离视频、音频和数据。视频、音频和数据被分别提供至视频缓冲器54、音频缓冲器55和数据缓冲器56。

控制单元60检查progressive_frame、progressive_sequence和picture_structure信息，以如上所述确定在光盘50上保存的源图像的编码类型，信息是从光盘50复制的。

如上所述，宏块类型检测单元57通过检查在宏块头中包含的dct_type域而确认宏块的编码类型。

如上所述，宏块类型转换单元55在转换了宏块的编码类型或者保持原始编码类型不变之后，将通过视频缓冲器53接收的宏块输出至解码器58。

解码器58使用零添加单元11、k系数倍增单元12和IDCT单元13将输入的宏块大小调整为任意分辨率。如上面参考图10和11所述，宏块类型转换单元57令宏块的编码类型与原始图像的编码类型一致，从而生成由离散余弦变换而正常放大的图像。

尽管参考有限的实施例公开了本发明，但是对于本领域熟练技术人员可以认识到由此可以得到多种改动和变化。应当认为，所附权利要求含该落在本发明的真正精神和范围内的所有这样的改动和变化。

去获取专利，查看全文>

相似文献

专利
中文文献
外文文献

1. 使用逆离散余弦变换调整图像大小的方法 [P] . 中国专利： CN1322737C . 2007.06.20
2. 利用离散余弦变换调整图像大小的方法及装置 [P] . 中国专利： CN101039431A . 2007-09-19
3. Method for resizing images using the inverse discrete cosine transform [P] . 欧洲知识产权局专利： EP2239704B1 . 2011-12-28

机译：使用逆离散余弦变换来调整图像大小的方法
4. Method for resizing images using the inverse discrete cosine transform [P] . 欧洲知识产权局专利： EP2239704A1 . 2010-10-13

机译：使用逆离散余弦变换来调整图像大小的方法
5. Method for resizing an image using the inverse discrete cosine transform [P] . 美国专利： US7421152B2 . 2008-09-02

机译：使用逆离散余弦变换来调整图像大小的方法