首页> 中国专利> 一种任意形状区域分割的分形图像编解码方法

一种任意形状区域分割的分形图像编解码方法

摘要

本发明属于一种任意形状区域分割的分形图像编解码方法,所述的方法包括基于分形维数的粗分和基于区域增长的细分,在原始图像上以一定的距离散布尺寸为一个像素大小的值域种子,在紧缩图像上以一定的距离散布定义域种子,计算值域种子的分形维数和定义域种子的分形维数,存储区域面积就可实现对任意形状区域的轮廓编码,将增长后的区域面积量化为最小区域面积参数的整数倍,利用传统的熵编码算法以进一步提高编码效率,同时量化存储区域所有的变换系数,形成内容编码,最终获得压缩图像,从而避免了链码或区域边界地图等传统方法所带来的高冗余、低压缩比等弊端。

著录项

  • 公开/公告号CN1489114A

    专利类型发明专利

  • 公开/公告日2004-04-14

    原文格式PDF

  • 申请/专利权人 北京交通大学;

    申请/专利号CN03156749.5

  • 发明设计人 赵耀;孙运达;

    申请日2003-09-09

  • 分类号G06T9/00;

  • 代理机构11228 北京汇泽知识产权代理有限公司;

  • 代理人阎立德

  • 地址 100044 北京市海淀区西直门外上园村3号

  • 入库时间 2023-12-17 15:13:52

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2009-11-04

    专利权的终止(未缴年费专利权终止)

    专利权的终止(未缴年费专利权终止)

  • 2006-04-26

    授权

    授权

  • 2004-06-23

    实质审查的生效

    实质审查的生效

  • 2004-04-14

    公开

    公开

说明书

所属技术领域

本发明是一种任意形状区域分割的分形图像编解码方法。

背景技术

分形图像编码是近十年内发展起来的一种思路新颖的图像压缩方法,与其它较为成熟的压缩技术相比(如DPCM、DCT、VQ等),具有高压缩比、分辨率无关性等很多优点。它利用了数学中的不动点理论,试图用一个函数(族)来描述整幅图像,与以往的正交变换编码有着本质的区别;在解码时,通过对任意分辨率图像进行有限次的迭代变换,不管初始图像为何,都能收敛到解码图像。Bamsley和Sloan最早提出了这一思想,而1990年Jacquin设计出了第一个实用的基于方块划分的分形图像编码器,并引发了人们对这一领域浓厚的兴趣和广泛的关注。

在分形图像编码中,原始图像最终可划分为两类子块,即互不重叠的值域子块(编码单元)和允许有部分重叠的定义域子块,每一个编码单元都由某个定义域子块的变换获得最佳的近似,即近似误差(拼贴误差)最小化,存储或传输所有变换的系数(如比例因子、亮度平移、定义域子块的位置等)即完成对整幅图像的编码。如果使用固定长度码字量化这些系数,压缩图像的大小将基本上与编码单元的数目成正比。因此,研究人员的研究目的在于使编码单元尽量少、近似尽可能准确。其中,如何设计灵活的、与图像内容有关的分割策略,将原始图像划分为独立的编码单元是一项关键技术。

迄今为止,涌现出了一大批分形图像编码器。其中,Fisher的四象限树方案是经典的和比较成功的一种。它使用了可变大小的编码单元,能够随着图像块的复杂程度不断调整,使分割结果与图像内容有关,大幅度提高了解码图像质量。为了进一步增强分形编码器对图像内容的适应能力,人们相继提出了水平一竖直分割、三角分割、多边形分割、不规则形状分割一系列编码方案,具有更好的编码性能。

对分形图像编码而言,最简单最基本的分割策略就是均匀分割(如图1中a所示),即所有的编码单元都是k×k大小的正方形子块。子块大小一旦确定,均匀分割完全是与图像内容无关的,所以它很少单独用于编码方案中。长期以来,人们研究的重点是与图像内容有关的分割策略。对现有编码方案的现有分割策略归纳如下:

(1)规则形状类

这一类别囊括了所有具有规则形状编码单元的分形图像编码器。换句话说,在这一大类中,编码单元的大致形状事先是确知的,例如正方形、矩形或三角形等。

对于经典的四象限树方案(如图1中b所示),原始图像的分割过程是自顶而下的。树的初始层次(对应着编码单元的最大尺寸)确定之后,依据拼贴误差或图像块方差大小,任何一个满足分割准则的编码单元将被划分为四个象限子块,单独进行编码。另外一种自底而上的方式中,首先使用最小编码单元尺寸进行均匀分割,然后不断将满足条件的四个象限子块合并为一个大的编码单元,实现更有效的表达。

在Cai的方案中,他首先将原始图像划分为中等尺寸的编码单元,并使用一个均衡算法尽可能均衡所有编码单元的拼贴误差。通过合并低于平均拼贴误差的编码单元,同时分割高于平均拼贴误差的编码单元,使编码单元的总数保持不变,而拼贴误差的方差或总拼贴误差大大降低,从而获得准最优的分割。

水平一竖直分割(HV)(如图1中c所示)方案将图像划分为矩形编码单元。在拼贴误差准测下,如果某一编码单元找不到与之相匹配的定义域子块,就沿最明显的水平或竖直边缘将其划分为两个矩形子块。虽然存储分割信息需要付出较高的代价,HV分割仍然显示出了比四象限树方案更好的性能。

三角形分割可以通过几种不同的方法实现(如图1中d所示)。原始图像首先被划分为两个主三角形,如果需要,在某个已有三角形的每一边上各创建一个顶点,形成四个小三角形,即三边分割;或者在某个三角形的顶点和对边一点之间加入一条线段,形成两个小三角形,即单边分割;Delaunay三角化方法始于图像中的一组初始种子点,然后不断在方差过大的编码单元中插入新的种子点,形成三个小三角形。

多边形分割对图像内容具有更强的适应能力(如图1中e所示)。Reusens的方案类似于H-V分割,但包含了45度和135度的切分方向,他用拼贴误差作为分割准则,切分的方向和位置由基于方差的一致性测度决定。Davoine[11]也在Delaunay三角化的基础上提出了自己的方案,只要具有共同顶点的所有三角形灰度均值相近,就可以合并为一个大的多边形。

(2)不规则形状类

这一类别由称为“基于区域分割的分形图像编码器”(RBFC)构成。所有这些方案都采取了划分-合并的分割策略,从而生成了大量形状不可预知的编码单元,以期获得对图像内容的高度适应能力和更好的编码性能(如图1中f所示)。

Thomas和Deravi设计了具有启发式搜索的基于区域分割的分形图像编码器,并有复杂度不同的三种形式。在基本型中,他们从均匀分割中选择了一个编码单元作为种子,向四个主要方向迭代式增长,新加入的编码单元使用和种子相同的变换系数。同时为简便起见,定义域子块沿着与编码单元相同的方向增长。其它的两种形式涉及到更新过程和竞争策略。

Tanimoto、Ohyama和Kimoto也提出了一种有效的编码器。将原始图像均匀分割为互不重叠的基元块后,他们采取了两个步骤分别合并纹理基元块和平滑基元块。由于合并过程以一种特定的次序进行,编码单元的最终形状能够由构成区域的基元块数目唯一确定。

Chang,Shyu and Wang介绍了具有四象限树划分的基于区域分割的分形图像编码器。在四象限树划分之后,每一步都把合并后具有最小拼贴误差的一对区域予以合并,直到拼贴误差大于设定的阈值。他们还采用了Kanedo和Okudaris提出的分段链码记录区域轮廓。

Saupe和Ruhl将进化计算引入了分形图像编码。他们选择了N个个体作为祖先,每一个体都是一种分割方式和对应的分形码字。进化时随机合并两个相邻的区域,每一个体产生M(M>N)个子代。依据某种适应准测(如拼贴误差),从所有的N×M个子代中选出最好的N个作为下一代继续进化。随后,Ruhl、Hartenstein和Saupe改进了上述进化算法。他们应用了诸如特征向量最近邻搜索之类的成熟技术,并构造了一个优先级队列,从而加快了编码速度。

Breazu和Toderean的方案中提出了具有确定性搜索的基于区域分割的分形图像编码的思想。他们为每一编码单元构造一个具有N个定义域子块的列表。一旦两个编码单元合并为一个大的编码单元,就从这两个编码单元的2×N个扩展的定义域子块中选出N个最好的定义域子块。他们在每一步都把合并后具有最小拼贴误差的一对区域予以合并。整个编码过程始于均匀分割,直到获得规定数目的编码单元时结束,搜索过程具有确定性。

以上文献的实验结果表明,分割策略的优劣,在很大程度上决定了编解码器的性能。一般来讲,与图像内容有关的编码方法要优于图像内容无关的编码方法;而且对图像内容的适应能力越强,编码性能越好。

然而,现有方案的编码单元不外乎是直线段构成的多边形轮廓,这严重限制了压缩算法对图像内容的适应能力,制约了编解码器性能的提高。分析其内在原因,以往各种分裂、合并或两者相结合的分割策略不可能产生真正的任意形状区域;而且,现有轮廓编码技术用于任意形状区域时效率低下,缺乏对任意形状区域轮廓的有效表达。

发明内容

为此,本发明的目的是提出了一种任意形状区域分割的分形图像编解码方法,完全摒弃了分裂—合并的分割方法,而代之以由粗及细的两步骤,从而避免了链码或区域边界地图等传统方法所带来的高冗余、低压缩比等弊端。

本发明实现目的的方法是;所述的方法包括基于分形维数的粗分和基于区域增长的细分,有如下步骤:

(1)在原始图像上以一定的距离散布尺寸为一个像素大小的值域种子,对原始图像行、列降2采样或四个相邻像素的平均生成紧缩图像,在紧缩图像上以一定的距离散布定义域种子;

(2)分析每一个种子的生长环境,即在种子周围特定大小的正方形内,计算值域种子的分形维数和定义域种子的分形维数;

(3)对于每一个值域种子,选择和它的生长环境最相似,维数最接近的一定数量的定义域种子作为它的相似区域,所有值域种子和它们所对应的相似区域构成粗分结果;

(4)对粗分结果进一步的分割为基于区域增长的细分,从原始图像中取出一个值域种子,如果它所在的位置尚未被以前的值域种子增长到,种子有效,进行下一步,否则丢弃并处理下一个值域种子;

(5)从当前值域种子的相似区域中取出一个定义域种子,构成一个种子对,令一对种子共同增长,以A表示值域种子的增长区域,B表示定义域种子的增长区域,构造一个候选队列暂存所有等待被增长的像素,并用当前值域种子有效的8邻域像素初始化,根据一个伪随机数发生器的输出,不断的从候选队列中取出下一个像素,如果它尚未被当前值域种子增长过,则将其加入A中,将其有效的8邻域像素加入候选队列中,同时在紧缩图像中对应增长B,A和B要求至少增长到一个最小区域面积大小,如果拼贴误差大于设定的阈值或候选队列为空,增长结束;

(6)如果当前值域种子的相似区域中还有定义域种子,重复上一步,否则进行下一步;

(7)从当前值域种子各次增长得到的所有A中选择区域面积最大的一个,如果面积相同就选择拼贴误差较小的一个,作为当前值域种子对应的最佳编码单元,记录它所包含的像素;

(8)如果原始图像中还有值域种子,返回第4步,否则进行轮廓编码和内容编码;

(9)存储区域面积就可实现对任意形状区域的轮廓编码,将增长后的区域面积量化为最小区域面积参数的整数倍,利用传统的熵编码算法以进一步提高编码效率,同时量化存储区域所有的变换系数,形成内容编码,最终获得压缩图像;

(10)解码时,根据读出的区域面积再现每一个种子的增长过程,即可精确恢复任意形状的区域轮廓,在此基础上使用变换系数迭代任意的初始图像,生成区域内容,而对于原始图像中未能增长到的少量残余像素,由其邻域像素的线性预测器填充。

本发明的优点是:完全摒弃了分裂—合并的分割方法,而代之以由粗及细的两步骤,即基于分形维数的粗分和基于区域增长的细分。粗分时,使用分形维数度量图像的复杂程度,实现对编码单元的大致定位。细分时,通过种子的区域增长不断适应图像内容,最终生成任意形状的区域。分割完成后,只需要存储区域面积就可实现对任意形状区域的轮廓编码,从而避免了链码或区域边界地图等传统方法所带来的高冗余、低压缩比等弊端。本发明的方法使编码单元减少,区域内容信息减少,并且区域轮廓信息开销也不大,从而带来了更高的压缩比(低比特率);对图像内容适应能力的增强,极大改善了解码图像质量,减少了细节缺失和方块效应,视觉效果好,是一个灵活可靠、有实用价值的图像编解码方法。

附图说明

图1为传统的图像编解码方法分割图像示意图

图2为值域种子和定义域种子散布比较示意图

图3为本发明方法和传统的四象限树方法的性能比较示意图

图4为本发明方法的框架示意图

图5为本发明方法流程图

具体实施方案

如图4(a)所示,本发明基于任意形状区域分割的分形图像编解码方法由基于分形维数的粗分和基于区域增长的细分所构成。原始图像经过由粗及精的两步骤分割成为区域轮廓和区域内容两部分,轮廓编码形成轮廓码流,内容编码形成内容码流,并存储编码参数RSTEP、DSTEP、ENV_SIZE、MINA、S_BITS、O_BITS,最终生成压缩图像。

如图4(b)所示,解码时,根据读出的区域面积再现每一个种子的增长过程,即可精确恢复任意形状的区域轮廓。在此基础上,使用变换系数迭代任意的初始图像,生成区域内容。而对于原始图像中未能增长到的少量残余像素,由其邻域像素的线性预测器填充,没有额外的存储要求。

图4和图5所示,编码开始,在原始图像上以一定的距离散布尺寸为一个像素大小的值域种子;对原始图像行、列降2采样或四个相邻像素的平均生成紧缩图像,(如图2所示,a为原始图像中值域种子,b为紧缩图像中定义域种子)在紧缩图像上以一定的距离散布定义域种子;分析每一个种子的生长环境,即在种子周围特定大小的正方形内,计算值域种子的分形维数和定义域种子的分形维数;对于每一个值域种子,选择和它的生长环境最相似(维数最接近)的一定数量的定义域种子作为它的相似区域;即在原始图像上以RSTEP的距离散布尺寸为一个像素大小的值域种子Ri;对原始图像降2采样或四像素平均生成紧缩图像,在紧缩图像上以DSTEP的距离散布定义域种子Dj,(如图2所示);分析每一个种子的生长环境。即在种子周围ENV_SIZE×ENV_SIZE大小范围内,计算值域种子Ri的分形维数DimR(i)和定义域种子Dj的分形维数DimD(j);对于每一个值域种子Ri,选择和它的生长环境最相似(维数最接近)的DOM_NUM个定义域种子作为它的相似区域Rgn(i),

上式中,Rgn(i)为值域种子Ri的相似区域,DOM_NUM为每个相似区域中定义域种子的数量,DimR(i)为值域种子Ri的分形维数,DimD(j)为定义域种子Dj的分形维数。

对于值域种子之间的距离RSTEP,选取视用户对比特率和信噪比的要求而定。增大RSTEP,能够迅速降低编码比特率,但信噪比也大大降低,导致解码图像质量恶化,所以取值应在1-10之间。

对于定义域种子之间的距离DSTEP,其增大对比特率和编码速度的影响不明显,但会使信噪比略有降低,建议为1。

对于每个相似区域中定义域种子的数量DOM_NUM,选取视用户对编码速度的要求而定,DOM_NUM越小,编码速度越快,但信噪比也随之降低,建议大于10。

粗分结果为原始图像和紧缩图像之间的一系列具有相似生长环境的种子对构成。粗分的结果不够精确,不能直接用于图像压缩,还需要进一步的分割,所述的基于区域增长的细分是对原始图像中的值域种子依次重复下述步骤:检查当前值域种子是否完整,如果已经残缺,也就是在前面的值域种子增长的过程中已被增长到,则丢弃它,处理下一个值域种子;取出一个值域种子Ri

从Ri的相似区域Rgn(i)中取出一个定义域种子Dj,与Ri构成一个种子对并开始增长。用Ri的尚未被以前的值域种子增长过的8邻域像素初始化侯选队列,A表示值域种子增长中形成的区域,B表示定义域种子增长中形成的区域;用伪随机数发生器从侯选队列中取出伪随机数对应的像素P,若A当前轮廓的某8邻域像素P尚未被Ri之前的值域种子增长到,则将其加入A,同时对应增长B,将P未被以前的值域种子增长过的8邻域像素加入侯选队列;否则重新初始化;为了避免出现过多的残余像素,A和B至少应增长MINA个像素,即最小区域面积。此后,如果此时拼贴误差rms大于设定的阈值RMS_TO或候选队例为空,就结束增长,否则继续进行。

拼贴误差的公式为

                  rms=||A-(s·B+o·I||2

上式中,rms就是区域A和B之间拼贴误差的大小,s、o为A和B之间的变换参数,分别称为比例因子和亮度平移,I矩阵中元素全为1。

从Ri历次增长所得A中选择区域面积最大的一个作为最佳编码单元,存储相应的区域轮廓和区域内容信息,若面积相同选择拼贴误差较小的一个,作为值域种子Ri对应的最佳编码单元,记录它所包含的像素,如果原始图像中还有值域种子,返回细分。若所有值域种子处理完毕,则进行轮廓编码和内容编码;只需存储区域面积就可实现对任意形状区域的轮廓编码;将增长后的区域面积量化为最小区域面积参数的整数倍,利用传统的熵编码算法以进一步提高编码效率,同时量化存储区域所有的变换系数,形成内容编码,最终获得压缩图像;

解码时,根据读出的区域面积再现每一个种子的增长过程,即可精确恢复任意形状的区域轮廓。在此基础上,使用变换系数迭代任意的初始图像,生成区域内容。而对于原始图像中未能增长到的少量残余像素,由其邻域像素的线性预测器填充,没有额外的存储要求。

如图3所示,大量的实验结果表明,与以往大部分的同类方案相比,本发明无论是在压缩性能的客观量度上,还是恢复图像质量的主观评价上,都有了相当程度的提高。以四象限树方案为例,本发明(称为FS-RBFC)能够在高于10倍的压缩比时获得1.0-1.5dB的信噪比增益。FS-RBFC的比特率-信噪比曲线已经赶上甚至优于很多现有的分形方法(如图1所示)。

本发明编码单元减少,区域内容信息减少,并且区域轮廓信息开销也不大,从而带来了更高的压缩比(低比特率);对图像内容适应能力的增强,极大改善了解码图像质量,减少了细节缺失和方块效应,视觉效果好,是一个灵活可靠、有实用价值的编解码方法。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号