首页> 中国专利> 基于全局流形原型聚类算法与分水岭算法的图像分割方法

基于全局流形原型聚类算法与分水岭算法的图像分割方法

摘要

本发明公开一种基于全局流形原型聚类算法与分水岭算法的SAR图像分割方法,主要解决现有聚类分割方法计算量大和分割结果不稳定的问题。其实现步骤为:(1)设定终止条件,给运行参数;(2)输入待分割图像,对其进行粗分割;(3)提取粗分割后得到的图像块的特征;(4)以图像块的特征为待处理数据,选取初始聚类中心;(5)计算任意两个待处理数据点间的流形距离;(6)以待处理数据间的流形距离作为相似性度量对待处理数据进行聚类;(7)更新聚类中心;(8)判断是否达到终止条件,未达到则返回步骤(6),否则,输出分割结果图。本发明具有用时短,分割结果准确、稳定的优点,可用于图像增强、模式识别、目标跟踪等技术领域中。

著录项

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2018-01-26

    未缴年费专利权终止 IPC(主分类):G06T7/00 授权公告日:20110824 终止日期:20161211 申请日:20091211

    专利权的终止

  • 2011-08-24

    授权

    授权

  • 2010-07-07

    实质审查的生效 IPC(主分类):G06T7/00 申请日:20091211

    实质审查的生效

  • 2010-05-19

    公开

    公开

说明书

技术领域

本发明属于图像处理技术领域,涉及图像分割,可用于图像增强、模式识别、目标跟踪等技术领域中。

背景技术

图像分割是图像处理过程中的一个重要步骤。图像分割的任务是将输入图像分割为一些独立的区域,使同一区域具有相同的属性,而使不同的区域具有不同的属性。对于图像分割问题,研究者已经提出了很多方法,但是鉴于图像种类多、数据量大、变化多端的特点,迄今为止还没有一种图像分割的方法适合于所有的情况。数据聚类作为一种图像分割的手段,得到了广泛的应用。

聚类作为一种重要的数据分析方法已在许多领域被广泛关注,它是按照一定的要求和规律对数据进行区分和分类的过程。目前的聚类算法多采取欧式距离作为相似性度量,并以随机选取的方法对聚类中心进行初始化,这就导致了两个限制其性能的主要缺点:

其一是欧氏距离只对空间分布为球形或超球体的数据具有较好的性能,而对空间分布复杂的数据聚类效果很差,这是基于欧氏距离的相似性度量的缺陷导致的必然结果。然而,现实世界中的聚类问题,数据的分布往往具有欧式距离无法反映的复杂结构。一些研究者将流形距离引入聚类来解决这个问题,比如:Maoguo Gong等人提出了一种密度敏感的流形距离作为聚类的相似性度量,参见Maoguo Gong,Licheng Jiao,Ling Wang,Liefeng Bo,“Density-Sensitive Evolutionary Clustering,”In:Proceedings of the 11th Pacific-Asia Conference on Knowledge Discovery and DataMining,PAKDD07.Springer-Verlag,Lecture Notes in Computer Science,LNAI 4426,pp.507-514,2007。然而,要用图论中的最短路径来计算流形距离,其计算复杂度要明显高于欧式距离的计算复杂度。随着数据集规模的增加,这个弊端尤为明显,便更无法应用于诸如图像处理等大规模聚类问题。

其二是在传统聚类方法中,如果初始化的时候多采用随机选取的方式确定初始聚类中心,就很有可能对聚类结果的准确性造成较大的影响。为了降低聚类算法对于初始聚类中心的敏感性,Sheikh,R.H.等人将进化算法加入到聚类过程中,参见Sheikh,R.H.,Raghuwanshi,M.M.,Jaiswal,A.N.,“Genetic Algorithm Based Clustering:A Survey,”Emerging Trends in Engineering and Technology,ICETET′08.FirstInternational Conference on 16-18 July 2008,pp.314-319,2008。进化算法是一种并行的搜索技术,可以解决传统聚类方法对初始聚类中心敏感的缺点,并且提高其收敛到全局最优解的概率。也有一部分学者对于聚类算法初始值选取作了研究,参见Zhang,Chen,Xia,Shixiong,“K-means Clustering Algorithm with Improved InitialCenter,”IEEE Knowledge Discovery and Data Mining,Second International Workshopon 23-25 Jan.2009 pp.790-792,2009。但是,进化算法作为一种搜索算法,在对解进行优化的过程中容易受到局部最优解的干扰而出错。

由于上述传统聚类算法存在的缺点对聚类性能有很大的影响,限制了聚类算法在图像分割方面的应用,因此,研究一种行之有效的图像分割方法是本技术领域科技人员的当务之急。

发明内容

本发明的目的在于克服上述已有技术的不足,提出一种基于全局流形原型聚类算法与分水岭算法的图像分割方法,以实现在图像分割中既能得到良好的结果,又能降低传统聚类分割方法对初始聚类中心的敏感度,使得图像聚类分割结果更稳定、边缘更平滑、区域一致性更好。

本发明的技术方案是将流形距离引入聚类算法中以达到更好的聚类性能,并针对图像处理此类大规模问题设计了先粗分,再细分的分割方法,提出了基于原型的聚类方法解决流形距离计算复杂度高的问题,以图像的离散小波变换子带能量为聚类数据,得到新的图像分割方法。其具体实现过程如下:

(1)设定聚类终止条件e为10-10,给定分水岭标记阈值T、流形距离伸缩因子ρ运行参数;

(2)输入待分割图像,使用标记分水岭算法对其进行粗分割;

(3)提取待分割图像离散小波三层变换的子带能量,作为待分割图像的特征向量,并将粗分割图像中每个图像小块内点的小波特征中值作为该图像块的特征;

(4)以图像块的特征为待处理数据,依次选取令聚类误差最小的K个待处理数据点作为初始聚类中心,K为聚类类数;

(5)计算任意两个待处理数据点间的流形距离;

(6)以待处理数据间的流形距离作为相似性度量对待处理数据进行聚类;

(7)将每类中的所有待处理数据点分别作为该类的聚类中心,计算类内距离和,选取使类内距离和最小的待处理数据点,作为该类新的聚类中心;

(8)将当前新的聚类与上次聚类相比,求取聚类误差的变化率,若该变化率未达到聚类终止条件e,返回步骤(6),否则,将当前次聚类结果作为最终聚类结果,进行步骤(9);

(9)由待处理数据的最终聚类结果得到待分割图像的分割结果,并将分割结果图输出。

本发明与现有的技术相比具有以下优点:

1、本发明由于采用分水岭算法对图像进行粗分割,再使用聚类算法细分割,降低了计算量;

2、本发明由于采用以图像块的特征为待处理数据,依次选取令聚类误差最小的K个待处理数据点作为初始聚类中心,由此选出的初始聚类中心具有全局特性,因而克服了传统聚类算法的初始化敏感问题,提升了聚类算法的稳定性和聚类性能;

3、本发明由于引入流形距离作为聚类算法的相似性度量,更准确的反映出数据的分布特点,并设计了相应的聚类中心更新规则,缩减了计算量。

附图说明

图1是本发明实现步骤的流程框图;

图2是本发明更新聚类中心的子流程框图;

图3是流形距离与欧式距离的示意图;

图4是350×350的待分割SAR图像;

图5是用本发明方法对图4进行图像分割得到的仿真实验结果图;

图6是用现有遗传聚类算法对图4进行图像分割得到的仿真实验结果图;

图7是用现有K均值算法对图4进行图像分割得到的仿真实验结果图。

具体实施方式

参照图1,本发明的具体实现步骤如下:

步骤1、给定运行参数,设定算法终止条件。

所述的运行参数包括:聚类类数K、聚类终止条件e、分水岭标记阈值T和流形距离伸缩因子ρ。其中:

聚类类数K需要依据具体处理的图像而定,参考待分割图像的特点,期望将其分割为多少类,K便设为多少。

聚类终止条件e采用在连续两次迭代中聚类误差都没有明显改善时终止的方法,e设为10-10

分水岭标记阈值T决定了分水岭变换后的粗分割图像块个数,太小会导致过分割,太大则分割不精确,这里取为6。

流形距离伸缩因子ρ用来控制数据点的疏密程度,使距离近的数据点彼此更接近,距离远的数据点彼此更疏远,根据图像数据特点,ρ设为3。

步骤2、对图像使用标记分水岭算法进行粗分割。

标记分水岭算法是一种基于内外标记的形态学分割算法,按如下步骤进行:

2a)对待分割图像进行中值滤波和形态学开-闭滤波;

2b)求滤波后待分割图像的梯度图;

2c)选取滤波后待分割图像的内部标记:寻找滤波后图像的局部最小值区域,局部最小值区域是指灰度值在一个灰度范围内,即在阈值T内的连续区域,且此区域附近的像素灰度值均大于这个区域内的像素灰度值;

2d)选取滤波后待分割图像的外部标记:本发明所选取的外部标记是内部标记的分水岭变换;

2e)修正滤波后待分割图像的梯度:利用强制最小技术,对滤波后图像梯度图的值进行修正,忽略梯度图上与内部标记不重合的局部最小值,使梯度图上的局部最小区域仅出现在内部标记位置上;

2f)对修正后的梯度图进行分水岭变换,得到待分割图像的粗分割结果。

步骤3、提取待分割图像粗分割后的特征。

首先,提取待分割图像离散小波三层变换的子带能量f,作为待分割图像像素点的特征向量{f1,f2,...,ft},t表示特征向量的维数,本实例为离散小波三层变换,故t=10,子带能量为:

f=1MNΣi=1MΣj=1N|x(i,j)|---(1)

其中,M×N为子带大小,(i,j)表示子带系数的索引,x(i,j)表示该子带中第i行第j列的系数值。

然后,求粗分割图像中每个图像小块内像素点的特征向量中值,将其作为该图像块的特征向量。

步骤4、以图像块的特征为待处理数据,依次选取令聚类误差最小的K个待处理数据点作为初始聚类中心。

4a)由一类聚类c=1,c≤K开始,从数据集X={x1,...,xN}中选择与该数据集的中心最接近的数据点xi1,作为一类初始聚类中心,其中N为样本个数;

4b)对c值加1,将N个数据点序列(xi1,xi2,...,xi(c-1),xi),i=1,2,...,N分别作为c类聚类的初始聚类中心,计算聚类误差Ei的上限Ei≤E-bi,其中E是c类聚类的聚类误差,bi用来测量聚类误差下降量,bi=Σj=1Nmax(dc-1j-||xi-xj||2,0),dc-1j为数据点xj与其所属的聚类中心的距离平方,选取使Ei最小、或使bi最大的数据点xic作为新聚类的初始化中心,并将其与c-1类聚类的初始聚类中心合并,得到c类聚类的最优初始聚类中心(xi1,xi2,...,xi(c-1),xic);

4c)判断c与K是否相等,若相等,将数据点序列(xi1,xi2,...,xi(c-1),xic)作为所求K类聚类的初始聚类中心,否则,返回步骤4b)。

步骤5、计算任意两点间的流形距离。

5a)计算数据点对xi与xj间的欧氏距离ED(xi,xj),以图3为例,数据点对a与e间的欧式距离ED(a,e)=ae,ae为a与e间的线段长度;

5b)计算数据点对xi与xj间流形上的线段长度L(xi,xj)=ρED(xi,xj)-1,其中,ED(xi,xj)为xi与xj之间的欧氏距离,ρ>1为伸缩因子;

5c)按下式计算数据点对xi与xj间的流形距离:

D(xi,xj)=minpPi,jΣk=1l-1L(pk,pk+1)---(2)

p={p1,p2,…,pl}∈V表示加权无向图G=(V,E)上的一条连接点p1与pl的路径,V为G的顶点集合,V={x1,...,xN},i=1,2,...,N,E={Wij}为G的边集合,表示每一对数据点间的流形上的线段长度,(pk,pk+1)是连接点pk与pk+1的边,(pk,pk+1)∈E,1≤k<l-1,Pi,j表示连接数据点xi与xj的所有路径的集合。

流形距离可以测量沿着流形上的最短路径,使位于同一流形上的两点可以用许多较短的边相连接,而位于不同流形上的两点要用较长的边相连接,实现放大位于不同流形上的数据点间的距离,缩短位于同一流形上的数据点间的距离的目的。以图3为例,数据点对a与e间的流形距离D(a,e)=ab+bc+cd+de。

步骤6、将待处理数据以流形距离进行聚类。

待处理数据聚类的过程为:比较序列(D1,D2,...,DK)中各元素的大小,Dq,q=1,2,...,K为数据点xi,i=1,2,...,N到第q个聚类中心的流形距离,选出序列中的最小值为Dqm,将数据点xi归为第qm类。

步骤7、更新聚类中心。

参照图2,更新第g类聚类中心的过程实现如下:

将每类中的所有数据点分别作为该类的聚类中心,按下式计算类内距离和:

Dig=Σj=1ngdij---(3)

其中,Dig,g=1,...,K表示以第g类的第i个数据作为该类聚类中心得到的类内距离和,dij表示第i个数据点与第j个数据点之间的流形距离,ng表示第g个聚类的大小;

选取使Dig最小的待处理数据点xig作为第g类新的聚类中心。

步骤8、判断是否达到终止条件。

将当前新的聚类与上次聚类相比,求取聚类误差的变化率,若该变化率未达到聚类终止条件e,返回步骤(6),其中e设为10-10,否则,将当前次聚类结果作为最终聚类结果,进行步骤(9)。

步骤9、由待处理数据的最终聚类结果得到待分割图像的分割结果,并将分割结果图输出。

本发明的效果可通过以下仿真进一步说明:

1.仿真条件及仿真内容:

本实例在Intel(R)Core(TM)2 Duo CPU 2.33GHz Windows XP系统下,Matlab7.0运行平台上,完成本发明以及遗传聚类方法(Genetic Algorithm-based Clusteringtechnique,GAC)和K均值方法(k-means,KM)的图像分割仿真实验。

2.仿真实验内容

A.本发明图像分割方法的仿真

将本发明应用在如图4所示350×350的SAR图像上,该SAR图像可以大致分为建筑、跑道和土地三大区域,故K设为3。图5为用本发明方法对图4进行图像分割得到的仿真实验结果图,白色区域代表建筑,灰色区域代表土地,黑色区域代表跑道。

B.现有GAC和KM图像聚类分割方法的仿真

将现有的遗传聚类方法应用在如图4所示350×350的SAR图像上,仿真实验结果如图6所示,其中白色区域代表建筑,灰色区域代表土地,黑色区域代表跑道。

将现有的K均值方法应用在如图4所示350×350的SAR图像上,仿真实验结果如图7所示,其中白色区域代表建筑,灰色区域代表土地,黑色区域代表跑道。

3.仿真实验结果

从图5可以看出,本发明得到的仿真实验结果有较好的主观视觉效果,错误分割出现较少,边缘平滑清晰,区域一致性高,尤其对于图4中的重要信息——跑道主干部分分割比较准确。本发明对图4的仿真实验用时仅为30.693秒。

从图6可以看出,现有遗传聚类方法得到的仿真实验结果主观视觉效果较差,错误分割严重,边缘模糊不清,区域一致性低,无法准确区分图4中的三类区域。遗传聚类方法对图4的仿真实验用时多达99.847秒。

从图7可以看出,现有K均值方法得到的仿真实验结果主观视觉效果优于遗传聚类算法得到的仿真实验结果,区域一致性较好,但与本发明得到的仿真实验结果相比,错误分割较为严重,边缘不够平滑准确。K均值算法对图4的仿真实验用时为32.618秒。

由以上的仿真实验可以说明,针对SAR图像的分割,本发明存在一定的优势,克服了现有KM和GAC聚类分割技术应用在SAR图像上的不足,不论是视觉效果还是分割时间,本发明均优于现有的GAC和KM聚类分割技术。

综上所述,本发明针对SAR图像的分割效果明显优于现有的KM和GAC聚类分割技术对SAR图像的分割效果。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号