首页> 中国专利> 一种表示超像素以及度量超像素之间相似性的方法

一种表示超像素以及度量超像素之间相似性的方法

摘要

一种表示超像素以及度量超像素之间相似性的方法,包括两个阶段,第一阶段,进行超像素BoS构建:对于给定的输入图像,获取超像素建立超像素金字塔、提取最大内接正方形、显著正方形求解、建立超像素BoS描述符;第二阶段,基于超像素BoS模型的超像素相似度计算,在获得超像素BoS模型描述符的基础上,对于两个超像素

著录项

  • 公开/公告号CN103456013A

    专利类型发明专利

  • 公开/公告日2013-12-18

    原文格式PDF

  • 申请/专利权人 天津大学;

    申请/专利号CN201310398404.6

  • 发明设计人 冯伟;万亮;张加万;张士杰;王超;

    申请日2013-09-04

  • 分类号G06T7/00;G06T3/40;

  • 代理机构天津市北洋有限责任专利代理事务所;

  • 代理人杜文茹

  • 地址 300072 天津市南开区卫津路92号

  • 入库时间 2024-02-19 22:01:39

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2016-01-20

    授权

    授权

  • 2014-01-15

    实质审查的生效 IPC(主分类):G06T7/00 申请日:20130904

    实质审查的生效

  • 2013-12-18

    公开

    公开

说明书

本发明涉及一种图像处理和图像分析的方法。特别是涉及一种基于超像素的算法应用的表示超像素以及度量超像素之间相似性的新方法。

背景技术

超像素是在一幅图中在感知上有意义的不规则区域,超像素经常通过将相似的相邻像素合并而产生。在超像素级别的应用中一个重要的问题是怎样可靠的测量两个超像素之间的相似度。当前大部分超像素相关的工作主要集中于超像素的产生,或者超像素在不同的计算机视觉问题中的应用。相比较规则的图像区域,超像素具有以下点特征:(1)不规则性,一幅图片的超像素具有不同的大小和形状。(2)分离—合并多样化,一个相同的物体在两幅不同的图片中可能得到不同数目的具有不同大小、形状以及空间连通性的超像素。(3)多特征性,大部分超像素算法产生的超像素多为一致性区域,但是由于参数设置、算法失效等原因,会存在包含多个一致性区域的超像素。当前对于超像素间相似性的测量,仍然是将超像素简单地当做一般的图像区域,简单的使用现有的区域特征来表示,如区域直方图,区域协方差,GMM和SPM。 即使这些方法在某些应用中该方法表现良好,但其忽略了超像素中的某些特征而这些特征将会导致在测量超像素级别相似度时使用的一般图像区域特征失效。

发明内容

本发明所要解决的技术问题是,提供一种能够更好地匹配超像素的特性、精确地捕获超像素的细节信息,以及合理地处理超像素分离与合并的多样性的表示超像素以及度量超像素之间相似性的方法。

本发明所采用的技术方案是:一种表示超像素以及度量超像素之间相似性的方法,包括两个阶段,第一阶段,进行超像素BoS构建:对于给定的输入图像,获取超像素建立超像素金字塔、提取最大内接正方形、显著正方形求解、建立超像素BoS描述符;第二阶段,基于超像素BoS模型的超像素相似度计算,在获得超像素BoS模型描述符的基础上,对于两个超像素                                                和之间的相似度进行度量。

所述的第一阶段进行超像素BoS构建包括如下步骤:

1)提取超像素建立超像素金字塔:通过标准SLIC算法产生第1层超像素;给定第层的超像素,通过检测第层中超像素的初始种子与超像素的从属关系来产生第层的超像素;在第层中,每一个初始种子产生的超像素只包含具有和种子具有相同标签的像素,使得第层超像素的边界严格落在第层中产生该超像素的超像素的边界内;

2)提取超像素内最大内接正方形:将BoS模型建立在超像素金字塔中的第一层超像素中,对于金字塔第1层中的所有超像素,使用它在金字塔中的所有子超像素以及它本身作为提取最大内接正方形的源区域,在源区域中通过距离变换近似地提取最大内接正方形,具体是找到具有最大距离值的像素点,并且以该点作为中心,以该像素点到达边界的最短距离值为半径作圆,再作出圆的内接正方形,该内接正方形就是该区域的最大内接正方形,在剩余的区域内继续提取的最大内接正方形,从而递归地提取出一定数量的最大内接正方形;

3)正方形区域的表达:将正方形区域划分为一个均匀分布的同心带,每一个带区域都使用一个量化的颜色直方图描述,该颜色直方图将RGB三个颜色通道都划分为16等分,这样,该颜色直方图一共拥有4096个分布中心,每一个显著正方形的同心带都用来表示,将显著正方形的所有同心带从内到外拼接成一个中心点更大的直方图,再经过归一化处理形成了一个更大的稀疏直方图;

4)显著正方形区域求解:对于一个超像素,通过步骤1)~步骤3),得到候选的最大内接正方形,对所有候选的内接正方形依照面积大小使用降序排序,得到如下序列:

通过自验证聚类方法从中得到显著正方形;

5)建立超像素BoS模型描述符:一个超像素的BoS模型是一个带权显著正方形的集合:

,其中,                                  

表示一个显著正方形的集合,,为超像素中显著正方形的个数;

是一个权重向量,代表了显著正方形的重要程度,它表示为:

步骤4)所述的通过自验证聚类方法从中得到显著正方形是,首先,令,表示将面积最大的候选正方形当做一个显著正方形,并将它的权值赋值为1,同时定义,表示距离最远的显著正方形,对于中的候选正方形,我们将它与中的每一个显著正方形的相似度和它与的相似度做比较,如果与的距离大于与中的所有显著正方形的距离,我们将作为一个新的显著正方形加入到中,并且赋权值为1,记为,其中表示所代表的权重,在初始时赋值为1;否则,将被聚类到在集合中距离它最近显著正方形中,并且该显著正方形的权值加1,在直方图空间中,  ,其中,m表示稀疏直方图的中心个数。

    所述的对于两个超像素和之间的相似度进行度量如下:

在上式中,和分别代表超像素和中的显著正方形,以及代表与和相关的稀疏直方图,和分别代表相应的显著正方形的权重,是归一化因子,表示为:

是巴氏因子,表示为:

由此得到:最大值为1,值越大表示两个超像素之间的相似性越高。

本发明的一种表示超像素以及度量超像素之间相似性的方法,可以更好地匹配超像素的特性、精确地捕获超像素的细节信息,以及合理地处理超像素分离与合并的多样性。本发明所给出的统一的超像素描述以及相似性度量的方法,可以使得计算机视觉等相关领域中基于超像素的特定应用算法,如图像分割、图像匹配等算法,更好地应对超像素的不规则性、分离—合并多样性以及多特征性的特征,从而得到更好的效果。

 

附图说明

图1是本发明一种表示超像素以及度量超像素之间相似性的方法的流程图;

图2是本发明BoS模型的直观示意图;

图3是MSRM方法与本发明方法应用在图像分割上的结果比较,其中第一、五列表示带有用户标记的原始图像,第二、六列代表使用传统MSRM分割方法得到的结果,第三、七列代表使用基于BoS模型分割后的结果,即为本发明分割的结果,第四、八列代表标准分割结果;白色模糊效果的区域代表背景区域,清晰显示的区域代表前景区域;

图4a是本发明的方法与其他算法的正确率的比较折线图;

图4b是本发明的方法与其他算法的查全率的比较折线图;

图4c是本发明的方法与其他算法的F1-measure的比较折线图;

图4a、图4b、图4c中带有圆圈的线表示基于BoS模型的分割,带有方框的线表示传统分割;

图5是本发明的验证尺度不变性示意图,其中,横坐标表示放缩因子,纵坐标表示相似度统计量,每一个放缩因子对应着图的上短横表示最大值,下短横表示最小值,圆点表示期望,矩形框表示方差,虚线表示众数;

图6是本发明的验证BoS模型的旋转不变性示意图,其中,横坐标表示旋转因子,纵坐标表示相似度统计量,每一个旋转因子对应着图的上短横表示最大值,下短横表示最小值,圆点表示期望,矩形框表示方差,虚线表示众数。

 

具体实施方式

下面结合实施例和附图对本发明的一种表示超像素以及度量超像素之间相似性的方法做出详细说明。

本发明的一种表示超像素以及度量超像素之间相似性的方法,对图像首先提取超像素,进而提取其BoS模型,并设计了基于BoS模型的度量方法,在保证算法较高正确率前提下,使得计算机视觉等领域中基于超像素的特定应用算法,如图像分割、图像匹配等,可以更好地应对超像素的不规则性、分离—合并多样性以及多特征性的特征。

本发明的一种表示超像素以及度量超像素之间相似性的方法,包括超像素BoS模型的构建和基于BoS模型的超像素相似度计算两个阶段。如图1所示:

第一阶段,进行超像素BoS构建:对于给定的输入图像,获取超像素建立超像素金字塔、提取最大内接正方形、显著正方形求解、建立超像素BoS描述符,包括如下步骤:

1)提取超像素建立超像素金字塔:通过标准SLIC算法[1]产生第1层超像素;给定第层的超像素,我们通过检测第层中超像素的初始种子与超像素的从属关系来产生第层的超像素;在第层中,每一个初始种子产生的超像素只包含具有和种子具有相同标签的像素,使得第层超像素的边界严格落在第层中产生该超像素的超像素的边界内;

2)提取超像素内最大内接正方形:为了保留超像素的特性,将BoS模型建立在超像素金字塔中的第一层超像素中,对于金字塔第1层中的所有超像素,使用它在金字塔中的所有子超像素以及它本身作为提取最大内接正方形的源区域,在源区域中通过距离变换[1]近似地提取最大内接正方形,由于距离图像表示每一个像素点到达区域边界的最短距离,故具体是仅仅需要找到具有最大距离值的像素点,并且以该点作为中心,以该像素点到达边界的最短距离值为半径作圆,再作出圆的内接正方形,该内接正方形就是该区域的最大内接正方形,在剩余的区域内继续提取的最大内接正方形,从而递归地提取出一定数量的最大内接正方形;

3)正方形区域的表达:将正方形区域划分为一个均匀分布的同心带,每一个带区域都使用一个量化的颜色直方图描述,该颜色直方图将RGB三个颜色通道都划分为16等分,这样,该颜色直方图一共拥有4096个分布中心[2],每一个显著正方形的同心带都可以用来表示,将显著正方形的所有同心带从内到外拼接成一个中心点更大的直方图,再经过归一化处理形成了一个更大的稀疏直方图;

4)显著正方形区域求解:对于一个超像素,通过步骤1)~步骤3),得到候选的最大内接正方形,对所有候选的内接正方形依照面积大小使用降序排序,得到如下序列:

通过自验证聚类方法从中得到显著正方形;首先,令,表示将面积最大的候选正方形当做一个显著正方形,并将它的权值赋值为1,同时定义,表示距离最远的显著正方形,对于中的候选正方形,我们将它与中的每一个显著正方形的相似度和它与的相似度做比较,如果与的距离大于与中的所有显著正方形的距离,我们将作为一个新的显著正方形加入到中,并且赋权值为1,记为,其中表示所代表的权重,在初始时赋值为1;否则,将被聚类到在集合中距离它最近显著正方形中,并且该显著正方形的权值加1,在直方图空间中,  ,其中,m表示稀疏直方图的中心个数。

5)建立超像素BoS模型描述符:一个超像素的BoS模型是一个带权显著正方形的集合:

,其中,

表示一个显著正方形的集合,,为超像素中显著正方形的个数;

是一个权重向量,代表了显著正方形的重要程度,它表示为:

第二阶段,基于超像素BoS模型的超像素相似度计算,在获得超像素BoS模型描述符的基础上,对于两个超像素和之间的相似度进行度量。具体如下:

在上式中,和分别代表超像素和中的显著正方形,以及代表与和相关的稀疏直方图,和分别代表相应的显著正方形的权重,是归一化因子,表示为:

是巴氏因子,表示为:

由此得到:最大值为1,值越大表示两个超像素之间的相似性越高。

    本发明的一种表示超像素以及度量超像素之间相似性的方法,给出了一套完整的统一的超像素描述以及相似性度量的方法,该方法可以更加合理地表示超像素,并且精确地度量超像素之间的相似性。相比较现行的区域描述符,该方法可以更好地匹配超像素的特性、精确地捕获超像素的细节信息,以及合理地处理超像素分离与合并的多样性。使得计算机视觉领域中基于超像素的特定应用算法,如图像分割、图像匹配等,可以更好地应对超像素的不规则性、分离—合并多样性以及多特征性。

 

参考文献:

[1].    R. Achanta, A. Shaji, K. Smith, A. Lucchi, P. Fua, and S. Susstrunk, “SLIC superpixels compared to state-ofthe-art superpixel methods,”  IEEE TPAMI, vol. 34, no.11, pp. 2274–2282, 2012

[2].    J. F. Ning, L. Zhang, D. Zhang, and C. K. Wu, “Interactive image segmentation by maximal similarity based region merging,” Pattern Recognition, vol. 43, no. 2, pp. 445–456, 2010.

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号