首页> 中国专利> 一种基于颜色样本与电场模型的图像分割方法

一种基于颜色样本与电场模型的图像分割方法

摘要

本发明涉及一种基于颜色样本与电场模型的图像分割方法。本发明把物理学中的电场理论引入颜色样本学习、模型训练与像素分类:从样本图片中选取目标区域的正样本与负样本像素数据,把颜色空间作为3D电场模型并计算每个坐标点的场强,基于贝叶斯准则推导空间中每处颜色值属于目标区域的概率,通过描述分类效果的ROC曲线寻找空间中目标的最优分割阈值,确定电场模型相关参数与合适的电场空间分辨率,利用映射表法建立索引进而实现像素的快速分类与图像分割。相比现有的直方图模型,本发明在小样本情况下也能够估算出非样本点的概率;相比现有的核密度估计法,本发明通过更多的核描述目标区域的颜色分布,能够实现精度更高且兼顾时间效率的图像分割。

著录项

  • 公开/公告号CN102663723A

    专利类型发明专利

  • 公开/公告日2012-09-12

    原文格式PDF

  • 申请/专利权人 武汉大学;

    申请/专利号CN201210043227.5

  • 发明设计人 赵俭辉;袁志勇;章登义;

    申请日2012-02-24

  • 分类号

  • 代理机构武汉科皓知识产权代理事务所(特殊普通合伙);

  • 代理人薛玲

  • 地址 430072 湖北省武汉市武昌珞珈山武汉大学

  • 入库时间 2023-12-18 06:28:50

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2019-02-15

    未缴年费专利权终止 IPC(主分类):G06T7/00 授权公告日:20140618 终止日期:20180224 申请日:20120224

    专利权的终止

  • 2014-06-18

    授权

    授权

  • 2012-11-07

    实质审查的生效 IPC(主分类):G06T7/00 申请日:20120224

    实质审查的生效

  • 2012-09-12

    公开

    公开

说明书

技术领域

本发明涉及数字图像处理中基于颜色特征的图像分割技术领域,尤其涉及一种基于颜色样本与电场模型的图像分割方法。

背景技术

图像分割是数字图像处理和计算机视觉领域中的一个基本而关键的问题,目的是将人们感兴趣的目标从图像背景中提取出来,为后续的分类、跟踪、识别等处理提供基础。具体而言,图像分割指的是利用数字图像的某些特性,如颜色、形状、纹理等,将图像细分为多个图像子区域或像素集合的过程。

现有的图像分割方法大致可分为阈值分割、边缘检测分割、区域特性分割、特征空间聚类分割等。其中阈值分割法主要包括直方图阈值、最大类间方差(Otsu)阈值、二维最大熵值、模糊阈值、共生矩阵阈值等;边缘检测法主要包括Sobel算子、Canny算子、Laplacan算子、Roberts算子、Prewitt算子、Susan边缘检测算子、活动轮廓模型、分水岭算法、水平集方法等;区域分割法主要包括区域增长、区域分开与合并、数学形态学等;空间聚类法主要包括K均值、模糊C均值、Mean-Shift等。从特征角度考虑,颜色是图像分割最常使用的特征之一,如目标的灰度或彩色信息,而常用颜色模型包括RGB、HSI、YCbCr等。在实际应用中,目标往往会受光照、阴影等的影响而呈现出不同颜色,从而无法为目标定义适合所有情况的颜色区间。因此,只能根据某种具体场景的样本数据做针对性统计分析,得到适合该类场景的目标颜色范围并用于图像分割。

已有方法将采集到的目标区域的样本像素映射到颜色模型的1D空间(如HSI颜色模型的H通道)或2D空间(如YUV颜色模型的UV平面),然后根据样本分布情况通过阈值定义相对简单的规则的颜色范围,或者通过不等式组定义相对复杂的不规则的颜色范围。为了更加精确地描述样本数据的分布范围,还有方法在YCbCr模型的CbCr平面上拟合了三条多项式曲线作为映射后样本集合的边界。但事实上样本像素是在3D颜色空间中分布的,因此这种简单映射到低维空间的方式难以描述目标区域的精确范围。

对样本数据3D分布进行统计分析的典型方法包括直方图模型与核密度估计法。直方图模型在颜色空间中分别统计出正样本和负样本的颜色直方图,基于两个直方图并借助贝叶斯准则构造分类器,使得每组颜色值对应着一个是否为目标的布尔值,因此在颜色空间中定义的目标范围是由离散点组成的集合,与目标区域颜色连续性分布的客观事实相距较远。虽然直方图模型样本学习时间短,但只有在大样本训练时才能获得较好的分割效果,小样本情况下无法估计出非样本点的概率。以高斯混合模型(GMM)为例的核密度估计法定义混合概率密度函数为若干高斯核之和,由此计算出的像素概率代表了其为目标的可能性。该模型试图通过若干个影响周围空间的高斯核组合描述颜色分布的连续性,但这种近似的表达仍然比较粗略,对颜色范围及其边界的定义不够精确,相应的分割效果也不够理想。另外,GMM的训练时间过长,尤其是在高斯核数目自动计算的情况下。

发明内容

针对上述存在的技术问题,本发明目的是提供一种基于颜色样本与电场模型的图像分割方法,以实现基于颜色特征的精度更高且兼顾时间效率的目标分割。

为达到上述目的,本发明采用如下的技术方案:

一种基于颜色样本与电场模型的图像分割方法,包括以下步骤:

步骤1,从样本图片中,选取目标区域的像素作为正样本数据,选取非目标区域的像素作为负样本数据;

步骤2,建立电场模型,包括以下子步骤,

步骤2.1,将三维的颜色空间作为电场空间,将电场空间中每个单位坐标作为一个点电荷,

(a)将正样本数据以散乱点集的形式置于电场空间,点电荷所带电量等于相应单位坐标处的正样本数据个数;

设点电荷                                                的电量为,点电荷在电场空间中任一单位坐标处产生的电场场强为;

其中,为与之间的距离函数,常量参数为调节场强梯度的参数;

设在电场空间任一单位坐标处,由所有点电荷产生的电场场强叠加后的结果为;

其中,N为电场空间的单位坐标总数,由电场空间分辨率决定;

(b)将负样本数据以散乱点集的形式置于电场空间,点电荷所带电量等于相应单位坐标处的负样本数据个数;

设点电荷的电量为,点电荷在电场空间中任一单位坐标处产生的电场场强为;

其中,为与之间的距离函数,常量参数为调节场强梯度的参数;

设在电场空间任一单位坐标处,由所有点电荷产生的电场场强叠加后的结果为;

其中,N为电场空间的单位坐标总数,由电场空间分辨率决定;

步骤2.2,基于贝叶斯准则推导在电场空间任一单位坐标处颜色值属于目标区域的概率,相应公式如下,

其中,与分别为正样本数据的个数与负样本数据的个数在所有样本数据中所占的比例;表示若已知某像素为正样本数据,则该像素的颜色为处颜色值的概率;表示若已知某像素为负样本数据,则该像素的颜色为处颜色值的概率;

步骤2.3,通过描述分类效果的ROC曲线寻找电场空间中目标区域的最优分割阈值;

步骤3,根据步骤2建立的电场模型,确定距离函数的形式、常量参数的取值以及电场空间分辨率,从而确定电场模型的场强计算公式;

步骤4,根据步骤3确定的场强计算公式,利用映射表法建立索引,将颜色空间中每个单位坐标的颜色值映射成是否为目标的布尔值;图像分割时,对每个像素的判断直接通过查表得到是否属于目标区域的结论,实现快速分割。

而且,步骤2.3中通过ROC曲线寻找目标的最优分割阈值时,包括以下子步骤,

①基于正样本数据和负样本数据计算并绘制ROC曲线,其横纵坐标分别为假阳性率和真阳性率;

②遍历ROC曲线上的点,比较每一点对应的分割阈值;

③选取最优分割阈值,使得真阳性率尽量大且假阳性率尽量小。

而且,步骤3中,将函数定义为单位坐标与点电荷之间欧氏距离的平方;通过ROC曲线确定常量参数和电场空间分辨率的取值。

本发明把物理学中的电场理论引入颜色样本的学习,把样本数据在颜色空间中的分布与作用,建模为电场中能够在周围空间产生场强的带电电荷,通过电场场强推导概率分布以描述目标区域的范围与边界,并根据样本的分类效果确定最优分割阈值,同时兼顾算法的时间效率。本发明具有以下优点和积极效果:

(1) 电场模型中每个电荷都辐射影响周围空间,即使在小样本情况下,仍能计算出颜色空间中非样本点的目标概率值,从而对具有该处颜色值的像素进行分类;

(2) 电场模型以颜色空间中每个单位坐标为最小电荷,核的数量越多,对样本数据颜色分布连续性的描述越精确,越容易获得目标的更加准确的颜色范围与边界;

(3) 电场模型的基本函数形式与求解方法相对简单,能够保证在训练阶段的样本学习与电场建模的时间效率;

(4) 利用映射表法建立索引,避免了在分割阶段对每个像素分类判断时的电场模型概率计算与阈值比较,能够通过直接查表实现图像的实时分割。

具体实施方式

本发明的技术方案可由本领域技术人员采用计算机软件手段实现。下面以火灾图像中基于颜色特征的火焰分割为具体实施例,对本发明技术方案作进一步说明。实施例的流程包括具体步骤如下:

步骤1,从样本图片中,选取火焰区域的像素作为正样本数据,选取非火焰区域的像素作为负样本数据。具体实现说明如下:

挑选出100张具有代表性的火灾图片,图片中包含典型的红色、黄色、白色以及几种颜色混合的火焰区域,手工选取火焰区域的像素作为正样本数据,选取非火焰区域的像素作为负样本数据。而针对火灾图像的基于颜色特征的目标分割,就是使用经样本学习与训练后的电场模型自动提取图片中属于火焰区域的像素。

步骤2,建立电场模型,包括以下子步骤:

(1) 把3D颜色空间作为电场模型,以便计算空间中每个坐标点的场强:

实施例的正负样本数据分别以散乱点集的形式置于3D的RGB颜色空间中,当然,颜色空间并不局限于单一的RGB模型。根据数字图像处理的基础知识,其它类型的颜色模型都可以转换至RGB颜色空间。

将3D颜色空间建模为电场空间,将电场空间中每个单位坐标作为一个点电荷。在正样本数据和负样本数据分别以散乱点集的形式置于电场空间后,点电荷所带电量等于相应单位坐标处的正样本数据个数或负样本数据个数。

以正样本构造的3D电场空间为例,空间中每个单位坐标作为一个点电荷(假设电荷总数为N,在RGB颜色空间中当单位电荷大小为1*1*1时N=256*256*256),点电荷所带电量等于具有该处颜色值的正样本个数。设点电荷的正电量为,在电场空间任一单位坐标处产生的电场场强为:

                                                       (1)

其中为与之间的距离函数,用于表达距离电荷越远,则其产生的电场强度越弱的电荷辐射的衰减特点;常数用于调节场强的梯度即衰减速度,同时防止距离为零时场强无穷大的情况。

在电场空间任一单位坐标处,由所有正电荷产生的场强叠加为:

                                                          (2)

在以负样本构造的3D电场空间中,同理设点电荷的负电量为,在电场空间任一单位坐标处产生的电场场强为:

                                                       (3)

在电场空间任一单位坐标处,由所有负电荷产生的场强叠加为:

                                                         (4)

(2) 基于贝叶斯准则推导空间中每处颜色值属于目标区域的概率:

(2.1) 针对正样本数据,计算其颜色为空间某坐标处颜色值的概率。若已知某像素为正样本,则实施例将其颜色为单位坐标处颜色值的概率定义为:

                                                    (5)

(2.2) 针对负样本数据,计算其颜色为空间某坐标处颜色值的概率。若已知某像素为负样本,则实施例将其颜色为单位坐标处颜色值的概率定义为:

                                                    (6)

(2.3) 根据贝叶斯准则,具有单位坐标处颜色值的像素属于目标区域的概率为:

                                  (7)

其中与分别为正样本(火焰区域像素)与负样本(非火焰区域像素)在所有样本中所占的比例。例如,步骤1选取了6,000,000个火焰区域像素作为正样本数据,选取了4,000,000个非火焰区域像素作为负样本数据,则=0.6,=0.4。

基于所得目标区域概率,在图像分割时,对于具有颜色空间处颜色值的像素,通过阈值来判断其是否属于目标区域,判断公式为:

                                                  (8)

显然,阈值(取值范围[0,1])的设置直接影响着像素分类与图像分割的效果。如果阈值过大,会导致图像分割时漏掉大量的火焰像素;如果阈值过小,会导致分类时将大量的非火焰像素误判为火焰。

(3) 通过描述分类效果的ROC曲线寻找空间中目标的最优分割阈值:

(3.1) 基于正负样本计算并绘制高精度的ROC曲线,其横坐标为假阳性率(指被误判为火焰的非火焰样本像素在所有负样本像素中所占的比例),纵坐标为真阳性率(指被正确判断为火焰的样本像素在所有正样本像素中所占的比例)。

具体方法为:以0.001为步长枚举阈值在[0,1]范围内所有可能的取值,由公式(8)可知每个值对应着一个针对正负样本数据的分类结果,从而计算出一个相应的假阳性率(横坐标值)与一个相应的真阳性率(纵坐标值),进而在坐标系中绘制出一个点,这样所有值对应的点即可连线组成一条高精度的ROC曲线。ROC曲线是受试者工作特征曲线或感受性曲线(receiver operating characteristic curve)的简称。

(3.2) 遍历ROC曲线上的点,对任一点所对应的分割阈值通过函数进行评价,评价函数定义为:

                                         (9)

其中(取值范围[0,1])为阈值对应点的横坐标即假阳性率;(取值范围[0,1])为阈值对应点的纵坐标即真阳性率;参数(取值范围[0,1])为真阳性率的权重系数,即实际应用中对真阳性率的重视程度。例如,火灾容易给人类造成无法估计的灾难,因此在火灾识别中往往更加重视真阳性率,即宁可容忍一定程度的误判也不放过真正的火灾,所以针对火灾识别的应用可以设置。

(3.3) 从ROC曲线上选择最小对应的分割阈值作为最优分割阈值,从公式(9)可知使得最小的条件是:真阳性率应尽量大,同时假阳性率应尽量小。

从电场空间中样本数据点集分布的角度考虑,最优分割阈值事实上相当于定义了3D颜色空间中用于描述目标范围边界的最优分割曲面,曲面上所有点的目标概率相等,曲面内部为目标区域而外部为非目标区域。

在寻找最优分割阈值时,本发明假设场强公式(1)与公式(3)中的距离函数与常量参数均为已知,否则无法计算分类结果。就是说,最优分割阈值只针对特定的场强公式,场强公式的变动将导致最优分割阈值的重新定位。

步骤3,根据步骤2建立的电场模型,确定距离函数的形式、常量参数的取值以及电场空间分辨率,从而确定电场模型的场强计算公式。具体确定方式则是基于模型的分类方法以及分类效果的评估。

(1) 场强公式(1)与公式(3)中的距离函数可定义为多项式、指数等多种函数形式,但函数形式越复杂则计算量越大,本发明借鉴物理学中点电荷场强的计算公式,把函数简单定义为与之间欧氏距离的平方。

(2) 场强公式(1)与公式(3)中的常量参数用于调节场强梯度,参数越大,电场梯度越大,场强衰减越快,电荷对周围空间的影响越弱,电场模型对样本颜色连续性分布的表达越差;反之,参数越小,电场梯度越小,颜色空间中各处概率值的差异越小,会因连续性过强而导致区分度不明显,从而削弱最终的分类效果。

参数的选择同样基于分类效果,即尽可能多地枚举参数的取值,并计算出每个值对应着的针对正负样本数据的分类结果(假阳性率与真阳性率),从而得到一条高精度的ROC曲线。遍历ROC曲线上的点,对任一点所对应的参数通过与公式(9)类似的函数进行评价,评价函数定义为:

                                        (10)

其中(取值范围[0,1])为参数对应点的横坐标即假阳性率;(取值范围[0,1])为参数对应点的纵坐标即真阳性率。从ROC曲线上选择最小对应的值,并用于场强公式。同理,在寻找合适的常量参数时,可假设最优分割阈值已知,否则无法计算分类结果。就是说,最优分割阈值的变动将导致参数的重新定位。

当然,同时确定最优分割阈值与常量参数也是可行的。具体方法为:同时枚举分割阈值(假设总数为)与常量参数(假设总数为),然后从所有组合(总数为)中选择分类效果最好的一个,从而获得对应的最优值与最优值。

(3) 电场空间分辨率与点电荷的大小相关联,例如,分辨率为256*256*256时点电荷大小为1*1*1,分辨率为128*128*128时点电荷大小为2*2*2,而分辨率为64*64*64时点电荷大小为4*4*4。当点电荷对应的小立方体体积大于1时,其电量是小立方体内所有1*1*1的单位坐标电荷的电量之和。

电场空间分辨率越高,分类效果越好,但样本学习与模型建模的时间越长;反之,电场空间分辨率越低,分类效果越差但耗时越少。因此,本发明兼顾分类效果与时间效率,确定最优的电场空间分辨率。

具体方法为:枚举从8*8*8到256*256*256的共6种电场空间分辨率(从1*1*1到4*4*4的过低的分辨率因无法保证分类效果而不予考虑),计算出每种分辨率对应着的针对正负样本数据的分类结果(假阳性率与真阳性率),通过与公式(9)类似的函数对分类效果进行评价,评价函数定义为:

                                        (11)

其中(取值范围[0,1])为分辨率对应点的横坐标即假阳性率;(取值范围[0,1])为分辨率对应点的纵坐标即真阳性率。随着电场空间分辨率的增加,函数值逐渐减小(分类效果逐渐变好),但同时样本学习与模型建模的耗时急剧增大。当出现相邻分辨率值的减小不再明显,同时学习与建模的时间效率也能够接受的情况时,所对应的分辨率即为最优的电场空间分辨率。

步骤4,利用映射表法建立索引进而实现像素的快速分类与图像分割:

在确定场强公式参数、最优分割阈值、电场空间分辨率后,就可将训练好的电场模型用于非样本图片的目标分割。即对于图像中任一像素点,基于其颜色值与公式(7)计算该像素属于目标区域的概率,再基于公式(8)判断其是否属于目标区域。这种处理方式需要对每个像素计算其颜色的电场模型概率并与分割阈值比较,计算量很大。基于电场模型建模后颜色空间中所有颜色值是否属于目标区域可统一确定的特点,本发明采用下述的映射表法,把颜色值直接映射成是否为目标的布尔值。

(1) 为了实现像素分类的实时判断,预先使用映射表法建立索引,即根据步骤3确定的场强计算公式,将3D颜色空间中每个坐标的颜色值映射成是否为目标的布尔值,即布尔值表示某坐标是否属于目标区域。实施例针对火灾图像中的火焰目标分割,建立一个3D查找矩阵M,RGB颜色空间中每个坐标的颜色值,都对应着唯一的矩阵元素M[r][g][b],且元素为布尔值1(True,火焰)或0(False,非火焰)。例如,RGB颜色空间中(255,0,0)坐标的颜色值为r=255,g=0,b=0,其对应的查找矩阵元素为M[255][0][0]=1,其中r,g,b分别代表红、绿、蓝通道的颜色值。

(2) 在对非样本图片进行目标分割时,对每个像素的判断不需要计算其颜色的电场模型概率并与分割阈值比较,而是直接通过查表得到是否为目标的结论,从而实现快速的像素分类与图像分割。例如,如果当前像素颜色值为r=255,g=0,b=0,则直接通过该像素对应的查找矩阵元素M[255][0][0]判断其为火焰。当然,电场建模后统一确定的映射表数据可保存为文件,程序执行时再读入内存。

本文中所描述的具体实施例仅仅是对本发明精神作举例说明。本发明所属技术领域的技术人员可以对所描述的具体实施例做各种各样的修改或补充或采用类似的方式替代,但并不会偏离本发明的精神或者超越所附权利要求书所定义的范围。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号