法律状态公告日
法律状态信息
法律状态
2016-12-07
未缴年费专利权终止 IPC(主分类):G06F17/30 授权公告日:20121128 终止日期:20151022 申请日:20101022
专利权的终止
2012-11-28
授权
授权
2011-05-04
实质审查的生效 IPC(主分类):G06F17/30 申请日:20101022
实质审查的生效
2011-03-23
公开
公开
技术领域:
本发明涉及计算机视觉、图像理解以及模式识别等领域,特别涉及一种基于多层位图颜色特征的图像检索方法。
背景技术:
随着多媒体技术及Internet的迅速发展,图像信息的检索已经成为迫切需要解决的问题,因此,研究人员相继提出了各种基于内容的图像检索方法,使用颜色、纹理、形状、及区域等视觉特征来表征图像的内容。
在众多的视觉特征中,颜色是描述图像内容最基本和最直接的视觉特征,并被广泛应用于图像检索技术。传统的基于颜色特征的图像检索技术,主要提取图像的颜色直方图或者阶矩等颜色的分布统计特征,其中,图像颜色的低阶矩已被证明为一种有效的图像特征,一阶矩(即均值)体现了图像颜色分布的基本能量,而二阶矩(即方差)表现为相对于均值的变化,并且具有易于计算的特点。但是,这种统计分布特征不可避免的具有缺乏细致性的不足之处,同时提取特征单一,对于实际生活中颜色信息丰富的图像,难以进行有效的颜色内容表征,因此影响了检索的效果。在此基础上,一些研究者提出了基于全局与局部特征的图像检索方法,以局部特征对全局统计特征进行补充,完善对图像内容的描述,从而达到提高检索效果的目的。在文献Lu Tzu Chuen and Chang Chin Chen,“Color image retrieval techniques based on color features and image bitmap”,Information Processing and Management,2007,43(2):461-472中,作者提取二值化的位图特征以反映图像颜色信息相对于全局统计特征的局部变化,增强颜色分布特征对图像内容的描述能力。虽然这种方法具有一定的理论意义和合理性,但是,由于位图局部特征的提取依赖于全局统计特征,而全局统计特征本身又相对粗糙,因此,以其为基础所提取的局部特征的补充能力大打折扣。此外,这些方法在提取特征过程中,并没有考虑到颜色与人眼视觉感知特性之间的联系,同时,也未能充分有效地扩展比较图像内容差异时所利用的信息范围,影响了检索效果的进一步提高。
发明内容:
为了避免现有技术的缺陷,本发明提出了一种基于多层位图颜色特征的图像检索方法,其目的在于提取出彩色图像丰富内容中的有效层次性颜色特征进行图像检索。它通过颜色聚类,能够得到一副彩色图像中不同的颜色分布层次,然后分别在不同的分布层次中提取整体和局部颜色特征;同时,为了加快运算速度,它运用了快速颜色聚类算法,提高了特征提取的效率。
为了达到上述目的,本发明采用以下技术方案予以实现:一种基于多层位图颜色特征的图像检索方法,其特征在于,包括以下步骤:
首先,对查询图像的颜色空间进行网格化,通过统计各网格中像素点数目,选取具有数目局部最大值的网格;然后,在K均值聚类算法中,应用一种新的距离优化算法,估算K个颜色聚类初始中心;应用ENNS算法,快速生成各颜色聚类;然后计算各颜色聚类的合理统计分布中心;另一方面,对查询图像进行空间子块划分,在对空间子块进行高斯加权后,再计算其颜色均值;接下来,以K个颜色聚类的合理统计分布中心为阈值,通过将图像子块颜色均值与其进行比较,提取K层位图特征;最后,综合颜色聚类合理统计分布中心与位图的相似性度量,进行图像特征的匹配检索。
本发明的进一步改进和特点在于:
(1)所述先对查询图像的颜色空间进行网格化,通过统计各网格中像素点数目,选取具有数目局部最大值的网格,具体为:假设输入查询图像的颜色空间为RGB,将R,G,B各分量等分为η个区间,则颜色空间被划分为互不交叠的网格单元,图像中的每个像素依据其颜色值隶属于一个特定的网格;统计落入网格中的像素点数目,选取具有局部最大值的网格Gi(i=1,…,M)共M个。
(2)所述在K均值聚类算法中,应用一种新的距离优化算法,估算K个颜色聚类初始中心,方法为:
①计算每个具有数目局部最大值的网格中像素点的颜色均值:
其中,表示Gi网格中包含的像素点数目,M为具有数值局部最大值的网格数目;
②选取具有最多像素点数目的网格,以其像素点的颜色均值作为第一个聚类初始中心点:
其中,表示选取具有最大数目值网格的颜色均值,C1表示第一个颜色聚类初始中心点;
③对于k=2,…,K,Ck通过距离优化的方式选取:对于每个未被选取为初始中心点的网格颜色均值首先计算其与已经选取的聚类初始中心点的优化距离:
其中,maxi=1,…,k-1{·}表示选取与k-1个已选取的聚类初始中心点距离的最大值。那么:
其中,argmin{αj}表示选取最小优化距离αj所对应的网格颜色均值为第k个聚类初始中心。
(3)所述在K均值聚类算法中,应用ENNS算法,快速生成各颜色聚类,方法为:
①以k=1,…,K,为初始聚类中心,分别计算聚类中心均值和图像每个像素点的颜色强度值:其中k=1,…,K;其中i=1,…,N;
②对于每个像素点Pi{R,G,B},其中i=1,…,N,计算其与第一个聚类中心C1的距离:
③对于k=2,…,K,根据ENNS原理,如果则D(Pi,Ck)≥dmin;否则重新计算D(Pi,Ck);如果D(Pi,Ck)<dmin,则更新dmin←D(Pi,Ck);
④更新聚类中心其中k=1,…,K;
循环执行②~④步骤,直到像素划分保持不变为止,最终得到所有像素按颜色欧式距离误差最小原则进行聚类的划分:i=1,…,N,k=1,…,K,
其中,表示所有属于以Ck为中心的聚类中的像素集合。
(4)所述计算各颜色聚类的合理统计分布中心,步骤为:
①首先,对K个聚类分别以其中心Ck的均值为基础,按照像素颜色强度大于等于均值或小于均值,将聚类分为两个子集:和
②其次,再分别计算两个子集的均值,称之为上均值、下均值:
③最后,求取上均值和下均值的平均值,作为聚类的最终的合理统计分布中心:
其中k=1,…,K,为最终合理分布的颜色中心。
(5)所述对查询图像进行空间子块划分,在对空间子块进行高斯加权后,再计算其颜色均值,步骤为:
①首先将查询图像分成互不重叠的图像块,记为Bj={b1,b2,…,bN,},即第j个图像块,其中j=1,…,L,N代表该图像块中像素的总数,L代表该图像具有的图像块的总数;
②假设属于图像块Bj的像素在图像中的标准坐标为则在该图像块内,所属像素的相对中心坐标为:
根据高斯函数定义,图像子块中每个像素点对应的高斯加权系数为:
其中,σ为高斯分布的均方差;
最后,得到各个图像块对像素颜色值进行高斯加权后的颜色均值:
(6)所述以K个颜色聚类的合理统计分布中心为阈值,通过将图像子块颜色均值与其进行比较,提取K层位图特征,具体为:
相对于K个颜色聚类的合理统计分布中心记图像的位图特征为Tk=(TRk,TGk,TBk),其中各分量分别为则由下式生成:
其中,j=1,…,L,k=1,…,K,Tk=(TRk,TGk,TBk)为二值位图特征。
(7)所述综合颜色聚类合理统计分布中心与位图的相似性度量,进行图像特征的匹配检索,具体为:
首先,将颜色聚类合理统计分布中心的颜色值,在基于整个图像数据库的基础上,进行高斯归一化,方法为:
其中代表图像库中所有颜色聚类合理统计分布中心的均值,代表图像库中所有颜色聚类合理统计分布中心的标准差,Z代表图像库中所有图像的数目,代表第z幅图像中第k个颜色聚类的合理统计分布中心;
然后,对颜色聚类合理统计分布中心的颜色值进行欧式距离度量,对位图特征进行城区距离度量;最后,将两者特征的相似距离之和,作为图像间的相似度距离,并依次进行图像匹配。
本发明通过颜色聚类,能够得到一副彩色图像中属于不同颜色分布层次的像素集合,为进一步特征提取的精确性提供了保障;然后在聚类的基础上,生成合理统计分布中心,避免了传统算术均值中心与图像实际颜色分布不相符合的缺陷,同时,在各聚类中提取的二值位图特征,反映了在不同层次上,各个图像块的颜色均值相对于颜色聚类合理统计分布中心的大小变化,其与颜色聚类合理统计分布中心相结合,共同组成了层次区间内的整体与局部特征,相互补充,有效增强了对图像内容的描述能力;并且,在提取位图特征的过程中,对图像进行空间子块划分,然后计算其高斯加权的颜色均值,使特征的提取更加符合人眼的视觉特性;此外,在进行颜色聚类之前,应用距离优化算法到K均值聚类算法中,结合网格中像素点数目与网格间的距离,利用数目局部最大值网格估算出K个初始颜色聚类中心,一方面克服了噪声的影响,另一方面避免传统聚类算法由于对聚类中心的选取比较敏感而导致得到局部最优的不良结果;在聚类的迭代过中,应用ENNS算法,利用像素颜色强度值和聚类中心均值之间的标量计算来排除当前搜索的聚类中心是否为该像素点的最近邻中心,以减少划分阶段的冗余距离计算,提高聚类速度,使本发明具有一定的硬件实用性。
附图说明:
图1是基于多层位图颜色特征的图像检索方法的总体流程图。
具体实施方式:
下面结合附图对本发明做进一步详细描述:
参见图1,用于实施的硬件环境为:Pentium(R)Dual E22002.20GHz 2.19GHz,1.98GB内存的计算机,运行的软件环境为:Windows 2002和Microsoft Visual Studio2008。我们用VC++程序设计语言实现了本发明提出的方法。实验所用的图像库为Corel图像库,包括10类图像(每类包含100幅同类图像),每幅图像均存储在RGB颜色空间;实验参数取值:颜色空间等分区间η=8,目标聚类数目K=4。
如附图1所示,本发明基于多层位图颜色特征的图像检索方法,主要包括以下步骤:
(1)首先,将输入查询图像颜色空间的R,G,B各分量等分为η个区间,则颜色空间被划分为互不交叠的网格单元,图像中的每个像素依据其颜色值隶属于一个特定的网格;统计落入网格中的像素点数目,选取具有局部最大值的网格Gi(i=1,…,M)共M个。
具体为:若M≥K,则继续执行下一步;否则,η=η+1,重新执行(1)步。
(2)在K均值聚类算法中,应用一种新的距离优化算法,估算K个颜色聚类初始中心,步骤为:
①计算每个具有数目局部最大值的网格中像素点的颜色均值:
其中,表示Gi网格中包含的像素点数目,M为具有数值局部最大值的网格数目;
②选取具有最多像素点数目的网格,以其像素点的颜色均值作为第一个聚类初始中心点:
其中,表示选取具有最大数目值网格的颜色均值,C1表示第一个颜色聚类初始中心点;
③对于k=2,…,K,Ck通过距离优化的方式选取:对于每个未被选取为初始中心点的网格颜色均值首先计算其与已经选取的聚类初始中心点的优化距离:
其中,maxi=1,…,k-1{·}表示选取与k-1个已选取的聚类初始中心点距离的最大值。那么:
其中,argmin{αj}表示选取最小优化距离αj所对应的网格颜色均值为第k个聚类初始中心。
(3)在K均值聚类算法中,应用ENNS算法,快速生成各颜色聚类,,步骤为:
①以k=1,…,K,为初始聚类中心,分别计算聚类中心均值和图像每个像素点的颜色强度值:其中k=1,…,K;其中i=1,…,N;
②对于每个像素点Pi{P,G,B},其中i=1,…,N,计算其与第一个聚类中心C1的距离:
③对于k=2,…,K,根据ENNS原理,如果则D(Pi,Ck)≥dmin;否则重新计算D(Pi,Ck);如果D(Pi,Ck)<dmin,则更新dmin←D(Pi,Ck);
④更新聚类中心其中k=1,…,K;
循环执行②~④步骤,直到像素划分保持不变为止,最终得到所有像素按颜色欧式距离误差最小原则进行聚类的划分:i=1,…,N,k=1,…,K,
其中,表示所有属于以Ck为中心的聚类中的像素集合。
(4)计算各颜色聚类的合理统计分布中心,步骤为:
①首先,对K个聚类分别以其中心Ck的均值为基础,按照像素颜色强度大于等于均值或小于均值,将聚类分为两个子集:和
②其次,再分别计算两个子集的均值,称之为上均值、下均值:
③最后,求取上均值和下均值的平均值,作为聚类的最终的合理分布中心:
其中k=1,…,K,为最终合理分布的颜色中心。
(5)对查询图像进行空间子块划分,在对空间子块进行高斯加权后,再计算其颜色均值,步骤为:
①首先将查询图像分成互不重叠的图像块,记为Bj={b1,b2,…,bN,},即第j个图像块,其中j=1,…,L,N代表该图像块中像素的总数,L代表该图像具有的图像块的总数;
②假设属于图像块Bj的像素在图像中的标准坐标为则在该图像块内,所属像素的相对中心坐标为:
根据高斯函数定义,图像子块中每个像素点对应的高斯加权系数为:
其中,σ为高斯分布的均方差;
最后,得到各个图像块对像素颜色值进行高斯加权后的颜色均值:
(6)以K个颜色聚类的合理统计分布中心为阈值,通过将图像子块颜色均值与其进行比较,提取K层位图特征,按照如下步骤:
相对于K个颜色聚类的合理统计分布中心记图像的位图特征为Tk=(TRk,TGk,TBk),其中各分量分别为则由下式生成:
其中,j=1,…,L,k=1,…,K,Tk=(TRk,TGk,TBk)为二值位图特征。
(7)最后综合颜色聚类合理统计分布中心与位图的相似性度量,进行图像特征的匹配检索,步骤为:
首先,将颜色聚类合理统计分布中心的颜色值,在基于整个图像数据库的基础上,进行高斯归一化,方法为:
其中代表图像库中所有颜色聚类合理统计分布中心的均值,代表图像库中所有颜色聚类合理统计分布中心的标准差,Z代表图像库中所有图像的数目,代表第z幅图像中第k个颜色聚类的合理统计分布中心;
然后,假设对任意两幅图像A和B,其颜色聚类合理统计分布中心的颜色值之间的相似距离度量如下:
位图特征之间的相似距离用城区距离度量如下:
其中,为图像A的第k个位图TRk的第j个分量,其余类同;
综合以上两种距离,最终的图像A和B之间的相似度量定义为:
距离d(A,B)越小,两幅图像内容之间的相似度越高,最后依据图像间的相似性度量,输出与查询图像相似距离最小的图像集合。
我们以Corel图像库中的1000幅图像作为测试平台,对每一幅图像分别作为查询图像进行检索,和传统方法相比,我们发现:本发明方法提取的图像颜色特性更符合图像的实际特性,具有更加精确的表征能力,检索准确率更高;综合来看,本发明对各种颜色丰富图像的检索应用具有良好性能。
以上内容是结合具体的优选实施方式对本发明所作的进一步详细说明,不能认定本发明的具体实施方式仅限于此,对于本发明所属技术领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干简单的推演或替换,都应当视为属于本发明由所提交的权利要求书确定专利保护范围。
机译: 读取互补金属氧化物半导体检测器的图像的方法,涉及通过基于复位图像和校正复位帧的差异确定图像和校正后的复位图像的差异来形成校正后的图像。
机译: 美容行业视频图像序列的虚拟仿真方法,涉及基于数据库中的准则和专家系统的决策准则,修改皮肤结构的序列图像和颜色特征
机译: 用于基于颜色特征信息与存储器中的计算机程序产品比较图像的图像处理设备