首页> 中国专利> 一种基于矢量量化的全局和局部颜色图像检索方法

一种基于矢量量化的全局和局部颜色图像检索方法

摘要

一种基于矢量量化的全局和局部颜色图像检索方法。本发明提出一种新的颜色图像检索方法,涉及图像处理技术领域。该方法将RGB颜色空间转换为HSV颜色空间,运用基于神经网络的竞争学习算法训练码书,对颜色空间进行更为精确的聚类划分;引入颜色转移矩阵描述颜色的空间分布情况;将索引直方图和主颜色转移矩阵两种颜色特征相结合进行相似性度量;运用形态学开闭运算处理图像,凸显目标轮廓,以提取出局部感兴趣区域,突出了重要区域,限制背景信息。本发明提出的颜色图像检索方法克服了全局颜色直方图法对颜色空间分布描述不够,不能有效限制背景信息的缺点。使颜色量化更为准确,匹配效果更好,是进一步提高检索效率的有效方法。

著录项

  • 公开/公告号CN103440348A

    专利类型发明专利

  • 公开/公告日2013-12-11

    原文格式PDF

  • 申请/专利权人 重庆邮电大学;

    申请/专利号CN201310420161.1

  • 申请日2013-09-16

  • 分类号G06F17/30(20060101);G06T7/40(20060101);

  • 代理机构50102 重庆市恒信知识产权代理有限公司;

  • 代理人刘小红

  • 地址 400065 重庆市南岸区黄桷垭崇文路2号

  • 入库时间 2024-02-19 21:18:53

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2016-11-02

    授权

    授权

  • 2014-01-08

    实质审查的生效 IPC(主分类):G06F17/30 申请日:20130916

    实质审查的生效

  • 2013-12-11

    公开

    公开

说明书

技术领域

本发明属于基于内容的图像检索领域,具体涉及一种基于矢量量化的全局 和局部感兴趣区域相结合的颜色检索方法。

背景技术

随着计算机技术、多媒体技术和网络技术的发展,大量图像数据通过互联 网广泛传播。然而,因缺乏有效的图像检索方法,使得对于庞大的图像数据库 的利用一直处于极低的效率。对于图像数据的检索方法通常有三种:自由浏览、 基于文本的图像检索(Text Based Image Retrieval,TBIR)和基于内容的图像检 索(Content Based Image Retrieval,CBIR)。自由浏览只适用于偶然情况,对于 经常使用特殊多媒体信息的专业客户是不合适的。基于文本的图像检索存在两 方面的问题:一是需要花费大量的时间去对每一幅图像数据进行手工文字注解 和分类以备建库;二是这种注解往往对于个性化的人类主观视觉内容的表达是 无法精确化的。在基于内容的图像检索系统中,图像是通过对于自身的视觉内 容取代关键字注解获得特征信息的,例如颜色、纹理和形状信息。它们更接近 人类的视觉系统。目前图像检索技术普遍应用基于颜色的底层特征,基于形态 学图像处理,基于矢量量化等技术。

颜色是彩色图像最底层、最直观的物理特征,通常对噪声、图像质量的退 化、尺寸、分辨率和方向等的变化具有很强的鲁棒性,是绝大多数基于内容的 图像检索多媒体数据库中使用的特征之一。常用的颜色特征主要包括颜色直方 图、颜色一致性矢量、颜色相关图和颜色矩阵等。其中,利用颜色直方图检索 是最基本的方法,但是缺乏对颜色空间信息的描述;颜色相关图强调同一颜色 在图像中的空间距离相关性;颜色矩阵主要是采用图像中各颜色的均值和方差 做比较,处理简单,可以用它作为图像检索的初检,为下一步的检索缩小搜索 范围。图1为一种基于全局颜色的图像检索方法流程图。

数学形态学是一门以集合代数为基础的,研究数字影像形态结构与快速并 行处理的一门新兴学科。形态学图像处理的基本思想是利用一个称作结构元素 的“探针”收集图像的信息。当探针在图像中不断移动的时候,便可以考虑图 像各个部分间的相互关系,从而了解图像的结构特征。结构元素是形态学处理 中最重要、最基本的概念,它在形态变换中的作用相当于信号处理中的“滤波 窗口”。对于同一幅图像,结构元素不同,则处理的结果也不同。二值图像形态 学应用中,结构元素的选取原则往往具有旋转不变性,或者至少镜像不变性, 也就是说,结构元素的原点在其几何中心处,并且其他像素关于该原点呈对称 状。常用到的结构元素有水平单列、垂直单列、十字型、圆盘、菱形及方形等。 随着数学形态学理论的不断完善,数学形态学在图像分割中应用越来越广泛。

近年来,基于矢量量化的图像检索方法成为许多学者研究的热门领域。矢 量量化中一般是对图像像素块进行量化,通过传输或匹配码字的索引实现图像 的传输和匹配。量化的过程可以看成是一个从k维空间Rk到其中一个有限子集 Y的映射,Q:Rk→Y={Y1,Y2,…,YN}。其基本原理是把k维空间Rk无遗漏的划 分为N个互不相交的子空间(胞腔)R1,R2,…,RN。在每一个子空间Ri中找出一 个代表矢量Yi={yi1,yi2,…,yik},记为矢量集Y={Y1,Y2,…,YN},Y称为码书或码 本,Yi称为码字或码矢,N为码书尺寸。矢量量化过程就是对一输入矢量 X={x1,x2,…,xk},在Y中找出一个与X最相近的Yi代替X,即Yi是X的量化值。

在给定待检索图像的情况下,如何快速、准确地从图像库中找到用户想要 的图像是各类图像检索技术研究解决的问题,改善图像检索系统的性能已成为 目前一个相当重要的研究课题。但现有技术的检索方法颜色空间量化不精确, 颜色的空间分布描述不足及局部重要信息不突出,难以获得准确检索的信息。

发明内容

本发明针对现有的颜色图像检索方法中颜色空间量化不精确,颜色的空间 分布描述不足及局部重要信息不突出的问题,提出颜色图像检索方法。

本发明解决上述技术问题的技术方案是,一种基于矢量量化的全局和局部 颜色图像检索方法,包括步骤:读取彩色图像数据,将其从RGB颜色空间转换 到HSV颜色空间,选取相邻且互不重叠的4×4像素点作为训练矢量;采用训练 矢量平方和排序的方法形成初始码书;选取图像库中的图像构成训练矢量集训 练初始码书;通过统计各颜色出现的频率百分比及相邻像素块的颜色变化情况, 形成颜色索引直方图和主颜色转移矩阵,将其作为检索特征;利用形态学图像 处理,凸显目标轮廓以提取感兴趣局部图像区域;利用全局颜色特征和局部感 兴趣区域颜色特征加权检索。

具体包括:

颜色空间量化:(1)选取一幅色彩丰富且分布均匀的图像,从RGB颜色空 间转换到HSV颜色空间,并将其H,S,V三个分量抽取出来;(2)选择相邻 且互不重叠的4×4像素点作为训练矢量;(3)采用矢量平方和排序的方法形成 初始码书;(4)在图像库各类图像中选取图像作为训练图像集,用竞争学习算 法(CL算法)训练初始码书。(5)经颜色聚类,三维彩色图像可以分别获得三 本码书Hi,Si,Vi,将它们合并为一个特征矢量(一本码书)ω, ω=(Hi,Si,Vi)i=1,2,…,N,而码字索引的集合相当于一个包含N种颜色的查色 表。

颜色特征提取:(1)颜色索引直方图:根据查色表,将待检索图像和图像 库中图像分成4×4的像素块,每个像素块通过一个码字的索引号(也即一种颜 色)来表征;通过统计各码字索引出现的频率及所占百分比,得到彩色图像的 颜色索引直方图H(v1,v2…,vi,…vN);其中,vi表示索引号为i的码字出现的比例, N为码书尺寸。(2)主颜色转移矩阵:将图像分成m×n块,每一块均包含s×t个 像素;得出每一块的主颜色索引值(也即该块中出现次数最多的索引值),形成 一个二维的主颜色矩阵,其大小为m×n,记为 A={ai,j}i=1,2,…m,j=1,2,…n;建立一个N×N的矩阵P,其各元素的初始 值为0;将矩阵A按Z字型进行扫描,设ai,j和ap,q为扫描序列中一对相继出现的 颜色(ai,j在前面ap,q),则P中相应元素自增1,如此反复,直到扫描完 成;统计图像中各不同颜色的相邻关系及这种关系的在整幅图像所有像素块对 中出现的比例。

感兴趣区域提取:采用结构元素度量、提取图像中的对应形状,简化数据, 保持基本形状特征并去除不相干的结构;利用开运算消除比结构元素小的散点 和毛刺,切断细长搭接而起到分离的作用,即对图像进行平滑和低通滤波;利 用闭运算把比结构元素小的缺口或孔洞填充上,搭接短的间断把物体连接起来, 即对图像进行外部滤波,磨光凸向图像内部的尖角;经开闭运算对图像进行平 滑处理,保留图像重要的轮廓、去除易造成过分划分的细节和噪声;然后设定 相应的阈值消除细小分块,取出面积最大的块;记录起始像素点的行列值及宽 度和高度以提取矩形感兴趣区域。

相似度匹配:计算待查询图像与图像库中图像视觉特征相似度,将全局和 局部感兴趣区域特征加权检索。设待查询图像为A,图像库中任意一幅图像为B, 它们的感兴趣区域分别为a和b,其相应的颜色索引直方图和主颜色转移矩阵分 别为:HA,HB,Ha,Hb,DA,DB,Da,Db;计算全局相似度

Simi1=ω1(HA-HB)(HA-HB)T+ω2Σi=1NΣj=1N(DAi,j-DBi,j)2和局部相似度

Simi2=ω3(Ha-Hb)(Ha-Hb)T+ω4Σi=1NΣj=1N(Dai,j-Dbi,j)2,ω1为全局颜色直方图 的权重,ω2为全局主颜色转移矩阵的权重,ω3为局部颜色索引直方图的权重,ω4为局部主颜色转移矩阵的权重(其中ω1234∈[0,1],ω12=1,ω34=1); 将全局相似度和局部相似度合成作为最终度量:Similar=pSimi1+qSimi2(其 中p,q∈[0,1]p+q=1);将Similar按升序排列,相似度值越小的图像与查询图 像越相似;按需要返回排序后的检索结果。

本发明采用基于矢量平方和排序的方法选择初始码书,运用基于神经网络 的竞争学习算法训练码书,对颜色空间进行更为精确的聚类划分,使量化结果 更接近人的感知;在提取分块主颜色的基础上引入颜色转移矩阵,以描述颜色 的空间分布情况;将索引直方图和主颜色转移矩阵两种颜色特征相结合进行相 似性度量;运用形态学开闭运算处理图像,凸显目标轮廓,以提取出局部感兴 趣区域;给图像全局和局部感兴趣区域赋以不同的权值,既在一定程度上反映 图像颜色的空间分布情况,又突出了重要区域,限制背景信息。本方案克服了 全局颜色直方图法对颜色空间分布描述不够,不能有效限制背景信息的缺点, 竞争学习算法有效的聚类了相似矢量,构造出鲁棒性较好的码书,使颜色空间 量化更为准确,匹配效果更好,是进一步提高检索效率的有效方法。

附图说明

图1为一种基于全局颜色的图像检索方法流程图;

图2为本发明方法的基本流程图;

图3为码书设计(颜色量化)算法流程图;

图4为利用形态学图像处理提取感兴趣区域的算法流程图;

图5为整体查准率曲线图。

具体实施方式

下文中所使用变量的意义如下:X表示训练矢量;Y表示码书;ω表示三 个颜色分量合成的最终码书;N表示码书尺寸;H表示颜色索引直方图;D表 示主颜色转移矩阵;P表示查准率。

本发明从颜色空间量化及局部感兴趣区域出发,提高颜色量化精度,充分 反映图像颜色分布情况且增强图像局部特征以改善检索性能。以下使用具体事 例和附图对本发明作进一步说明,图2为本发明方法的基本流程图。具体实施 步骤如下:

颜色空间量化:选取HSV空间为颜色量化空间,进行RGB空间到HSV空 间的转换;将图像H,S,V空间抽取出来,选择相邻且互不重叠的4×4像素点 作为训练矢量;采用矢量平方和排序的方法形成初始码书;并用CL算法训练初 始码书形成最终码书(矢量量化码表),即形成一个查色表(颜色集)。

颜色特征提取:颜色特征选用颜色索引直方图和主颜色转移矩阵。

(1)颜色索引直方图:根据查色表把待检索图像和图像库中图像每一个小 像素块(4×4)的颜色归结为其对应的码字索引值;通过统计各个码字索引出现 的频率及所占百分比,得到彩色图像的颜色统计向量;以各码字的索引号为横 坐标,其出现的比例为纵坐标,得到图像的颜色索引直方图。

(2)主颜色转移矩阵:将图像分块(每块包含t个4×4的小像素块),根据 查色表统计每一块中颜色频率最多的索引值作为该像素块的主颜色;按Z字型 扫描各个像素块,统计相继出现的主颜色值;记录图像中各不同颜色的相邻关 系及这种相邻关系在整幅图像所有像素块对中出现的比例。

感兴趣区域提取:利用形态学上的开闭运算对图像进行平滑处理,保留图像 重要的轮廓、去除易造成过分划分的细节和噪声;然后设定相应的阈值消除细 小分块,取出面积最大的块;记录起始像素点的行列值及宽度和高度以形成矩 形感兴趣区域。

相似度匹配:分别计算全局和局部颜色索引直方图及主颜色转移矩阵的欧 氏距离;将全局颜色索引直方图和主颜色转移矩阵的欧氏距离加权,即为全局 相似度;将局部颜色索引直方图和主颜色转移矩阵的欧氏距离加权,即为局部 相似度;合成全局和局部相似度并按升序排列。

以下具体描述本发明的实现方式:

(1)初始码书设计:选取一幅色彩丰富且分布均匀的图像,将其H,S,V 空间抽取出来,选择相邻且互不重叠的4×4像素点作为训练矢量;采用矢量平 方和排序的方法形成初始码书。图3为码书设计(颜色量化)算法流程图。矢 量平方和排序法的具体步骤为:

①设训练矢量集为X={X1,X2,…,XL},码书尺寸为N;

②计算每个矢量的Xl平方和Sl,将Sl按升序排列;

③将排序后的训练矢量平均分成N段,每段有K=L/N个训练矢量;

④依次选择每段的第一个码字作为初始码字,形成尺寸为N的初始码书。

该初始码书算法对训练矢量运用基于矢量平方和排序的方法分段选取初始 码字。算法使用了矢量的特征量,脱离了对图像结构因素的依赖,形成鲁棒性 较好的初始码书。

(2)码书训练:在图像库各类图像中选取色彩迥异的24幅图像作为训练 图像集,并用竞争学习算法(CL算法)训练初始码书。

竞争学习算法(CL算法)具体步骤:

①设一幅图像的训练矢量集为X={X1,X2,…,XL}且Xl∈X,待设计码书为 Y={Y1,Y2,…,YN},迭代次数为t,经初始码书设计得到N个初始码本并采用平方误差测度;

②计算训练矢量与各码字之间的误差测度

dj(t)=(Xl,Yj(t-1))=||Xl-Yj(t-1)||2,j=1,2,···,N;

③选择最小误差测度对应的码字Yi,即当前竞争获胜的码字,

di=min(dj),j=1,2,…,N;

④按下式调整获胜单元码字:

其中,a(t)为学习速率,这里取a(t)=1/t;

⑤当满足误差要求或指定迭代次数时停止训练,所得Y作为最终码书;否则, 转至步骤②。

竞争学习矢量量化是一种简单的硬判决聚类算法,在学习的过程中只更新 获胜的神经元(码字),并不断调整学习速率,使算法收敛。经颜色聚类,三维 彩色图像可以分别获得三本码书Hi,Si,Vi,将它们合并为一个特征矢量(一本码 书)ω,ω=(Hi,Si,Vi)i=1,2,…,N,而码字索引的集合相当于一个包含N种颜 色的查色表。

(3)颜色索引直方图:在基于像素的颜色直方图中,对于一幅图像I,其 颜色有N级(C1,C2,…,CN)组成,Ci为第i级颜色值。在整幅图像中,具有Ci值的 像素个数为‖Lci‖,则一组像素的统计值h1,h2,…,hN就成为该图像的颜色直方图。 其定义为:H(I)=(h1,h2,…,hN)其中,hi=‖Lci‖/m;Ci代表图像的特征取值;N是 特征可取值的个数;‖Lci‖表示图像中具有颜色特征值为Ci的像素个数;m是图 像总的像素个数。

基于矢量量化的索引直方图首先将图像分成和码字大小相同的像素块,然 后对每一个块进行矢量量化,输出量化对应索引,再计算索引序列直方图(bin 的数量等于码书的尺寸)。其中像素块的数量远小于像素数量,计算量可以有效 降低。当两个像素块具有相同或相似的的像素直方图时,其内容显然是不一样 的,相对于像素处理方法中可能会视为相同的像素块来说,在矢量量化中,它 们一般不可能量化为同一个码字,也即对应不同的索引值。索引直方图的具体 形成步骤如下:

①将待检索图像和图像库中图像分成4×4的像素块;

②根据查色表,每个像素块通过一个码字的索引号(也即一种颜色)来表征;

具体方法描述如下:

1)计算每一个训练矢量与各码字之间的欧氏距离;

2)对于每一个训练矢量,选择与其欧式距离最小的码字索引作为该矢量 的表征;

3)记录所有矢量对应的码字索引值(即颜色表征)。

③通过统计各码字索引出现的频率及所占百分比,得到每幅彩色图像的颜色 索引直方图H(v1,v2…,vi,…vN);其中,vi表示索引号为i的码字出现的比 例,N为码书尺寸。

(4)主颜色转移矩阵:主颜色转移矩阵是建立在HSV量化颜色空间之上 的用以刻画颜色相对分布位置的一种颜色特征。首先将图像分块,根据查色表 统计每块颜色频率最多的索引值作为该像素块的主颜色;按Z字型扫描各个像 素块,统计相继出现的主颜色值;记录图像中各不同颜色的相邻关系及这种相 邻关系在整幅图像所有像素块对中出现的比例。得到图像主颜色转移矩阵的具 体方法描述如下:

1.由CL算法训练得到图像的矢量量化码表,共N个码字,也即量化成了N 种颜色;

2.将图像分成m×n块,每一块均包含s×t个像素;

3.得出每一块的主颜色索引值,也就是该块出现次数最多的索引值。这样就 形成了一个二维的主颜色矩阵,其大小为m×n,记为

A={ai,j}i=1,2,…m,j=1,2,…n;

4.建立一个N×N的矩阵P,各元素的初始值为0。将矩阵A按Z字型进行 扫描,设ai,j和ap,q为扫描序列中一对相继出现的颜色(ai,j在前面ap,q) 则P中相应元素自增1,如此反复,直到扫描完成;

5.建立一个N×N的矩阵D,其元素的计算公式如下

(5)感兴趣区域提取:其基本思想是根据原图像的目标特征选取合适的结 构元素,利用结构元素对原图像进行平移、交、并等运算,平滑图像并凸显目 标轮廓,然后将重要轮廓区域形成一个矩形区域,输出坐标点。首先利用开闭 运算对图像进行平滑处理,保留图像重要的轮廓、去除易造成过分划分的细节 和噪声;然后设定相应的阈值消除细小分块,取出面积最大的块;记录起始像 素点的行列值及宽度和高度以形成矩形感兴趣区域。图4为利用形态学图像处 理提取感兴趣区域的算法流程图。

形态学图像处理的基本运算有膨胀、腐蚀、开运算和闭运算。

膨胀:数学定义为集合运算,A被B膨胀,记为A⊕B,定义为

其中,为空集,B为结构元素。A被B膨胀是所有结构元素原点位置组成 的集合,映射并平移后的B至少与A的某些部分是重叠的。膨胀是将与物体所接 触的所有背景合并到该物体,使边界向外部扩张的过程,可以用来填补物体中 的空洞。具体步骤如下:

①用结构元素B扫描图像A的每一个像素;

②用结构元素与其覆盖的二值图像做“与”操作;

③如果都为0,结果图像的该像素为0,否则为1。

腐蚀:A被B腐蚀,记为AΘB,定义为

其中,为空集,B为结构元素。A被B腐蚀是所有结构元素原点位置组成 的集合,映射并平移后的B与A的背景并不叠加。腐蚀是一种消除边界黑点,使 边界向内部收缩的过程,可以用来消除小且无意义的物体。具体步骤如下:

①用结构元素B扫描图像A的每一个像素;

②用结构元素与其覆盖的二值图像做“与”操作;

③如果都为1,结果图像的该像素为1,否则为0。

开运算:先腐蚀后膨胀,即A被B腐蚀后再用B来膨胀腐蚀后的结果,定义 为:

其中,∪{□}指大括号中所有集合的并集,符号表示C是D的一个子 集。该公式的简单几何解释为:AоB是B在A内完全匹配的平移的并集。开运 算完全删除了不能包含结构元素的对象区域,平滑了对象轮廓,断开了狭窄连 接,去掉了细小突出部分,同时并不明显改变其面积。

闭运算:先膨胀后腐蚀,即A被B膨胀后再用B来腐蚀膨胀后的结果,定义 为:

其中,∪{□}指大括号中所有集合的并集,从几何上讲A□B是所有不与A重 叠的B的平移并集。像开运算一样,闭运算会平滑对象轮廓。然而与开运算不同 的是,闭运算一般会将狭窄的缺口连接起来形成细长的弯口,并填充比结构元 素小的洞,同时并不明显改变其面积。

提取感兴趣区域的具体步骤如下:

①读取彩色图像,将其转换为灰度图像;

②对灰度图像进行滤波,平滑图像去除噪声;

③选取圆盘结构元素,对灰度图像进行开运算;

④对开运算后的图像进行减运算,以增强图像,消除背景;

⑤将增强后的灰度图像进行对比度拉伸,灰度值映射到[0,1];

⑥将灰度图像二值化;

⑦选取矩形结构元素,分别对矩形行、列进行开闭运算;

⑧对连通的区域进行标记;

⑨计算图像各个连通区域的特征尺寸,取出面积最大的区域,记录其起始像 素点的行列值及高度和宽度以形成矩形区域;

⑩根据码字的大小将矩形区域截取为合适的尺寸。

(6)相似度匹配:对于一幅待检索图像,首先提取其感兴趣区域,记录其 起始和结束像素点的行列坐标,对应截取图像库中各图像的相应区域作为感兴 趣区域进行颜色特征匹配。最后将全局颜色特征和局部感兴趣区域特征加权检 索。具体步骤如下:设待查询图像为A,图像库中任意一幅图像为B,提取其感 兴趣区域,分别为a和b;

①统计全局和局部各颜色的频率百分比,形成颜色直方图HA,HB,Ha,Hb

②统计相邻像素块的颜色变化情况,形成颜色转移矩阵DA,DB,Da,Db

③采用欧氏距离计算全局相似度:其中ω1为全局颜色索引直方图的权重,ω2为全局主 颜色转移矩阵的权重(ω12∈[0,1]且ω12=1),为颜色转移矩 阵DA,DB中第i行j列元素;

④采用欧氏距离计算局部相似度:其中ω3为局部颜色索引直方图的权重,ω4为局部主 颜色转移矩阵的权重(ω34∈[0,1]且ω34=1),为颜色转移矩阵 ,Da,Db中第i行j列元素;

⑤合成相似度:Similar=pSimi1+qSimi2(其中p,q∈[0,1]p+q=1);

⑥将Similar按升序排列,返回检索结果。

在MATLAB7.9软件平台下结合附图对本发明方案的实例进行详细说明

使用256×384规格的彩色图像数据源,通过仿真实验与一种基于全局颜色 的图像检索算法进行比较。本发明方案的具体实施步骤如下:

初始码书设计阶段:

步骤1:读取一幅色彩丰富且分布均匀的彩色图像,得到彩色图像数据源的 3维矩阵A(有256行,384列,3个颜色通道,简记为(256×384×3));

步骤2:将RGB颜色空间转换为HSV颜色空间,分别提取出H(色调)、 S(饱和度)、V(亮度)三个分量。其中参数H表示色彩信息,即所处光谱颜 色的位置,它用角度量来表示,红、绿、蓝分别相隔120度,互补色分别相差 180度。饱和度S为一比例值,范围从0到1,它表示所选颜色的饱和度和该颜 色最大饱和度之间的比率。V表示色彩的明亮程度,范围从0到1;

步骤3:采用矢量平方和排序的方法将H、S、V(其尺寸均为256×384) 三个分量量化成为三本初始码书。以色调H为例,设码书的尺寸为N,首先将 相邻的互不重叠的4×4像素块转换成1×16的行矢量,则整幅图像由256×384转 换为6144×16(即6144个行矢量);计算6144个矢量的平方和Sl,将Sl按升序 进行排列;将排序训练矢量分成N段,每段有T=6144/N个训练矢量;依次选 择每段的第一个码字作为初始码字,形成尺寸N为初始码书。

码书训练阶段:

步骤1:在图像库各类图像中选取色彩迥异的24幅图像作为训练图像集;

步骤2:设一幅图像的训练矢量集为X={X1,X2,…,X6144}且Xl∈X,待设 计码书为Y={Y1,Y2,…,YN},迭代次数为t,经初始码书设计得到N个初始码本 并采用平方误差测度;

步骤3:计算训练矢量与各码字之间的误差测度

dj(t)=(Xl,Yj(t-1))=||Xl-Yj(t-1)||2,j=1,2,···,N;

步骤4:选择最小误差测度对应的码字Yi,即当前竞争获胜的码字,

di=min(dj),j=1,2,…,N;

步骤5:按下式调整获胜单元码字:

其中,a(t)为学习速率,这里取a(t)=1/t;

步骤6:当满足误差要求或指定迭代次数时停止训练,所得Y作为最终码书; 否则,转至步骤3;

步骤7:依次对训练图像集的图像进行训练。

经CL算法颜色聚类后,三维彩色图像可以分别获得三本码书Hi,Si,Vi(i=1,2,…,N),将量化后的三个颜色分量合并为一个特征矢量(一本码书)ω, ω=(Hi,Si,Vi)=LH□Hi+LS□Si+LV□Vi,而码字索引的集合相当于一个包含N种 颜色的查色表。

颜色索引直方图:

步骤1:将将待检索图像和图像库中图像分成和码字相同大小的像素块(如 本试验中为4×4);

步骤2:根据查色表,每个像素块通过一个码字的索引号(也即一种颜色) 来表征,具体实施方法如下:

4)计算每一个训练矢量与各码字之间的欧氏距离;

5)对于每个训练矢量,选择与其欧式距离最小的码字索引作为该矢量的 表征;

6)记录6144个矢量对应的码字索引值(即颜色表征)。

步骤3:通过统计各索引出现的频率百分比,得到每幅彩色图像的颜色索引 直方图H(v1,v2…,vi,…vN);其中,vi表示索引号为i的码字出现的比例,N为码 书尺寸。

主颜色转移矩阵:

步骤1:由前面的颜色空间量化得到图像的矢量量化码表,共N个码字,也 即量化成了N种颜色;

步骤2:将图像分成m×n块,每一块均包含s×t(本实验选取4×4)个像素;

步骤3:得出每一块的主颜色索引值,也就是该块出现次数最多的索引值。 这样就形成了一个二维的主颜色矩阵,其大小为m×n,记为 A={ai,j}i=1,2,…m,j=1,2,…n;

步骤4:建立一个N×N的矩阵P,各元素的初始值为0。将矩阵A按Z字 型进行扫描,设ai,j和ap,q为扫描序列中一对相继出现的颜色(ai,j在前面ap,q) 则P中相应元素自增1,如此反复,直到扫描完成;

步骤5:建立一个N×N的矩阵D,其元素的计算公式如下 D就是该图像的主颜色转移矩阵。

感兴趣区域提取:

步骤1:读取彩色图像,并将其转换为灰度图像;

步骤2:对灰度图像进行滤波,从输入数据中滤除噪声和干扰以提取有用信 息;

步骤3:运用IPT函数strel构造各种形状和大小结构元素(本实验选取平 坦圆盘为结构元素);

步骤4:对灰度图像进行开运算,删除不能包含结构元素的对象区域,平滑 轮廓对象,断开狭窄的连接并去掉细小的连接,同时并不明显的改变其面积;

步骤5:将滤波后的灰度图像与开运算后的图像进行减运算,以增强图像, 消除背景;

步骤6:将增强后的灰度图像进行对比度拉伸,设置阈值m,将输入值低于 m的灰度级压缩为输出图像中较暗灰度级的较窄范围内;类似地,将输入值高 于m的灰度级压缩为输出图像中较亮灰度级的较窄范围内;输出具有较高对比 度的图像,灰度值映射到[0,1];

步骤7:将灰度图像通过适当的阈值选取,获得仍然可以反映图像整体和局 部特征的二值化图像,使图像变的简单,数据量减少且凸显出感兴趣区域的目 标轮廓,以方便图像的进一步处理;

步骤8:选取矩形结构元素,分别对矩形行、列进行开闭运算,平滑物体内 的细小空洞、毛刺和背景区域上分布的细小噪声;

步骤9:对连通的区域进行标记,一般采用八连通或四连通寻找。八连通是 指一个像素如果和其他像素在上、下、左、右、左上角、左下角、右上角和右 下角连接着,则认为它们是连通的;四连通是指如果像素的位置在其他像素相 邻的上、下、左或右,则认为它们是连通的,在左上角、左下角、右上角或右 下角连接,则不认为它们连通;

步骤10:计算连通区域的特征尺寸,取出面积最大的区域,记录其起始像 素点的行列值及区域的高度和宽度以形成矩形区域;

步骤11:将行列的像素数目模4去除余数,形成行列值都为4的整数倍的 矩形区域即为感兴趣区域(由于本实验像素块量化取4×4大小,码字为1×16, 故矩形区域行列像素点需为4的整数倍,以方便像素块量化)。

相似度匹配:

步骤1:设两幅图像A和B,提取其感兴趣区域,分别为a和b;

步骤2:统计全局和局部各颜色的频率百分比,形成颜色索引直方图 HA,HB,Ha,Hb

步骤3:统计相邻像素块的颜色变化情况,形成主颜色转移矩阵 DA,DB,Da,Db

步骤4:采用欧氏距离作为度量方法,分别计算两幅图像全局索引直方图及 主颜色转移矩阵的欧氏距离,将两种颜色特征进行加权。则全局相似度为: Simi1=ω1(HA-HB)(HA-HB)T+ω2Σi=1NΣj=1N(DAi,j-DBi,j)2其中,ω1为全局颜色 索引直方图的权重,ω2为全局主颜色转移矩阵的权重(ω12∈[0,1]且 ω12=1);

步骤5:采用欧氏距离作为度量方法,分别计算两幅图像局部索引直方图及 主颜色转移矩阵的欧氏距离,将两种颜色特征进行加权。则局部相似度为: Simi2=ω3(Ha-Hb)(Ha-Hb)T+ω4Σi=1NΣj=1N(Dai,j-Dbi,j)2其中,ω3为局部颜色索 引直方图的权重,ω4为局部主颜色转移矩阵的权重(ω34∈[0,1]且ω34=1);

步骤6:合成相似度:Similar=pSimi1+qSimi2(其中p,q∈[0,1]p+q=1);

步骤7:将Similar按升序排列(Similar值越小说明两幅图像越相似);

步骤8:按需求返回检索结果。

对于检索效果的评价在于检索结果的正确与否,主要使用的是查准率 (precision)和查全率(recall)两个指标。查准率是指在一次查询过程中,系统 返回查询结果中相关图像的数目占所有返回图像数目的比例。查全率是指系统 返回查询结果中相关图像的数目占图像库中所有相关图像数目(包括返回的和 没有返回的)的比例。这两个指标越高说明检索方法的效果越好。查准率和查 全率的公式可表示为:

查准率P=p(A|B)=p(AB)p(B)=RARA+RB

查全率R=p(B|A)=p(AB)p(A)=RARA+RC

其中,RA表示检索出的相关图像的数目;RB表示检索出的无关图像数目; RC表示图像库中漏检的相关图像数目。

实验采用Li.J提供的标准图像数据库,选取其中420幅256×384或者 384×256的彩色图像形成检索图像库,共有人物、恐龙、花朵、草原、海滩、山 峰和汽车七类图像,每类包含60幅,用查准率来衡量其检索性能。

具体测试时,不同类别的图像各取10幅构成测试图像集,每幅图像依次返 回6幅,12幅,…,60幅的检索图像。在不同返回数目情况下,分别计算各类样 本图像的平均查准率作为该类别的查准率。表1给出了全局颜色检索算法和本 发明算法在返回图像数目为6幅,12幅,…,60幅的情况下每类图像的查准率。

表1每一类图像的查准率P(%)

表1续

从表1可以看出,在返回图像数目较少时,全局算法和本算法的查准率都 较高,随着返回图像数目的增加,查准率均有所下降。对于颜色分布较为集中 的图像,如人物、恐龙、花等,加入局部感兴趣区域之后,在返回不同图像数 目时,检索效率都有明显提高。对于海滩、山峰这两类颜色分布相对较散的图 像,加入局部感兴趣区域后,检索效率有一些起伏,如海滩在返回30幅图像时, 山峰在返回48幅和54幅时,本文检索效率有所下降,这是因为颜色分布不集 中的图像,目标与背景区分不明显。对于图像库整体的查准率,图5给出了相 应结果。

在返回图像数目相同的情况下,计算七类图像的平均查准率,作为在该返回数 目下图像库的整体查准率,以此对算法进行综合评价。由于各语义类别的图像 有很大不同,每个人对图像的感受和理解也都不同,所以查准率有一定的波动。 从整体效果来看,本发明提出的检索算法性能较全局检索算法更优。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号