公开/公告号CN101470730A
专利类型发明专利
公开/公告日2009-07-01
原文格式PDF
申请/专利权人 中国科学院自动化研究所;
申请/专利号CN200710304207.8
申请日2007-12-26
分类号G06F17/30(20060101);G06T7/00(20060101);
代理机构11021 中科专利商标代理有限责任公司;
代理人周国城
地址 100080 北京市海淀区中关村东路95号
入库时间 2023-12-17 22:14:42
法律状态公告日
法律状态信息
法律状态
2023-05-09
专利权人的姓名或者名称、地址的变更 IPC(主分类):G06F17/30 专利号:ZL2007103042078 变更事项:专利权人 变更前:人民中科(济南)智能技术有限公司 变更后:人民中科(北京)智能技术有限公司 变更事项:地址 变更前:250000 山东省济南市经十路7000号汉峪金谷新媒体大厦2层201室 变更后:100176 北京市大兴区北京经济技术开发区科谷一街8号院8号楼14层1401(北京自贸试验区高端产业片区亦庄组团)
专利权人的姓名或者名称、地址的变更
2020-03-27
专利权的转移 IPC(主分类):G06F17/30 登记生效日:20200310 变更前: 变更后: 申请日:20071226
专利申请权、专利权的转移
2019-12-20
专利权的转移 IPC(主分类):G06F17/30 登记生效日:20191203 变更前: 变更后: 申请日:20071226
专利申请权、专利权的转移
2010-12-22
授权
授权
2009-08-26
实质审查的生效
实质审查的生效
2009-07-01
公开
公开
查看全部
技术领域
本发明涉及计算机应用技术领域的多媒体检索技术,是一种基于频谱特征分析的图像重复检测方法。
背景技术
随着多媒体技术和计算机网络的飞速发展,全世界包括数字图像、音频、视频在内的多媒体数据正在以惊人的速度进行增长。特别是图像数据,由于其直观、内容表达丰富、可以进行个性化编辑等因素,非常受到用户的青睐。但是,每天新生成的海量级的图像数据,由于其巨大的冗余性,无情地吞噬了我们有限的存储空间,并且淹没了很多有用的信息,从而给用户的图像数据搜索带来了很大的麻烦。如何才能使用户有效地利用信息并对所需多媒体资源的快捷定位、方便获取以及有效管理已经是一个亟待解决的问题,特别是那些为用户服务的互联网搜索公司以及个性化数据供应商更是希望能够低成本地维护和更新图像数据库。然而,目前诸如google、yahoo以及百度等成熟的商业图像搜索引擎几乎都是用文本来索引图像的,这样就会导致在数据库出现大量的文本索引不同而内容几乎一样的图像,从而占用了大量的宝贵的存储空间;更严重的是,用户检索服务的质量会严重下降,因为检索出来的图像存在很大的重复性,直接会影响用户的使用心情,造成用户的不满。因此,图像数据库中的重复检测问题显得尤为重要,然而重复检测问题的核心是图像表达。只要数据库中的图像索引做得好,就能有效地进行图像重复检测。
图像表达的本质是寻找一个合适的特征映射函数,该函数能够将图像映射到一个不仅类内相似度高而且类间相似度也低的高维空间。在图像表达研究领域,大致存在两种类型的特征映射函数,它们分别是基于底层视觉特征和高层语义特征,我们称它们为底层特征映射函数和高层语义特征映射函数。底层特征映射函数主要是获得图像的一些底层信息,这些信息主要包括颜色、纹理、梯度等。该函数的主要优点是操作方便,灵活度高,计算复杂度低等,其主要缺点是缺乏图像的高层语义信息。相比之下,高层语义特征映射函数主要是获得图像里的存在的目标或者整个图像场景的语义信息,其主要优点是能够有效进行图像理解,从而较准确地表达图像,但是,其主要的缺点是计算复杂度高,需要设定参数较多,灵活度低,不能够被大规模地使用。综合以上两种映射函数的优缺点以及图像数据库重复检测问题本身的特性,我们决定采用底层特征映射函数去捕获图像信息,其主要原因如下:(1)图像数据库的规模比较大,对计算复杂度的要求非常严格;如果采用高层语义特征映射函数的话,数据库维护和更新的代价非常巨大。(2)图像重复检测这个问题本身对图像内容表达的要求不高。通常,两幅重复的图像是可以通过一些变换进行相互转换的,这些变换主要包括平移、旋转以及尺度,且其变换幅度非常小。底层特征映射函数完全可以处理以上这些变换所造成的影响。(3)底层特征映射函数灵活度高,易于计算机处理;而高层语义特征映射函数正好相反,它受到诸多因素的限制,需要事先设置很多的经验参数,不利于计算机处理。于是在这种背景下,我们提出了一种融合图像颜色和梯度信息的特征。在该特征中,图像颜色信息是通过图像的频谱来体现的,而图像梯度信息主要是通过图像梯度方向直方图的频谱来体现的。在以下几个部分,我们将详细介绍该特征。
发明内容
本发明提出了一种基于频谱特征分析的图像重复检测方法,这种方法采用了集成了图像颜色和梯度信息的图像索引,,应用于图像重复检测领域。
本发明提出的基于频谱分析的图像重复检测方法,包括:
采用下采样模块对图像进行下采样,用于缩短图像频谱分析的计算时间;
采用频谱分析模块对图像进行频谱分析,用于提取下采样后的图像的低频谱信息,得到图像像素的颜色信息;
采用频谱分析模块对图像进行梯度信息分析;用于获取下采样后的图像梯度分布特征;
采用索引生成模块融合图像颜色和梯度信息,作为图像索引;
以图像索引为依据,检测图像是否重复。
进一步,所述下采样后的图像的低频谱信息包括旋转、平移以及尺度不变。
进一步,所述下采样后的图像梯度分布特征具有旋转、平移以及尺度不变的性质。
进一步,所述频谱分析步骤包括:
对图像进行傅立叶变换,获取其幅度谱;
对幅度谱进行对数极坐标映射形成一幅新的图像;
对这幅新的图像进行傅立叶变换,获得幅度谱;
仅保留低频谱信息,用来刻画图像颜色分布的特征。
进一步,所述梯度信息分析步骤包括:
提取图像每一个像素的梯度,统计所有像素的梯度方向;
将方向空间量化为n个等级;
将每一个像素的梯度方向映射到相应的等级,构建成了一个梯度方向直方图;
对直方图进行傅立叶变换,取其幅度谱;
将幅度谱作为刻画图像梯度信息的特征。
本发明提出的基于频谱特征分析的图像重复检测方法,使用的图像底层特征较好地表达了图像中的结构和细节信息;其作为图像索引,可以有效地检测出图像数据库中文本索引不同而内容几乎一样的图像,从而极大地节约了宝贵的存储空间,从而提高了用户检索服务的质量。
附图说明
图1为本发明系统结构框图;
图2为本发明检测重复山河图像的应用实例;
图3为本发明检测重复飞机图像实例;
图4为本发明检测重复溪流图像实例。
具体实施方式
下面将结合附图对本发明加以详细说明,应指出的是,所描述的实施例仅旨在便于对本发明的理解,而对其不起任何限定作用。
本发明总体结构由以下三个模块组成:一、下采样模块,该模块的功能是对图像进行下采样。二、频谱分析模块,该模块的功能是进行图像频谱分析和图像梯度信息分析。三、图像索引生成模块,该模块的任务是将频谱分析模块得到的两种特征统一起来,从而形成一个对图像旋转、平移以及尺度变化非常鲁棒的图像索引。我们利用这个索引来进行图像重复检测。图1显示了本发明的整体结构。
下面详细给出该发明技术方案中所涉及的各个细节问题的说明。
1)通过下采样模块对图像进行下采样。
首先将图像进行下采样,这样做的目的是降低计算复杂度,同时也能获取图像大尺度的结构信息。通常,下采样率是0.5,也就是图像的尺寸变成原来的一半。此外,如果要处理的图像是彩色图像,那么我们首先将彩色图像转换为灰度图像。
2)通过频谱分析模块对图像进行频谱分析。
对下采样后的图像进行傅立叶变换,获取其幅度谱;然后对幅度谱进行对数极坐标映射形成一幅新的图像;接着对这幅新的图像进行傅立叶变换,获得幅度谱;最后仅保留一些低频率的谱信息。经过以上处理后所获得的谱信息是不变于图像尺度、旋转以及平移变换的,这些属性可以通过我们以下的理论分析得到证实。
给定一幅原始图像fa(x,y),我们对它进行旋转、尺度以及平移变换后得到一幅新的图像fb(x,y),其中旋转角度是α,尺度因子是σ,x方向的平移量为x0,以及y方向的平移量为y0,以上变换过程可以用以下的公式说明:
fb(x,y)=fa[σ(xcosα+ysinα)—x0,σ(—xsinα+ycosα)—y0]。
我们分别对fa(x,y)和fb(x,y)进行傅立叶变换,得到对应的频谱Fa(u,v)和Fb(u,v)。根据傅立叶变换理论,Fa(u,v)和Fb(u,v)存在以下的关系:
>
其中,φb(u,v)是fb(x,y)的相位谱,该相位谱与旋转角度、尺度因子以及平移量有关;但如果我们只考虑幅度频谱|Fb(u,v)|,就会发现|Fb(u,v)|是平移不变的,即:
|Fb(u,v)|=σ-2|Fa[σ-1(ucosα+vsinα)0,σ-1(—usinα+vcosα)]|。
以上公式表明,|Fa(u,v)|和|Fb(u,v)|之间是通过旋转角度α和尺度因子σ之间联系的。然后我们在极坐标系(r,θ)里重新表达|Fa(u,v)|和|Fb(u,v)|,即u=rcosθ和v=rsinθ。从而可以衍生出以下的关系:
fap(θ,r)=|Fa(rcosθ,rsinθ)|;fbp(θ,r)=|Fb(rcosθ,rsinθ)|
经过一些简化运算,我们可以得出:
fbp(θ,r)=σ-2fap(θ—α,r/σ)。
这样图像旋转转换就被转换为沿着角度轴θ的平移和半径轴r的尺度变换。接着,我们进一步将fbp(r,θ)的半径轴r映射到对数坐标系里,这样我就有了以下的关系式:
fbpl(θ,λ)=fbp(θ,r)=σ-2fapl(θ—α,λ—η),
其中,λ=log(r),η=log(σ)。这样以来,图像的旋转和平移就被简化为沿着λ轴和η轴的平移;然后我们对fbpl(θ,λ)进行傅立叶变换;根据傅立叶变换理论,我们有以下的关系:
Fbpl(ξ,ζ)=σ-2e-j2π(ξη+ζλ)Fapl(ξ,ζ)。
我们对|Fbpl(ξ,ζ)|进行归一化,然后取其作为最后的频谱特征,这样|Fbpl(ξ,ζ)|是旋转、尺度和平移不变的。
3)通过频谱分析模块对图像进行梯度信息分析。
提取下采样后的图像每一个像素的梯度,然后统计所有像素的梯度方向;接着,我们将方向空间等间隔量化为36个等级;然后我们将每一个像素的梯度方向映射到相应的等级,这样构建成了一个梯度方向直方图;然后对直方图进行傅立叶变换,取其幅度谱。由于梯度方向直方图本身具有尺度和平移不变的属性,再加上傅立叶变换后去幅度谱,这样以来得到的特征有具有旋转不变的特性。
4)通过索引生成模块融合图像颜色和梯度信息,实现特征集成。
第二步得到的谱特征和第三步得到的梯度方向直方图谱特征,它们都具有旋转、尺度以及平移不变的属性。我们将这两种特征组合起来作为一幅图像的索引,分别使用欧式距离来度量两幅图像之间的距离,另外再定义一个阈值来判别两幅图像是否重复;如果两种距离的和小于这个阈值,我们就认为比较的两幅图像是重复的;反之亦然。
图2、图3以及图4给出了我们图像重复检测系统的三个应用实例。在图2中,我们选中数据库中的一幅含有山河的图像,对其提取我们提出的基于频谱分析的图像底层特征,然后利用该特征进行图像匹配,从而挑选出数据库中与检索图像重复的4张图片。在图3中,我们选中数据库中的一幅含有飞机的图像,对其提取我们提出的基于频谱分析的图像底层特征,然后利用该特征进行图像匹配,从而挑选出数据库中与检索图像重复的3张图片。在图4中,我们选中数据库中的一幅含有溪流的图像,对其提取我们提出的基于频谱分析的图像底层特征,然后利用该特征进行图像匹配,从而挑选出数据库中与检索图像重复的3张图片。
以上所述,仅为本发明中的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉该技术的人在本发明所揭露的技术范围内,可理解想到的变换或替换,都应涵盖在本发明的包含范围之内,因此,本发明的保护范围应该以权利要求书的保护范围为准。
机译: 重复图像检测装置和图像转换装置,重复图像检测方法和图像变换方式以及图像记录介质
机译: 基于图像特征分析的胶囊内窥镜图像处理方法
机译: 基于图像数据的生物特征分析医学图像处理装置