首页> 中国专利> 一种复杂背景下结合显著性信息的物体性检测方法

一种复杂背景下结合显著性信息的物体性检测方法

摘要

一种复杂背景下结合显著性信息的物体性检测方法,其步骤为:(1)利用SSS显著性检测算法分别获得各个通道在设定的8个高斯核下的显著性图;(2)分别计算8个显著性图的Renyi熵值,标记出Renyi熵值变化最大处;(3)将8幅显著性图分成两部分,分别在两部分中选出Renyi熵值最小的显著性图;(4)将两张显著性图归一化后叠加作为该通道的最终显著性图;(5)重复上述步骤,计算出3个通道各自的最终显著性图;(6)将获得的3个通道的最终显著性图与各自对应通道图相乘并重新组合;(7)用Bing算法对组合后的图像进行物体性检测。本发明具有原理简单、可操作性好、检测效率高等优点。

著录项

  • 公开/公告号CN104143085A

    专利类型发明专利

  • 公开/公告日2014-11-12

    原文格式PDF

  • 申请/专利权人 中国人民解放军国防科学技术大学;

    申请/专利号CN201410341108.7

  • 发明设计人 牛轶峰;沈林成;沈镒峰;

    申请日2014-07-17

  • 分类号G06K9/00;G06T7/00;

  • 代理机构湖南兆弘专利事务所;

  • 代理人赵洪

  • 地址 410073 湖南省长沙市砚瓦池正街47号中国人民解放军国防科学技术大学三院

  • 入库时间 2023-12-17 01:59:14

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2017-09-05

    授权

    授权

  • 2014-12-10

    实质审查的生效 IPC(主分类):G06K9/00 申请日:20140717

    实质审查的生效

  • 2014-11-12

    公开

    公开

说明书

技术领域

本发明主要涉及到图像处理技术领域,特指一种适用于复杂背景下的结合显著性信息的 物体性检测方法。

背景技术

自动快速的检测出图像中的物体是计算机视觉的一项重要任务,这项研究广泛应用于图 片的自动处理、Google眼镜的视频数据分析、自动机器人的障碍检测与定位等。

虽然,目前在物体识别领域已经取得了巨大成功,但物体性检测依然面临很多严峻挑战, 特别在2维图像中的物体性检测。由于这些数据没有深度信息,给检测带来了很高的难度。 以最常用于算法评价的数据库之一:VOC2007数据库为例,该数据库包含9963张图片,类 别为20类,均为日常生活中常见的物体如人、自行车、飞机等。每一类图像包含96-2008张 图像,均为一股尺寸的自然图像,图像中背景复杂,每张图像可能包含多个不同类别物体并 存在互相遮挡重叠等情况,且物体尺度变化很大,因而检测难度很大,并且实际图像还存在 光照、噪声等众多因素的干扰。

有从业者提出利用显著性检测可以得到的图像的前景信息,这就可以弥补2维图像所缺 少的深度信息,而且显著性检测算法计算简单,鲁棒性好,对噪声不敏感,因此可以将显著 性检测与物体性检测进行结合,达到信息的互补与资源的整合,使有限的信息发挥最大的效 能。

但是现有技术中,将两者的相互结合方式是直接把显著区域的分割块作为候选物体窗口, 这类方式的最大问题就是对显著性检测算法和分割算法依赖度大,而现存的算法很难达到要 求。因此,亟需一种物体性检测与显著性检测结合的新方法。

发明内容

本发明要解决的技术问题就在于:针对现有技术存在的技术问题,本发明提供一种原理 简单、可操作性好、检测效率高的复杂背景下结合显著性信息的物体性检测方法。

为解决上述技术问题,本发明采用以下技术方案:

一种复杂背景下结合显著性信息的物体性检测方法,其步骤为:

(1)、利用SSS显著性检测算法分别获得各个通道在设定的8个高斯核下的显著性图;

(2)、分别计算8个显著性图的Renyi熵值,并标记出显著性图的Renyi熵值变化最大 处;

(3)、根据步骤(2)得到的标记处将8幅显著性图分成两部分,并分别在两部分中选出 Renyi熵值最小的显著性图;

(4)、将步骤(3)中选取的两张显著性图归一化后叠加作为该通道的最终显著性图;

(5)、重复上述步骤,计算出3个通道各自的最终显著性图;

(6)、将获得的3个通道的最终显著性图与各自对应通道图相乘,并重新组合;

(7)、组合后的图像作为最终的测试图像并利用Bing算法进行物体性检测。

作为本发明的进一步改进:所述步骤(1)中SSS显著性检测算法的具体步骤为:

(1.1)利用傅里叶变换分别将输入图像的三个通道变换到频域,并求取其对应的幅值谱 和相角谱;

(1.2)将幅值谱与8个设定的高斯核因子;进行卷积得到8个新的幅值谱;

(1.3)将新的幅值谱与原来的相角谱傅里叶反变换到时域即为显著性图。

作为本发明的进一步改进:所述步骤(2)和步骤(3)中计算8个显著性图的Renyi熵 值是通过公式:来进行的,并以8个图之间的Renyi熵值斜率变化最大 处为界将这8个图划分成两类。

作为本发明的进一步改进:在所述步骤(4)中,在两类图分别选出Renyi熵值最小的显 著性图SalMapl和SalMaps,将选取的两张显著性图归一化后叠加作为该通道的最终显著性图 SalMapfinal;具体的叠加方式为:SalMapfinal=N(SalMapl+λ*SalMaps);其中,N为归 一化函数,λ为两类最优显著图的最大值之比:

λ=max(max(SalMapl))max(max(SalMaps)).

作为本发明的进一步改进:所述步骤(6)和步骤(7)为进行显著性与物体性的结合, 其具体步骤如下:

步骤a.将输入的彩色图像获得的3个通道的最终显著性图与各自对应通道图相乘,并重 新组合生成彩色图像;

步骤b.对VOC2007数据库上的图像进行步骤a的处理,并将处理过的部分图片作为Bing 检测算法的训练样本,训练出新的物体模型;

步骤c.将获得的物体模型对经过步骤a同样处理的图像进行物体检测。

与现有技术相比,本发明的优点在于:本发明的复杂背景下结合显著性信息的物体性检 测方法,将显著性信息直接作用于物体性检测的过程中,在保持显著区域物体特征的同时对 非显著区域的物体特征进行抑制,更加有效的利用显著性信息且并不受算法性能的局限性影 响,而且不需要引入分割算法,提高了物体检测率。

附图说明

图1是本发明方法的流程示意图。

图2是SSS算法的流程示意图。

图3是8个显著性图对应的Renyi熵值。

具体实施方式

以下将结合说明书附图和具体实施例对本发明做进一步详细说明。

如图1、图2和图3所示,本发明的一种复杂背景下结合显著性信息的物体性检测方法, 其步骤为:

(1)、利用SSS(Spectral Scale Space)显著性检测算法分别获得各个通道(L、A、B)在 设定的8个高斯核下的显著性图;

(2)、分别计算8个显著性图的Renyi熵值,并标记出显著性图的Renyi熵值变化最大 处;

(3)、根据步骤(2)得到的标记处将8幅显著性图分成两部分,并分别在两部分中选出 Renyi熵值最小的显著性图;

(4)、将步骤(3)中选取的两张显著性图归一化后叠加作为该通道的最终显著性图;

(5)、重复上述步骤,计算出3个通道各自的最终显著性图;

(6)、将获得的3个通道的最终显著性图与各自对应通道图相乘,并重新组合;

(7)、组合后的图像作为最终的测试图像并利用Bing算法进行物体性检测;Bing算法可 参考文献Ming-Ming Cheng,Ziming Zhang,Wen-Yan Lin,Philip Torr.BING:Binarized Normed  Gradients for Objectness Estimation at300fps[A].IEEE Conference on Computer Vision and  Pattern Recognition[C].2014。

常规的SSS显著性检测算法的基本原理可参考文献Li J,Levine M D,An X,et al.Visual  saliency based on scale-space analysis in the frequency domain[J].Pattern Analysis and Machine  Intelligence,IEEE Transactions on,2013,35(4):996-1010.,本实施例中,步骤(1)中SSS显著 性检测算法为改进的SSS显著性检测算法,具体步骤为:

(1.1)利用傅里叶变换分别将输入图像的三个通道变换到频域,并求取其对应的幅值谱 和相角谱。

(1.2)将幅值谱与8个设定的高斯核因子(2k,k∈[-1,6])进行卷积得到8个新的幅值 谱。

(1.3)将新的幅值谱与原来的相角谱傅里叶反变换到时域即为显著性图。

本实施例中,步骤(2)和步骤(3)中计算8个显著性图的Renyi熵值是通过公式: 来进行的,并以8个图之间的Renyi熵值斜率变化最大处为界将这8个 图划分成两类。

本实施例中,在步骤(4)中,在两类图分别选出Renyi熵值最小的显著性图SalMapl和 SalMaps,将选取的两张显著性图归一化后叠加作为该通道的最终显著性图SalMapfinal。具体 的叠加方式为:SalMapfinal=N(SalMapl+λ*SalMaps);

其中,N为归一化函数,λ为两类最优显著图的最大值之比:

λ=max(max(SalMapl))max(max(SalMaps)).

为了评价本发明模拟视点转移机制方法的性能,在ImgSal的眼动数据库的C6类图像中 使用ROC(Receiver operating characteristic)值即ROC曲线下的面积AUC(Area under the ROC  curve)及AUC的标准差作为指标来对模型进行定量比较。结果证明本发明的方法取得了比其 它基于频域分析的视觉显著性检测算法较优越的性能,证明了本发明方法的有效性。在提高 检测准确度的同时,保持频域类算法运算速度快的优势也是非常重要的。本发明从运行时间 上对算法复杂度进行评估。本发明在Intel Pentium(R)CPU G20202.9GHz、Matlab2012b的平 台上在人眼跟踪数据库上单幅图像平均运行时间进行测试,结果如表1所示。除SIG算法在 运行时间上有明显优势外,其它算法运行时间差别较小,综合检测准确率和运行时间两方面 来看,本发明具有明显优势。

表1本发明的改进显著性算法与其它算法的实验结果对比

算法 AUC 标准差 运算时间 SR 0.74751 0.1193 0.3762 PFT 0.75427 0.1064 0.2802 IG 0.57676 0.1177 0.1498 SIG 0.80066 0.1216 0.0289 SSS 0.76417 0.0838 0.1895 Ours 0.83009 0.0596 0.1950

本实施例中,步骤(6)和步骤(7)为进行显著性与物体性的结合,其具体步骤如下:

步骤a.将输入的彩色图像获得的3个通道的最终显著性图与各自对应通道图相乘,并重 新组合生成彩色图像。

步骤b.对VOC2007数据库上的图像进行步骤a的处理,并将处理过的部分图片作为Bing 检测算法的训练样本,训练出新的物体模型(或称物体滤波器)。

步骤c.将获得的物体模型对经过步骤a同样处理的图像进行物体检测。

在具体的应用实例中,以基于VOC2007数据库以VOC的检测准则(intersection/union>0.5) 作为评价指标(即检测率),对本发明提出的物体性检测算法进行了评价。如表2所示,Ours 在1个和10个候选窗口下取得的检测率高于其它算法。

表2本发明的物体性检测算法与其它算法的实验结果对比

#WIN Alexe DNN Bing Ours 1 0.22 0.241 0.255 0.271 10 0.41 0.453 0.469 0.489

以上仅是本发明的优选实施方式,本发明的保护范围并不仅局限于上述实施例,凡属于 本发明思路下的技术方案均属于本发明的保护范围。应当指出,对于本技术领域的普通技术 人员来说,在不脱离本发明原理前提下的若干改进和润饰,应视为本发明的保护范围。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号