首页> 中国专利> 一种目标鲁棒识别的抗旋转HDO局部特征描述方法

一种目标鲁棒识别的抗旋转HDO局部特征描述方法

摘要

本发明公开了一种目标鲁棒识别的抗旋转HDO局部特征描述方法,包括以下步骤:设定图像圆形检测区域;计算图像近似RGT梯度;计算结构张量,并求出每个像素点的主方向和一致性;把圆形图像划分为若干个环状扇形区间作为cell,每四个相邻的cell组合成一个Block,计算每个Block的特征向量;组合每个Block的特征向量,形成的HDO特征描述。本发明引入RGT变换技术,并在构造像素点圆形邻域中构造结构张量,可以保证在图片旋转的情况下每个像素点的主方向和一致性保持不变,然后求每个Block的主方向直方图,再采用环状扇形分区的空间池化划分方式,使得到的局部特征有良好的鉴别能力和抗旋转变换能力。

著录项

  • 公开/公告号CN105740870A

    专利类型发明专利

  • 公开/公告日2016-07-06

    原文格式PDF

  • 申请/专利权人 湘潭大学;

    申请/专利号CN201610067074.6

  • 发明设计人 张东波;胡扬;

    申请日2016-01-30

  • 分类号G06K9/46(20060101);

  • 代理机构湘潭市汇智专利事务所(普通合伙);

  • 代理人颜昌伟

  • 地址 411105 湖南省湘潭市雨湖区羊牯塘

  • 入库时间 2023-06-19 00:02:20

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2023-01-10

    未缴年费专利权终止 IPC(主分类):G06K 9/46 专利号:ZL2016100670746 申请日:20160130 授权公告日:20190315

    专利权的终止

  • 2019-03-15

    授权

    授权

  • 2016-08-03

    实质审查的生效 IPC(主分类):G06K9/46 申请日:20160130

    实质审查的生效

  • 2016-07-06

    公开

    公开

说明书

技术领域

本发明涉及一种局部特征描述方法,特别涉及一种目标鲁棒识别的抗旋转HDO局 部特征描述方法。

背景技术

局部特征描述在图像目标检测和识别中应用广泛,在过去二十年里,研究人员提 出了大量的局部特征描述算子。为了处理图像中存在的尺度、光照、对比度、旋转等变化,通 常要求特征描述需具备光照、尺度和旋转不变性等。著名的具有光照、尺度和旋转不变性的 描述算子有SIFT和SURF算子,但是其构造过程相对比较复杂,计算量大。2005年Dalal提出 的梯度方向直方图(HOG),由于计算简单,能够较好地捕获图像形状特性,在人脸和行人检 测中获得良好的检测性能,但是HOG在噪声较大和图像背景混乱的情况下鉴别能力显著下 降,因此为了克服HOG的这些弱点,2014年WonjunKim提出了鲁棒性更强的HDO特征,HDO特 征能够鲁棒地描述图像局部主方向结构信息,对于噪声和光照具有较强的鲁棒性,同时其 关注于主方向结构的描述,类似于人眼视觉系统,在复杂场景中也能保证良好的鉴别能力, 因此能用于各种目标检测问题,但是原有HDO特征不具备旋转不变性,因此在很大程度上限 制了它的推广应用。

影响特征描述的旋转不变性的因素主要来自特征提取和池化操作两个方面,一是 像素微观邻域提取局部特征以及在局部子空间内进行特征池化操作时,要具备旋转不变 性;二是在图像整体空间池化操作时也应具有旋转不变性。只有同时满足这两个方面的旋 转不变性,才能建立具有旋转不变性的图像局部特征描述方法。当然,特征描述具有旋转不 变性,并不能保证该特征一定具有良好的鲁棒识别性能,因此需要考虑在保证鉴别能力的 前提下,使特征描述方法能够对抗图像中可能出现的旋转变换。

已有抗旋转变换的局部特征描述技术中,SIFT和SURF算子通过估计局部主梯度方 向作为参考方向,然后做适当的方向校准实现抗旋转变换,但是由于梯度方向估计可能存 在±20°的误差,因此易导致误判。LBP特征为了获得旋转不变性特征模式,则通过排序策略 找到具有最小值的模式特征,该处理策略在基于梯度的方向直方图中也可以借用,例如找 到最大梯度方向,然后以此为基准,按顺时针或逆时针方向重新排列梯度方向直方图,但是 因易受噪声和其它因素干扰,有时难以获得稳定的排序关系,对于最终检测与识别造成困 扰。

发明内容

为了解决上述技术问题,本发明提供一种鉴别能力强、抗旋转、鲁棒性能好的目标 鲁棒识别的抗旋转HDO局部特征描述方法。

本发明解决上述问题的技术方案是:一种目标鲁棒识别的抗旋转HDO局部特征描 述方法,包括以下步骤:

(1)设定图像圆形检测区域;

(2)获取圆形图像的梯度并做近似RGT变换,得到圆形图像每个像素点的RGT梯度;

(3)计算每个像素点半径为2个像素宽度的圆形邻域的结构张量,并根据结构张量 求出特征值和特征向量,从而求出每个像素点的主方向θ和一致性c;

(4)把圆形图像划分为若干个环状扇形区间作为cell,每四个相邻的cell组合成 一个Block,统计每个Block的主方向一致性直方图并做归一化处理得到Block的特征向量;

(5)从圆形图像的左上角开始,按照从外环到内环、顺时针方向组合Block的特征 向量,形成具有抗旋转变换的HDO特征描述。

上述目标鲁棒识别的抗旋转HDO局部特征描述方法,所述步骤(1)中,获取到的原 始图像为矩形或者方形,以矩形或方形图片的中心点为圆心,以图片的长为直径,获取图像 圆形检测区域。

上述目标鲁棒识别的抗旋转HDO局部特征描述方法,所述步骤(2)具体步骤为:

①求取步骤(1)得到的圆形图像的梯度,在近似RGT变换时将圆形图像等分为8个 扇形区域,每个区域为45度;

②将扇形区域内的各个点的基向量量化,基向量量化后的方向与图像的8个方向 一致,由于梯度在基向量上的投影值等于图像在该基向量方向的方向导数,因此直接利用 相邻像素点灰度值计算RGT梯度。

上述目标鲁棒识别的抗旋转HDO局部特征描述方法,所述步骤(3)具体步骤为:

①依次选定圆形图像里的每个像素点,以选定的像素点为圆心,以2个像素点宽为 半径选取此像素点的圆形邻域;

②用圆形邻域里的近似RGT梯度构造结构张量S(i):

S(i)=ΣjBiIr2(j)ΣjBiθIr(j)It(j)ΣjBiθIr(j)It(j)ΣjBiIt2(j)

③求得S(i)的特征值和特征向量,再求出像素点邻域的主方向θ和一致性c:

θ=tan-1v1y/v1x.v1=[v1xv1y]T

c=λ12

其中Ir'、It分别表示径向方向和切向方向的近似RGT梯度幅值,Bi表示以像素点ith为中心半径为2个像素点的圆形邻域,θ为此像素点邻域的主方向,为Bi旋转θ角度后的圆 形邻域,v1是结构张量的最大特征值对应的特征向量,c为此像素点邻域的一致性,是结构 张量特征值λ1和λ2的差值,其中λ1是绝对值大的那个特征值,是特征向量里的两元 素。

上述目标鲁棒识别的抗旋转HDO局部特征描述方法,所述步骤(4)具体步骤为:

①将圆形图像划分为环形加扇形四分区,环状扇形区间中的每个连通区域作为图 像cell;

②每四个相邻的cell组合成一个Block;

③以Block为基本单位统计主方向直方图,将主方向在0°180°分为K个Bin组,K= 8,然后构建主方向一致性直方图;

④对每个Block的特征向量做归一化处理,生成特征描述子f=(f1,f2,....,,fk), fk表示第K个Block的特征描述子向量;

其中,c(x,y)和θ1(x,y)分别为像素点(x,y)的一致性和主方向,M是当前的Block, 是一个很小的正数。

上述目标鲁棒识别的抗旋转HDO局部特征描述方法,所述步骤(5)中,把Block特征 向量从圆形图像的左上角开始,按照从外环到内环、顺时针方向连接起来得到整个圆形图 像的HDO特征描述子:

F=(f1,f2,....,,fN)

其中,N表示图像中总的Block的数目,fn表示第n个Block的特征描述子向量,最终 的用于描述图像的HDO特征向量维数为KxN。

本发明的有益效果在于:本发明引入RGT变换技术,并在构造像素点圆形邻域中构 造结构张量,可以保证在图片旋转的情况下每个像素点的主方向和一致性保持不变,然后 用不变的主方向和一致性求每个Block的主方向直方图,再采用环状扇形分区的空间池化 划分方式,使得到的局部特征有良好的鉴别能力和抗旋转变换能力,从而使HDO局部特征具 有良好的鲁棒识别性能。解决了目标旋转后识别不了或识别不准确的问题。

附图说明

图1为本发明的流程图。

图2为本发明中图像圆形检测区域示意图。

图3为RGT变换示意图。

图4为本发明中近似RGT变换图.

图5为本发明中图片旋转后圆形邻域示意图。

图6为本发明中环状空间示意图。

图7为本发明中四扇区环状空间划分图。

图8为本发明中主方向一致性直方图。

具体实施方式

下面结合附图和实施例对本发明作进一步的说明。

如图1所示,一种目标鲁棒识别的抗旋转HDO局部特征描述方法,包括以下步骤:

(1)设定图像圆形检测区域。

如图2所示,正方形表示图像,以正方形的中心点为圆心、正方形边长的一半为半 径画正方形的内接圆,内接圆所在的区域就是图像圆形检测区域。

(2)获取圆形图像的梯度并做近似RGT变换,得到圆形图像每个像素点的RGT梯度。

如果按传统的方式来计算梯度,当图片旋转后,各个像素点的梯度会发生变化。因 此,为了获得旋转不变的HDO特征,我们需要进行RGT(RadialGradientTransform)变换, RGT的变换过程如图3所示。

图3中,O表示图像的中心,P为某圆周上任意一点,以P点为原点,沿OP和垂直OP方 向构建新的局部坐标系统,假设r和t分别是沿径向和切向两个正交方向的单位向量,则

r=p-o||p-o||,t=Rπ/2r---(1)

其中Rπ/2是旋转90度矩阵,在新的局部坐标系统中,p点的梯度g可以分解为径向和 切向分量之和,即g=(gTr)r+(gTt)t,其中第一项是p点梯度的径向分解,第二项是p点梯度 的切向分解。因此梯度g在局部坐标系统中可以表示为向量(gTr,gTt)。假定以O为中心旋转 角度α,则对应的旋转后的P′点坐标、沿径向的单位向量r′、沿切向的单位向量t′、梯度g′记 为:

P′=RαP,r′=Rαr,t′=Rαt,g′=Rαg

Rα为旋转α矩阵。

可以证明经RGT变换后的梯度具有旋转不变性

(Ir,It)=(gTr,gTt)=((Rαg)TRαr,(Rαg)TRαt)=(gTRαTRαr,gTRαTRαt)=(gTr,gTt)=(Ir,It)

其中Ir'、It分别表示径向方向和切向方向的近似RGT梯度幅值,Ir′、It′分别表示旋 转后径向方向和切向方向的近似RGT梯度幅值。

为了避免大量的浮点数运算,提高计算速度,采用一种近似的RGT变换,即将圆形 区域内各个点的基向量r和t以45度一个区间单位近似为r′和t′,r′量化后的结果如图4所 示(t′的量化处理结果跟r′相似),因此其梯度可以直接利用相邻像素点灰度值进行计算。 具体实现过程如下:

①在近似RGT变换时将圆形图像等分为8个扇形区域,每个区域为45度;

②将扇形区域内的各个点的基向量量化,基向量量化后的方向与图像的8个方向 一致,如图4所示,由于梯度在基向量上的投影值等于图像在该基向量方向的方向导数,因 此直接利用相邻像素点灰度值计算RGT梯度。

(3)计算每个像素点半径为2个像素宽度的圆形邻域的结构张量,并根据结构张量 求出特征值和特征向量,从而求出每个像素点的主方向θ和一致性c。

传统的HDO构造结构张量时,需要在给定像素点的矩形邻域Bi中计算,当图片旋转 θ后,像素点的矩形邻域通常和Bi并不完全相同(θ=90°和180°除外),这就不能充分保证 HDO特征描述子具有旋转不变性。因此本发明提出用圆形邻域代替矩形邻域求取每个像素 点的结构张量。图5显示了某手掌图片旋转前后采用不同局部邻域的情况,其中第二行为截 取的局部子图,从图5可以看出,如果采用矩形邻域,当图片旋转后,其邻域显然会存在一定 变化(图5(a),(b)所示),如果采用圆形邻域,无论图片怎么旋转,像素点的圆形邻域是不变 的(图5(c),(d)所示),即同时因为满足(Ir′,It′)=(Ir,It),由此构造的结构张量S (i)不变。

Sθ(i)=ΣjBiθIr2(j)ΣjBiθIr(j)It(j)ΣjBiθIr(j)It(j)ΣjBiθIt2(j)=ΣjBiIr2(j)ΣjBiθIr(j)It(j)ΣjBiθIr(j)It(j)ΣjBiIt2(j)=S(i)

其中Ir'、It分别表示径向方向和切向方向的近似RGT梯度幅值,Ir′、It′分别表示旋 转后径向方向和切向方向的近似RGT梯度幅值,Bi表示以像素点ith为中心半径为2个像素点 的圆形邻域,θ为此像素点邻域的主方向,为Bi旋转θ角度后的圆形邻域。

因而籍此计算的该像素点的主方向θ和一致性值c不变。具体步骤为:

①依次选定圆形图像里的每个像素点,以选定的像素点为圆心,以2个像素点宽为 半径选取此像素点的圆形邻域;

②用圆形邻域里的近似RGT梯度构造结构张量S(i):

S(i)=ΣjBiIr2(j)ΣjBiθIr(j)It(j)ΣjBiθIr(j)It(j)ΣjBiIt2(j)

③求得S(i)的特征值和特征向量,再求出像素点邻域的主方向θ和一致性c:

θ=tan-1v1y/v1x.v1=[v1xv1y]T

c=λ12

其中v1是结构张量的最大特征值对应的特征向量,c为此像素点邻域的一致性,是 结构张量特征值λ1和λ2的差值,其中λ1是绝对值大的那个特征值,是特征向量里的 两元素。

(4)计算Block的特征向量。

为了实现抗旋转HDO特征描述,采用环形空间池化策略,如图6所示,其中每个圆环 相当于传统HDO的cell。显然,无论图片怎么旋转,每个圆环所包含的图像区域是不变的,因 此在环状区域内进行特征的池化操作,可以实现抗旋转变换HDO特征描述。但是环状空间对 图像描述过于粗糙,因此依进行特征池化获得的特征分辨性能较差,因而在保证分辨性能 的前提下,有必要对环状区域次此进一步做扇区划分,如图7所示,本发明采用了四扇区环 状划分,具体步骤为:

①圆形图像划分为环状扇形四分区,环状扇形区间中的每个连通区域作为图像 cell,如图7所示;

②每四个相邻的cell组合成一个Block,如图6中的连通区域1、2、5、6,区域2、3、6、 7,区域3、4、7、8,区域5、6、9、10,区域6、7、10、11以及区域7、8、11、12,区域9、10、13、14,区域 10、11、14、15,区域11、12、15、16组合成Block,;

③以Block为基本单位统计主方向直方图,将主方向在0°~180°分为K(K=8)个 Bin组,然后构建主方向一致性直方图,如图8所示,图中横坐标表示主方向,纵坐标表示一 致性;

④对每个Block的特征向量做归一化处理,生成特征描述子,f=(f1,f2,....,, fk),fk表示第K个Block的特征描述子向量;

其中,EL是随K值变化的,El就是变化的Ek.右边的公式EK,就是坐标公式里的EL.

c(x,y)和θ1(x,y)分别为像素点(x,y)的一致性和主方向,M是当前的Block,是 一个很小的正数。

(5)从圆形图像的左上角开始,把Block特征向量按照从外环到内环、顺时针方向 连接起来,形成具有抗旋转变换的HDO特征描述子:

F=(f1,f2,....,,fN)

其中,N表示图像中总的Block的数目,fn表示第n个Block的特征描述子向量,最终 的用于描述图像的HDO特征向量维数为KxN。

以上所述仅是本发明的优选实施方式,本发明的保护范围并不局限于上面所描述 的内容,在本领域技术人员所具备的知识范围内,不脱离本发明构思作出的各种变化,仍落 在本发明的保护范围内。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号