首页> 中国专利> 一种复杂光照人脸识别的光照不变量提取方法

一种复杂光照人脸识别的光照不变量提取方法

摘要

本发明公开了一种复杂光照人脸识别的光照不变量提取方法,其特征在于:包括以下步骤:(1)读入人脸图像;(2)对图像进行多尺度多方向轮廓分析;(3)求取图像的多尺度多方向轮廓信息;(4)求取图像各尺度的轮廓信息;(5)求取图像各尺度的轮廓方向信息;(6)求取图像轮廓的主方向。本发明解决了现有技术方法在复杂光照情况下人脸识别的效果不能令人满意的问题,本发明目的是从多尺度、多方向轮廓特征出发,提出更有效的光照不变量提取方法,以便提高复杂光照情况下人脸识别的识别准确性。另外该方法还可以应用于图像检索领域。

著录项

  • 公开/公告号CN101833658A

    专利类型发明专利

  • 公开/公告日2010-09-15

    原文格式PDF

  • 申请/专利权人 南京理工大学;

    申请/专利号CN201010159750.5

  • 发明设计人 程勇;赵春霞;

    申请日2010-04-29

  • 分类号G06K9/00(20060101);G06K9/46(20060101);

  • 代理机构32224 南京纵横知识产权代理有限公司;

  • 代理人董建林

  • 地址 210094 江苏省南京市孝陵卫200号

  • 入库时间 2023-12-18 00:52:30

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2015-06-17

    未缴年费专利权终止 IPC(主分类):G06K9/00 授权公告日:20130724 终止日期:20140429 申请日:20100429

    专利权的终止

  • 2013-07-24

    授权

    授权

  • 2010-11-03

    实质审查的生效 IPC(主分类):G06K9/00 申请日:20100429

    实质审查的生效

  • 2010-09-15

    公开

    公开

说明书

技术领域

本发明涉及光照不变特征提取、多尺度几何分析技术及复杂光照情况下的人脸识别技术。

背景技术

光照变化对人脸识别影响的问题,已经引起了研究人员的重视,并提出了多种方法。这些方法大致可归为3类:光照标准化、三维模型以及光照不变量的提取。光照标准化是早期的消除光照影响的处理方法,它是指利用基本的图像处理技术对光照图像进行预处理,获取光照鲁棒的图像。该方法主要包括:对数变换、直方图均衡化、伽玛校正、自适应直方图均衡化以及局部直方图均衡化等。尽管此类方法能够从一定程度上消除光照变化对人脸识别的影响,但是在复杂光照情况下识别率很难令人满意。后来,随着复杂光照情况下人脸识别研究的不断深入,国内外研究人员主要从提取光照不变量和三维模型两个方面进行研究,取得了一定的成果。光照三维模型是指通过三维模型对人脸图像进行拟合来消除光照影响。为了获取有效的三维模型,这类方法不仅需要充足的训练样本,而且要假设人脸图像是凸的结构,况且算法的复杂度较高,这些条件往往在实际应用中很难实现。

由于三维模型具有明显的缺陷,因此提取光照不变量一直是复杂光照人脸识别研究的主流。提取光照不变量的方法是指提取与光照条件无关的特征,消除光照变化的影响。1997年,国外研究者Jobson等在兰伯特(Lambertian)光照模型的基础上提出了多尺度Retinex(MSR)方法。该方法通过在对数域求取原图与平滑图像的差来消除光照变化的影响,对应的平滑图像是通过加权原图的几个不同频率的低通滤波图获取。MSR方法虽然从一定程度上消除了单尺度Retinex的光晕现象,但光晕依然很明显。后来,Gross和Brajovie(GB)使用各向异性滤波器求取平滑图像,从某种程度上减弱了光晕现象,识别率有所提高。2005年,中国科学院自动化研究所的研究人员王海涛等提出了自商图像(SQI)。该方法通过求原图与平滑后图像的商来获取光照不变量,但是加权的高斯滤波器很难在低频域保持良好的边缘信息,在复杂光照情况下识别效果依然不能令人满意。2006年,在SQI的基础上,美国伊利诺斯大学研究者Chen等提出了对数全变差(LTV)算法,但是此种算法对图像尺度具有较大的敏感性。2009年,重庆大学张太平博士提出了基于小波变换的光照不变量(MFSR)和梯度脸(Gradientfaces),较大程度地消除了不同光照对人脸识别的影响,但是MFSR使用小波变换会产生较强的伪Gibbs现象。

发明内容

为了解决上述方法在复杂光照情况下人脸识别的效果不能令人满意的问题,本发明目的是从多尺度、多方向轮廓特征出发,提出更有效的光照不变量提取方法,以便提高复杂光照情况下人脸识别的识别准确性。

为了达到上述目的本发明所采取的技术方案是:

一种复杂光照人脸识别的光照不变量提取方法,其特征在于:包括以下步骤:

(1)读入人脸图像;

(2)对图像进行多尺度多方向轮廓分析;

(3)求取图像的多尺度多方向轮廓信息;

(4)求取图像各尺度的轮廓信息;

(5)求取图像各尺度的轮廓方向信息;

(6)求取图像轮廓的主方向。

前述的一种复杂光照人脸识别的光照不变量提取方法,其特征在于:在步骤(2)中,对人脸图像进行非下采样轮廓波变换(NSCT),获取图像的多尺度多方向轮廓的幅频信息,假设各尺度各方向的幅频信息描述为:

{Cm,d},m=1,2,…,k;d=1,2,…,lm;k∈N,lm=2N,其中,m表示分解尺度,d表示分解方向,k表示对图像的分解尺度数,lm表示在m尺度上的分解方向数,Cm,d表示分解尺度为m,分解方向为d的NSCT的方向子带系数;

前述的一种复杂光照人脸识别的光照不变量提取方法,其特征在于:在步骤(3)中,图像的多尺度多方向轮廓信息为:其中,θdm为分解尺度为m,分解方向为d的方向子带的分解方向角度。

前述的一种复杂光照人脸识别的光照不变量提取方法,其特征在于:在步骤(4)中,图像各尺度的轮廓信息为:

前述的一种复杂光照人脸识别的光照不变量提取方法,其特征在于:在步骤(5)中,图像各尺度的轮廓方向信息为:其中,Im(Om(x,y))为图像轮廓信息的虚部,Re(Om(x,y))为图像轮廓信息的实部。

前述的一种复杂光照人脸识别的光照不变量提取方法,其特征在于:在步骤(6)中,图像的轮廓主方向为:P(x,y)=max(A1(x,y),A2(x,y),…,Ak(x,y))。

本发明的有益效果是:本发明从多尺度多方向轮廓分析、图像融合和相位谱的角度出发,提出多尺度轮廓主方向(MCPD)图像特征,可以提取更多的光照不变特征,可以提高复杂光照情况下的人脸识别精度,另外该方法还可以应用于图像检索领域。

附图说明

图1是本发明复杂光照人脸识别的光照不变量提取方法的流程图;

图2是本发明对Yale B人脸库其中一个人各子集提取的光照不变量示意图。

具体实施方式

下面结合附图对本发明做进一步的描述。

目前国内外有效的光照不变量提取方法主要包括:多尺度Retinex(MSR)、自商图像(SQI)、对数全变差(LTV)和基于小波变换的光照不变量(MFSR)和梯度脸(Gradientfaces)。

如图1所示:一种复杂光照人脸识别的光照不变量提取方法(简称MCPD),可以选择不同的多尺度轮廓分析工具。本发明在具体实施过程中,采用非下采样轮廓波变换对图像进行3(参数k的值)个尺度,4(参数lm的值)个方向进行分析,获取图像的轮廓信息。具体方法的描述如下:

步骤1:读入人脸图像;

步骤2:对人脸图像进行非下采样轮廓波变换(NSCT),获取图像的多尺度多方向轮廓的幅频信息(由于非下采样轮廓波变换为实数域变换,因此只能获取多尺度多方向轮廓的幅频信息),假设各尺度各方向的幅频信息描述为:

{Cm,d},m=1,2,…,k;d=1,2,…,lm;k∈N,lm=2N其中,m表示分解尺度,d表示分解方向,k表示对图像的分解尺度数,lm表示在m尺度上的分解方向数,Cm,d表示分解尺度为m,分解方向为d的NSCT的方向子带系数。

步骤3:求取图像的多尺度多方向轮廓信息(包括幅频和相频信息),图像的多尺度多方向轮廓信息为:其中,θdm为分解尺度为m,分解方向为d的方向子带的分解方向角度。

步骤4:求取图像各尺度的轮廓信息,图像各尺度的轮廓信息为:

步骤5:求取图像各尺度的轮廓方向信息,图像各尺度的轮廓方向信息为:其中,Im(Om(x,y))为图像轮廓信息的虚部,Re(Om(x,y))为图像轮廓信息的实部。

步骤6:求取图像的光照不变量,即图像的轮廓主方向为:P(x,y)=max(A1(x,y),A2(x,y),…,Ak(x,y))。

为了验证本发明的有效性,我们选用两个光照人脸库:Yale B and CMU PIE进行实验。实验中,对人脸图像进行3(参数k的值)层无下采样轮廓波变换,每层对应4(参数lm的值)个方向子带,使用本发明提取人脸库的光照不变量。在识别阶段,采用经典的PCA方法提取整体特征,本发明在实验中保留90%的能量,并使用基于欧式距离的最近邻分类器对人脸图像进行分类。

Yale B包括10个人,九个姿态,64种不同的光照,共计5760幅图像。原始图像的尺寸为640×480,所有图像被人工裁剪,尽量仅包括脸部部分,并且图像大小被调整为192×168。本文重点在消除光照的影响,因此,实验中仅使用正面图像,共计640幅人脸进行实验。根据光照入射角度的不同,人脸库可分5个子集:子集1(0o~12o)、子集2(13o~25o)、子集3(26o~50o)、子集4(51o~77o)和子集5(up 77o)。附图2给出了其中一个人各子集的利用本发明方法提取的光照不变量。选择子集1作为训练集,其它4个子集作为测试集,各种方法的实验结果见附表1。从附表1可以看出,本文发明的识别率均高于其它算法,而且在所有测试集上的识别率均达到100%。

表1Yale B人脸库的识别效果(%)

CMU PIE人脸库中,包括68个人,13个姿态,21种光照,4种表情,共计41368幅图像。原始图像是640×480的,所有的图像被人工裁剪,尽量仅包括脸部部分,并且图像大小被调整为64×64。选取前6幅图像作为训练集,其余15幅图像作为测试集,实验结果见附表2。实验结果表明本发明在CMU PIE人脸库的上性能依然优于其它算法。

表2CMU PIE人脸库的识别效果(%)

以上显示和描述了本发明的基本原理和主要特征和本发明的优点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的只是说明本发明的原理,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内。本发明要求保护范围由所附的权利要求书及其等效物界定。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号