法律状态公告日
法律状态信息
法律状态
2019-08-09
未缴年费专利权终止 IPC(主分类):G06K9/00 授权公告日:20120627 终止日期:20180820 申请日:20100820
专利权的终止
2012-06-27
授权
授权
2011-02-02
实质审查的生效 IPC(主分类):G06K9/00 申请日:20100820
实质审查的生效
2010-12-15
公开
公开
技术领域
本发明属于图像处理技术领域,涉及模式识别,特别是一种人脸的识别方法,可用于公共安全,信息安全,金融安全的监督和防护。
背景技术
作为生物特征识别关键技术之一的人脸识别技术在公共安全,信息安全,金融等领域具有潜在的应用前景。人脸被普遍认为是在图像识别领域中最有研究价值的物体。这一方面是因为人脸在人类视觉系统中具有显著的识别能力,另一方面是因为自动人脸识别技术中有大量重要的应用。另外,人脸识别中的技术问题也涵盖了模式识别研究中所遇到的问题。由于人脸识别问题是典型的小样本高维模式样本,学习方式不恰当的话,维数灾难的问题是不可避免,从而产生过拟合问题。识别高维数据的一个核心问题是分类器的选择;另一个核心问题是关于特征选择或者特征变换。在人脸识别中,已经提出了如下技术,包括:特征脸、Fisher脸、Laplace脸、随机脸等。由上述方法提取出来的特征更加利于人脸识别,包括最近邻和最近子空间在内的简单的分类器都可以利用其进行识别。
最近邻方法是一种实现简单的非参数分类器,待识别数据只需要在已知的数据中寻找最近邻进行匹配分类即可。在此基础上,台湾学者Kuang-Chih Lee、Jeffrey Ho和美国学者David Kriegman在2005年提出了最近子空间分类方法,并把该方法用到了人脸识别中。在该方法中,待识别数据需要在各类数据上寻求其最佳线性组合表示,根据待识别数据与该线性组合形成的子空间的距离进行分类识别,将与待识别数据距离最近的那一类数据判别为待识别数据的类别。最近子空间分类器优于最近邻分类器的地方在于,采用了在一类数据上的表示来分类而不是只根据单个数据来进行分类,更具有“全局性”。但是Kuang-Chih Lee、Jeffrey Ho和David Kriegman所提出的最近子空间分类器由于仅是对数据原始特征的线性表示,不能对数据非线性特征进行线性表示,而且其全局性是针对某一类数据而言,并非整体数据集,因此该分类器对于具有非线性特征的人脸数据识别精度较低。
发明内容
本发明的目的在于克服上述已有技术的不足,提出一种基于核最近子空间的人脸识别方法,以提高分类器对于具有非线性特征的人脸数据识别精度。为实现上述目的,本发明包括如下步骤:
(1)输入总训练样本矩阵
(2)通过Mercer核经验映射方法,将训练样本矩阵
(3)随机产生矩阵
(4)根据上一步得到的第i类降维并归一化的训练样本矩阵
>
解出第i类样本的重构系数向量xi,其中
(5)计算降维并归一化的测试样本
>
(6)在k个残差ri(l)中求得最小值,以该最小值对应下标的类别作为测试样本y所属的类别。
本发明由于对训练样本矩阵和测试样本采用了Mercer核经验映射,且Mercer核经验映射是在总数据集上进行,因而与现有方法相比,具有以下优点:
1)映射样本具有了非线性的特征,能够线性表示非线性特征。
2)保留了数据特征的全局性,有利于分类,提高了分类器的精度。
附图说明
图1是本发明的流程图;
图2是现有Att_face数据库中的人脸样本示意图;
图3是现有Umist_face数据库中的人脸样本示意图。
具体实施方式
下面参照附图对本发明作详细说明:
步骤1:输入训练样本矩阵和测试样本。
输入的样本为Att_face数据库或Umist_face数据库中的人脸样本图片,Att_face数据库由400张正面人脸组成,总共有40个类别,其中每一张图片的尺寸均为92*112,且均经过标准化处理;Umist_face数据库由564张人脸组成,总共有20个类别,其中每一张图片的尺寸均为92*112,且均经过标准化处理。例如图2为Att_face数据库中其中一个类别的部分人脸样本示意图,图3为Umist_face数据库中其中一个类别的部分人脸样本示意图。
为了保证算法的有效性,在每一类样本中随机的选取一半作为训练样本,另一半作为测试样本,按照这种方法随机分成10组。由于每个类别的样本数并不完全一致,所以每个类别平均取一半的图片作为训练样本,其余作为测试样本。总训练样本矩阵
步骤2:将训练样本矩阵和测试样本通过Mercer核经验映射至非线性特征空间。
将训练样本矩阵和测试样本分别通过Mercer核经验映射至非线性特征空间,本实施例采用的Mercer核经验映射函数为高斯径向基核,其核函数的表示式如下:
K(u,v)=exp(-‖u-v‖2/(2*p2))
其中u、v均为样本,对不同的高斯径向基核经验映射表示u、v的具体含义不同;p为高斯径向基核的参数,K(u,v)为映射结果。
在对训练样本矩阵进行高斯径向基核经验映射时,是将总训练样本矩阵A中的样本代入上述高斯径向基核函数,得到的映射结果作为新的训练样本矩阵M,其中u、v表示任意两个训练样本。
在对测试样本进行高斯径向基核经验映射时,是将总训练样本矩阵A中的每个样本与测试样本y代入上述高斯径向基核函数,得到的映射结果作为新的测试样本l,其中u为总训练矩阵A中的样本,v为测试样本。
对于该高斯径向基核参数p的选取,本实施例采用五倍交叉验证的方法,将总训练样本A均分为五等份,四份作为训练样本,一份作为测试样本。测试时,首先选择将样本映射至实验中的最低维数,在比较大的参数范围内选出使测试样本分类错误率最低的参数作为最优参数,例如参数p选取2-15,2-14,...,215;然后在最低维数的最优参数附近选取其他维数参数。
总训练样本矩阵
步骤3:利用随机降维方式对训练样本矩阵和测试样本进行降维并归一化。
随机产生矩阵
在本实施例中降维数d分别取30、40、50、60、70、80、90、100、120、150和200维;对降维后的训练样本矩阵和测试样本进行归一化,是将降维后的训练样本矩阵和测试样本同时除以这两者中的最大值,得到标准化的数据以利于分类。在本实施例中选择降维方式为随机降维,但不局限于此,例如特征脸、Fisher脸和Laplace脸。
步骤4:对降维并归一化后的每一类训练样本矩阵和测试样本,利用最小二乘法求解测试样本对于每一类训练样本的重构系数。
根据上一步得到的第i类降维并归一化的训练样本矩阵
步骤5:计算降维并归一化的测试样本
>
步骤6:通过比较残差ri(l)的大小来判断测试样本所属的类别,即在步骤5中所得到的k个残差ri(l)中求得最小值,以该最小值对应下标的类别作为测试样本y所属的类别。
本发明的效果通过以下仿真进一步说明:
1、仿真条件与内容:
首先,使用Att_face数据库进行人脸识别实验,该数据库由400张正面人脸组成,总共有40个类别,其中每一张图片的尺寸均为92*112,且均经过标准化处理。每个类别中的人脸图片均在不同的时间,不同的光照条件拍摄获得,拍摄的人脸图有不同的面部表情,包括睁眼/闭眼,笑/不笑,戴眼镜/不戴眼镜,如图2所示。在实验中,本发明随机的选取一半的样本作为训练样本,另一半作为测试样本,按照这种方法随机分成10组。由于每个类别的样本数并不完全一致,所以每个类别取其中一半图片作为训练样本,其余作为测试样本。
然后,使用Umist_face数据库进行人脸识别实验,该数据库由564张人脸组成,总共有20个类别,其中每一张图片的尺寸均为92*112,且均经过标准化处理。每个类别中的人脸图片从左面到右面均在不同角度下拍摄获得,如图3所示。在实验中,随机的选取一半的样本作为训练样本,另一半作为测试样本,按照这种方法随机分成10组。由于每个类别的样本数并不完全一致,所以每个类别取其中一半图片作为训练样本,其余作为测试样本。
软件平台为MATLAB7.1。
2、仿真结果:
本发明首先在Att_face数据库上进行实验,为了进行对比,本实验将人脸样本分别降至30、40、50、60、70、80、90、100、120、150和200维,进行仿真比较,实验结果如表1所示。
表1用两种方法对Att_face数据库在不同维数上的识别错误率对比
从表1可以看出,本发明方法在实验中各个维度上的识别率均比现有方法要好。
对于Umist_face数据库的人脸识别实验,本实验将人脸样本分别降至30、40、50、60、70、80、90、100、120、150和200维,进行仿真比较,实验结果如表2所示。
表2用两种方法对Umist_face数据库在不同维数上的识别错误率对比
从表2可以看出,本发明方法在实验中各个维度上的识别率均比现有方法要好。
综上,本发明方法对训练样本矩阵和测试样本采用了高斯径向基核经验映射,在实验中可以看到,在人脸数据库上的实验效果都要优于现有方法。
机译: 基于多尺度协方差描述子和局部敏感RIEMANN核稀疏分类的三维人脸识别方法
机译: 基于子空间和LVQ分类器的实时人脸识别
机译: 基于核非负矩阵分解和稀疏特征表示的基于字典学习的人脸识别方法和系统