首页> 中国专利> 基于核最近子空间的人脸识别方法

基于核最近子空间的人脸识别方法

页面导航

摘要
著录项
法律信息
说明书
相似文献

摘要

本发明公开了一种基于核最近子空间的人脸识别方法，主要解决现有方法不能对数据非线性特征进行线性表示的问题。实现步骤为：(1)将训练样本矩阵和测试样本通过Mercer核经验映射至非线性特征空间，然后对映射后的样本进行降维并归一化处理，再把降维后的每一类训练样本提取出来；(2)求解归一化后的测试样本与每一类训练样本矩阵之间的样本重构系数，对原测试样本进行重构；(3)求得各类别重构样本与原测试样本的残差，再将残差中的最小值对应下标的类别作为测试样本所属的类别。本发明提高了在人脸识别应用中的精度，同时将应用范围推广至低维样本，使其更具有通用性，可用于公共安全，信息安全，金融安全的监督和防护。

著录项

公开/公告号CN101916369A

专利类型发明专利
公开/公告日2010-12-15

原文格式PDF
申请/专利权人西安电子科技大学;
展开▼

申请/专利号CN201010259571.9
发明设计人张莉;焦李成;刘兵;王爽;钟桦;侯彪;马文萍;尚荣华;王婷;
展开▼

申请日2010-08-20
分类号G06K9/00;G06K9/66;
代理机构陕西电子工业专利中心;
代理人王品华
地址 710071 陕西省西安市太白南路2号
入库时间 2023-12-18 01:26:38

法律信息

法律状态公告日

法律状态信息

法律状态
2019-08-09

未缴年费专利权终止 IPC(主分类):G06K9/00 授权公告日:20120627 终止日期:20180820 申请日:20100820

专利权的终止
2012-06-27

授权

授权
2011-02-02

实质审查的生效 IPC(主分类):G06K9/00 申请日:20100820

实质审查的生效
2010-12-15

公开

公开

说明书

技术领域

本发明属于图像处理技术领域，涉及模式识别，特别是一种人脸的识别方法，可用于公共安全，信息安全，金融安全的监督和防护。

背景技术

作为生物特征识别关键技术之一的人脸识别技术在公共安全，信息安全，金融等领域具有潜在的应用前景。人脸被普遍认为是在图像识别领域中最有研究价值的物体。这一方面是因为人脸在人类视觉系统中具有显著的识别能力，另一方面是因为自动人脸识别技术中有大量重要的应用。另外，人脸识别中的技术问题也涵盖了模式识别研究中所遇到的问题。由于人脸识别问题是典型的小样本高维模式样本，学习方式不恰当的话，维数灾难的问题是不可避免，从而产生过拟合问题。识别高维数据的一个核心问题是分类器的选择；另一个核心问题是关于特征选择或者特征变换。在人脸识别中，已经提出了如下技术，包括：特征脸、Fisher脸、Laplace脸、随机脸等。由上述方法提取出来的特征更加利于人脸识别，包括最近邻和最近子空间在内的简单的分类器都可以利用其进行识别。

最近邻方法是一种实现简单的非参数分类器，待识别数据只需要在已知的数据中寻找最近邻进行匹配分类即可。在此基础上，台湾学者Kuang-Chih Lee、Jeffrey Ho和美国学者David Kriegman在2005年提出了最近子空间分类方法，并把该方法用到了人脸识别中。在该方法中，待识别数据需要在各类数据上寻求其最佳线性组合表示，根据待识别数据与该线性组合形成的子空间的距离进行分类识别，将与待识别数据距离最近的那一类数据判别为待识别数据的类别。最近子空间分类器优于最近邻分类器的地方在于，采用了在一类数据上的表示来分类而不是只根据单个数据来进行分类，更具有“全局性”。但是Kuang-Chih Lee、Jeffrey Ho和David Kriegman所提出的最近子空间分类器由于仅是对数据原始特征的线性表示，不能对数据非线性特征进行线性表示，而且其全局性是针对某一类数据而言，并非整体数据集，因此该分类器对于具有非线性特征的人脸数据识别精度较低。

发明内容

本发明的目的在于克服上述已有技术的不足，提出一种基于核最近子空间的人脸识别方法，以提高分类器对于具有非线性特征的人脸数据识别精度。为实现上述目的，本发明包括如下步骤：

(1)输入总训练样本矩阵和测试样本其中表示实数集，k表示类别数，i＝1，2，…，k，表示第i类的训练样本矩阵，v_i，j是一个训练样本，j＝1，2，…，n_i，n_i为第i类的样本个数，m为样本维数，总样本个数为

(2)通过Mercer核经验映射方法，将训练样本矩阵与测试样本映射至非线性特征空间，得到映射训练样本矩阵和映射测试样本第i类映射训练样本矩阵为i＝1，2，…，k；

(3)随机产生矩阵作为随机投影矩阵，其中d＜＜n，再将随机投影矩阵P分别与映射训练样本矩阵M和映射测试样本l相乘，进行随机降维处理，并对降维后的训练样本矩阵和降维后的测试样本进行列归一化，获得降维并归一化的训练样本矩阵和降维并归一化的测试样本

(4)根据上一步得到的第i类降维并归一化的训练样本矩阵和降维并归一化的测试样本利用最小二乘法求解下面的线性方程组：

$> \tilde{l} = {\tilde{M}}_{i} x_{i}, i = 1,2, \cdot \cdot \cdot, k$ >

解出第i类样本的重构系数向量x_i，其中为降维并归一化的测试样本在上的重构样本；

(5)计算降维并归一化的测试样本与其重构样本的残差r_i(l)：

$> r_{i} (l) = {| | \tilde{l} - {\tilde{M}}_{i} x_{i} | |}_{2}, i = 1,2, \cdot \cdot \cdot, k;$ >

(6)在k个残差r_i(l)中求得最小值，以该最小值对应下标的类别作为测试样本y所属的类别。

本发明由于对训练样本矩阵和测试样本采用了Mercer核经验映射，且Mercer核经验映射是在总数据集上进行，因而与现有方法相比，具有以下优点：

1)映射样本具有了非线性的特征，能够线性表示非线性特征。

2)保留了数据特征的全局性，有利于分类，提高了分类器的精度。

附图说明

图1是本发明的流程图；

图2是现有Att_face数据库中的人脸样本示意图；

图3是现有Umist_face数据库中的人脸样本示意图。

具体实施方式

下面参照附图对本发明作详细说明：

步骤1：输入训练样本矩阵和测试样本。

输入的样本为Att_face数据库或Umist_face数据库中的人脸样本图片，Att_face数据库由400张正面人脸组成，总共有40个类别，其中每一张图片的尺寸均为92*112，且均经过标准化处理；Umist_face数据库由564张人脸组成，总共有20个类别，其中每一张图片的尺寸均为92*112，且均经过标准化处理。例如图2为Att_face数据库中其中一个类别的部分人脸样本示意图，图3为Umist_face数据库中其中一个类别的部分人脸样本示意图。

为了保证算法的有效性，在每一类样本中随机的选取一半作为训练样本，另一半作为测试样本，按照这种方法随机分成10组。由于每个类别的样本数并不完全一致，所以每个类别平均取一半的图片作为训练样本，其余作为测试样本。总训练样本矩阵测试样本其中m＝10304为原样本维数，n为训练样本的个数，对于Att_face数据库n＝400，对于Umist_face数据库n＝564。

步骤2：将训练样本矩阵和测试样本通过Mercer核经验映射至非线性特征空间。

将训练样本矩阵和测试样本分别通过Mercer核经验映射至非线性特征空间，本实施例采用的Mercer核经验映射函数为高斯径向基核，其核函数的表示式如下：

K(u，v)＝exp(-‖u-v‖²/(2*p²))

其中u、v均为样本，对不同的高斯径向基核经验映射表示u、v的具体含义不同；p为高斯径向基核的参数，K(u，v)为映射结果。

在对训练样本矩阵进行高斯径向基核经验映射时，是将总训练样本矩阵A中的样本代入上述高斯径向基核函数，得到的映射结果作为新的训练样本矩阵M，其中u、v表示任意两个训练样本。

在对测试样本进行高斯径向基核经验映射时，是将总训练样本矩阵A中的每个样本与测试样本y代入上述高斯径向基核函数，得到的映射结果作为新的测试样本l，其中u为总训练矩阵A中的样本，v为测试样本。

对于该高斯径向基核参数p的选取，本实施例采用五倍交叉验证的方法，将总训练样本A均分为五等份，四份作为训练样本，一份作为测试样本。测试时，首先选择将样本映射至实验中的最低维数，在比较大的参数范围内选出使测试样本分类错误率最低的参数作为最优参数，例如参数p选取2^-15，2^-14，...，2¹⁵；然后在最低维数的最优参数附近选取其他维数参数。

总训练样本矩阵测试样本通过高斯径向基核经验映射后得到映射后的训练样本矩阵为映射后的测试样本为映射后每一类训练样本矩阵为i＝1，2，…，k，对于Att_face数据库k＝40，对于Umist_face数据库k＝20，n_i为第i类的样本个数。

步骤3：利用随机降维方式对训练样本矩阵和测试样本进行降维并归一化。

随机产生矩阵作为随机投影矩阵，其中d＜＜n，再将随机投影矩阵P分别与映射训练样本矩阵M和映射测试样本l相乘，进行随机降维处理，并对降维后的训练样本矩阵和降维后的测试样本进行归一化，获得降维并归一化的训练样本矩阵和降维并归一化的测试样本获得第i类降维归一训练样本矩阵为i＝1，2，…，k。

在本实施例中降维数d分别取30、40、50、60、70、80、90、100、120、150和200维；对降维后的训练样本矩阵和测试样本进行归一化，是将降维后的训练样本矩阵和测试样本同时除以这两者中的最大值，得到标准化的数据以利于分类。在本实施例中选择降维方式为随机降维，但不局限于此，例如特征脸、Fisher脸和Laplace脸。

步骤4：对降维并归一化后的每一类训练样本矩阵和测试样本，利用最小二乘法求解测试样本对于每一类训练样本的重构系数。

根据上一步得到的第i类降维并归一化的训练样本矩阵和降维并归一化的测试样本利用最小二乘法求解线性方程组：i＝1，2，…，k，解出第i类样本的重构系数向量x_i，其中为降维并归一化的测试样本在上的重构样本。

步骤5：计算降维并归一化的测试样本与其重构样本的残差r_i(l)：

$> r_{i} (l) = {| | \tilde{l} - {\tilde{M}}_{i} x_{i} | |}_{2}, i = 1,2, \cdot \cdot \cdot, k .$ >

步骤6：通过比较残差r_i(l)的大小来判断测试样本所属的类别，即在步骤5中所得到的k个残差r_i(l)中求得最小值，以该最小值对应下标的类别作为测试样本y所属的类别。

本发明的效果通过以下仿真进一步说明：

1、仿真条件与内容：

首先，使用Att_face数据库进行人脸识别实验，该数据库由400张正面人脸组成，总共有40个类别，其中每一张图片的尺寸均为92*112，且均经过标准化处理。每个类别中的人脸图片均在不同的时间，不同的光照条件拍摄获得，拍摄的人脸图有不同的面部表情，包括睁眼/闭眼，笑/不笑，戴眼镜/不戴眼镜，如图2所示。在实验中，本发明随机的选取一半的样本作为训练样本，另一半作为测试样本，按照这种方法随机分成10组。由于每个类别的样本数并不完全一致，所以每个类别取其中一半图片作为训练样本，其余作为测试样本。

然后，使用Umist_face数据库进行人脸识别实验，该数据库由564张人脸组成，总共有20个类别，其中每一张图片的尺寸均为92*112，且均经过标准化处理。每个类别中的人脸图片从左面到右面均在不同角度下拍摄获得，如图3所示。在实验中，随机的选取一半的样本作为训练样本，另一半作为测试样本，按照这种方法随机分成10组。由于每个类别的样本数并不完全一致，所以每个类别取其中一半图片作为训练样本，其余作为测试样本。

软件平台为MATLAB7.1。

2、仿真结果：

本发明首先在Att_face数据库上进行实验，为了进行对比，本实验将人脸样本分别降至30、40、50、60、70、80、90、100、120、150和200维，进行仿真比较，实验结果如表1所示。

表1用两种方法对Att_face数据库在不同维数上的识别错误率对比

从表1可以看出，本发明方法在实验中各个维度上的识别率均比现有方法要好。

对于Umist_face数据库的人脸识别实验，本实验将人脸样本分别降至30、40、50、60、70、80、90、100、120、150和200维，进行仿真比较，实验结果如表2所示。

表2用两种方法对Umist_face数据库在不同维数上的识别错误率对比

30 0.2775 0.1063 40 0.1364 0.0864 50 0.1129 0.0820 60 0.1028 0.0785 70 0.0971 0.079 80 0.0948 0.0784 90 0.0923 0.0766 100 0.0929 0.0765

120 0.0899 0.0743 150 0.0878 0.0689 200 0.0878 0.0763

从表2可以看出，本发明方法在实验中各个维度上的识别率均比现有方法要好。

综上，本发明方法对训练样本矩阵和测试样本采用了高斯径向基核经验映射，在实验中可以看到，在人脸数据库上的实验效果都要优于现有方法。

去获取专利，查看全文>

相似文献

专利
中文文献
外文文献

1. 基于核最近子空间的人脸识别方法 [P] . 中国专利： CN101916369B . 2012.06.27
2. 基于多稀疏描述的最近邻子空间SAR目标识别方法 [P] . 中国专利： CN103886337A . 2014-06-25
3. THREE-DIMENSIONAL HUMAN FACE RECOGNITION METHOD BASED ON MULTI-SCALE COVARIANCE DESCRIPTOR AND LOCAL SENSITIVE RIEMANN KERNEL SPARSE CLASSIFICATION [P] . 世界知识产权组织专利： WO2019080488A1 . 2019-05-02

机译：基于多尺度协方差描述子和局部敏感RIEMANN核稀疏分类的三维人脸识别方法
4. REAL-TIME FACE RECOGNITION BASED ON SUBSPACE AND LVQ CLASSIFIER [P] . 韩国专利： KR20080067793A . 2008-07-22

机译：基于子空间和LVQ分类器的实时人脸识别
5. METHOD AND SYSTEM FOR FACE RECOGNITION BY MEANS OF DICTIONARY LEARNING BASED ON KERNEL NON-NEGATIVE MATRIX FACTORIZATION, AND SPARSE FEATURE REPRESENTATION [P] . 世界知识产权组织专利： WO2018149133A1 . 2018-08-23

机译：基于核非负矩阵分解和稀疏特征表示的基于字典学习的人脸识别方法和系统