法律状态公告日
法律状态信息
法律状态
2014-10-22
未缴年费专利权终止 IPC(主分类):G06K9/00 授权公告日:20130320 终止日期:20130905 申请日:20110905
专利权的终止
2013-03-20
授权
授权
2012-04-18
实质审查的生效 IPC(主分类):G06K9/00 申请日:20110905
实质审查的生效
2012-01-18
公开
公开
技术领域
本发明属模式识别技术领域,具体涉及一种基于复合梯度向量的人脸识别方法。
背景技术
人脸识别技术是利用计算机进行人脸图像的分析与匹配,具有无接触、距离适中、过程简单的技术优点。人脸识别应用广泛,在罪犯身份识别、身份跟踪、出入境身份核实及门禁系统等安全领域具有较高的应用价值,同时也是模式识别领域内的经典研究课题。
早在20世纪60年代末期,人们利用筛选出的人脸几何特征进行分类识别,识别效果不甚理想。80年代末期,Kirby[1]等人通过K-L变换思想的引入,设计了一种基于最小均方误差描述下的人脸识别技术。在此基础上,Turk和Pentland[2]提出了基于重构权向量的特征脸识别技术,随后,人脸识别领域展开了基于面部表征的子空间人脸分析法的研究热潮。其中比较经典的识别方法有人脸主成分分析法PCA[2]、线性判别法LDA[3]、独立主成分分析法ICA[4]、Baysian方法[5]、基于核技术的Kernel PCA方法[6]、Kernel LDA方法[7]、Variant Faces分类方法[8] 、基于全局和局部特征集成的方法[9]等等。
与生物界的识别系统相比,现有人脸识别方法的一个普遍弱点是缺乏与环境同步调节的能力。而生物的视觉感知可以自然地与周围环境进行很好的协调,以适应其本身对视觉目标的最大关注度,自动追踪目标最有吸引力的表征信息,然后将这些最有吸引力的表征信息组合起来,形成生物视觉效应中最明显的特征分布约束信息,以此作为目标识别的依据。如果现有的人脸识别方法具有了生物的这种“自适应”判别的能力,将对人脸识别效果的提高起到不可限量的作用。
参考文献
[1] Kirby M, Sirovich L. Application of the Karhunen-Loeve procedure for the characterization of human faces. IEEE Trans . on Pattern Analysis and Machine Intelligence,1990,12:103-108。
[2]Turk M,Pentland A.Eigenfaces for recognition.Journal of Cognitive Neuroscience,1991,3:71~86。
[3]Belhumeur V, Hespanda J, Kiregeman D. Eigenfacesvs. Fisherfaces:Recognition using class specific linear projection. IEEE Transactions on Pattern Analysis and Machine Intelligence,1997,19:711~720。
[4]Bartlett M. S, Movellan J.R. Sejnowski T.J. Face recognition by independent component analysis. IEEE Transactions on Neural Networks,2002,13:1450~1464。
[5]Moghaddam Brik. Principal manifolds and probabilistic subspaces for visual recognition. IEEE Transactions on Pattern Analysis and Machine Intelligence,2002,24:780~788。
[6]Kim K.I, Jung K. Kim H. J. Face recognition using kernel principal component analysis. IEEE Signal Processing Letters,2002,9:40~42。
[7]Mika S. Rat sch G. Weston J. Scholkopf B. Muller K. Fisher discriminant analysis with kernels. In: Proceedings of IEEE Workshop on Neural Network for Signal Processing,Madison, Wisconsin,USA,1999,9:41~48。
[8]Martinez A M. Recognizing Imprecisely Localized,Partially Occluded,and Expression Variant Faces from a Single Sample Per Class[J].IEEE Trans.on Pattern Analysis and Machine Intelligence,2008,28:755-768.。
[9]苏煜,山世光,陈熙霖,高文.基于全局和局部特征集成的人脸识别[J].软件学报,2010,21:1849-1862。
发明内容
本发明的目的在于克服上述技术不足,提供一种基于复合梯度向量的人脸识别方法。
本发明解决技术问题采用的技术方案为特征提取、向量融合和人脸识别三个阶段:
1、特征提取阶段
本阶段的主要目的是提取待识别人脸的特征信息。
(1)、归一化待识别的人脸图像,得到目标区域 ,其中为包含了人脸主要信息的目标区域,为目标区域宽度,为长度。
(2)、计算各灰度阶对应像素的分布概率和信息熵值,并统计信息熵分布和一维信息熵的极值点。以信息熵分布中取得极大值时所对应的灰度阶作为目标区域的分割阈值,划分分散特征子区域。分散特征子区域的边缘像素点为奇异点。
(3)、在目标区域内,以宽度中心的像素点作为起始点,垂直向下搜索奇异点,并将搜索到的第一个奇异点作为终点,建立第一个基向量。
(4)、以基向量的终点作为起点,分别垂直向左、下、右的逆时针方向搜索下一个奇异点,并将每个方向上搜索到的第一个奇异点作为终点分别建立第一个基向量的三个后继向量。直至目标区域T的边缘仍未发现奇异点,则不建立该方向的基向量。
(5)、以建立的所有基向量的终点作为起点再分别垂直向左、下、右、上的逆时针方向搜索奇异点,并将搜索到的第一个奇异点作为终点分别建立基向量。每个奇异点只需搜索三个方向,其起点方向忽略,且直至目标区域的边缘仍未发现奇异点,则不建立该方向的基向量。
(6)、当所有起点的各个方向均已到达目标区域的边缘都搜索不到奇异点,停止搜索。此时已经采样得到目标区域内所有基向量。
对于目标区域内的基向量,其中为整数;;;基向量在向量簇中的位置是第行、第列,向量簇的内容详见向量融合阶段;基向量维度记为,梯度记为;当基向量的终点是基向量的起点,称为的前趋向量,为的后继向量;无前驱向量的基向量称为向量簇的根向量,无后继向量的基向量称为向量簇的叶向量。基向量称为向量簇的根向量。
2、向量融合阶段
本阶段的主要目的是将待识别人脸的特征信息进行融合,得到其最大约束特征信息。
(1)、将采样得到的基向量组建向量簇,其中是基向量的集合;是基向量间相互关系的集合。并标定基向量、记录基向量前驱和后继约束关系、提取基向量维度和梯度信息。
(2)、将向量簇中基向量的标定、约束关系、纬度和梯度信息分别用结构矩阵、约束矩阵、维度矩阵和梯度矩阵表示:
其中:;;; ;;。
在结构矩阵中,第一行的元素为向量簇的根向量;第二行的元素是基向量、和,均是的后继向量,并以三者为根向量的子向量簇、、在向量簇中的顺序分别是垂直向左、下、右的逆时针方向;基向量,按逆时针方向分别复合向量、和得到其后继向量,,;结构矩阵的第行、第列的基向量有三个后继向量、和,且三者在向量簇中是按照垂直向左、下、右、上的逆时针方向排列的,那么有,,。
在约束矩阵中,元素是二元组,二元组的元是基向量;二元组的第一元是第二元的前驱向量; 是的后继向量。
在维度和梯度矩阵中,对应于结构矩阵的第行、第列的基向量,维度矩阵的第行、第列的元素为基向量的维度,梯度矩阵的第行、第列的元素为基向量的梯度。
(3)、搜索约束矩阵,寻找在矩阵中只充当二元组的第二元而未充当第一元的基向量,该类基向量称为叶向量。
(4)、在约束矩阵中,搜索以叶向量为第二元的二元组,记录该二元组的第一元基向量。该第一元基向量称为叶向量的前驱向量。
(5)、搜索叶向量前驱向量的前驱向量,直至搜索到的向量为根向量,停止搜索过程。记录从叶向量到根向量的路径。
(6)、将路径上所有的基向量进行多维复合,得到目标区域内所有的极大梯度向量,其中,,;和表示基向量在向量簇中的位置是第行、第列;符号为复合,复合向量和为;为连续复合;极大梯度向量的维度为,梯度为,即得到人脸面部最大约束特征信息。
(7)、以向量簇的所有极大梯度向量为元素进行融合得到人脸面部的复合梯度向量,其中为极大梯度向量的数量;;;复合梯度向量的维度记为,梯度记为。
3、人脸识别阶段
本阶段的主要目的是匹配待识别人脸与数据库存储的各人脸的最大约束特征信息,识别出人脸身份。
人脸库中存储的人脸图像的数量为,其复合梯度向量分别为,维度分别为,梯度为,待识别人脸的复合梯度向量、维度信息和梯度信息分别为、和。计算和,其中, 统计与的最小值,即可判断待测图像的人脸身份。
本发明的有益效果:通过基向量正交采样可以看出,基向量的标定基本覆盖了人脸面部的关键特征区域,抑制了非关键信息,从而实现生物视觉系统中对待识别目标最明显特征分布约束信息的有效提取,在环境变化和待识别人脸处于不同条件时,由基向量标定出的同一目标最明显特征分布约束信息保持了较好的稳定性,在环境变化和目标自身变化的条件下,该方法显示了很好的鲁棒性。同时由于复合梯度向量标定出的人脸最明显特征分布约束信息的数据量较低,使该方法具有较高的识别速度和较强适应能力。本发明是基于生物“自适应”特征约束识别的思想而提出;复合梯度向量识别方法是建立在子空间人脸分析的整体框架之上,利用人脸信息熵分布将人脸面部的全局结构信息进行子区域分割与筛选,然后对特征子区域进行正交采样,将采样向量融合成向量簇,对基向量进行多维复合得到最明显的特征分布约束信息。该方法通过对待识别人脸表征的最明显特征分布约束信息的提取与识别,克服了特征域旋转、光照强度变化及多姿态、多表情对人脸识别的影响,具较高的识别速度和很好的鲁棒性能。
具体实施方式
以下结合实施例对本发明具体说明。
下面以CMU-PIE人脸库为例,说明本方法的实施过程。该人脸数据库包含68位测试人员的41368张不同姿态、不同光照和不同表情的面部图像.其姿态与光照变化是在严格控制的条件下进行多角度变换采集,本例中测试人员的人脸样本,每人具有表情、照明、光线和姿态四种不同集合。实施流程如下:
1、特征提取阶段
首先,归一化四种集合的人脸图像,分别得到各幅人脸图像的目标区域。
然后,计算各幅人脸图像的目标区域内各灰度阶对应像素的分布概率和信息熵值,统计信息熵分布和一维信息熵的极值点,以信息熵分布中取得极大值时所对应的灰度阶作为目标区域的分割阈值,划分分散特征子区域,得到四种集合的人脸特征子区域。
最后,对人脸特征子区域进行正交采样,得到四种集合的人脸目标区域的基向量。
2、向量融合阶段
首先,对四种集合采样得到的基向量组建向量簇,并标定基向量、统计基向量前驱和后继约束关系、提取基向量维度和梯度信息。将四种集合的向量簇中基向量的标定、约束关系、纬度和梯度信息分别用结构矩阵、约束矩阵、维度矩阵和梯度矩阵表示。
然后,采用最大约束特征提取方法对四种集合的向量簇建立极大梯度向量。
最后,以向量簇的所有极大梯度向量为元素进行融合得到四种集合中每幅人脸的复合梯度向量。
3、人脸识别阶段
对每位人员的不同集合均反复标定20次,建立复合梯度向量数据库,以减少特征信息存储容量并提高识别速度,得到的信息库中包括68位测试人员的复合梯度向量信息,每位人员拥有左侧视、右侧视、正视、低视和仰视五种姿态的复合梯度向量人脸集合。人脸库中存储的人脸图像的数量为,其复合梯度向量分别为,维度分别为,梯度为。
然后将光照不变、姿态变化的图像集合进行识别测试,最后将姿态和光照都有变化的图像集合进行识别测试,对测试中每个集合均反复测试20次,测试结果以均值为准。测试状态个数为8,测试的特征为、和,计算和,其中。当与为最小值时,即可判断待测图像是人脸库的第张图所对应的人脸身份。
在本案例中,采用本方法对人脸图像进行识别,获得了98.3%的识别率。
机译: 基于分类特征向量的训练支持向量机及基于相同特征的人脸识别方法
机译: 基于深度学习的人脸识别模型提取特征向量的人脸识别系统
机译: 基于深度学习的人脸识别模型提取特征向量的人脸识别系统