首页> 中国专利> 一种改进的压缩感知人脸识别方法

一种改进的压缩感知人脸识别方法

摘要

本发明公开了一种改进的压缩感知人脸识别方法,包括步骤1图像预处理;采用累积分布函数对灰度人脸图像进行直方图均衡,然后采用LBP旋转不变均匀模式提取的灰度人脸图像特征矢量,构造LBP特征空间;步骤2在低维LBP特征空间内寻找测试图像的近邻样本;步骤3利用近邻样本自适应的构造出冗余字典,完成测试图像的感知识别。本方法在低维LBP特征空间寻找测试样本的近邻样本,由近邻样本构成完备的冗余字典,字典原子数量大大降低,同时字典原子与测试样本具有更高的结构相似性,因此算法既提高了识别速度,又提高了正确识别率。

著录项

  • 公开/公告号CN105809132A

    专利类型发明专利

  • 公开/公告日2016-07-27

    原文格式PDF

  • 申请/专利权人 山东师范大学;

    申请/专利号CN201610131381.6

  • 发明设计人 魏冬梅;周茂霞;马娜;

    申请日2016-03-08

  • 分类号

  • 代理机构济南圣达知识产权代理有限公司;

  • 代理人赵敏玲

  • 地址 250014 山东省济南市历下区文化东路88号

  • 入库时间 2023-06-19 00:12:25

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2023-02-28

    未缴年费专利权终止 IPC(主分类):G06K 9/00 专利号:ZL2016101313816 申请日:20160308 授权公告日:20190723

    专利权的终止

  • 2019-07-23

    授权

    授权

  • 2016-08-24

    实质审查的生效 IPC(主分类):G06K9/00 申请日:20160308

    实质审查的生效

  • 2016-07-27

    公开

    公开

说明书

技术领域

本发明公开了一种改进的压缩感知人脸识别方法。

背景技术

人的面部特征因其具有唯一性、稳定性和不可盗取性等优点而成为一种新的身份认证介质。与其它生物特征识别相比,人脸识别的方式更符合人类自身辨别身份的习惯,识别更加自然直观,人脸图像采集设备简单,在自然光下,利用普通家用摄像机即可完成,采集时不需要使用者配合,甚至具有隐蔽性,因此减少了伪装欺骗的概率。人脸也不会轻易在介质上留下痕迹,安全性更高。因此人脸识别技术在军事安全、公共安全、民事和经济等领域的应用前景非常广阔。由于人脸容易受表情、光照、姿态以及遮挡等因素的影响,也一直是生物特征识别领域中的研究难点。

经过几十年的研究发展,以主成分分析(PrincipalComponentAnalysis,PCA)为基础的子空间分析方法因其简单高效而成为经典算法。在该类算法中,用低维的特征矢量表征高维的人脸图像,因此特征提取和选择成为基于特征子空间分析方法的重点和难点。

作为一种有效的非参数化图像局部纹理描述方法,局部二值模式(LocalBinaryPattern,LBP)捕捉到图像的细节特征,提取出更利于分类的局部邻域关系模式,且计算方法简单,因此成为人脸识别算法的主流方法之一。

Yang等提出可以将人脸识别归结为压缩感知问题,证明可以用所有训练数据构造冗余字典作为压缩感中的表示矩阵对测试图像进行“稀疏”表示,用高斯矩阵作为感知矩阵,提出“随机脸”的概念,特征数量可以选择任意维数,维数越高越有利于正确识别,避免了传统算法中特征提取和选择的难题,有效的解决了人脸识别的“小样本”问题。

为了提高识别算法对于遮挡的鲁棒性,Wright等提出SRC算法,利用正交矩阵作为遮挡字典对图像中的异常像素点进行单独编码,虽然提高了算法对遮挡的鲁棒性,但同时也极大地增加了字典原子的数量。Huang等提出的STSR算法将图像在水平方向和垂直方向上的梯度也作为字典中的原子,解决了图像在非对齐下的识别问题,但冗余字典的原子数量是训练样本数量的3倍。Yang等首先提取图像的Gabor特征,利用Gabor特征代替原始人脸图像作为字典原子,字典的原子数量也远大于训练样本的数量。

压缩感知理论指出,当测试图像被充分地“稀疏”表示时,可以用以范数代替范数作为约束条件求稀疏表示矢量。但是范数最小解计算复杂,计算量巨大,且随着字典原子数量的增加,计算速度急剧下降,从而导致识别速度慢,不适合实时应用。

发明内容

为了解决现有技术存在的技术缺陷,本发明提出一种改进的冗余字典的构造方法。在低维LBP特征空间寻找测试样本的近邻样本,由近邻样本构成完备的冗余字典,字典原子数量大大降低,同时字典原子与测试样本具有更高的结构相似性,因此算法既提高了识别速度,又提高了正确识别率。

本发明采用的技术方案如下:

一种改进的压缩感知人脸识别方法,其中构造冗余字典的方法,如下:

步骤1图像预处理;采用累积分布函数对灰度人脸图像进行直方图均衡,然后采用LBP旋转不变均匀模式提取灰度人脸图像特征矢量,构造LBP特征空间;

步骤2在低维LBP特征空间内寻找测试图像的近邻样本;

步骤3利用近邻样本自适应的构造出冗余字典,完成测试图像的感知识别。

进一步的,步骤2中近邻样本的寻找方法如下:

步骤2-1在LBP特征空间计算测试图像和训练图像的相似度;表示测试图像与训练图像相似性;表示测试图像与第i训练图像的平均相似性;表示测试图像与全部训练图像的平均相似性

步骤2-2比较测试图像与全部训练图像的平均相似性与合法数据相似性阈值ζth的大小,若则测试图像为非法数据,拒绝识别;若则再比较测试图像与训练图像相似性与测试图像与第i训练图像的平均相似性标记为近邻样本,若不进行标记,不会作为字典原子。

进一步的,步骤2-1中合法数据相似性阈值ζth由经验值给出,利用ORL、AR和YaleB三个标准的人脸库进行实验证明了ζth的取值范围;每类数据中留出一部分作为识别时的测试数据,然后分别从ORL数据库中取每人前6幅共有240幅图像、AR数据库中每类选7幅共700幅图像、YaleB数据库中每类选16幅共608幅图像参与实验,通过计算同类样本间、不同类样本间以及不同数据库中样本间的卡方相似性寻找ζth的经验值。

进一步的,所述的同类样本间的相似性实验采用“留一交叉验证法”,从样本集中挑出一幅图像作为测试样本,该类中剩余图像作为训练样本,计算测试样本与训练样本之间的平均卡方相似性,称为“类内平均卡方相似性”;重复这一步骤直到该类中每幅图像都充当过测试样本为止。

进一步的,不同类样本间平均卡方相似性指图像与本数据库中其它各种不同类样本间的平均卡方相似性。

进一步的,不同数据库上样本间的相似性是指来自于本数据库外的图像与数据库中所有样本之间的平均卡方相似性。

进一步的,步骤2-3的具体过程如下:

对任意输入测试图像y,根据公式计算出其与任意一幅训练图像xij(第i个人的第j幅人脸图像)的χ2卡方相似性记为ζij=ζ(y,xij),其中Hy(k)和分别表示测试图像y和任意测试图像xij对应的LBP特征图像直方图的第k个bin值,即LBP特征矢量中第k个特征的取值;Q为整数表示矢量长度,k为整数表示特征序号;令表示测试图像与第i类样本间的平均卡法相似性,其中,ni表示属于第i类训练样本的数量,即第i个人共有ni幅训练图像,若则xij被标注为测试样本的近邻。

进一步的,步骤3的具体过程如下:

表示第i类训练样本中任意一个近邻样本,令表示由第i类近邻样本构成的矩阵,其中li表示第i类中共有li个近邻样本。全部近邻样本构成冗余字典R=[R1,…,Ri,…,RC],C表示训练样本的类别数,即共有C个人的人脸图像;用此字典代替压缩感知人脸识别算法中表示矩阵X,即可实现对测试样本的快速识别。

本发明的有益效果如下:

基于压缩感知的人脸识别算法克服了各类子空间人脸识别算法中的特征提取和特征选择的难题,解决了人脸识别的“小样本”问题。但是该类算法依赖于原子的数量及其结构,系数表示矢量的求解是以范数作为约束条件的,范数最小解计算复杂,且随着原子数量增多,计算复杂度急剧上升,识别速度急速下降,不适合实时应用。本专利提出一种基于近邻样本压缩感知的人脸识别算法,自适应构造与测试数据匹配的冗余字典的方法。算法具有以下几个优点。

第一,在LBP特征空间寻找测试图像的近邻样本。LBP特征值是通过二值化邻域内周边像素与中心像素灰度差得到的,邻域中心像素的灰度值仅描述了整幅图像的亮度分布情况,与其LBP模式值相互独立,因此LBP特征不仅有效保留了图像的局部纹理特性,而且具有灰度平移不变性,对光照变化比较鲁棒,可以很好的描述图像之间的统计相似性。算法采用P=8,R=1的旋转不变均匀模式对高维人脸图像进行投影,在10维的LBP特征空间计算图像之间的相似性,与在高维人脸图像空间计算相似性相比,计算速度得到极大提高。

第二,用卡方相似性(卡方系数的负对数)作为图像之间在统计意义上的相似性度量,提高了相似性的区分度。从本质上说,LBP特征是二维样本的统计直方图,卡方(χ2)系数可以很好的衡量直方图之间的近似程度。为了进行不同尺寸图像之间相似性的比较,本算法以图像中包含的像素总数为标准对LBP直方图归一化。这一运算使直方图中元素的取值范围落在(0,1)上,样本间的标准卡方系数均小于0.1,直接利用χ2系数度量图像之间的相似性时,区分度不明显。为此本算法对原始卡方系数取负对数,并定义其为“卡方相似性”,由于引入了对数运算,取值范围被非线性扩展,能够更好的区分各样本间的相似性。

第三,近邻样本涵盖了训练样本中的每一类。当测试样本与训练样本的相似性大于测试样本与该类训练样本的平均相似性时,此训练样本被标注为近邻。这种近邻选择准则将近邻样本分布于训练样本的每一类中,保证了冗余字典原子类别的多样性,同时原子数量大大减少,提高了计算的速度。

第四,冗余字典的原子采用标注为近邻的原始人脸图像。与原始高维人脸图像相比,10维的LBP特征矢量丢失了很多信息,过少的特征值不利于压缩感知分类。因此本算法利用近邻的原始人脸图像作为字典原子,保证了字典原子包含有足够多的特征值,同时字典原子与测试图像具有更高的结构相似性,更符合压缩感知理论中对冗余字典原子的要求,因此识别率得到了提高。

附图说明

图1圆形邻域示例;

图2P=8,R=1的均匀模式及旋转不变均匀模式;

图3特征提取流程图;

图4基于LBP近邻样本压缩感知分类的人脸识别(CSFR_NS)算法框图;

图5χ2系数与“卡方相似性”比较;

图6ORL作训练库时各种χ2相似性曲线。

具体实施方式

下面结合附图对本发明进行详细说明:

1.局部二进制模式(LBP)编码原理

通常用一对数值(P,R)描述以(xc,yc)为中心,R为半径的局部圆形邻域,如图1所示。用gc表示中心像素的灰度值,gp(p=0,…,P-1)表示圆周上P个等间距分布的近邻像素点的灰度值。假设中心像素的坐标为(0,0),则近邻像素点的坐标(xp,yp)为(-Rsin(2πp/P),Rcos(2πp/P))。若(xp,yp)没有落在像素点上,则利用双线性插值法计算该点的灰度值gp。P、R的不同取值组合描述了不同的LBP描述子。

LBP算法利用结构化思想分析固定窗口内图像的纹理特征。以中心像素灰度值gc为阈值,对邻域内其它P个像素的灰度值进行二值化,然后从某个指定点开始按照一定的结构顺序将P个二进制数进行加权求和形成局部二值模式,最终用直方图统计方法提取图像的整体统计特征。

点(xc,yc)处的LBP特征值被定义为

>LBPP,R(xc,yc)=Σp=0P-1s(gp-gc)2p---(1)>

其中>s(x)=1,x>00,x0>为阶跃函数。

若把描述LBP模式值的二进制数串视为首尾链接的环形,用

>U(LBPP,R)=Σp=1P-1|s(gp-gc)-s(gp-1-gc)|+|s(gP-1-gc)-s(g0-gc)|>表示0、1之间相互转换的次数,当U(LBPP,R)≤2时,该LBP模式被定义为“均匀模式”(UniformPattern),记为是从256个LBPP,R模式中挑选出58个均匀模式来描述图像的旋转不变纹理特征,图2以P=8,R=1为例列出了所有的均匀不变模式,黑点表示取值为1,白点表示取值为0,未在图中列出的LBP模式均令其

图2的上面7行中,任意一个二进制串均可由本行中其它二进制串旋转得到,因此可把它们视为同一种具有旋转不变性均匀模式定义

第一行均匀模式对应输出的旋转不变模式值依次可计算出第二行,…,第七行的分别为2,…,7。第8行周边像素取值均为0,说明中心像素是邻域的峰值,其第9行周边像素取值均为1,说明中心像素是邻域的谷值,其未在图2中列出的模式归为一类,令其通过查表可以完成从LBPP,R的多对一映射。通过简单的二值计算和查表,可将一幅w×h的图像I,映射为一幅具有旋转不变性的均匀局部二值模式图像图像的直方图就是灰度图像I的特征矢量,可定义为

>H(k)=Σi=1wΣj=1hf(LBPP,Rriu2(i,j),k),k[0,P+2]---(3)>

其中是冲激函数,k是特征值,其最大值为P+2。

以P=8,R=1为例,图像的旋转不变均匀模式的特征提取流程如图3所示。

公式(1)和公式(2)说明中心像素的灰度值gc与其LBP模式值相互独立,它只描述了整幅图像的亮度分布情况,与图像的局部纹理无关,因此LBP局部纹理特性具有灰度平移不变性,且对光照变化比较鲁棒。

2.压缩感知人脸识别算法原理

设有C个人,每人有ni幅大小为w×h的训练图像,训练样本的总数量(m=w×h)表示第i个人的第ki幅图像按列串接构成的列矢量。任一幅人脸图像均可看作图像空间中的一点。

文献(YangA,W.J.,MaY.ShankarS,FeatureSelectioninFaceRecognition:ASparseRepresentationPerspective,2007:UCBerkeley,USA.)提出的采用压缩感知的人脸识别算法中,利用训练图像作为字典原子构造冗余字典将该冗余字典作为表示矩阵Ψ对测试图像进行稀疏表示,即Ψ=X;选择随机分布的高斯矩阵作为感知矩阵对人脸图像进行感知,得到“随机脸”>Ai=ΦXi=[fi,1,...,fi,ni],>测量矩阵经过感知矩阵感知后,高维人脸图像被投影到低维测量空间。

对任意测试图像y进行感知,其观测值为稀疏系数矢量Θ满足方程fy=AΘ。令系数矢量若用>Θi=[θni-1+1,...,θni-1+ni]T>表示第i类训练样本对应的表示系数构成的矢量,则稀疏系数矢量可表示为

理想情况下,当测试图像来自第i类样本时,解矢量Θ中只有与第i类训练数据对应的元素不等于零,其它元素都为0,即显然Θ是稀疏的,而且训练数据种类越多,Θ越稀疏。在实际应用中由于噪声的存在,非零元素也可能会发生在其它位置,通常噪声引起非零元素取值较小。

本算法采用正交匹配跟踪(OMP)算法求稀疏表示系数Θ,并对测试样本进行重构,设重构样本为fA=AΘ。令表示在测量空间重构样本与第i类训练样本之间的平均距离(平均误差),测试样本y的类别本发明把上述算法称为压缩感知人脸识别算法(CSFR),归纳如下。

3.基于近邻样本压缩感知的人脸识别算法

如何构造紧致完备的冗余字典对测试图像进行稀疏表示是采用压缩感知人脸识别算法的关键问题。由于人脸的面部具有共性特征,因而利用训练人脸图像作为冗余字典原子符合稀疏表示理论中原子构成的准则。但过多的原子数量将导致字典不够简练,在求解稀疏表示系数时,计算量会随着字典中原子数量的增大急剧增加。为了减少计算量,提高识别速度,本发明提出一种改进的压缩感知人脸识别(CSFR_NS)方法与系统,主要提出了一种新的冗余字典即表示矩阵的构造方法。算法首先在LBP特征空间寻找测试图像的近邻样本,然后利用近邻样本自适应的构造出冗余字典,使其能够更高效准确的对测试图像进行感知识别。如图4所示,算法包括三大部分:第一部分,预处理,包括图像均衡和LBP特征提取。第二部分,在低维LBP特征空间寻找测试图像的近邻样本。第三部分,利用近邻样本构造冗余字典完成测试图像的感知识别。

3.1图像预处理

为了避免光照的影响,提高计算速度和判断的准确性,本算法在特征提取前,采用累积分布函数对灰度人脸图像进行直方图均衡,然后再按照P=8,R=1的旋转不变均匀模式提取其特征矢量。即把灰度图像I可投影由10维的特征矢量特征数量H表示。

3.2近邻样本的选择

(1)LBP特征矢量相似性度量

不同尺寸的图像所包含的像素总数不同,因此在LBP特征直方图中,每种模式出现的频数变化范围较大,因此直接采用LBP直方图计算图像间的相似性是不科学的。本算法以图像中包含的像素总数为标准对LBP直方图归一化。令表示第k个bin出现的概率,Ok表示第k个bin出现的次数,归一化直方图H=[H(k)]。

卡方(χ2)系数可以很好的衡量图像直方图之间的近似程度,数学上定义两个直方图之间的卡方系数为:

>χ2(H1,H2)=Σk=1Q(H1(k)-H2(k))2H1(k)+H2(k)---(4)>

其中H1,H2表示两幅图像的归一化直方图,H1(k),H2(k)分别表示两幅直方图中第k个bin的取值,Q表示直方图中bin的个数。

由于任意H均满足0<H(k)<1,所以根据公式(4)计算的卡方系数均远远小于1,因此直接利用χ2系数度量图像之间的相似性时,区分度不明显。本算法对原始卡方系数取负对数作为图像之间在统计意义上的相似性度量值,并称其为“卡方相似性”,记为ζ

>ζ=-log(χ2(H1,H2)=-logΣk=1Q(H1(k)-H2(k))2H1(k)+H2(k))---(5)>

ζ值越大,两幅图像之间的距离越小,两者的相似度越高,否则其值越小,两幅图像之间的距离越大,相似性越低。图5给出了ORL数据库中第一幅图像和其它230幅图像的χ2系数和“卡方相似性”ζ。图中的“o”表示根据公式(5)计算出的第一幅图像和其它图像之间的卡方相似性,与它自身的卡方相似性为∞,与其它图像的卡方相似性的取值位于1.2731到3.5611之间。“+”表示根据公式(4)计算出的第一幅图像和其它图像之间的卡方系数,与它自身的卡方相系数为0,与其它图像的卡方系数取值区间为0.0003到0.0533。从图中可以清楚的看出,卡方相系数之间的差值很小,这些系数几乎聚集在一条线上,相对来说,卡方相似性之间的差值要大得多,具有较高的区分度。

(2)合法数据相似性阈值

当测试图像与训练样本的平均相似性大于合法阈值ζth时,认为该测试数据为合法数据,并对其所属类别进行判断。ζth可由经验值给出,算法利用ORL、AR和YaleB三个标准的人脸库进行实验证明了ζth的取值范围。为了后面的识别,每类数据中留出一部分作为识别时的测试数据,此处分别从ORL数据库中取每人前6幅共有240幅图像、AR数据库中每类选7幅共700幅图像、YaleB数据库中每类选16幅共608幅图像参与实验,通过计算同类样本间、不同类样本间以及不同数据库中样本间的卡方相似性寻找ζth的经验值。

同类样本间的相似性实验采用“留一交叉验证法”,从样本集中挑出一幅图像作为测试样本,该类中剩余图像作为训练样本,计算测试样本与训练样本之间的平均卡方相似性,称为“类内平均卡方相似性”。重复这一步骤直到该类中每幅图像都充当过测试样本为止。

类间平均卡方相似性指图像与本数据库中其它各种不同类样本间的平均卡方相似性。不同数据库上样本间的相似性是指来自于本数据库外的图像与数据库中所有样本之间的平均卡方相似性。图6画出了以ORL数据中的240幅图像为合法训练数据,测试样本分别来自AR和YaleB数据库的“库外平均卡方相似性”曲线图,分别用——和表示。图6中还画出了ORL数据中240幅图像的“类内平均卡方相似性”和“类间平均卡方相似性”分别用表示。

以AR、YaleB作为合法训练数据库,同样做三种实验计算出的各种卡方相似性与图6基本相同。通过大量实验发现,样本的相似性不依赖于具体的实验数据而具有独立性,而且各类卡方相似性具有以下规律:(1)大部分样本的“类内平均卡方相似性”大于2.2;(2)“类间平均卡方相似性”介于1.8到2.2之间,绝大多数样本的类间平均卡方相似性取值都在2左右;(3)“库外卡方相似性”基本不超过1.5。因此合法数据相似性阈值的选择具有通用性。

合理选择合法阈值是非常重要的,这将直接影响到错误接受率、错误拒绝率和正确识别率。具体应用可依据应用场景倾向于拒绝识别还是接受识别在[1.21.8]之间合理选择合法阈值ζth,阈值越小,对测试样本的合法性要求越低,即不轻易拒绝识别样本,错误接受率升高。相反,ζth越大,越倾向于拒绝识别,对合法测试样本要求较高,容易产生更大的错误拒绝率。

(3)近邻样本选择

对任意输入测试图像y,根据公式(5)计算出其与任意一幅训练图像xij的χ2卡方相似性ζij=ζ(y,xij),令表示测试图像与第i类样本间的平均卡法相似性,若则xij被标注为测试样本的近邻。

3.3基于近邻样本的压缩识别

表示第i类训练样本中任意一个近邻样本,表示由第i类近邻样本构成的矩阵,其中li表示第i类中共有li个近邻样本。全部近邻样本构成冗余字典R=[R1,…,Ri,…,RC]。用此字典代替压缩感知人脸识别算法中表示矩阵X,即可实现对测试样本的快速识别。

3.4算法的实验结果

表1列出了本算法在各数据上字典原子数量的范围。表1第2行列出了数据库中训练样本的数量,第3行和第4行分别是文献算法SRC和算法STSR中字典的原子数量。显然本算法中原子数量大大减少了,因此在计算稀疏系数矢量时,计算速度得到极大提升,大概是SRC算法的5倍,比STSR算法提高更多。

ORLYALEBAR训练样本数量240608700SRCSTSR72018242100CSFR_NS102~128236~350252~411

表2给出了3个标准人脸库上,几种方法的正确识别率。

表2ORL/YALEB/AR人脸库上的正确识别率(%)

上述虽然结合附图对本发明的具体实施方式进行了描述,但并非对本发明保护范围的限制,所属领域技术人员应该明白,在本发明的技术方案的基础上,本领域技术人员不需要付出创造性劳动即可做出的各种修改或变形仍在本发明的保护范围以内。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号