首页> 中国专利> 基于稀疏表示的人脸分类算法的远距离考勤方法

基于稀疏表示的人脸分类算法的远距离考勤方法

摘要

本发明公开了一种基于稀疏表示的人脸分类算法的远距离考勤方法,属于考勤技术领域,解决现有的考勤不能远距离识别的问题,步骤如下:(1)采集所有被考勤人员的人脸信息作为训练样本数据集;(2)重新采集被考勤人员的人脸信息作为测试样本,基于稀疏表示的人脸分类算法将测试样本在训练样本集中稀疏表示,得到最稀疏的解;(3)将得到的最稀疏的解,基于ZigBee技术的有源RFID实现远距离人员身份信息识别,采用双基站模型,并利用RSSI定位技术对人员通行的方向进行准确的判别,识别出人员是进入考勤区域还是离开考勤区域。本发明实现远距离实时跟踪和记录人员出入的详细情况。

著录项

  • 公开/公告号CN104574555A

    专利类型发明专利

  • 公开/公告日2015-04-29

    原文格式PDF

  • 申请/专利权人 四川大学;

    申请/专利号CN201510016667.5

  • 申请日2015-01-14

  • 分类号G07C1/10(20060101);G06K9/62(20060101);

  • 代理机构成都弘毅天承知识产权代理有限公司;

  • 代理人杨保刚;徐金琼

  • 地址 610064 四川省成都市一环路南一段24号

  • 入库时间 2023-12-18 08:25:28

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2017-07-07

    授权

    授权

  • 2015-05-27

    实质审查的生效 IPC(主分类):G07C1/10 申请日:20150114

    实质审查的生效

  • 2015-04-29

    公开

    公开

说明书

技术领域

基于稀疏表示的人脸分类算法的远距离考勤方法,实现远距离实时跟踪和记 录人员出入的详细情况,属于考勤技术领域。

背景技术

考勤管理是人力资源管理的重要组成部分,是保障高校与企事业单位正常运 转的重要手段,关系着员工的切身利益。考勤管理系统是一门跨学科、高科技的 综合性技术集合,主要涉及到心理学、信息技术、数据库系统、计算机网络以及 物联网应用等技术学科,具有对企事业单位员工进行考勤、数据分析、自动薪酬 计算以及考核等多种功能。

考勤管理系统主要有身份识别模块、身份认证模块以及信息管理模块三大部 分组成。首先需要对人员的身份进行识别以及确认,然后通过网络将人员身份信 息上传到中央服务器进行分析与处理。通常在需要考勤的门口安装考勤设备,如 IC(ID)卡阅读器、指纹机、虹膜扫描机、摄像头等,当人员身份信息被这些设 备进行捕获之后,通过计算机网络将数据传回到中央服务器,对数据进行确认、 记录和分析。合理的考勤管理对一个企业或者高校的发展有着举足轻重的作用。

近年来,各种类型的考勤管理系统在高校、企事业单位得到了广泛的应用。 早期的考勤管理系统多采用人工签到、近距离主动式刷卡等方式进行考勤管理, 需要被考勤人员主动在考勤设备面前停留进行考勤管理,费时费力,容易出现卡 片丢失、磨损、被复制以及他人代替刷卡等问题,并且当被考勤人员数量众多时, 需要排队考勤,用户体验很差,在强调人性化体验的今天,以不能满足各种应用 场合的需求。

打指纹、按掌纹、扫描虹膜等基于人体生物信息识别的考勤管理方式同 样面临着这些问题,需要在考勤设备面前停留数秒进行考勤,虽然指纹、虹膜等 人体生物信息具有长久不变、随身携带等特性,仍然不能满足现代智能考勤管理 的需求。

基于RFID技术的非接触式考勤管理避免了需要停留考勤的缺点,可以使被 考勤人员随身携带卡片自由出入,而不会漏掉考勤管理数据,近年来得到了越来 越多的应用。但传统的RFID存在识别距离短、安全性低、容易被人体和金属遮 以及定位困难等问题。针对这些问题,基于ZigBee技术的远距离主动RFID识 别方式通过在标识卡中加入低功耗微控制器与ZigBee通信模块,并采用休眠/ 唤醒模式,可以实现远距离(50-80米)自动身份识别。基于ZigBee技术的射 频识别系统不仅可以支持50米范围内的轻松读取,还支持高达200个标识卡的 同时读取,更能克服远距离被动识别方式容易被人体、金属等遮挡的问题,可以 保证上百位员工同时进出的正确读取,是目前应用最多、受欢迎程度最大的一种 识别方式。该方法还能实时对员工进出的详细情况进行跟踪和记录,但仍然容易 出现他人代替刷卡以及卡片丢失、被复制等问题。

发明内容

本发明针对现有技术的不足之处提供了一种基于稀疏表示的人脸分类算法 的远距离考勤方法,实现远距离实时跟踪和记录人员出入的详细情况,并且能够 提高考前管理或者门禁系统的安全性,避免出现一些人为的安全性问题。

为了实现上述目的,本发明采用的技术方案为:

一种基于稀疏表示的人脸分类算法的远距离考勤方法,其特征在于,如下步 骤:

(1)采集所有被考勤人员的人脸信息作为训练样本数据集;

(2)重新采集被考勤人员的人脸信息作为测试样本,基于稀疏表示的人脸 分类算法将测试样本在训练样本集中稀疏表示,稀疏表示是找出线性方程组:Ax =b最稀疏的解,A是一个m×n的矩阵,是一个向量,x是这个方程组的解, 采用一个评估函数J(x)来找到最稀疏的唯一解,定义一个常用的优化问题PJ,P J:minxJ(x),使Ax=b,其中J(x)采用二范数的平方||x||22,得到最稀疏的解;

(3)将得到的最稀疏的解,基于ZigBee技术的有源RFID实现远距离人员 身份信息识别,采用双基站模型,并利用RSSI定位技术对人员通行的方向进行 准确的判别,识别出人员是进入考勤区域还是离开考勤区域。

作为优选,所述步骤(2)中,所述基于稀疏表示的人脸分类算法的步骤如 下:

(21)输入由k类训练样本组成的字典数据集和测试样 本

(22)用单位二范数规范化字典Α的所有列;

(23)求解l1最小化问题,x1:min‖x‖1 st.‖Ax-y‖2≤ε,ε为给 定的可容忍的噪音项的二范数常量;

(24)计算残差for i=1:k;ri(y)=‖y-Aδi(x1)‖2,其中截断函数δi∶ δi(x1)用以保留x1中与第i类对应的系数,其余位置都置为0;

(25)输出测试样本y的类别ID,即测试样本y属于字典中的第i类。

作为优选,所述步骤(21)中,判断人脸测试样本是否为合法的样本,步骤 如下:

(211)在训练样本上计算稀疏系数,通过稀疏集中系数来判断稀疏表示x 中非零元是否集中在训练样本的某一个类别上,稀疏集中系数 SCI(x)=k·maxiPδi(x)P1/PxP1-1k-1[0,1],系数向量如果SCI(x)=1, 则表明测试样本仅仅是由训练样本中的某一个类表示,而如果SCI(x)=0,则表 明稀疏系数的非零元几乎分散在所有的类别中;

(212)取定一个τ∈[0,1],如果SCI(x1)<τ,则拒绝该测试样本。

与现有技术相比,本发明的优点在于:

一、基于稀疏表示的人脸分类算法、ZigBee技术的有源RFID实现远距离 人员身份信息识别和RSSI定位,实现远距离实时跟踪和记录人员出入的详细情 况;

二、根据稀疏解的非零元的的分布进行分类识别,并且可以利用该分布 进行测试样本的有效性验证,拒绝非法数据,提升算法的性能。

附图说明

图1为本发明自动考勤管理流程图;

图2为本发明重新排列后的b=Ax;

图3为本发明非零稀疏系数分类示意图;

图4为本发明非法测试样本系数的分布;

图5为本发明非法测试样本残差的分布;

图6为本发明为本发明合法测试样本系数分布;

图7为本发明合法测试样本残差的分布;

图8为本发明系统整体架构图;

图9为本发明人员身份信息自动识别示意图;

图10为本发明人员卡结构图和考勤基站的结构图;

图11为本发明主干网网络拓扑结构图;

图12为本发明主干网基站的电路结构简图;

图13为本发明从基站一到基站二的RSSI值变化示意图;

图14为本发明考勤数据处理流程;

图15为本发明λ变化对SRC人脸识别率的影响;

图16为本发明不同的维度对识别率的影响;

图17为本发明PCA与随机脸特征提取方法识别率比较;

图18为本发明SRC与NN、NS识别率比较。

具体实施方式

下面结合附图对本发明作进一步的说明。

对于一个满秩矩阵当m<n时,欠定线性方程组Ax=b将会有无穷 多个解。稀疏表示旨在找出线性方程组:Ax=b最稀疏的解,其中,A是一个m×n 的矩阵,是一个向量,x是这个方程组的解。为了避免方程组可能没有解, 设m<<n,以保证方程有无穷多个解。在所有的解中,最感兴趣的当属最稀疏的 那一个解,即包含最少非零元素的解。寻找最稀疏的解的问题,称为稀疏表示。 要想在无穷多个解中找到最稀疏的那个解,需要采用附加的策略。引入一个性能 评价函数J(x)来评估一个可能的解,J(x)的值越小越好。先定义一个常用的优 化问题PJ,PJ:minxJ(x)使Ax=b,选择一个严格的凸函数将会保证解的唯一性, J(x)采用二范数的平方||x||22,二范数问题P2将只有唯一的解。

在稀疏表示的领域,还可以采用稀疏性(Sparsity)来进行评估。简单而直 观的评估一个向量x的稀疏性,通过判断x中非零元素的个数,当x中非零元素 的个数越少时,向量x越稀疏,引入零范数l0优化问题:||x||0=#{i:xi=0},如 果||x||0<<n,则x是稀疏的。前面引出的零范数问题P0,有J(x)=J0(x)=||x||0,显 然:(P0):minx||x||0使Ax=b,令ai(1≤i<<n)是矩阵A的列,则上面的方程又 可以表示为:b=x1a1+…+xnan

稀疏优化问题和最小化二范数(l2)问题很相似,但他们在本质上有很大的 区别。l2问题总是有唯一解并且可以利用成熟的线性代数工具进行求解,而l0问题是NP-hard的。需要验证l0问题有唯一解。具体的验证如下为:

基于spark的唯一性,Spark对于任意矩阵Spark(A)为A的最小线 性相关列数。矩阵A的秩(Rank)为A的极大线性无关组的列数,矩阵的秩和 Spark的之间有着明显的相似性,相对于求矩阵的秩来说,矩阵的Spark的求解 过程要对矩阵A所有列可能的子集进行组合优化搜索。矩阵的Spark为稀疏解的 唯一性给出了一个简单的标准,将方程y=Ax与矩阵A的零空间联系起来,从 矩阵的零空间可知,在矩阵的零空间Ax=0上,x的非零元素的分布是比较均匀 的,不会集中在某一个元素上,这与期望的结果并不相符,这时需要的是抛Ax=0 中的解。求解Ax=0中的x等于是从A中挑选出一些列,并且这些列是线性相关 的,这不是所希望的情况,所以需要想办法避免这种情况的发生。通过方程发现, 零空间的解向量就是挑选的线性相关的列,这些线性相关的列必定会存在一个界 限,超过了这个界限,A中的列向量就是线性相关的,即是零空间上的方程有解。 在这个界限之类的列向量就是线性无关的,零空间上的方程无解。通过分析已经 能够明确我们需要的就是这个界限,这个界限就是spark(A)。对于任意矩阵Spark(A)为A的最小线性相关列数,对于其零空间的所有解x都满足 ||x||0>spark(A)。通过Spark可以得到结论为若x是一个线性方程组y=Ax的P0解,且x满足‖x‖0<Spark(A)/2,则这个解x是线性方程组的最稀疏的唯一解。

具体的证明为:假设P0存在另外一个解y满足条件,则‖x‖0=‖y‖0,并 且A(x-y)=0,说明矩阵A的列与元素x-y线性相关。根据Spark的定义,‖x-y‖ 0≥Spark(A)。

由于‖x‖0+‖y‖0≥‖x-y‖0,可以得出 ||y||0≥spark(A)-||x||0>spark(A)/2>||x||0,这与前面的相矛盾,因此x必定是唯一 的。此证明过程清晰的给出何时才能得到唯一的最稀疏解,但是spark(A)的求解 过程非常复杂,因此可以考虑利用与spark非常相关的格莱姆(Gram)矩阵来进 行求解。

设矩阵A的列已经被规范化,令矩阵为矩阵A的p列所构成的 矩阵,则Gram矩阵Ap可以定义为:当Gram矩阵的行列式为非零 值时(当Gram矩阵是非奇异的),矩阵Ap的列才是线性无关的。

基于相关系数的唯一性,求解spark的复杂度和求解P0问题的复杂度相当, 一种采用相关系数(Mutual Coherence)的方法是解决稀疏解的唯一性的简单方 法,相关系数的定义为:对于任意矩阵它的相关系数为:ai,、aj分别为Am×n的第i、j列。可以得出一个矩阵的相关系数是该 矩阵不同列之间的内积经过规范化之后的最大绝对值,是描述矩阵的列之间的相 关性的一种方法。对于一个单位阵,它的所有列之间相互正交,因此,相关系数 为零。对于一个列数大于行数的普通矩阵,m>n,相关系数肯定为正,我们需 要得到一个尽可能小的值,以便尽可能获得相似于单位阵的特性。

对于一个的矩阵,让AT与A相乘,就可以得到一个与A本身有关的矩阵 ATA,由于采集到的数据通常都不是很干净的数据,为了避免数据倾斜带来的不 必要的问题,先将矩阵A按列进行规范化,然后,就可以得到在这个矩阵里面 的任意一项的表达,即式子只是有了每一项的表达,按这个式子能 够计算出来的结果很多,需要将矩阵ATA的结果用比较简明的方式进行表达。 一种比较直观的方法便是用整个矩阵中的最大项来替代其他项。对于表达式 的最大项,就是当整个对角线上的元素都是1,如果整个矩阵全部替换 成1,便变成了单位阵,不是所需要的结果。为了避开这个结果,需要避开对角 线上的元素,用其他所有元素中的最大值去替换所有这些元素,替换之后,得到 对任意矩阵相关系数μ(A)与spark(A)的关系为:将难以计算的spark(A)与相对容易计算的相关系数μ(A)联系在了一起,解决了 spark(A)难以计算的问题,下面给出证明。

给定任意的p>0,从矩阵A中选择p列组成Ap以及对应的Gram矩阵,Gram 矩阵G(Ap)是非对角占优矩阵,如果1-(p-1)μ(A)≤0,即说明 矩阵Ap的p列可能线性相关,根据spark的定义,是判 断稀疏解唯一性的有效衡量标准。根据这个条件,继续探索x的0范数与相关系 数之间的关系。

当方程的最稀疏解唯一时,有‖x‖0<spark(A)/2,即对于任意满足‖x‖0< spark(A)/2的x,必然有x小于最小的一个spark(A),通过式子,求出最小的 spark(A)的值,如果用spark(A)的最小值直接替换spark(A),便得到一个用于 计算方程有唯一稀疏解的评估表达式,即得到基于相关系数的方法来评估线性方 程是否具有唯一的最稀疏解,若线性方程组y=Ax有一个解x0满足:则这个解是该线性方程组最稀疏的解。

在了解满足什么条件时,才能得到的最稀疏解才是唯一的。简单直接的方法 难以对P0问题进行求解,需要先找到能够在特定条件下对P0问题进行求解的方法。 对于P0问题,即

(P0):minx‖x‖0 s.t. b=Ax,

未知数x由两个有效的部分组成,一部分需要满足方程组使得等式成立,另 一部分要使得非零元个数最少。因此,一个可行的方法就是从满足方程的有效解 出发,则x中的非零值将很容易通过最小二乘法求得。求解P0问题的算法是离 散的,而贪婪算法将是最佳选择。

贪心算法求解l0问题如下:

设一个矩阵A,其spark(A)>2,最优化0范数问题的解(最优解)为val(P0) =1,并且这个最优解是唯一的,因此向量b是矩阵A的某些列和一个标量的乘 积。通过对矩阵A的每一列进行测试找到这些列,第j趟测试可以通过最小化 ∈(j)进行,得到残差的表达式为:

(j)=minzj||ajzj-b||22=||ajTb||aj||22aj-b||22=||b||22-2(ajTb)2||aj||22+(ajTb)2||aj||22=||b||22-(ajTb)2||aj||22

如果残差为零,就得到了所要的解。从上面的公式可以看出,这个测试只需 要计算并且b和aj是平行的。整个过程的时间复杂度为O(mn), 是普通PC可以接受的。

同样的原理,设一个矩阵A,其spark(A)>2k0,最优化0范数问题的解为 val(P0)=k0,则向量b为矩阵A中最多k0列的线性组合。对A的所有个由k0列组成的子集进行枚举测试,利用枚举测试的时间复杂度为计算量 成指数级增长,难以让普通PC接受。

贪心策略摒弃了穷举搜索,在每一步计算过程中,通过求解局部最优来更新 解。算法从x0=0开始,通过k次迭代维护活动列的集合xk,在每一次迭代过程中, 加入一列到这个集合中。每一次迭代的目的是尽可能的减少用当前活动列近似b 的残差,新的列加入之后,对残差进行重新评估,如果残差小于某个给定的阈值, 算法结束。

OMP算法近似求解l0问题如下:

OMP(Orthogonal-Matching-Pursuit)算法是贪心算法家族的一员,通过每 次迭代加入一个新的列,来求解0范数最小化问题。OMP算法每次从训练样本字 典A中选择一项原子来构建最优原子的集合Aopt,并在每一步对所选择的原子进 行正交化处理。OMP算法的初始化参数为:k=0,r0=b在第k步迭代时, 从字典A通过以下式子中选择一个原子其中, rk=b-Σi=1kaλixi=b-Akxk,以及xk=argminxRk||b-Akx||2Rk,则可以定义 OMP算法绝不会选择同一个原子两次,即OMP算法肯定会在 不超过m次迭代过程中收敛。具体证明如下:

对任意的k≥0,由于xk=argminx||b-Akx||2,(b-Akxk)AkT=0,aλiT·rk=0,(i=1,...,k),可得出aλk+1=argmaxaA|aTrk|=argmaxaA\Ak|aTrk|Ak,每次迭代过程选择的新的原子,一定不属于已选原子构成的集合,即OMP算法在 不同的迭代步骤中,不会选择同一个原子,所以OMP算法必定会在有限的迭代步 骤之后收敛,并且迭代次数不会超过m次。

设样本b恰好可以由K个原子线性表出,则b可以表示为将这些 原子组成的集合表示为Aopt={aλ1,aλ2,...,aλk}.

通过对矩阵A和x进行重新排列,如图2所示,需要证明OMP算法每步迭代 过程选择的原子在集合Aopt中,即OMP算法的每一步迭代都会选择最优的原子。 证明了OMP算法求得的最优解能够保证解的稀疏性,可得到OMP算法每次迭代都 会选择正确的原子,并且不会重复选择已经被选择的原子,即OMP算法每步迭代 过程选择的原子必定在集合Aopt中,经过k0次迭代过程之后,计算残差将变为0, 算法终止,保证整个算法能够成功的重构样本。

由于0范数问题是NP-hard问题,因此希望能够通过对0范数问题进行一些 等价转换,从而找到可行的解。具体如下:

在解足够稀疏的情况下,最小化0范数问题可以转化成最小化1范数问题, 而最小化1范数问题可以用成熟的线性规划(linear programming)方法求解。 通过将最小化0范数问题转换为最小化1范数问题,通过线性规划方法对原问题 进行求解,以及求得的解能够保证解的特性。下面给出了最小化0范数问题和最 小化1范数问题的等价性证明。

先定义l1(P1)问题:(P1)min||Wx||2 s.t. b=Ax,其中W为对角正定矩阵, Wi=||ai||2,ai为矩阵A的第i列。线性方程组b=Ax的一个解x0满足最稀疏条件则x0同为P0问题与P1问题的唯一解,其中且rank(A)=m,m<n,得到(P0)xL0:min‖x‖0 s.t. b=Ax, (P1)xL1:min‖Wx‖1 s.t. b=Ax,具体证明如下:

先定义一个其他可行解的集合Γ, Γ={y|y≠x,A(y-x)=0,||Wy||1≤||Wx||1,||y||0>||x||0},若Γ非空,说明存在不同 于x的其他可行解存在;若集合Γ为空集,说明解x是唯一的。x是方程组的最 稀疏解,其他的解都没有x稀疏,因此,设e=y-x,则 Γ={y|y≠x,A(y-x)=0,||Wy||1≤||Wx||1,||y||0>||x||0}式可以重新表示为: Γe={e|e≠0,Ae=0,||W(x+e)||1≤||Wx||1,||x+e||0>||x||0},对这个集合进 行放大,并证明即使是在放大之后,这个集合仍然为空集。

先从||W(x+e)||1≤||Wx||1出发,假设集合x的k0个非零元素全部集中在向量 的最前面,则||W(x+e)||1-||Wx||1=Σi=1k0Wii·(|(xi+ei)|-xi)+Σi>k0Wii·|ei|0,根 据不等式的性质以及Wii>0,以对式子 ||W(x+e)||1-||Wx||1=Σi=1k0Wii·(|(xi+ei)|-xi)+Σi>k0Wii·|ei|0进行缩放: Σi=1k0wii·(|(xi+ei)|-xi)+Σi>k0wii·|ei|-Σi=1k0Wii·|ei|+Σi>k0Wii·|ei|,将记为表示向量|We|的前k0个元素的和,则 Σi=1k0wii·(|(xi+ei)|-xi)+Σi>k0wii·|ei|-Σi=1k0Wii·|ei|+Σi>k0Wii·|ei|可以表示为: ||We||1-21k0T·|We|0.分析条件Ae=0,

0=Ae=ATAe=ATAW-1We=W-1ATAW-1We,即在Ae的左边乘上一个AT,结果 不变,得到W-1ATAW-1We=0,并且有-We=(W-1ATAW-1-I)We,对两边取 绝对值,并进行放缩,得到 |we|=|(W-1ATAW-1-I)We|≤|W-1ATAW-1-I|·|We|,分析W-1ATAW-1-I的 结构,设A=[a1,a2,…,an],其中aj为矩阵的第j列,即

其中,为秩为1所有元素均为1的n阶方阵,并且用到了相关系数。 可得出 定义f=We,则 Γe={e|e≠0,Ae=0,||W(x+e)||1≤||Wx||1,||x+e||0>||x||0}可以重新表示为: 集合Γf1是无界的,因为如 果f∈Γf1,则αf∈Γf1对所有的α≠0成立,为了进一步的证明它的特性, 约束f为规范化向量,即则可以定义新集合Γf2={f|||f||1=1,|f|μ(A)1+μ(A)1,1-21k0T|f|0},由 又因为||f||1=1,所以 1-21k0T|f|=1-2Σi=1k0|fi|1-2kmax|fi|=1-2k0μ(A)1+μ(A),k0<(1μ(A)+1)/2, 则有1-2k0μ(A)1+μ(A)>0,1-21k0T|f|>0,这与Γf2中的1-21k0T|f|0,矛盾,即不存在其他可行的解,线性方程组b=Ax的一个解x0满 足最稀疏条件则x0同为P0问题与P1问题的唯一解,其 中且rank(A)=m,m<n,得到(P0)xL0:min‖x‖0 s.t. b =Ax,(P1)xL1:min‖Wx‖1 s.t. b=Ax就得证。

通过上述可知,对于难以求解的0范数最小化问题,可以转化为1范数最小 化问题进行求解,并且可以保证解的稀疏性和唯一性。而1范数最小问题可以利 用成熟的线性规划方法进行求解,例如BP(BasisPursuit)算法。通常采用最 小化1范数问题来求解方程组的稀疏解,使得稀疏表示问题可以在普通PC上进 行求解。

在人脸识别领域,稀疏表示算法旨在求解测试样本在训练样本集中的稀疏表 示,如何根据稀疏解的非零元的的分布进行分类识别,并且可以利用该分布进行 测试样本的有效性验证,拒绝非法数据,提升算法的性能。具体的基于稀疏表示 的人脸分类算法(ClassificationBased On Sparse Representation,SRC)如 下:

人脸分类是指将一个给定的人脸样本划分到该样本所属的训练样本的某一 类中,即给定一个测试样本,算法需要判别出这个测试样本属于哪一个类。从训 练样本中选择一张人脸y作为测试样本,理想情况下,通过稀疏1范数最小化问 题求得的稀疏解的非零元应该全部位于测试样本y所对应的那一类中,便可直接 通过稀疏解的非零元来进行分类。如图3所示,测试样本y的1范数最小化问题 的稀疏解只有对应第i类的元素不为零,因此可以认为y属于第i类。

在实际应用中,由于噪声和模型误差的影响,稀疏解的非零元可能会分布在 训练样本的多个类别中,使得我们不能直接利用稀疏解的非零元来进行分类。这 种情况下,可以利用全局稀疏表示来设计多种可能的分类方法。例如,可以简单 的将y划分到所有非零元中最大的元素所对应的类。但这此方法没有很好的利用 人脸识别问题中图像的子空间运算的封闭性,为了更好的利用这种线性结构,我 们利用对应于不同类别的系数重构人脸图像的质量来进行分类,即重构误差越小, 测试样本就越有可能属于这个类。

对于每一个类i,我们引入截断函数

其中,是一个包含ni×ni的单位子矩阵,用于选出x中对于与第i 类的元素,进而利用这些元素来重构测试样本y。对于给定的测试样y, Yi=Aδi(x1)。依据测试样本y与人脸子空间的表达的差值ri(y)=‖y-Yi‖2最小来划分y的分类,即样本属于第k类,若 rk(y)=mini ri(y)=min,||y-Yi||2=mini||y-Aδi(x1)||2

其中,x1=arg min||x||1 s.t Ax=y。

基于稀疏表示的人脸分类算法具体步骤如下:

步骤1:输入由k类训练样本组成的字典数据集和测 试样本

步骤2:用单位二范数规范化字典Α的所有列;

步骤3:求解l1最小化问题,x1:min‖x‖1 st.‖Ax-y‖2≤ε,ε为给 定的可容忍的噪音项的二范数常量;

步骤4:计算残差for i=1:k;ri(y)=‖y-Aδi(x1)‖2,其中截断函数 δi(x1)用以保留x1中与第i类对应的系数,其余位置都置为0;

步骤6:输出测试样本y的类别ID,即测试样本y属于字典中的第i类。

人脸图像有效性验证:分类算法旨在将一个给定的测试样本划分到样本最大 可能所属的类别中,但如果给定一个不属于任何类别的样本,上述描述的分类算 法同样会得出该样本属于某一个类别,为了避免这种情况,有必要在对测试样本 y进行分类之前,先判断它是否为有效样本数据,即训练数据集中是否含有与测 试样本y属于同一类的样本数据,并拒绝为不属于训练样本中任何一类的测试 样本进行分类。如果不进行判断便直接进行分类,不属于训练样本任何类别的测 试样本,也会根据以上分类算法被划分到残差最小的那一类别当中。

随机选择一个不相干的的图像用于测试,并将该图片降采样到12×10,并 在Extended Yale B训练样本上计算稀疏系数,图4给出了稀疏系数的示意图, 图5给出了残差的示意图。而图6和图7分别是合法的测试样本的稀疏系数和残 差示意图,对比可以发现,随机选择的样本的稀疏系数没有集中在任何一个类别 上,而是分散在所有类别上,合法样本的稀疏系数会集中在某一个类别上。因此, 稀疏系数的分布在测试样本的验证方面具有很大的信息量:对于一个合法的测试 样本,其稀疏系数的非零元会集中在某一个类别上;而对于非法的测试样本,其 稀疏系数的非零元会分散在所有类别上。

有效的测试样本在数据集中的稀疏表示的非零元大多集中在某一类别中,所 以可以通过观察x系数的非零元是否集中分布在某个类中来判断测试样本的有 效性,从而避免出现非法数据错误分类的情况,进而可以验证当前人脸是否为合 法的用户。

可以通过稀疏集中系数SCI(x)=k·maxiPδi(x)P1/PxP1-1k-1[0,1],系数向量 来判断稀疏表示x中非零元是否集中在训练样本的某一个类别上。

利用稀疏表示的1范数最小化问题求得的解x,如果SCI(x)=1,则表明测 试样本仅仅是由训练样本中的某一个类表示;如果SCI(x)=0,则表明稀疏系 数的非零元几乎分散在所有的类别中。即SCI越接近1,x中的非零元越集中于 某一类,反之,SCI越接近0,x的非零元越分散。因此,我们可以选取一个下限 τ,用SCI(x)≥τ作为有效性的标准。如果SCI(x)≥τ,则我们接受这个 测试样本,否则我们认为这个测试样本是非法的。

与NN和NS不同,通过SCI来验证测试样本不需要计算残差。从图6和7 可以看出,即使是对一个非人脸的图像,非法样本的最小残差在一个大的训练集 中仍然比较小。与依靠单一的统计信息进行验证和识别不同,基于SCI的验证将 验证和识别的过程分开,利用稀疏系数进行验证,而利用残差来进行识别。通过 比较SCI系数的大小,判别是否接受测试图像进行识别的有效性从实验上也得到 了验证。在正确的拒绝无效图像方面,比NN和NS提高了10~20个百分点。如果 将SCI进行测试样本验证加入到人脸分类的算法中,用以提高算法对非法数据 的验证率,即在进行残差计算之前,首先通过SCI系统的比较,判断当前测试样 本是否为合法样本,如果为非法样本,则拒绝。对测试样本进行验证的方法为: 取定一个τ∈[0,1],如果SCI(x1)<τ,则拒绝该测试样本。

在计算残差之前,先利用SCI来判断该测试样本是否为合法的样本,如果不 是,则不予分类识别。改进后的分类算法能够对某些测试样本和多个类相似的情 况下提升算法的性能。

系统整体架构图:人员身份自动识别是考勤管理系统的主要任务,便是对合 法人员的详细进出状况进行记录和分析,可以通过自动身份识别的方式来改善用 户体验。要想实现人员身份信息的自动识别,RFID技术是上佳的选择。RFID系 统能够具有较远的识别距离、较高的识别精度、不容易被人体和金属等物体遮挡 以及对恶劣环境有较高的适应能力。本发明采用一种新型的RFID识别方式—— 基于ZigBee技术的有源RFID系统。由于系统采用有源电子标签,为了保证有 源卡的使用寿命,卡片采用睡眠/唤醒工作模式,当卡片进入考勤区域后,通过 低频信号对卡片进行唤醒,进入工作状态,实现考勤管理时又保证了卡片的使用 寿命,人员卡的结构简图如图10所示。休眠时卡片的耗电量仅为工作状态的千 分之一,这种方式即保证了卡片拥有强大的功能。在考勤管理过程中,每位人员 拥有一张考勤卡片,在门禁通道装有考勤基站,为了确切的识别出人员通行的方 向,采用双基站模型,即两个基站,并利RSSI定位技术对人员通行的方向进行 准确的判别,识别出人员是进入考勤区域还是离开考勤区域,系统的架构图如图 8所示,图9为人员身份信息自动识别示意图。

考勤基站的结构简图如图10所示,天线采用专用的天线矩阵,在人员可能 经过的通道构成完整的封闭辐射空间,实现人员卡在通道的任何位置,都能被快 速、准确的读取。低频唤醒模块可以调节唤醒距离,使得在具体的应用环境中实 现最佳智能识别。基于ZigBee的无线传感网络——主干网,在整个系统中负责 感知数据的双向通信。主干网基于ZigBee无线通信协议,是一种短距离、低复 杂度、低功耗、低数据速率、低成本的双向无线网络技术。主干网由部署在不同 位置的主干网基站组成,整个网络采用网站ZigBee拓扑结构,利用ZigBee的 自动组网功能,这些基站可以自组网加入网络,并具有路由功能。主干网的拓扑 结构如图11所示,主干网基站的结构简图如图12所示。

射频模块采用CC2530,支持2.4GHz工作频段,并且内部集成有RF收发器、 增强型8051CPU、可编程闪存,有很强大的功能。

自动考勤管理流程图如图1所示。包括数据接收、解析、分发、分析、推 送以及查询与存储等;数据接收是从功能性网关接收主干网传回的数据;对接收 到的数据进行解析之后,分发到各自的平台。在不同的子系统处理数据,并根据 数据类型进行推送、查询以及存储。数据处理的核心就是通过两个分析两个基站 传回的数据的RSSI值和卡号,通过卡号可以明确当前通行的人员的身份信息, 而比较RSSI值可以得到当前通行人员的方向。卡片拥有四种状态,即正在进入、 已经进入、正在离开、已经离开。通过对这四种状态之间的转换的分析,可以得 知持卡人员的状态。

RSSI是ZigBee通信中信号强弱的标识,通信距离越近,信号越强,距离越 远,信号越弱,比较两个数据包的RSSI值,便可以判定出人员当前离那个基站更 近。如图13所示为持卡人员从基站一一侧通行到基站二一侧的RSSI值变化示意 图。

当人员卡进入考勤区域,相应的考勤数据经过主干网上传到服务器,在数据 处理时,对同一张人员卡上传的RSSI值进行记录,当数据量达到一定量的时候, 在进行判断对来自两个基站的数据包进行同时接收和处理,便可以利用一次比较 就得出结果,不用每次数据到达都进行比较。

人员卡的状态在正在进入、已经进入、正在离开、已经离开四种状态之间转 换。当人员卡第一次进入考勤区域时,将其状态切换到正在进入,当判断人员卡 已经从考勤基站一一侧进入到考勤基站二一侧,则将其状态转换为已经进 入。当经过一个时间片之后,人员卡再次进入考勤区域,则人员卡将从已经进入 状态切换到正在离开状态,到达考勤基站一一侧之后,从正在离开切换到已经离 开。这样就实现了利用两个考勤基站,并通过RSSI值实现人员通行方向的自动 识别。

当确定人员已经进入或者已经离开时,需要记录这些信息,即记录人员出入 的详细信息,图14为考勤数据处理流程。

为了使注册的客户端能够实时获取考勤结果,服务器端需要在记录这些信息 的同时将数据推送到客户端。系统采用WCF实现服务器与客户端的交互,由于客 户端和服务器端属于不同的域,要想直接通过服务器端向客户端发送数据,需要 客户端实现前面定义的回调契约,即SendAttData(string message)。回调契 约通过委托(Delegate)来实现,即通过委托实现调用客户端的方法。有考勤数 据存储在数据库中,以便进行考勤数据分析、查询。例如,我们可以通过折线图 友好的展示出勤某个时间段的出勤情况统计图,如图5-6所示。

在基于稀疏表示的人脸验证中特征提取方法的选择以及对遮挡等误差的处 理两个重要问题。

特征提取方法的选择:主流的特征提取方法分为两类,一类提取人脸全局特 征如Eigenfaces、Fisherfaces、Laplacianfaces,另一类是提取具有较强识别 能力的部分人脸特征,如眼睛、鼻子、眉形等。

由于大多数特征变换仅仅涉及到线性变换,从人脸图像空间到人脸特征空间 的变换矩阵可表示为对y=Ax两边同时应用该变换矩阵可得: y~=A~x=RAx,其中y~d×1=Rd×mym×1,A~d×n=Rd×mAm×n.由于d<<m,方 程组仍有无穷多解,若解x0足够稀疏,可通过lR1问题求解: (lR1)x~1:min||x||1s.t.||RAx-Ry||2θ,其中将 作为训练样本矩阵,将作为测试样本。R 的维数d越大,还原度越高,人脸识别的准确率也越高。

对于问题lR1与lε1(lR1)x~1:min||x||1st.||RAx-Ry||2θ,x1:min||x||1 st. ||Ax-y||2≤ε,如果解x1足够稀疏,则lR1在维度d 足够大是有很大的概率能够恢复lε1中的稀疏信号x1。如果x1中含有k个非零元 素,且k<<n,只要Rd×m中的d≥2tlog(n/d)时,lR1就能恢复出lε1中的稀疏信号 x1。

利用高斯随机矩阵线性映射生成的特征称为随机脸(Randomfaces),随机 脸的优势在于他的产生过程比较高效,并且变换矩阵R也与数据集中的人脸图像 无关,即使人脸数据发生改变,R也不需重新计算。

对于变换矩阵Rd×m中每一行元素相互独立并服从均值为0的正态分布,且每 一行都经过单位二范数规范化,Ry称为ym×1的随机映射,则Ry就称为随机脸。 R的每行元素都是单位长度、均值为0的高斯分布。只要稀疏解x1能够被正确的 恢复,则分类算法就能够得到相同的分类结果,和具体的特征提取算法无关。因 此,只要特征提取矩阵Rd×m中d满足维数祝福定理,则分类算法将快速收敛,特 征提取的选择不再是人脸识别问题成功的关键。

对遮挡和误差的处理:实际应用中,测试图像可能会出现部分遮挡或损坏, 导致测试样本y的数据有误差存在。此时,测量值ym×1和真实值y0m×1之间有差值 e0m×1,即y=y0+e0=Ax0+e0,其中e0是任意的,不同测试图像的误差是未知 的。如误差e0可表示为矩阵中列向量的线性组合,由于只有部分数 据点存在误差,e0对整个样本集来说是稀疏的,e0=Aeu0,其中u0是稀疏的, 则测试样本可表示为:y=Bw=AAex0u0Ax0+Aeu0=y0+e0,其中 由于x0和u0都是稀疏的,所以w=x0u0也是稀疏的。为了便于计算和表达,选取一种特殊情况ne=m, 即e0在自然坐标下是稀疏的。所以,y=Bw0=AIx0e0,其中 方程组的最稀疏解。在一定的约 束条件下,扩展的le0问题仍然可以转化成le1问题求解。当图像损坏程度保持在 一定的范围内时,是可以准确的找到我们需要的稀疏解的,需满足条件为: ni+|support(e0)|<d/3,其中,ni是损坏部分的维度,d是测试样本的维度。 即只要遮挡或者误差不超过这个范围,le1求得的稀疏解w1就能恢复w0。通过求 解扩展的le1问题来恢复稀疏解w0,w1=argmin||w||1 st. y=Bw, 其中求得稀疏解w1,从而得到e1, 利用y0=y-e1,得到y0为还原失真数据后的测试样本。对于有部分遮挡或损坏 的失真样本,修改分类算法中残差ri(y)表达式: 只要能够正确的求解最稀疏解w1, 则算法仍然能够较好的处理这些存在遮挡以及损坏等失真样本。

λ对识别率的影响:LASSO用于解决l1问题是稳定的。l1问题 (l1) xL1:min||x||1 s.t. Ax=y的LASSO扩展形式为:min||y-Ax||2+λ||x||1,其 中λ为LASSO中拉格朗日乘子的逆。实验中,首先对所有人脸数据进行PCA降维, 特征提取的维度值d=30。实验结果如下表所示:

λ 0.005 0.02 0.1 0.5 1 d 30 30 30 30 30 识别率 91.65% 91.65% 91.74% 83.85% 68.87%

从表中可看出LASSO中λ的变化对人脸识别结果的影响。为了更加直观的 分析实验结果,给出图例分析。如图15中我们可以直观的看出当λ值从0逐渐 增大时,

算法的识别率越来越低。实验中采用PCA作为特征提取方法。

LASSO中取λ=0.005固定,特征提取的维度d变化,实验数据如下表给出 了不同的特征维度下人脸识别的正确率。

d 30 50 80 100 120 λ 0.005 0.005 0.005 0.005 0.005 识别率 91.65% 94.1% 96.01% 96.37% 97.19%

图16是对应的结果,从图中可看出,在其他条件不变的情况下,特征的维 度越大,识别率越高,但当维度达到某个阈值时,随着维度增加识别率提升越小。 实验中采用PCA作为特征提取方法。

为了验证SRC进行人脸识别时对特征提取方法的要求,我们采用随机脸和常 用的特征提取方法——主成分分析方法分别进行试验,并对比他们的识别结果。

主成分分析概述通常用于人脸识别的特征提取方法包括PCA、 Laplacianface以及DownSampled face三种,他们通过不同的方法对人脸图像 进行降维,并提取不同的特征,为了较好的保留特征信息,特征的维度为120 维。特征提取的过程就是对数据进行降维,即将原始图像映射到一个新的低维的 空间,以便更有效的进行分类与验证。其中PCA能够最大程度的保留原始图像的 特征,而Downsampled face则最差。为了更好的得到对比试验的效果,选择用 PCA和随机脸方法进行对比试验。PCA(主成分分析)通常用于对高维数据进行 特征提取,以简化存储空间和计算量,并尽量保留数据的重要特征。

利用PCA对数据集A=[a1,a2,…,an]进行特征提取,其维度为m×n,首先要求 出矩阵A的协方差矩阵S;然后计算协方差矩阵S的特征值,并将计算得到的特 征值按照从大到小的顺序排列,选出最大的特征值;最后,得到最大的特征值所 对应的特征向量,并将整个所有样本数据投影到最大特征值对应的特征向量所张 成的空间当中。以上三个步骤便实现了用PCA对数据进行特征提取以及降维。

随机脸与PCA特征提取识别率的比较:在常见的三种特征提取方法中,PCA 进行特征提取效果最好,利用随机脸和PCA方法分别提取不同维度的特征,选择 的维度为30,50,80,100,120维,分别配合SRC算法进行人脸识别,对前面 介绍的测试数据库中的测试数据进行分类,分类结果如下表所示,并且在图17 中给出了更直观的表示。

d 30 50 80 100 120 PCA 91.65% 94.10% 96.01% 96.37% 97.19% 随机脸 89.92% 92.37% 95.04% 95.69% 96.42%

实验中我们没有对人脸图像进行其他处理,直接利用数据库中的数据进行特 征提取,然后利用SRC算法进行识别。实验中的λ值设置为0.005,特征维度 从30到120维变化。从实验结果我们可以直观的看出,两种特征提取方法在识 别率上不相上下,PCA方法由于能够最大可能的保留原始图像的特征,识别率 略高,而随机脸方法虽然识别率略低于PCA,但是计算量要小得多,在需要实时 处理的地方。验证了基于稀疏表示的人脸识别算法对特征提取的要求不再是传统 的人脸识别方法那么苛刻,即使是随机脸方法,也能得到令人满意的识别效果。 另外,也验证了随着特征维度的增加,识别率会逐渐增大,但到达一个阈值之后, 增加的幅度越来越小。

为了进一步验证SRC算法的有效性,在相同的数据集中采用不同的算法进 行仿真实验。采用PCA对人脸数据进行降维,分别用SRC、NN以及NS进行分类 识别。

NN(Nearest Neighbor)分类通过计算测试样本y和所有训练样本之间的欧式距 离,并将测试样本划分到这个距离最小的样本所属的类别,即对k类的所有训练 样本aij,for i=1:k;for j=1:ni, identity(y)=riNN(y)=argmin||y-|aij||2,最后将测试样本y划分到欧式 距离最小的样本所在的第i类。

NS(Nearest Subspace)分类方法与NN分类不同,它计算测试样本与测试样本 在每个类别所在的子空间的投影之间的距离,并将测试样本划分到距离最小的那 个类别。定义训练样本子空间Ai(属于第i类的全部测试样本) 计算测试样本与每个类别子空间的欧式距离: for i=1:k,最后将测试样本划分到第i类。

NN算法通过技术测试样本y与训练样本aij之间的欧式距离来划分类别,利 用了与某个测试样本之间的关系,从直观上便可看出这样的标准有些片面。而 NS算法通过计算测试样本与训练样本子空间之间的距离来划分类别,度量了测 试样本和一个类别之间的关系,更接近流形学习的思想,这样的分类标准也比 NN更加可信。

在实验中我们采用PCA进行特征提取,然后分别利用SRC、NN和NS进行人 脸识别实验,数据集采用Extended Yale B人脸数据库,一半作为训练集,剩 下的部分作为测试集。我们分别选取维度为30,50,80,100,120维,进行实 验。如下表以及图18给出了实验结果数据。

d 30 50 80 100 120 PCA+SRC 91.65% 94.10% 96.01% 96.37% 97.19% PCA+NN 53.27% 64.25% 69.24% 71.78% 72.96% PCA+NS 67.36% 71.49% 74.98% 79.94% 80.24%

从图18中可看出,SRC算法在特征维度为120维时可以达到97.19%的超高 识别率,而同等情况下,NN为72.96%,NS为80.24%,稀疏表示算法具有更好 的表现。特别是在低维特征时,SRC算法的有效性更加突出,在30维时仍然具 有91.65%的识别率,而NN和NS最高位67.36%,在应用中已经无法令人满意。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号