公开/公告号CN103440504A
专利类型发明专利
公开/公告日2013-12-11
原文格式PDF
申请/专利权人 中国科学院自动化研究所;
申请/专利号CN201310418307.9
申请日2013-09-13
分类号G06K9/62;G06K9/66;G06K9/40;
代理机构中科专利商标代理有限责任公司;
代理人宋焰琴
地址 100190 北京市海淀区中关村东路95号
入库时间 2024-02-19 21:18:53
法律状态公告日
法律状态信息
法律状态
2016-08-17
授权
授权
2014-01-08
实质审查的生效 IPC(主分类):G06K9/62 申请日:20130913
实质审查的生效
2013-12-11
公开
公开
技术领域
本发明涉及模式识别与机器学习领域,特别涉及一种基于结构先验知 识的生物特征识别方法,该方法使用稀疏表示、半二次最小化等算法进行 生物特征识别。
背景技术
近些年,线性表示模型在计算机视觉领域得到了广泛的应用,比如人 脸识别等生物特征识别。比如说,对于人脸识别问题,同一个人的多张不 同人脸图像一般分布在同一个子空间之中,所以这个人的一张图像可以近 似用他的其他张图像来线性表示。基于这种认知,人们提出了一系列线性 最小二乘方法,例如最近邻特征线,最近邻特征平面以及最近邻特征空间 等具体算法。而从稀疏性角度分,线性表示模型又大致分为两类,即为稀 疏线性表示模型与非稀疏线性表示模型,前者采用L1范数来约束线性表 示系数,后者则采用L2范数进行约束。稀疏性主要是考虑当用所有的训 练样本去重构待测试样本时,在训练样本数量充分冗余,类别分布覆盖面 充分广的条件下,只有跟测试样本同类别的训练样本重构能力最强。如果 令线性表示系数是稀疏的,则必然有重构能力最强的训练样本所对应的线 性表示系数非零,而其余参加重构的训练样本对应的系数为零。
对于人脸识别等生物特征识别问题,如何处理有遮挡(墨镜、围巾等) 情况下的识别与分类困扰着该领域的研究人员,同时也决定了一个实际生 物特征识别系统的稳定性与实用性。然而,上述中的大多数模型都不能很 好的解决遮挡噪声对识别分类结果的干扰,也没有考虑遮挡这一常见噪声 的结构特性。为此,本模型中引入遮挡噪声的空间连续性先验,即使得被 恢复出的遮挡噪声相邻像素的一阶差分值尽可能小,进而使得模型对像遮 挡这样的连续性噪声更加鲁棒。
发明内容
为了解决现有技术存在的空缺,本发明的目的是提供一种基于结构先 验知识的生物特征识别方法,本发明根据实际中遮挡等噪声一般具有空间 连续性这一先验知识,对线性表示中的噪声项施加连续性约束,即令遮挡 噪声项的相邻像素值的一阶差分值尽可能小。同时本发明还使用鲁棒M估 计子(Robust M-Estimator)来约束重构系数、遮挡噪声项以及重构误差, 从而解决了L1约束使得优化目标函数在原点处不可微,L2约束使得模型 对遮挡等大噪声十分敏感,过分拟合噪声误差等问题。
本发明提出的一种基于结构先验知识的生物特征识别方法包括以下 步骤:
步骤S1,收集图像数据形成训练样本集和测试样本集;
步骤S2,提取所述训练样本集中每个训练样本的特征向量,并将提取 得到的特征向量组成字典矩阵X;
步骤S3,基于所述字典矩阵X,通过优化算法计算得到与所述测试样 本集中的每一测试样本对应的重构系数向量;
步骤S4,基于所述字典矩阵X,使用与所述测试样本集中的每一测试 样本对应的重构系数向量进行样本重构,得到与每一测试样本对应的分属 于不同类别的重构测试样本,与相应测试样本最为接近的重构训练样本的 类别即为所述测试样本的类别。
由于本发明中引入了遮挡噪声的空间连续性先验知识,从而使本发明 对生物特征识别的过程中的遮挡类噪声更加鲁棒,进而提高了生物特征识 别分类的准确率。
附图说明
图1是本发明提出的基于结构先验知识的生物特征识别方法流程图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,以下结合具体实 施例,并参照附图,对本发明进一步详细说明。
本发明通过引入遮挡噪声的空间连续性这一结构先验知识,有效的处 理在有遮挡噪声情况下的生物特征识别问题,使得生物特征识别更加的稳 定与实用。
图1是本发明提出的基于结构先验知识的生物特征识别方法流程图, 本发明的识别方法适用于对于任何生物特征的识别,下文以人脸识别为例 对本发明方法进行介绍,如图1所示,所述生物特征识别方法包括以下步 骤:
步骤S1,收集图像数据形成训练样本集和测试样本集;
其中,每个样本集中包含有多个类别的图像,且每个类别包含有多张 图像(例如同一人脸的不同图像)。
对于训练样本集,其中的图像均为无遮挡噪声的正常图像;对于测试 样本集,其中的图像为有遮挡噪声(墨镜、围巾等)的图像。
步骤S2,提取所述训练样本集中每个训练样本的特征向量,并将提取 得到的特征向量组成字典矩阵X;
该步骤中提取所述特征向量的步骤进一步包括:
步骤S21,将某一训练样本的各列像素值顺序连接拉直成为一个新的 列向量;
步骤S22,将得到的列向量进行归一化(比如归一化到[0,1]之间)后 得到的向量作为该训练样本的特征向量。
之后,将训练样本集中所有训练样本的特征向量按照类别依次排列就 组成了所述字典矩阵X。
步骤S3,基于所述字典矩阵X,通过优化算法计算得到与所述测试样 本集中的每一测试样本对应的重构系数向量;
所述步骤S3进一步包括以下步骤:
步骤S31,将待识别的测试样本集中的某一测试样本表示成为重构项、 噪声项以及重构误差项z之和:
y=Xβ+e+z,
其中,y表示某一测试样本;β为与该测试样本对应的重构系数向量;Xβ 为与该测试样本对应的重构项,所述重构项也可以理解为是所述训练样本 集中所有训练样本的特征向量的线性加权和,加权系数即为重构系数;e 为噪声向量;z为重构误差向量。
步骤S32,在上述约束条件下,通过最小化目标函数,使重构系数向 量β和噪声向量e稀疏化,重构误差向量z最小化,同时使噪声向量e的 邻接像素一阶差分最小化,进而求得重构系数向量β。
所述重构误差向量z属于高斯噪声,其与噪声向量e相比较小,实际 中可以忽略不计。
在本发明一实施例中,所述目标函数表示为:
其中,φ(t)为鲁棒估计子:α为鲁棒估计子参数,该鲁棒 估计子使得所述目标函数在原点处可微并且对大噪声有较好的抑制作用, 同时也能保证一定的稀疏性,控制模型的复杂度;r为robust的缩写,表 示鲁棒性,也就是说,该下标表示φr(ej)和φr((Gre)j)对噪声具有鲁棒性; j为向量的第j个元素;Gr为变换矩阵,其主对角线元素为1,主对角线上 方的第一个对角线元素均为-1,其余元素为0,该变换矩阵可约束噪声向 量e相邻像素的一阶差分值;λ为正则化参数;s为sparsity的缩写,表示 稀疏性,也就是说,该下标表示φs(βi)能够控制所述目标函数的稀疏性; i为向量的第i个元素。
接下来采用乘性半二次最小化算法来优化式(1)所表示的目标函数, 具体地,鲁棒估计子φ(tj)可以展开为其中pj为附加 变量,为φ(·)的对偶共轭函数,pj由φ(·)的最小化函数δ(·)确定,一旦φ(·) 的形式确定,则δ(·)的形式也就确定。所述鲁棒估计子取为则当pj给定时,变为常数,φ(tj)的优化就相 当于优化一个二次项,此时目标函数的求解变为凸优化问题。式(1)经 过上述分解转化后即可变成如下形式:
其中,P为半二次优化中的附加变量(中间变量),b、c、a分别表示(2) 中第一、二、三项的附加变量的标号。
把式(2)改写成矩阵形式,得到式(3):
其中,
然后应用拉格朗日乘子法可求解得到重构系数向量β和噪声向量e:
其中,
步骤S4,基于所述字典矩阵X,使用与所述测试样本集中的每一测试 样本对应的重构系数向量进行样本重构,得到与每一测试样本对应的分属 于不同类别的重构测试样本,与相应测试样本最为接近的重构训练样本的 类别即为所述测试样本的类别。
该步骤中,分别计算不同类别的重构测试样本与相应的测试样本之间 的残差,使得残差最小的那个重构训练样本的类别即为所述测试样本的类 别,即上述过程可表示为:
其中,C表示测试样本的类别,c表示多个可选的类别,Xc为同属于类别 c的所有训练样本的字典矩阵,βc为重构系数向量β中类别c的训练样本 所对应的重构系数向量,Xcβc为与某一测试样本对应的属于类别c的重构 测试样本,表示欧式距离平方和。
为了详细说明本发明的具体实施方式,以人脸识别领域常用的AR数 据库为例再次阐述本发明的各个关键步骤。此数据库中包含56个女人和 70个男人的4000多幅人脸图像。这些人脸图像包含了不同的表情变化, 光照变化以及带有墨镜、围巾等真实遮挡的图像。
步骤S1,选择AR数据库中54个女人和65个男人的每人8张不含遮 挡的正面人脸图像作为训练样本集,共计956张图像,选取带有墨镜遮挡 的人脸图像作为测试样本集;
步骤S2,把每个训练样本图像的各列像素值顺序连接拉直成为一个新 的列向量并归一化到[0,1]之间,作为该训练样本图像的特征向量,每个训 练样本图像的维度为112×92=10304,则特征向量的维数亦为10304,将每 个训练样本的特征向量按照类别依次排好组成一个维度为10304×956的字 典矩阵X;
步骤S3,结合式(1)到(5),采用迭代最小化的策略对目标函数进 行优化求解,即首先初始化重构系数遮挡噪声正则化参数 λ=0.1以及鲁棒估计子中的参数α=0.001,然后迭代第一步按照式(7) 即可求出附加变量p,
迭代的第二步相当于求解含有等式约束的拉格朗日乘子问题,结果可 由式(4)(5)得出;然后重复此两步迭代过程,直至算法收敛为止。实 验中迭代次数设置为30次左右即可取得较好的收敛效果。
步骤S4,求得重构系数后,根据式(6)分别计算基于与每一测试样 本对应的分属于不同类别的重构测试样本,然后分别计算该类的重构测试 样本与测试样本之间的残差,获得残差最小的那个类别即为测试样本的类 别。
以上所述的具体实施例,对本发明的目的、技术方案和有益效果进行 了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施例而 已,并不用于限制本发明,凡在本发明的精神和原则之内,所做的任何修 改、等同替换、改进等,均应包含在本发明的保护范围之内。
机译: 基于矩阵流形先验知识的具有测量误差的鲁棒STAP方法
机译: 基于数据增量的鲁棒对象识别方法及系统
机译: 基于姿态估计的鲁棒人脸识别方法