技术领域
本发明涉及计算机视觉领域,尤其涉及一种基于注意力机制和数据平衡的跨年龄人脸识别方案,一种跨年龄人脸识别方案。
背景技术
随着社会经济与科学技术的发展,人脸识别在各行各业已经得到了广泛的应用,并且取得了令人印象深刻的表现。然而,面对人脸的随着年龄的老化,一般的人脸识别方案暴露了其低鲁棒性的缺陷,不能够准确、稳定的识别有着较大年龄差别的人脸。
随着年龄的老化,有时人脸在不同年龄之间的差距甚至会超过不同人之间的差距。因此,跨年龄人脸识别的一个关键挑战是从人脸提取不受年龄影响的身份特征,从而克服年龄的影响。总的来说,跨年龄人脸识别可以分为生成方法与判别方法。生成方法通过建模人脸老化过程生成人脸在不同的年龄的图像进行识别,判别方法则是通过提取不受年龄影响的身份特征进行人脸识别。许多判别方法简单的通过移除人脸特征中的年龄因素提取身份特征,但是这种方法会在一定程度上损失身份信息。此外,深度学习对于数据集有着巨大的依赖,而跨年龄人脸数据集通常表现出严重的年龄标签分布不均,即青年、中年的人脸数据较多,低龄和高龄人群的人脸数据较少,这种数据分布的不均衡很大程度上影响了跨年龄人脸识别的效果。
发明内容
针对现有技术中存在的不足,本发明提供一种基于注意力机制与数据不平衡的跨年龄人脸识别方法。本发明旨在解决如何通过神经网络从人脸提取鲁棒的身份特征,从而提高跨年龄人脸识别的准确性与鲁棒性。
为了达到上述目的,我们从人脸序列中提取面部特征序列,通过自注意力机制捕获序列中的全局信息,通过一个重加权年龄损失函数缓解年龄标签的不平衡分布,此外,我们通过特征融合与分解提高了身份特征对年龄因素的鲁棒性,最终提高跨年龄人脸识别的准确性。
一种基于注意力机制与数据不平衡的跨年龄人脸识别方法,步骤如下:
步骤1、从跨年龄人脸识别数据集Morph中抽取同一个人不同年龄的面部照片组成人脸时间序列,通过特征提取网络提取面部特征序列,通过自注意力机制进行处理得到处理后的特征序列;
步骤2、将自注意力机制处理后的特征序列进行线性融合。
步骤3、将融合后的面部特征分解为身份特征与年龄特征。
步骤4、监督训练;
采用重加权的年龄损失和身份损失分别对年龄估计和身份估计任务进行监督,并采用相关性损失约束年龄特征与身份特征之间的相似性。
步骤1、从跨年龄人脸识别数据集Morph中抽取同一个人不同年龄的面部照片组成人脸时间序列:
其中,σ是softmax函数,W
步骤2、将自注意力机制处理后的特征序列进行线性融合。
其中w
步骤3、将融合后的面部特征分解为身份特征与年龄特征。
首先通过三个全连接层将融合后的特征x
从融合的面部特征中减去投影后的年龄特征即可得到身份特征:
将身份特征
步骤4、监督训练;
采用重加权的年龄损失和身份损失分别对年龄估计和身份估计任务进行监督,并采用相关性损失约束年龄特征与身份特征之间的相似性。
重加权的年龄损失:
L
身份损失同样采用交叉熵损失。
相关性损失:
L
其中P描述了年龄特征与身份特征的相关性,μ
本发明所达到的有益效果为:
通过融合同一个身份不同年龄的面部照片以及自注意力机制,学习了年龄对面部的影响,提取了更加鲁棒的身份特征;通过重加权年龄损失,缓解了年龄数据分布不平衡导致的准确率下降。
附图说明
图1为本发明方法流程图;
图2为本发明实施例采用的网络结构示意图。
具体实施方式
下面结合附图并通过具体实施例对本发明做进一步详述。
本方法所采用的网络结构如图2所示,首先通过一个特征提取网络对输入的进行特征提取,随后的自注意力模块对提取的面部特征序列进行处理,特征融合部分对面部特征序列进行融合,随后通过特征分解模块得到年龄特征与身份特征,由分类器估计出相应的年龄与身份。
如图1所示,本发明的具体实施例及其实施过程如下:
具体实施过程包括深度模型的训练与测试两个阶段:
步骤1:从Morph数据集中选取三张人脸照片样本,身份为p:
其中σ是softmax函数,W
步骤2:将序列中的三个特征线性融合。
步骤3:通过三个全连接层将融合后的特征x
从融合的面部特征中减去投影后的年龄特征即可得到身份特征:
将身份特征
步骤4、监督训练。
采用重加权的年龄损失和身份损失分别对年龄估计和身份估计任务进行监督,并采用相关性损失约束年龄特征与身份特征之间的相似性。
重加权的年龄损失:
L
身份损失同样采用交叉熵损失。
相关性损失:
L
其中P描述了年龄特征与身份特征的相关性,μ
训练参数为:在pytorch库下,优化器选择SGD随机梯度下降,初始学习率为10
测试阶段:
步骤5:将测试图片组成序列输入到网络进行特征提取与融合,当同一个人的面部图片不足三张时用翻转后的图像作为补充,将线性融合的特征PCA降维后进行比对识别。
机译: 基于元数据启发式搜索的人脸识别方法和系统
机译: 基于混合方法和径向基函数神经网络的数据处理技术的人脸识别方法
机译: 一种用于创建神经网络模型的方法和计算设备,该模型输出基于EEG数据的大脑年龄预测信息