首页> 中文学位 >基于增强Pictorial模型的鲁棒精确人眼定位技术研究
【6h】

基于增强Pictorial模型的鲁棒精确人眼定位技术研究

代理获取

摘要

人眼精确定位作为人脸图像规整化的预处理步骤对人脸识别系统的性能具有重要影响。但是人眼相对于人脸包含的特征较少,同时容易受到复杂光照、表情变化的影响,造成对象模式变化丰富,而且人眼经常会受到头发、眼镜等附属物的遮挡,很大程度上增加了精确定位人眼的难度。因此,探寻能够应对这些复杂条件变化,并实现高效鲁棒精确的人眼定位,将会在很大程度上推动人眼定位技术走向现实应用,从而本课题的研究变得很有意义。本文重点研究非控自然条件下的高效鲁棒精确人眼定位,在对当前人眼定位技术做了综述性的调查分析之后,确定了研究思路:综合利用人眼的外观特征以及人眼与周围面部特征之间的空间位置分布关系,选择标准Pictorial模型作为研究的出发点。结合Pictorial模型的特点以及人眼定位面临的挑战,提出了增强的Pictorial模型进行人眼定应。
   本文主要工作如下:
   1、把用于对象描述和对象检测的Pictorial模型引入到人眼精确定位问题中。虽然该模型在解决一般对象检测问题上有许多优势,但是要实现复杂情况下的人眼精确定位,还有许多工作要做。
   2、针对由于复杂光照和表情变化以及附属物遮挡造成的人眼模式复杂变化的特点,标准Pictorial模型中,基于高斯分布的生成模型已经不足以表达人眼外观模式变化的多样性。本文提出了使用基于概率支持向量机的判别模型来刻画复杂的人眼模式分布,该方法通过寻找特征空间中的一个最优分类面,从完全不同于生成模型的角度,可以得到一个推广能力较好的分类器。
   3、由于标准Pictorial模型中基于构件间的相对位置分布所建立的结构约束过强,导致对旋转、尺度放缩和平移等仿射变换不鲁棒。针对该问题,本论文提出了基于全局结构约束的结构模型来提高对常见的图像旋转、尺度放缩和平移等仿射变换的鲁棒性。在由眼睛和鼻子构成的稳定三角形空间位置分布结构中,结构约束表示为边长、边长比例和三角形内角余弦值,分别体现构件间的相对距离,构件间相对距离变化的一致性,三个构件间的结构整体性。
   4、为了消除光照和其它仿射变换的影响,以得到较稳定的对象表示形式,从而便于利用本文提出的增强Pictorial模型实现精确的人眼定位,采取了一系列的预处理措施,包括:人脸检测、人脸验证、尺度归一化和光照预处理。同时,为了减少实验细节对模型性能的影响,采取了一些参数优化方法,包括优化模板和搜索区域大小、采用Bootstrap方法收集具有代表性的反例样本和采用启发式方法处理遮挡问题。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号