首页> 中国专利> 利用降维方法进行人脸姿态估计的方法

利用降维方法进行人脸姿态估计的方法

摘要

本发明公开了一种图像识别技术领域的利用降维方法进行人脸姿态估计的方法,具体包括如下步骤:(1)对不同姿态的人脸图像训练样本进行预处理操作;(2)对预处理后的数据进行PCA处理;(3)初始化受限玻尔兹曼机神经网络;(4)用PCA处理后的数据预训练受限玻尔兹曼机神经网络;(5)调整受限玻尔兹曼机神经网络参数;(6)对新的人脸图像进行姿态识别;本发明于现有技术相比错误率进一步降低,同时由于其数据的维数经过PCA处理后大大降维,后续的网络中每一层的节点数也随之减少,不仅减少了训练时间,同时测试速度也大为提高。

著录项

  • 公开/公告号CN101021900A

    专利类型发明专利

  • 公开/公告日2007-08-22

    原文格式PDF

  • 申请/专利权人 上海交通大学;

    申请/专利号CN200710038076.3

  • 申请日2007-03-15

  • 分类号G06K9/00(20060101);G06K9/62(20060101);

  • 代理机构31201 上海交达专利事务所;

  • 代理人王锡麟;张宗明

  • 地址 200240 上海市闵行区东川路800号

  • 入库时间 2023-12-17 19:03:16

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2013-05-08

    未缴年费专利权终止 IPC(主分类):G06K9/00 授权公告日:20090527 终止日期:20120315 申请日:20070315

    专利权的终止

  • 2009-05-27

    授权

    授权

  • 2007-10-17

    实质审查的生效

    实质审查的生效

  • 2007-08-22

    公开

    公开

说明书

技术领域

本发明涉及一种图像识别技术领域的方法,具体是一种结合了主成分分析(PCA)和受限玻尔兹曼机神经网络的降维方法进行人脸姿态估计的方法。

背景技术

目前人脸识别的研究重点已经从二维拓展到三维,而三维人脸识别中最为核心的技术就是如何根据二维人脸图像估计该人脸的三维姿态。姿态估计本质上是一个分类问题,即判断一幅人脸图像中的人脸属于哪一个姿态。但是人脸图像是典型的高维数据,一般的分类方法根本不能够被直接应用于姿态估计,因此首先必须对高维人脸数据进行降维,然后再对降维后的数据进行姿态估计。

经对现有技术文献的检索发现,G.G.Hilton等在《Science》(科学杂志,2006年第313卷第5786期第504页)发表的“Reducing the Dimensionality of Data withNeural Networks”(用神经网络降低数据维数),该文提出了一种基于受限玻尔兹曼机神经网络的非线性降维方法,实验证明该方法可以被用于姿态估计。利用大量的不同姿态的人脸图像数据对网络进行预训练得到初始权值,然后再用原始数据对整个网络的权值进行调整使网络达到最佳状态。但是该方法的训练时间随着训练样本的个数和维数的上升而急剧增加。但是在实际应用上,人脸图像在生成过程中受到外界的干扰而包含了很多冗余的信息和噪音,这些冗余的信息和噪音不但会增加计算时间,还会影响后期的识别精度,因此在真正对这些数据利用神经网络进行降维处理之前有必要去除这些冗余的信息和噪音,另外受限玻尔兹曼机神经网络降维方法同时还有速度慢、精度低等缺陷。

发明内容

本发明的目的在于克服现有技术中的不足,提供一种利用降维方法进行人脸姿态估计的方法,即首先对原始数据进行PCA处理从而去除冗余信息和噪音,然后再利用神经网络方法对PCA处理后的数据进行降维处理操作。把这种新的降维方法应用到人脸姿态识别,从而可以提供人脸姿态信息以能够在多角度下进行人脸识别。

本发明是通过以下技术方案实现的,本发明首先对训练样本进行PCA处理,去除原始数据中的冗余信息和噪音,并得到PCA处理后的数据,然后使用该数据对受限玻尔兹曼机神经网络进行预训练,得到预训练网络参数,并用梯度下降方法调整整个网络参数。最后对于待进行姿态估计的人脸图像,对其进行PCA处理,再把PCA处理后的数据送入该学习好的神经网络中进行姿态识别分类。

本发明具体包括如下步骤:

(1)对不同姿态的人脸图像训练样本进行预处理操作;

(2)对预处理后的数据进行PCA处理;

(3)初始化受限玻尔兹曼机神经网络;

(4)用PCA处理后的数据预训练受限玻尔兹曼机神经网络;

(5)调整受限玻尔兹曼机神经网络参数;

(6)对新的人脸图像进行姿态识别;

所述的步骤(1),是指:对于每个人脸图像训练样本,首先把其缩放为高为h个像素、宽为w个像素的图像。然后把该缩放后的人脸图像变换为灰度图像,并把所有像素的灰度值归一化到[0,1],最后把它们拉成长度为h×w的向量,即该向量的维数是h×w。

所述的步骤(2),是指:对步骤(1)中的预处理后的数据进行PCA操作,去除冗余信息和噪音,保持98%的信息,把所有数据都从h×w降到s维,同时得到平均向量和特征向量P,如果把原始h×w维的向量数据表示为X,降维后的s维数据表示为b,那么X可以表示为: >>X>=ver>>x>‾>>+>Pb>,>>>

获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号