首页> 中文学位 >基于卷积神经网络的监控场景下行人属性识别研究
【6h】

基于卷积神经网络的监控场景下行人属性识别研究

代理获取

目录

第一个书签之前

展开▼

摘要

在真实视频监控场景中,行人视觉属性,比如性别、背包、衣着类型,对行人检索和行人重识别是非常重要的。视觉属性识别,由于高层次的语义信息,可以建立底层特征与高层认知的联系,因此在计算机视觉领域是一个很重要的研究方向。 行人属性识别主要有两个应用场景:自然场景和监控场景。目前,大量的研究者都关注自然场景下的行人属性识别研究,也在目标检测、人脸识别上取得了极大的成功。然而监控场景下行人属性识别,是一个极具挑战性的研究,面临的主要挑战:(1)行人外观多样化;(2)行人外观模糊。因此为了对监控场景下行人属性进行识别,利用卷积神经网络在不同的传统计算机视觉任务中出色的表现的特点,对行人属性识别方法进行研究。具体工作如下: (1)把监控场景下的行人属性识别问题,看成多标签图像分类问题。同时从传统属性识别算法人工特征提取和忽略属性之间的联系这两个不足出发,在 AlexNet 卷积神经网络模型的基础上提出了两种识别方法:单属性识别方法,行人属性被看作成独立的,然后通过分类器来一个个来识别属性;多属性识别方法,通过重新定义损失函数,考虑属性之间的联系来学习所有属性,然后可以同时端到端识别出所有的属性。通过对比实验表明,与传统算法相比,本文所提的方法在属性识别精度上有着很大的提高。 (2)上述算法虽然很好的完成了监控场景下行人属性识别任务,但是在图片中对一个人整体进行属性识别。为了提高属性识别精度,又提出了基于行人部位及附属物的目标检测算法。从属性在行人身体不同部位的特点出发,然后采用目前比较成熟的加速区域卷积神经网络目标检测框架,经过建议框生成、特征提取、窗口分类、位置精修这四个步骤,采用交替训练的方式,完成对行人部位及附属物检测。通过对比实验表明,本文算法能够端到端很精确完成行人部位及附属物的检测。 (3)在完成对行人部位及附属物检测的基础上,提出了属性精细化分类算法。因此,在行人部位及附属物的具体位置上,然后采用分类网络进行更精确的分类。基于速度和精确度的考虑,选取 VGG-16 网络作为基础的分类器,从而可以得到更优化的结果。同时为了消除行人属性样本数据分布不平衡的问题,引入了带权重的交叉熵损失函数。通过对比实验表明,先检测再对属性进行精细分类,与传统的直接对一张行人图片进行分类识别相比,识别结果更精确。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号