首页> 中文学位 >大规模人脸图像检索的深度度量哈希法
【6h】

大规模人脸图像检索的深度度量哈希法

代理获取

目录

声明

1 绪论

1.1 研究背景及意义

1.2 图像检索的研究现状

1.2.1 基于文本的图像检索

1.2.2 基于内容的图像检索

1.2.3 哈希检索算法

1.3 本文的主要贡献与创新

1.4 本文的结构安排

2 理论基础

2.1 图像哈希检索

2.1.1 图像哈希检索流程

2.1.2 图像特征提取

2.1.3 图像的相似性度量

2.1.4 图像检索指标

2.2 深度卷积神经网络

2.2.1 卷积神经网络的基础知识

2.2.2 经典卷积神经网络及其设计思路

2.3 深度人脸识别

2.3.1 深度人脸识别概述

2.3.2 基于度量损失的人脸识别及思路

2.4 本章小结

3 深度度量哈希方法

3.1 度量损失

3.2 主干网络

3.3 CGA模块

3.4 新人脸图像的哈希编码

3.5 本章小结

4 实验与分析

4.1 数据集与度量指标

4.2 实验设置

4.3 实验结果与分析

4.4 结构分析

4.5 本章小结

结论

参 考 文 献

攻读硕士学位期间发表学术论文情况

致谢

大连理工大学学位论文版权使用授权书

展开▼

摘要

人脸图像检索,就是在人脸图像数据库中搜索与检索图像属于同一个人的人脸图像。随着社交网络在智能移动服务上的日益普及,包含人脸的图像和视频呈爆炸式增长。如何在海量人脸数据库中快速、准确地检索出目标人脸成为计算机视觉领域中一个有吸引力的研究方向。当前大规模人脸检索面临的主要挑战是同类差异大、计算时间和存储成本高。因此,有必要开发出有效的人脸图像检索方法来解决上述两个问题。 大多数现有人脸图像检索方法的性能往往取决于所使用的视觉特征。传统的检索方法多采用手工特征来表示人脸图像的视觉内容。然而,手工特征并不能很好地揭示人脸图像的深层次语义信息,往往限制了人脸图像检索的性能。近年来,卷积神经网络(CNN)在目标识别、图像分类等计算机视觉任务中表现出了惊人的性能。从图像中学习到的CNN特征更加健壮,能够很好地捕捉图像潜在的语义结构。深度哈希方法将CNN与哈希算法相结合,旨在学习具有高级语义的人脸特征并将其映射成紧凑的二进制哈希码,提高检索精度的同时又能减小存储空间和缩短检索时间,近年来该方法引起了人们的广泛关注。现有的深度哈希方法通常存在着分离特征提取和哈希编码阶段、忽略哈希编码之间的信息冗余、只关注图片对之间的相似关系而使训练难度增大等问题。 本文针对这些问题,提出了一种新的深度度量哈希(Deep Metric Hashing,DMH)方法用于大规模人脸图像检索。该方法将深度学习、哈希编码和度量学习结合到一个统一的端到端框架中,来学习具有区分性的紧凑哈希码。本文对深度结构和监督信号进行了详细的探讨,具体来说: (1)为了得到高质量的哈希编码,本文借鉴DenseNet网络的设计思想,设计了一个包含稠密卷积块的深度网络来提取多尺度、具有鲁棒性的特征。其中,该稠密块以一种前馈的方式将每一层卷积与后边卷积层进行连接。 (2)为了减少哈希码编码之间的信息冗余并充分利用特征的空间信息,设计了一个由卷积层和全局平均池化层构成的模块(Convolution-and-Global Average Pooling,CGA),生成紧凑哈希码的同时又能降低大量参数。 (3)此外,组合“SoftmaxLoss+Center Loss+Quantization Loss”监督信号来最小化哈希码的预测误差,学习具有区分性的紧凑哈希码。 (4)在两个大规模人脸图像数据集上的实验结果表明,与一些最先进的哈希方法相比,该方法具有更好的性能。

著录项

  • 作者

    潘鹏飞;

  • 作者单位

    大连理工大学;

  • 授予单位 大连理工大学;
  • 学科 应用统计
  • 授予学位 硕士
  • 导师姓名 张金涛;
  • 年度 2019
  • 页码
  • 总页数
  • 原文格式 PDF
  • 正文语种 中文
  • 中图分类
  • 关键词

    人脸; 图像检索; 度量; 哈希;

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号