首页> 中文学位 >基于关注度机制的图像理解
【6h】

基于关注度机制的图像理解

代理获取

目录

声明

摘要

第1章 绪论

1.1 研究背景和意义

1.2 研究动机和内容

1.3 结构安排和创新点

第2章 关注度机制的基本概念

2.1 关注度机制的概念

2.2 为什么需要关注度机制

2.2.1.计算资源

2.3.2.按作用方法分类

2.3.3.按作用对象分类

2.4 关注度机制的作用

第3章 基于关注度机制的多标签图像识别

3.1 研究背景

3.2 相关工作

3.3 方法

3.3.1.语义定位网络

3.3.2.双流语义模型

3.3.3.优化过程

3.4 实验

3.4.1.实验设置

3.4.2.数据集

3.4.3.评价指标

3.4.4.比较方法

3.4.5.实验结果

3.5 本章小结

第4章 基于关注度机制的相册事件识别

4.1 研究背景

4.2 相关工作

4.3 多粒度事件识别

4.3.1.特征表达

4.3.2.关注度模块

4.3.3.层级结构

4.4 实验

4.4.1.实验数据集

4.4.2.实验参数设置

4.4.3.相册识别方法

4.4.4.实验结果

4.5 本章小结

第5章 基于关注度机制的细粒度图像分类

5.1 研究背景

5.1.1.细粒度图像分类

5.2 模型

5.2.1.基础网络

5.2.2.关注度分支

5.2.3.局部分支

5.3 实验

5.3.1.实验设置

5.3.2.数据集

5.3.3.比较方法

5.3.4.实验结果

5.4 本章小结

第6章 基于关注度机制的快速人脸检测

6.1 研究背景

6.2 级联树形模型

6.2.1.像素特征

6.2.2.决策树

6.2.3.随机森林

6.2.4.级联结构

6.2.5.级联树形结构

6.2.6.人脸关键点拓展

6.3 实验

6.3.1.数据集

6.3.2.训练

6.3.3.测试

6.3.4.拓展人脸对齐

6.4 本章小结

第7章 总结与展望

参考文献

致谢

在读期间发表的学术论文与取得的研究成果

展开▼

摘要

随着互联网的高速发展以及智能相机和移动设备的普及,图像数据出现了爆炸式增长。在日常生活中,人们越来越习惯于通过拍照来记录他们生活的点点滴滴、表达抒发他们对待一些事物的看法、亦或者通过社交网络去分享一段他们自己的经历。据InfoTrends[1]估计,2017年全年使用智能手机,数码相机和其他设备拍摄的图片数目达1.2万亿张,而储存的照片总量将高达4.7万亿。这些照片一部分被用户储存在本地的储存设备中,一部分将被用户上传至社交网络中,作为用户分享的内容。图像已然成为了人类记录生活的重要信息组成部分。用户的图像通常通过以下几个方面进行管理:1)作为独立个体的图像,这类图像通常以单张图像的形式出现,图像描述独立物体、风景或者人物等。2)作为事件内容的图像,这类图像通常以故事相册的形式得以保存,其内容多为通过一系列时间连续的图像记录生活中的一些事件,比如生日聚会,外出旅游。3)作为某一类特定物体的图像,这类图像通常以集合相册的形式得以保存,其内容不具有时间连续性,其中的图像描述具体的特定物体,比如各种各样的花、狗。4)作为人脸图像,这类图像包含了用户与亲朋好友的合照,用户希望得到人脸信息。而对于如此大规模的图像,如何认知图像的内容并进行管理成为了一项挑战。
  关注度机制的灵感来自于人们认知事物的过程。为了更好地认知一个事物,人们在观察该事物的时候,目光会沿感兴趣的地方移动,有时会对着局部细节仔细观察,然后再得出最终结论。这一过程在网络的学习过程中体现为,对有用的信息给予其较高的权重而对于无用的信息给予其较低的权重。无论是在传统的机器学习领域还是近年来在计算机视觉领域产生了突破式进展的深度学习领域,关注度机制都可以对图像认知产生帮助。在传统的机器学习领域,关注度机制被广泛应用于adaboost[2]一类算法中。其将关注度机制应用于实例上,首先将关注度集中在容易分类的实例上,接下来逐步将关注度集中在难以分类的实例上。自2012年以来,深度学习极大地推动了计算机视觉领域的发展。其在大规模的图像数据集上训练得到的分类模型具有很好的可迁移性,在新的任务上表现出很好的泛化能力。这使得大规模的图像数据的理解分析成为了可能。在此基础上,我们将关注度机制应用于网络中可以帮助网络更好认知事物。
  在本文中,我们将利用关注度机制对图像进行进一步的分析理解。针对用户图像,我们逐一对其设计模型。
  对于独立个体图像而言,日常生活中的图像通常包含多个主体,且主体所占空间大小不一。其分类问题是一个多标签分类问题,而不是传统的单标签分类问题。我们利用关注度机制找到主体所在区域,利用这些区域更好地提取相关特征并挖掘主体之间的空间关联性,最终完成分类任务。
  对于事件内容的图像,我们通常对一个相册进行事件认知。然而由于用户存在迥然不同的拍照习惯,往往一个相册的事件不能通过其内一张图像所能展示,并且一个相册内的图像也往往不都于这个相册有关。我们利用关注度机制学习图像重要性,使于相册事件相关的图像有更高的认知权重,并利用多种视觉特征以及图像时间特征综合分析得出最终预测结果。
  对于某一类特定物体的相册,其内图像通常具有相同的高层语义,比如一个鸟类的相册集内会包含各种类型的鸟类。如何认知其中物体,这种问题被称为细粒度分类。我们利用关注度机制找到图像的细节特征,组合多种细节特征最终完成分类。
  对独立个体图像理解的另一方面是人脸检测任务。我们介绍了基于传统特征的利用了基于实例的关注度机制的人脸检测方法,并在此基础上作出改进。

著录项

  • 作者

    郭聪;

  • 作者单位

    中国科学技术大学;

  • 授予单位 中国科学技术大学;
  • 学科 信息与通信工程
  • 授予学位 博士
  • 导师姓名 田新梅;
  • 年度 2018
  • 页码
  • 总页数
  • 原文格式 PDF
  • 正文语种 中文
  • 中图分类 TP391.41;
  • 关键词

    图像理解; 深度学习; 卷积神经网络; 关注度机制;

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号