首页> 中文学位 >基于深度学习和稀疏表示的图像分类与检索方法研究
【6h】

基于深度学习和稀疏表示的图像分类与检索方法研究

代理获取

目录

声明

1 绪论

1.1 研究背景及意义

1.2 本课题研究进展及现状

1.2.1 CBIR和CBIC技术工作原理概述

1.2.2 CBIR和CBIC技术的发展及现状

1.3 本文的主要工作

1.4 本文结构安排

2 图像特征表示模型概述

2.1 引言

2.2 图像的底层特征表示

2.2.1 全局特征

2.2.2 局部特征

2.3 图像的特征表达模型

2.3.1 BoVW模型

2.3.2 SPM模型

2.4 图像的特征学习模型

2.4.1 基于矩阵分解的图像特征学习模型

2.4.2 基于深度学习的图像特征学习模型

2.5 本章小结

3 基于稀疏表示和特征融合的图像检索方法

3.1 引言

3.2 基于稀疏表示的稀疏特征学习模型

3.2.1 基于稀疏表示的稀疏特征学习模型

3.2.2 基于稀疏表示的稀疏特征学习模型的关键步骤

3.3 稀疏表示

3.3.1 稀疏表示模型

3.3.2 系数学习算法a.凸松弛算法

3.4 字典学习

3.4.1 字典学习概述

3.4.2 MOD算法

3.4.3 K-SVD算法

3.5 特征池化

3.5.1 常用特征池化方法

3.5.2 空间金字塔池化

3.6 基于稀疏表示和特征融合的图像检索方法

3.6.1 特征融合思路框架

3.6.2Gist场景特征提取(Generalized Search Tree)

3.6.3 基于稀疏表示和特征融合的图像检索框架

3.7 实验设计及性能分析

3.7.1 实验环境和评价指标

3.7.2 实验结果分析

3.8 本章小结

4 基于卷积深度置信网络的图像分类和检索方法

4.1 引言

4.2 卷积深度置信网络CDBN

4.2.1 卷积受限玻尔兹曼机CRBM

4.2.2 稀疏正则化

4.2.3 概率型最大值池化

4.2.4 CDBN的构建及训练

4.2.5 softmax分类器

4.3 基于卷积深度置信网络的图像分类与检索框架

4.3.1 基于CDBN模型的特征提取

4.3.2 基于CDBN模型的图像分类与检索框架

4.4 实验设计及性能分析

4.4.1 实验环境和数据集a.实验环境和参数设置

4.4.2 实验结果分析

4.5 本章小结

5 总结与展望

5.1 本文总结

5.2 研究展望

致谢

参考文献

攻读硕士期间主要研究成果

展开▼

摘要

图像分类和图像检索技术是当前计算机科学飞速发展和数字图像资源爆发式增长形势下智能信息处理领域研究的热点问题。如何对图像内容进行有效的表示是图像分类和图像检索技术中一个关键问题。目前,在图像分类与图像检索技术中,特征描述是图像表示的主要形式,存在着高维度与复杂性等问题。图像的稀疏表示模型作为一种新兴的特征表示方法,能够有效解决实际应用中所存在的存储量、计算复杂度与图像解译性等方面的问题。此外,深度学习技术的出现使得图像特征提取不再依赖于受人为主观因素影响的人工设计方法,而是着眼于通过大量数据来发掘数据中所隐含的深层次关系,使得图像特征的描述能力基于稀疏表示的图像表得到进一步的提升。本文主要针对图像分类和图像检索中图像特征表示问题,研究了示方法和基于层次化特征提取的深度学习模型,以达到提升图像分类与检索性能的目的。本文的主要工作包括: (1)提出一种基于稀疏表示和特征融合的图像检索方法:针对目前图像局部特征表达所存在的高维度与复杂性等问题,以"稀疏编码"为核心,通过字典学习、系数学习、特征池化等一系列操作,构建了基于稀疏表示的稀疏特征学习模型,所获得的特征描述相较于局部特征更具稀疏性与可区分性。同时,根据人类视觉系统在认知过程中先整体而后局部的特性,结合Gist特征描述子在进行事物初划分上的高效性,构建了一种基于稀疏表示和特征融合的分阶段图像检索算法。该算法的主要优点在于,一是传统的局部特征描述存在数量不等及高维度等问题,在图像检索应用领域局限性较大。因此,采用基于局部特征的稀疏特征学习模型能够有效解决图像局部特征在图像检索领域的应用问题。二是采用了结合全局特征和局部特征的分阶段检索结构,从而可以对图像进行全面的描述,进而提高了图像检索的性能。在Coil20和改进的Caltech256数据集上进行的实验测试,验证了本文提出算法的有效性。 (2)提出一种基于卷积深度置信网络的图像分类与检索方法:首先,结合CNN中"局部感受野"的思想,在DBN模型中引入卷积操作,构建了一个由3个CRBM堆叠而成的卷积深度置信网络(CDBN),从而可以较好地获取到图像数据邻域的空间信息,获得到具备良好局部不变性和高层次的特征描述。其次,为了探究CDBN模型在图像分类与检索应用中的有效性,使用CDBN与softmax分类器相结合的算法构建了基于卷积深度置信网络的图像分类框架。然后,在图像分类的基础上,通过对查询图像进行正确分类并在类内使用HOG特征进行检索排序,进一步构建了基于卷积深度置信网络的图像检索框架,实现了通过图像分类来优化图像检索的性能。在三个标准图像数据集(Coil20、UCM和改进Caltech256)上的实验验证了以卷积深度置信网络作为特征提取器,可以有效提升图像特征的表达能力,在图像分类和检索应用中表现出一定的优势。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号