首页> 中文学位 >基于深度神经网络的图像检索算法的研究
【6h】

基于深度神经网络的图像检索算法的研究

代理获取

目录

声明

第一章 绪论

1.1 研究的背景和意义

1.2 基于内容图像检索的研究历史,现状以及发展趋势

1.3 本文的主要工作和组织结构

第二章 基于内容图像检索的相关理论与技术

2.1 CBIR的基本内容和基本结构

2.2 基于卷积神经网络的图像特征提取方法

2.3 特征向量相似性度量方法

2.4 检索性能评价标准

2.5 本章小结

第三章 基于卷积神经网络和高效流形排序的图像检索

3.1 基于VGG-net的图像特征提取

3.2 特征降维

3.3 基于图论的流形排序

3.4 高效流形排序

3.5 实验结果讨论与分析

3.6 本章小结

第四章 基于眼动数据和相关反馈的图像检索

4.1 引言

4.2 图像初步检索

4.3 眼动数据指导下的相关反馈

4.4 实验结果与分析

4.5 本章小结

第五章 总结和展望

5.1 总结

5.2 未来工作展望

参考文献

研究生期间科研成果

致谢

展开▼

摘要

基于内容的图像检索(CBIR)是计算机视觉领域的一个研究热点。近年来随着卷积神经网络(CNN)的兴起,其在CBIR中的应用也越来越广泛。然而现有的大多数CBIR系统研究的重点偏向于通过构建更好的CNN网络模型来提取更为抽象的图像特征或者通过寻找更好的特征匹配算法来提升检索效果,而忽略了特征内部所包含的信息以及图像的语义对检索系统的影响。针对以上两个问题,本文的主要工作和贡献如下:
  首先,提出了一种基于卷积神经网络和高效流形排序的检索方法。考虑到由CNN提取出来的特征维度较高,该方法首先利用核主成分分析(KPCA)算法对特征进行降维。然后利用高效流形排序(EMR)来挖掘特征点之间的近邻信息。对于一幅给定的查询图像,根据其它特征点与查询特征点之间的近邻信息对特征点进行打分排序,得分较高的特征点所对应的图像被认为是和查询图像相关的图像。实验结果证明了本文提出的算法优于目前比较流行的哈希算法。
  其次,提出了一种基于眼动数据和相关反馈的图像检索方法。首先,本文利用支持向量机(SVM)和模糊C均值聚类(FCM)算法对图像进行分类和预筛选,以减小搜索空间,并且提高了检索效率。其次,为了缩小语义鸿沟,本文利用眼动追踪技术及其眼动数据作为反馈信息的获取手段,实现相关反馈。实验结果表明:眼动数据和相关反馈的结合能够有效地提高检索系统的性能。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号