互联网环境下大规模图像的内容分析、检索和自动标注的研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

随着互联网和数字摄影设备的普及和发展，互联网上的图像数量飞速增长。一方面，互联网上的海量图像吸引了越来越多的用户；另一方面，越来越丰富的图像资源使用户难以在浩如烟海的数据中找到其真正需要的信息。这使得快速、有效的图像检索技术成为商业界和学术界的一个重要研究方向。当前，互联网图像检索主要分成两大类：基于文本的图像检索(text-based image retrieval，简称TBIR)，和基于内容的图像检索(content-based image retrieval，简称CBIR)。TBIR在商业图像搜索引擎中被广泛使用。在TBIR系统中，互联网图像的文本信息用来索引和搜索图像。因此，图像文本标注的质量成为TBIR中的一个重要的问题。CBIR是学术界中一个非常流行的方向。在CBIR系统中，图像的视觉内容被用来索引。它面临的最主要的困难是语义鸿沟问题，即图像的低层内容特征(如颜色)，不能有效的描述高层语义(如“狗”)。在本文中，我们尝试充分利用互联网图像丰富的文本信息和视觉信息，来解决上面提到的几个问题。我们对自动图像标注、图像标注改善、减小互联网图像检索中的语义鸿沟、基于对象的图像检索等问题进行了深入的研究。另外，为了更好地处理和利用互联网上的海量数据，更有效地帮助用户的在线检索，我们在设计相关算法和实现检索系统的时候，还特别地注意了其处理大规模图像的能力以及实时性。本文主要成果和创新之处包括以下几个方面： 1.讨论并分析了自动图像标注问题，提出了一个多标记稀疏编码的框架来进行特征提取和分类，并把它应用到自动图像标注中。我们认为具有部分重叠标记的两张图像之间的语义相似度应该以一种重构的方式而不是一对一的方式来度量。因此，在这个框架中，图像标记向量之间的语义相似度，以及图像特征向量之间的语义相似度，都基于一对多的e1稀疏重构/编码来度量。 2.讨论并分析了大规模的自动图像标注问题，并提出了一个基于搜索的图像标注框架。在这个框架下，我们给用户提供了一个在线图像标注服务，可以对用户提交的任意图像进行实时的标注。我们从互联网上收集了一个大规模的图像库，并把它用做训练集来标注任意一张图像。快速检索技术的应用和大规模图像库的使用保证了我们提出的基于搜索的图像标注框架处理大规模图像的能力及实时性。 3.讨论并分析了图像标注改善问题。我们把图像标注改善问题表述成一个马尔可夫过程，并在这个框架下解释了已有的图像标注改善工作。针对已有工作的问题，我们提出了一个基于内容的图像标注改善算法。马尔可夫过程表示的有效性，以及待标注图像与训练集中图像的内容信息的充分利用，使得我们提出的算法很大程度上改善了已有算法中存在的若干问题。 4.讨论并分析了互联网上基于内容的图像检索中的语义鸿沟问题，并提出了一个基于排序的距离度量学习算法。通过互联网图像丰富的文本信息的引导，我们试图在视觉空间中学出一个新的距离度量，使得给定一张查询图像，基于这个新的距离度量，我们可以在图像库中检索到与查询图像语义上更相关的图像。基于这个新的距离度量学习算法，我们提出了一个大规模的基于内容的图像检索(CBIR)框架，并在2.4 million规模的互联网图像库上实现了一个实时的CBIR检索系统。 5.讨论并分析了用多实例半监督学习(MISSL)算法来解决基于对象的图像检索问题。我们针对MISSL问题提出了一个新的正则化框架。基于这个框架，我们提出了一个基于图的多实例学习(GMIL)算法来解决MISSL问题。同样，在这个框架下，GMIL可以分别退化成一个新的标准多实例算法(GMIL-M)和一个标准半监督学习算法(GMIL-S)。我们从理论上证明了GMIL-S算法具有闭式解，以及GMIL和GMIL-M的迭代解的收敛性。我们用GMIL算法来解决基于对象的图像检索问题，实验结果验证了GMIL算法的有效性。

著录项

作者
王长虎;
展开▼
作者单位

中国科学技术大学;

展开▼
授予单位中国科学技术大学;
学科信号与信息处理
授予学位博士
导师姓名张宏江,李明镜;
年度 2009
页码
总页数
原文格式 PDF
正文语种中文
中图分类 TP391.41;TP311.131;
关键词
内容分析; 图像分析; 图像检索; 图像标注; 多标记稀疏编码; 语义相似度;

相似文献

中文文献
外文文献
专利

1. 面向互联网的大规模重复图像检索技术研究 [J] . 王树鹏 ,陈明 ,吴广君 . 通信学报 . 2014,第012期
2. 基于内容检索的图像自动标注方法研究 [J] . 邓莉琼 ,郝向宁 ,夏鸣 . 计算机科学 . 2014,第0z2期
3. 基于本体和自动标注的网络邮票图像语义检索研究——以南京邮电大学数字邮票库为例 [J] . 张志武 . 情报探索 . 2013,第010期
4. MapReduce环境下支持大规模文本检索的概念索引 [J] . 张生 ,胡加靖 . 计算机工程 . 2015,第007期
5. 基于词频统计特征和 GVP的大规模图像检索算法研究 [J] . 刘宇 ,邓亮 ,郭耕辰 . 集成技术 . 2014,第002期
6. 互联网环境下敏感群体社交纬度大规模深度计算的关键技术研究 [C] . 齐世萍 ,张华秋 . 2014年科技强检电子信息系统研发与示范项目成果研讨会 . 2014
7. 大规模图像内容分析与检索方法研究 [A] . 张鹏飞 . 2018

互联网环境下大规模图像的内容分析、检索和自动标注的研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅