首页> 中文学位 >基于多标记学习的图像标注算法研究与实现
【6h】

基于多标记学习的图像标注算法研究与实现

代理获取

目录

声明

致谢

摘要

1 引言

1.1 研究背景及意义

1.2 国内外研究现状

1.3 论文主要研究内容

1.4 论文组织结构

2 图像标注相关理论

2.1 图像视觉特征

2.1.1 颜色特征

2.1.2 纹理特征

2.1.3 形状特征

2.1.4 基于关键点的特征

2.2 半监督学习

2.2.1 有监督、无监督与半监督学习的算法介绍

2.2.2 基于图的半监督学习

2.3 多标记学习

2.4 标签排序

2.5 本章小结

3 基于结构化低秩表示的半监督学习框架下的图像标注算法

3.1 算法的提出

3.2 算法详细设计

3.2.1 数学符号及表达式

3.2.2 图像标注的正则化框架

3.2.3 图像标注算法的优化求解

3.2.4 优化结果在图像标注的应用

3.3 算法实验结果

3.3.1 图像数据集

3.3.2 评价指标

3.3.3 实验对比方法

3.3.4 实验结果展示与分析

3.4 本章小结

4 基于标签排序以及矩阵恢复的图像标注算法

4.1 算法的提出

4.2 算法详细设计

4.2.1 标签排序的正则化模型

4.2.2 标签排序模型的优化求解

4.3 算法实验结果

4.3.1 图像数据集

4.3.2 评价指标

4.3.3 实验结果展示与分析

4.4 本章小结

5.1 总结

5.2 展望

参考文献

作者简历及攻读硕士学位期间取得的研究成果

学位论文数据集

展开▼

摘要

近年来,在计算机技术、数字媒体以及多媒体信息高速发展的大背景下,手机、数码相机等高科技产品已经深入人们的生活,随之而来的是呈爆炸式增长的海量图像信息。因此,如何有效地对这些海量图像进行检索就成为了如今计算机视觉及图像处理领域研究的热点问题。
  自动图像标注算法为给定图像自动地分配语义相关的关键字信息,目前已成为图像分类、检索的重要方法。大多数的研究把图像标注看做一个典型的多标记分类问题,这使得自动图像标注算法取得了一定的进展,但面对海量的图像数据,它们仍然存在一些问题:一是现实中训练样本不足,二是已标注图像数据集的噪声问题,三是如何使预测的关键字信息准确地反映图像特征。这三个问题已成为限制图像标注算法准确率的重要因素。
  为了提高自动图像标注算法的准确率,本论文对现有的图像标注算法进行了分类整理和深入分析,在多标记学习的基础上,从结合低秩约束正则项的半监督学习方法以及标签排序这两个角度入手,提出了两种图像标注算法,并且在ESPGame、IAPRTC-12、NUS-WIDE等数据库上验证了算法的高效性,主要的研究成果如下:
  (1)基于结构化低秩表示的半监督学习框架下的图像标注算法。该方法把不同标签的预测模型融合到一个矩阵中,并且引入了矩阵核范数形式的正则项,以此来获得不同标签之间的相关性以及控制模型的复杂程度。除此之外,该算法通过引入图拉普拉斯正则项来充分考虑在已标注和未标注图像上的局部几何结构。同时,考虑到已标注图像的标签噪声问题,算法引入了一个理想的完备矩阵来自动恢复丢失的标签、更正错误的标签。本文给出了对该算法框架的求解方法,并且在多个数据库中进行图像标注实验,验证了算法的有效性。
  (2)基于标签排序以及矩阵恢复的图像标注算法。该方法根据已给定图像的相关性对标签进行降序排列,而不再是简单的二值选择,解决了多标记学习中训练样本不足、已标注图像的标签不完备的问题。与此同时,该方法将标签排序模型引入到矩阵恢复问题中,并且考虑了矩阵低秩约束标签相关性,因此在标签空间很大而训练样本数有限的情况仍然可以学习出可靠的标签排序模型。本文对该模型采用了加速梯度优化算法(AGA),并在Corel5K、ESPGame、IAPRTC-12等数据库中证明了有效性。

著录项

  • 作者

    李敬伟;

  • 作者单位

    北京交通大学;

  • 授予单位 北京交通大学;
  • 学科 计算机科学与技术
  • 授予学位 硕士
  • 导师姓名 冯松鹤;
  • 年度 2017
  • 页码
  • 总页数
  • 原文格式 PDF
  • 正文语种 中文
  • 中图分类 TP391.41;
  • 关键词

    图像标注; 关联矩阵; 低秩约束; 多标记学习;

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号