首页> 中文学位 >面向图像检索的海量图像自动聚类方法研究
【6h】

面向图像检索的海量图像自动聚类方法研究

代理获取

目录

声明

致谢

摘要

1 绪论

1.1 研究背景及意义

1.2 国内外研究现状

1.2.1 特征提取研究现状

1.2.2 基于内容的检索研究现状

1.2.3 聚类算法研究现状

1.3 主要研究内容

1.4 论文组织安排

2 图像特征提取

2.1 全局特征

2.1.1 颜色特征

2.1.2 纹理特征

2.1.3 形状特征

2.1.4 HOG特征

2.1.5 GIST特征

2.2 局部特征

2.2.1 SIFT特征

2.2.2 SURF特征

2.3 词袋模型

2.3.1 词袋模型(BoW,Bag of Words)

2.3.2 视觉领域中的词袋模型(BoVW,Bag of Visual Words)

2.3.3 基于空间金字塔匹配的词袋模型

2.4 改进特征

2.4.1 分块颜色直方图和分块LBP特征

2.4.2 Color-SIFT特征

2.4.3 Dense SIFT和颜色相结合的联合特征

2.5 特征相似性度量

2.5.1 相似度系数

2.5.2 距离函数

2.6 本章小结

3 聚类分析

3.1 经典聚类算法

3.1.1 K均值聚类算法

3.1.2 GMM聚类算法

3.1.3 DBSCAN聚类算法

3.1.4 SOM聚类算法

3.2 谱聚类算法

3.3 AP聚类算法

3.4 基于DP的聚类算法

3.5 改进的聚类算法

3.5.1 Mini-Batch K均值

3.5.2 基于高斯核的谱聚类

3.6 本章小结

4 面向检索的图像聚类平台的设计和实现

4.1 系统设计和实现

4.1.1 系统设计

4.1.2 系统实现

4.2 聚类实验与分析

4.2.1 聚类性能指标

4.2.2 实验与分析

4.3 检索实验与分析

4.3.1 检索性能指标

4.3.2 实验与分析

4.4 本章小结

5 总结与展望

5.1 论文总结

5.2 未来展望

5.3 结束语

参考文献

作者简历及攻读硕士学位期间取得的研究成果

学位论文数据集

展开▼

摘要

移动互联网的发展和多媒体技术的兴起,让图像数据正呈爆炸式增长。面对海量的图像数据,如何便捷有效地对图像库进行管理和检索,并在图像库中发掘出有价值的潜藏信息,正成为一个亟需解决的问题。而数据挖掘中的聚类分析技术和基于内容的图像检索技术的兴起和应用,为这个问题的解决带来契机。聚类分析可以实现对无标注样本的分类,是一种无监督的学习方法。而基于内容的检索脱离了原始的文本搜索方式,比起基于标注的检索更客观和便捷。
  为解决这个问题,本文尝试提出使用聚类的方法完成对海量图像库的初步管理。通过对图像库进行聚类操作实现类别挖掘和标注,同时使用基于内容的方式完成对图像库的检索。在此基础上,实现了一个图像库聚类和检索平台。并且针对传统图像特征和聚类算法的不足,提出了改进的特征提取算法和聚类算法。主要研究工作和创新内容为以下几个方面:
  (1)针对传统图像特征的不足提出改进方法。提出结合空间信息的分块颜色直方图和分块LBP特征;通过结合颜色信息提出Color-SIFT特征,弥补了SIFT特征只有灰度信息的缺点;提出综合Dense SIFT和颜色信息的联合特征,既有局部区域描述能力,同时保留了图像的全局信息,实验结果表明性能比其他特征都好。
  (2)以K均值算法为基础提出Mini-Batch K均值,不仅提高了算法的稳定性同时大大提升了算法的速度。将核函数引入谱聚类中提出基于高斯核的谱聚类算法,提升了谱聚类算法的性能。
  (3)归纳并整理了相关图像特征,包括全局特征及局部特征。颜色特征有颜色直方图、颜色矩等;纹理特征有LBP特征、灰度共生矩阵等;形状特征有Hu矩、边缘直方图。局部特征方面主要讲解了经典的SIFT特征和SURF特征。
  (4)研究和学习相关论文后,综述了经典聚类算法和最新的聚类算法。对这些聚类算法的原理及聚类步骤进行了详细讲解,归纳总结了算法的优缺点。
  (5)设计并实现了面向检索的图像聚类平台,将归纳整理的图像特征和聚类算法实现并整合到平台之中,同时依据聚类分析的结果提高了检索速度。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号