首页> 中文学位 >基于集合表示的图像分类
【6h】

基于集合表示的图像分类

代理获取

目录

封面

声明

中文摘要

英文摘要

目录

第1章 绪论

1.1 课题背景与研究意义

1.2 课题的研究现状

1.3 本文的主要组织框架

第2章 图像的集合表示方法

2.1Dense SIFT特征提取

2.2 词袋模型(BOW)

2.3 高效匹配核(EMK)

2.4 局部聚合描述符(VLAD)

2.5 实验中选取的数据库

2.6 本章小结

第3章 用于构建视觉单词的聚类方法

3.1 K-means聚类算法

3.2仿射传播聚类算法

3.3 高斯混合模型(GMM)聚类算法

3.4 集合表示方法和聚类算法的实验分析

3.5 本章小结

第4章 对VLAD集合表示方法的改进

4.1 对VLAD进行归一化方法处理

4.2基于GMP的VLAD的改进

4.3 本章小结

结论

参考文献

攻读硕士学位期间发表的论文和取得的科研成果

致谢

展开▼

摘要

图像分类的实质性问题是识别图像中的物体或目标,这就需要准确的对图像中的视觉信息进行描述。局部信息由于其对背景细节、光照等外在条件的鲁棒性使其成为目前特征表示的主流,尤其是在尺度不变特征变换以及基于尺度不变特征变换各种改进算法出现之后。然而不同图像局的部特征的个数往往不相同,不适于直接在局部特征上进行分类和检索等后续操作,因此在图像的局部特征集合上需求统一的集合表示方法。
  集合表示就是用一定的方法对图像提取的所有局部特征点进行操作,形成一个矢量来表示该图像。本文的主要工作和贡献如下:
  首先,本文从图像的集合表示角度,详细阐述了三种集合表示方法即词袋模型、高效匹配核和局部聚合描述符,并且基于这三种集合表示方法在本文选定的数据库上做了大量实验,验证三种集合表示方法的分类性能。
  其次,验证不同的聚类算法和聚类中心个数对最新提出的局部聚合描述符图像集合表示方法适用性。本文根据聚类中心个数的选定方式和局部特征的分配方式的不同,选用K-means、仿射传播算法和高斯混合模型三种聚类算法。
  最后,对局部聚合描述符提出自己的改进方法。在本文全面研究了归一化和pooling两种操作对局部聚合描述符的作用和有效性。归一化的方式选用power-law和L2范数,pooling方法采用sum pooling、average pooling和广义的max pooling。
  PPMI、Caltech-101和Scene-15分别是关于动作、物体和场景的数据库,在这三个数据库上验证了上述方法的有效性。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号