首页> 中文学位 >基于主题模型和图核模型的图像分类算法的研究与应用
【6h】

基于主题模型和图核模型的图像分类算法的研究与应用

代理获取

目录

声明

摘要

第1章 绪论

1.1 课题研究的背景及意义

1.2 国内外研究现状

1.2.1 图像分类的研究现状

1.2.2 基于LDA的图像分类研究现状

1.2.3 图核研究现状

1.3 主要研究内容与创新点

1.4 论文的组织结构

1.5 本章小结

第2章 相关理论

2.1 主题模型

2.1.1 主题模型的概念

2.1.2 参数学习

2.2 图核相关理论

2.2.1 图论的相关简介

2.2.2 图核的基本原理

2.3 支持向量机相关理论

2.3.1 基本原理

2.3.2 核函数的选择

2.3.3 SVM多类分类器的设计

2.4 本章小结

第3章 基于主题模型的图像分类研究

3.1 图像局部视觉特征的提取

3.1.1 SIFT特征

3.1.2 RGB SIFT特征

3.2 改进的词袋模型

3.3 基于LDA模型的图像分类算法

3.4 实验结果与分析

3.4.1 实验图像库

3.4.2 模型1:SIFT+K-means+LDA

3.4.3 模型2:RGB SIFT+K-means+LDA

3.4.4 实验分析

3.5 本章小结

第4章 基于图核的图像分类研究

4.1 几种常见图核的比较

4.1.1 随机通路核

4.1.2 最短通路核

4.1.3 最小生成树核

4.2 改进的最小生成树图核模型

4.2.1 建立四叉树

4.2.1 生成图结构

4.2.3 最小生成树图核计算

4.3 节点和边相似性计算

4.3.1 节点相似性计算

4.3.2 边相似性计算

4.4 改进的生成树图核算法在图像分类中的应用

4.5 实验结果与分析

4.5.1 图像库说明

4.5.2 参数设置

4.5.3 实验分析

4.6 本章小结

第5章 结合主题模型和图核模型的图像分类的研究

5.1 计算LDA模型中图像相似性

5.2 结合最小生成树图核和LDA模型的图像相似性计算

5.3 实验工具和软件包

5.4 参数的选取

5.5 实验结果与分析

5.6 本章小结

第6章 总结与展望

6.1 总结

6.2 展望

参考文献

致谢

攻读硕士学位期间发表的论文

展开▼

摘要

图像分类技术是计算机视觉领域重要的研究内容。图像分类性能的优劣对医学图像研究、生物数据分析、军事交通研究有至关重要的意义。伴随着机器学习的热潮,图像分类技术得到了迅速发展并成为计算机视觉领域研究的热点。
  主题模型是机器学习领域新兴的算法,它的出现为图像分类研究开辟了新的天空。主题模型是一种概率生成模型,主要应用在对文本信息进行处理中。相对于其他分类算法,其优势在于对语义信息的挖掘上。Latent Dirichlet Allocation(LDA)模型是在Probabilistic LatentSemantic Analysis(PLSA)模型的基础上提出的一种广泛应用在文本信息分类的主题模型。该算法采用了词袋(bag of words)思想,视每篇文档为一个词频向量。一篇文档代表了一些主题所构成的概率分布,而每一个主题又代表了很多单词所构成的概率分布。LDA通过这种方式把文本信息转化为易于建模的数字信息并挖掘数据集潜在的语义信息。随着LDA模型的发展和改进,它已经成功地应用在图像分类、检索等领域。
  但是,LDA算法使用的词袋模型把图像看作无序的单词而忽略了图像的空间结构信息,图核是一种计算图结构之间相似性的模型。本文提取了图像的空间结构信息并结合了主题模型和图核模型,分别从语义信息和空间结构信息的角度对图像进行处理。通过对这两种模型进行研究我们发现其中还存在可改进之处。本文首先对LDA的词袋模型进行改进,提高其分类效果,同时提出了使用带权重的最小生成树图核进行图像分类,并对最小生成树图核进行了改进,最后结合了两个模型的优势并应用于图像分类中,主要工作如下:
  1)利用传统LDA模型进行图像分类研究。在对图像进行处理时,使用SIFT算法检测特征点形成词典、计算词频,并根据LDA思想进行分类。文中利用Gibbs采样对参数进行估计,通过训练出来的参数对新图像进行分类预测。其次文中对这种传统方法进行改进,加入图像的色彩信息,利用RGB SIFT算法检测特征点,形成了信息更为丰富的描述子。
  2)本文对图核模型进行研究,并应用在图像分类中。首先综合考虑了常用的几种核,根据其优劣性,提出使用最小生成树算法计算图像之间相似性。其次在计算图结构相似性时,对最小生成树核进行改进,考虑了图结构中节点的权重信息。在利用带权重的最小生成树图核进行分类时,我们首先利用RGB SIFT算法得到图像的视觉单词以及空间坐标信息,通过构建四叉树把图像表示为图结构的数据,根据图来生成最小生成树并计算图像之间的相似性。为了利用相似性矩阵对图像进行分类,我们使用训练集中的相似性矩阵及其所属的类别对支持向量机(Support Vector Machine)即SVM进行训练,得到相应的分类器。其中支持向量机的核函数使用了最小生成树核。通过对测试集数据的分类预测验证了改进模型的优越性。
  3)结合LDA模型和图核模型的优缺点,将两种方法进行结合,使用余弦相似性得到LDA模型中图像的相似矩阵,并与图核中的相似性矩阵以一定的权值进行结合,最后利用SVM对相似性矩阵进行处理,成功对图像进行分类。该课题充分考虑图像的色彩信息、语义信息、空间信息得到新的模型进行图像分类。文中通过实验表明了该模型分类的优越性,也证明了该方法的合理性,具有较强的应用价值。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号