首页> 中文学位 >Research on Automatic Images Annotation Based on Scene Analysis
【6h】

Research on Automatic Images Annotation Based on Scene Analysis

代理获取

摘要

我们如今生活在一个全球化的时代,能非常容易的访问大量信息,尤其是“图像”。如果我们能够分类所有的数据,这会使得访问变得更加容易和快速。这便是“计算机视觉”这个经典问题的起源。分类图像数据最重要的事情是重定义这些图像。有大量关于此问题的研究,即:图像分类,图像检索,以及图像标注。有大量关于“图像标注”的研究,这些研究在对图像视区和高级语意字之间的联系起着非常重要的作用。
   图像标注有3种类型:手工,半手工,和自动图像标注(AIA)。此研究主要是针对AIA开发。AIA作为自动系统有效的节省了我们的时间。然而,相较于手工和半手工来说它的准确性是三种之中最低的。因此,找到一种好的办法开发此系统是很难的。
   此研究主要是基于PLSA&GMM模型并对其进行改进从而得到“SC&GMM”。在自然语言处理领域,相比较于其它模型PLSA模型能够更好的标注关键字。SC&GMM是基于场景分析的原则,并包含两个阶段。第一个阶段是训练过程,目的是将训练数据集分类到特征空间。第二个阶段是对测试图像数据标注关键字。SC&GMM算法通过使用PLSA聚类从组语意场景开始运行。然后,通过计算语意特征提取来找到场景中图像标注的关键字,其中每个图像有374维。
   之后,计算所有训练图像对之间的视觉特征提取距离(每张图像在每个分段区域有36D)方式Earth Mover’s Distance(EMD),创建一个距离向量。然后,把这些数据通过运用分层聚类分发到视觉场景中。当得到语意场景和视觉场景之后,对相似场景中的每个图像进行比较。如果它们相似,把语意场景和视觉场景结合在一起,结合方式是拥较少图像的场景融合到图像元素多的场景里。然后,对无相似剩余视觉场景计算注释关键字。对所有场景通过运用GMM来创建向量空间。
   接下来是通过对各个特征空间图与像数据视觉特征的比较来给测试图像数据从而标注关键字。此过程是通过本征场景来找出视觉特征的秘密。如果它们相似,通过运用GMM把它们放在一起。然后,给引用场景的图像注释关键字。
   在此研究中用到的图像的名字叫做“core15k”,包含5000张图像。把他们分成50组,每组100张。其中4500张是用来训练,500张是用来测试。同时,所有的5000张图像都与同现模型、翻译机器模型、CMRM、PLSA&GMM以及我们的模型SC&GMM一起进行了测试,通过recall,precision,and f-measure等标准的比较来得到各个模型的效率。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号