首页> 中文学位 >视觉模式识别中的差别性视觉词选择研究
【6h】

视觉模式识别中的差别性视觉词选择研究

代理获取

摘要

一般目标类识别和行为识别是当前计算机视觉界研究的热点问题。词袋模型为解决该类问题提供了一个基本框架。词袋模型涉及四个关键的因素:局部特征检测、局部特征描述、视觉词典的构造及分类器的设计。传统的视觉词典是由聚类算法得到,把聚类中心作为视觉词。其局限性在于,那些平凡的视觉词,就像文本处理中的冠词一样,大量出现在词典中,使词典庞大,造成图像量化表示的维数高,从而使得计算复杂性高。针对这一局限性,本文重点研究判别性视觉词的提取,在模式分类中提取最具判别性的视觉词,减小词典的规模,降低计算复杂性。另外,传统的词袋模型假设视觉词之间是独立的,然而,视频图像的视觉词之间在时间上是有关联的,本文针对行为识别研究具有时间关联性的判别性视觉词选择。本文主要的研究工作和贡献如下:
   1.针对一般类目标识别,提出基于假设检验的判别性视觉词提取算法。本文分别利用T检验,秩和检验,柯尔莫可洛夫-斯米洛夫检验三种假设检验方法计算各自的最优置信集的视觉词,三种检验得到的所有视觉词构成判别词典。将本文所提算法应用于Caltech、UIUC及Xerox标准图像库,实验结果验证了所提算法的有效性。
   2.针对一般类目标识别,提出基于最大边际多样性的视觉判别词提取方法。对图像的局部特征集,进一步放宽假设检验的限制,在不作任何先验假设的情况下,采用使边际多样性最大化的优化模型,求解判别性视觉词。将本文所提算法应用于Caltech、UIUC及Xerox标准图像库,并与传统的K-means聚类形成的词典比较,实验结果显示,算法在计算时间及分类精度上有了一定的提高。
   3.针对行为识别,提出基于格兰杰因果关系检验的判别性视觉词提取算法。将视频中局部特征之间的时间关联性考虑到视觉词的构造中,利用格兰杰因果关系,建立视频视觉词时间上的关联性,同时,结合最大边际多样性对视觉词进行选择。将本文算法应用于KTH人类行为视频库,鼠行为视频库等标准行为识别数据库上进行实验,实验结果验证了算法的有效性。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号