视觉模式识别中的差别性视觉词选择研究

代理获取

页面导航

摘要
著录项
相似文献
相关主题

摘要

一般目标类识别和行为识别是当前计算机视觉界研究的热点问题。词袋模型为解决该类问题提供了一个基本框架。词袋模型涉及四个关键的因素:局部特征检测、局部特征描述、视觉词典的构造及分类器的设计。传统的视觉词典是由聚类算法得到,把聚类中心作为视觉词。其局限性在于,那些平凡的视觉词,就像文本处理中的冠词一样,大量出现在词典中,使词典庞大,造成图像量化表示的维数高,从而使得计算复杂性高。针对这一局限性,本文重点研究判别性视觉词的提取,在模式分类中提取最具判别性的视觉词,减小词典的规模,降低计算复杂性。另外,传统的词袋模型假设视觉词之间是独立的,然而,视频图像的视觉词之间在时间上是有关联的,本文针对行为识别研究具有时间关联性的判别性视觉词选择。本文主要的研究工作和贡献如下:
　　 1.针对一般类目标识别,提出基于假设检验的判别性视觉词提取算法。本文分别利用T检验,秩和检验,柯尔莫可洛夫-斯米洛夫检验三种假设检验方法计算各自的最优置信集的视觉词,三种检验得到的所有视觉词构成判别词典。将本文所提算法应用于Caltech、UIUC及Xerox标准图像库,实验结果验证了所提算法的有效性。
　　 2.针对一般类目标识别,提出基于最大边际多样性的视觉判别词提取方法。对图像的局部特征集,进一步放宽假设检验的限制,在不作任何先验假设的情况下,采用使边际多样性最大化的优化模型,求解判别性视觉词。将本文所提算法应用于Caltech、UIUC及Xerox标准图像库,并与传统的K-means聚类形成的词典比较,实验结果显示,算法在计算时间及分类精度上有了一定的提高。
　　 3.针对行为识别,提出基于格兰杰因果关系检验的判别性视觉词提取算法。将视频中局部特征之间的时间关联性考虑到视觉词的构造中,利用格兰杰因果关系,建立视频视觉词时间上的关联性,同时,结合最大边际多样性对视觉词进行选择。将本文算法应用于KTH人类行为视频库,鼠行为视频库等标准行为识别数据库上进行实验,实验结果验证了算法的有效性。

著录项

作者
吴迪炜;
展开▼
作者单位

厦门大学;

展开▼
授予单位厦门大学;
学科计算机应用技术
授予学位硕士
导师姓名曲延云;
年度 2011
页码
总页数
原文格式 PDF
正文语种中文
中图分类 TP391.41;
关键词
一般目标类识别; 词袋模型; 假设检验; 边际多样性; 格兰杰检验; 视觉模式识别; 文本处理;

相似文献

中文文献
外文文献
专利

1. 对排球裁判员视觉差别感受性的研究 [J] . 甘其伟 . 体育学刊 . 1995,第002期
2. 艺术史研究中的视觉现代性阐释——《现代性的视觉政体》译后感 [J] . 汪瑞 . 中国图书评论 . 2021,第009期
3. 模式识别及其在计算机视觉中的实现研究 [J] . 郭宏博 . 电子技术与软件工程 . 2021,第019期
4. 模式识别及其在计算机视觉中的实现 [J] . 张华 . 电子技术与软件工程 . 2014,第024期
5. 焊缝缺陷模式识别以及焊缝缺陷检测数据库——计算机视觉技术在焊缝缺陷检测中的应用(2) [J] . 杨燕萍 ,杨清平 ,金顺敬 . 浙江建筑 . 2008,第011期
6. 视觉位姿测量中单目视觉与双目立体视觉测量精度比较 [C] . 朱枫 ,中国科学院研究生院 ,何雷 . 第五届全国信息获取与处理学术会议 . 2007
7. 视觉环境主观评价实验方法——语意差别量表因子分析法及其在中国画陈列室视觉环境研究中的应用 [A] . 周志 . 1986

视觉模式识别中的差别性视觉词选择研究

摘要

著录项

相似文献

相关主题

期刊订阅