【24h】

Visual Word Aggregation

机译:视觉词聚合

获取原文
获取原文并翻译 | 示例

摘要

Most recent category-level object recognition systems work with visual words, i.e. vector quantized local descriptors. These visual vocabularies are usually constructed by using a single method such as K-ineans for clustering the descriptor vectors of patches sampled either densely or sparsely from a set of training images. Instead, in this paper we propose a novel methodology for building efficient codebooks for visual recognition using clustering aggregation techniques: the Visual Word Aggregation (VWA). Our aim is threefold: to increase the stability of the visual vocabulary construction process; to increase the image classification rate; and also to automatically determine the size of the visual codebook. Results on image classification are presented on the testbed PASCAL VOC Challenge 2007.
机译:最新的类别级对象识别系统使用视觉单词,即矢量量化的局部描述符。这些视觉词汇通常是使用诸如K-ineans之类的单一方法构建的,用于对从一组训练图像中密集或稀疏采样的补丁的描述符向量进行聚类。取而代之的是,在本文中,我们提出了一种新颖的方法,用于使用聚类聚合技术来构建有效的用于视觉识别的代码簿:视觉单词聚合(VWA)。我们的目标是三方面的:提高视觉词汇构建过程的稳定性;提高图像分类率;并自动确定视觉密码本的大小。在PASCAL VOC Challenge 2007测试台上展示了​​图像分类的结果。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号