首页> 外文会议>Computer Vision (ICCV), 2011 IEEE International Conference on >Modeling spatial layout with fisher vectors for image categorization
【24h】

Modeling spatial layout with fisher vectors for image categorization

机译:使用Fisher向量对空间布局建模以进行图像分类

获取原文
获取原文并翻译 | 示例

摘要

We introduce an extension of bag-of-words image representations to encode spatial layout. Using the Fisher kernel framework we derive a representation that encodes the spatial mean and the variance of image regions associated with visual words. We extend this representation by using a Gaussian mixture model to encode spatial layout, and show that this model is related to a soft-assign version of the spatial pyramid representation. We also combine our representation of spatial layout with the use of Fisher kernels to encode the appearance of local features. Through an extensive experimental evaluation, we show that our representation yields state-of-the-art image categorization results, while being more compact than spatial pyramid representations. In particular, using Fisher kernels to encode both appearance and spatial layout results in an image representation that is computationally efficient, compact, and yields excellent performance while using linear classifiers.
机译:我们引入了词袋图像表示的扩展来对空间布局进行编码。使用Fisher框架,我们得到了一个表示,该表示对与视觉单词相关的图像区域的空间均值和方差进行编码。我们通过使用高斯混合模型对空间布局进行编码来扩展此表示形式,并表明该模型与空间金字塔表示形式的软分配版本有关。我们还将空间布局的表示与Fisher内核的使用相结合,以编码局部特征的外观。通过广泛的实验评估,我们证明了我们的表示产生了最新的图像分类结果,同时比空间金字塔表示更紧凑。特别是,使用Fisher核对外观和空间布局进行编码都会得到图像表示,该图像表示在计算上高效,紧凑,并且在使用线性分类器时表现出出色的性能。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号