首页> 外文期刊>電子情報通信学会技術研究報告 >Image Categorization using Scene-Context Scale
【24h】

Image Categorization using Scene-Context Scale

机译:使用场景上下文比例进行图像分类

获取原文
获取原文并翻译 | 示例
       

摘要

画像から抽出した特徴量の密度が高いはど高性能な画像分類を実現することができる.テクストンは代表的な高密度の特徴量であり,近年ではテクスチャ解析や一般物体認識にも特徴量として多く用いられ,その有効性が確認されている.しかし,テクストンを抽出する際,テクストンのスケール最適化が考慮されていないため,画像群中でスーケル変化が大きい物体の認識は困難であり,性能低下の原因になる.そこで我々は,予め画像からシーンコンテクストスケールを求め,物体のスーケルによって異なるテキストンを用いる画像分類手法を提案する.提案手法の有効性を確認するためMSRC21のデータベースを用いた評価実験を行い,従来法に比べ画像分類に対する大幅な精度向上が得られることを確認した.%Densely sampling visual words tend to improve image categorization performance. Textons are representative dense visual words and they have been proven effective in categorizing materials as well as generic object classes. Despite its success and popularity, no prior work has tackled the problem of its scale-optimization for the given image data and the associated object category. We propose scale-optimized textons to learn the best scale for each object in a scene and they are utilized in image categorization. Our textonization process would produce a scale-optimized codebook of visual words thus provide improved image categorization performance. We approach the scale-optimization problem of textons as solving a scene-context scale in each image, which means the effective scale of local context to classify an image pixel in a scene. We perform textonization process using random forests which are powerful tools with high computational efficiency in vision applications. Random forests are efficiently provide both a hierarchical clustering into semantic textons and local classification. In our experiments, we use MSRC21 dataset to assess our method and show that the usage of scale-optimized textons significantly improves the performance of image categorization.
机译:可以实现具有从图像中提取的特征的高密度的高性能图像分类。 Texton是典型的高密度特征量,近年来,它已广泛用作纹理分析和一般对象识别的特征量,并且其有效性得到了证实。然而,当提取纹理子时,没有考虑纹理子的比例优化,因此难以识别图像组中具有较大骨架变化的物体,这导致性能下降。因此,我们提出一种图像分类方法,该方法通过预先从图像中获取场景上下文比例,从而根据对象的骨骼使用不同的纹理。为了确认该方法的有效性,我们使用MSRC21数据库进行了评估实验,并确认与传统方法相比,图像分类的准确性得到了显着提高。 %密集采样视觉单词往往会改善图像分类性能。文本是代表性的密集视觉单词,并且已被证明有效地对材料以及通用对象类别进行了分类。尽管它成功并广受欢迎,但没有任何先前的工作能够解决其规模问题。对给定的图像数据和相关的对象类别进行优化。我们提出了比例优化的文本,以学习场景中每个对象的最佳比例,并将其用于图像分类。我们的文本化过程将生成视觉上经比例优化的密码本因此,我们通过解决每个图像中的场景上下文比例来解决纹理像素的比例优化问题,这意味着对场景中的图像像素进行分类的局部上下文的有效比例。随机森林是功能强大的工具,在视觉应用中具有很高的计算效率。在我们的实验中,我们使用MSRC21数据集来评估我们的方法,并表明使用比例优化的纹理可以显着提高图像分类的性能。

著录项

  • 来源
    《電子情報通信学会技術研究報告》 |2011年第382期|p.149-154|共6页
  • 作者

    Yousun KANG; Akihiro Sugimoto;

  • 作者单位

    National Institute of Informatics Yousun Kang, 2-1-2 Hitotsubashi, Chiyoda-ku, Tokyo 101-8430 National Institute of Informatics;

    National Institute of Informatics Yousun Kang, 2-1-2 Hitotsubashi, Chiyoda-ku, Tokyo 101-8430 National Institute of Informatics;

  • 收录信息
  • 原文格式 PDF
  • 正文语种 eng
  • 中图分类
  • 关键词

  • 入库时间 2022-08-18 00:30:01

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号