首页> 外文期刊>電子情報通信学会技術研究報告 >ユーザーの領域分割結果に基づく一般物体認識
【24h】

ユーザーの領域分割結果に基づく一般物体認識

机译:基于用户区域分割结果的通用物体识别

获取原文
获取原文并翻译 | 示例
       

摘要

In this paper, we revisit a generic object recognition problem from a point of view of human-computer interaction. Many of existing algorithms of the generic object recognition consist of following three tasks: target region segmentation, feature extraction and classification. While these three tasks are automatically processed on a computer in the previous approaches, solving the target region segmentation task by a computer is not always necessary in many practical situations in which a recognition system can request a user to input rough segmentation data of a target. Although rough segmentation may not give enough classification performance, the use of many rough segmentation datasets in learning process will avoid this problem. In order to validate this hypothesis, we created "20 wild bird datasets" and evaluated classification accuracy of the datasets. Our experiments revealed that generating multiple training samples from a single image by using multiple rough segmentation datasets brought positive effects on classification accuracies, especially when image features including spacial information such asrnPHOG and PHOW were used.%本報告では,一般物体認識の問題を,人間と計算機の対話型操作という観点から再考する.多くの一般物体認識アルゴリズムは,対象領域分割,特徴抽出,識別の3段階の処理で構成されている.通常,これら3つの処理は計算機により自動で行われるが,実用の場面では,領域分別の問題は必ずしも解く必要は無いと考えられる.アプリケーションによっては,ユーザーに大まかな領域分割を要求してもよいことが多いからである.大まかな領域分割では識別性能の低下が懸念されるが,学習用画像に対しても異なる複数の人間による大まかな領域分割データを多数集めておき,これらを用いて学習を行えば,この問題を回避できると考えられる.そこでこの仮説を立証するために“20 wild bird datasets”を作成し,識別性能を評価した.その結果,異なる領域分割データに基づいて,1枚の学習画 像から複数の学習サンプルを生成して学習することで,識別率が向上することがわかった.特に,特徴量に位置情報を含むPHOG 特徴量およびPHOW 特徴量において,顕著な改善が見られることがわかった.
机译:在本文中,我们从人机交互的角度重新审视了通用的对象识别问题。通用对象识别的许多现有算法包括以下三个任务:目标区域分割,特征提取和分类。尽管在先前的方法中在计算机上自动处理了这三个任务,但是在识别系统可以要求用户输入目标的粗略分割数据的许多实际情况下,通过计算机来解决目标区域分割任务并非总是必要的。尽管粗略分割可能无法提供足够的分类性能,但是在学习过程中使用许多粗略分割数据集可以避免此问题。为了验证该假设,我们创建了“ 20个野生鸟类数据集”并评估了这些数据集的分类准确性。我们的实验表明,使用多个粗糙分割数据集从单个图像生成多个训练样本会对分类精度产生积极影响,尤其是当使用包括空间信息(例如rnPHOG和PHOW)的图像特征时。 ,人间と计算机の対话型操作という観点から再考する。自动で行われるが,実用の场面では,领域分别の问题は必ずしも解く必要は无いと考えられる。アプリケーションによっては,ユーザーに大まかな领域分割を要求をいことが多いからである。领域分割では识别性能の低下が悬念されるが,学习用画像に対しても异なる复数の人间による大まかな领域分割データを多数集めておき,これらを用いて学习を行えば,この问题を回避できると考えられる。そこでこの仮说を立证するために“ 20野生鸟类数据集”を作成し,识别性能を评価した。その结果,异なる领域分割データに基づいて,1枚の学习画像から复数の学习サンプルに生成して学习することで,识别率が向上することがわかった。特に,特徴量に位置情报を含むPHOG特徴量およびPHOW特徴量において,顕着な改善が见られることがわかった。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号