首页> 外文期刊>電子情報通信学会技術研究報告 >学習による映像中の一般音源同定
【24h】

学習による映像中の一般音源同定

机译:通过学习识别视频中的一般声源

获取原文
获取原文并翻译 | 示例
           

摘要

本稿は,映像中の一般音源同定を目的としている.一般音源同定とは,音源となり得る物体が複数カテゴリ想定される場合の音源同定問題を示す.本稿では,一般音源同定問題をAdaBoost を用いた識別器学習の枠組みで扱う.音源となり得る物体が複数カテゴリ存在するため,学習には,音特徴に加え,一般物体認識に有効とされる複数の画像特徴を用いる.まず,その画像特徴と音特徴を独立に扱いながら,識別器学習を試みる.その場合,音源同定問題独特の性質として,画像特徴と音侍徴が与えられても音特徴がほとんど識別に寄与しないことが確認される.次にその解決法として,画像-音の相関特徴を識別器の学習に追加する.これにより,原理的に,音特徴が初めて有効に活用される.この事実を認識実験を行い,吟味した.%The purpose of this paper is to consider a sound source detection method.
机译:本文的目的是确定视频中的一般声源。一般的声源识别是指在多个类别中假定可以作为声源的对象时的声源识别问题。本文在使用AdaBoost进行分类器学习的框架中解决了一般的声源识别问题。由于有多种类别的对象可以作为声源,所以除了声音特征外,还可以使用对一般对象识别有效的多个图像特征进行学习。首先,尝试在分别处理图像特征和声音特征的同时尝试分类器学习。在那种情况下,作为声源识别问题特有的性质,即使给出图像特征和语音特征,也确认了声音特征几乎不有助于分类。接下来,作为解决方案,将图像声音相关特征添加到分类器的学习中。结果,原则上首次有效地利用了声音特征。我们对此事实进行了识别实验并进行了研究。 %本文的目的是考虑一种声源检测方法。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号