学習による映像中の一般音源同定

池田　千廣; フォン　ヤオカイ; 内田　誠一

首页> 外文期刊>電子情報通信学会技術研究報告 >学習による映像中の一般音源同定

【24h】

学習による映像中の一般音源同定

机译：通过学习识别视频中的一般声源

获取原文

获取原文并翻译 | 示例

掌桥外文数据库（机构版） >>

开具论文收录证明 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

本稿は，映像中の一般音源同定を目的としている．一般音源同定とは，音源となり得る物体が複数カテゴリ想定される場合の音源同定問題を示す．本稿では，一般音源同定問題をAdaBoost を用いた識別器学習の枠組みで扱う．音源となり得る物体が複数カテゴリ存在するため，学習には，音特徴に加え，一般物体認識に有効とされる複数の画像特徴を用いる．まず，その画像特徴と音特徴を独立に扱いながら，識別器学習を試みる．その場合，音源同定問題独特の性質として，画像特徴と音侍徴が与えられても音特徴がほとんど識別に寄与しないことが確認される．次にその解決法として，画像-音の相関特徴を識別器の学習に追加する．これにより，原理的に，音特徴が初めて有効に活用される．この事実を認識実験を行い，吟味した．%The purpose of this paper is to consider a sound source detection method.

机译：本文的目的是确定视频中的一般声源。一般的声源识别是指在多个类别中假定可以作为声源的对象时的声源识别问题。本文在使用AdaBoost进行分类器学习的框架中解决了一般的声源识别问题。由于有多种类别的对象可以作为声源，所以除了声音特征外，还可以使用对一般对象识别有效的多个图像特征进行学习。首先，尝试在分别处理图像特征和声音特征的同时尝试分类器学习。在那种情况下，作为声源识别问题特有的性质，即使给出图像特征和语音特征，也确认了声音特征几乎不有助于分类。接下来，作为解决方案，将图像声音相关特征添加到分类器的学习中。结果，原则上首次有效地利用了声音特征。我们对此事实进行了识别实验并进行了研究。％本文的目的是考虑一种声源检测方法。

著录项

来源
《電子情報通信学会技術研究報告》 |2011年第467期|p.67-72|共6页
作者
池田　千廣; フォン　ヤオカイ; 内田　誠一;
展开▼
作者单位

九州大学大学院システム情報科学府;

九州大学大学院システム情報研究院;

九州大学大学院システム情報研究院;

展开▼
收录信息
原文格式 PDF
正文语种 jpn
中图分类
关键词
音源同定; 学習; AdaBoost; bag of fbatures; ST－patch;

机译：声源识别;学习;AdaBoost;功能包;ST补丁;

相似文献

外文文献
中文文献
专利

1. 学習による映像中の音源同定 [J] . 池田千廣, フォンヤオカイ, 内田誠一電子情報通信学会技術研究報告. 情報論的学習理論と機械学習 . 2010,第188期

机译：通过学习识别视频中的声源
2. 学習による映像中の音源同定 [J] . 池田　千慮, フォン　ヤオカイ, 内田　誠一電子情報通信学会技術研究報告 . 2010,第188期

机译：通过学习识别视频中的声源
3. 学習による映像中の音源同定 [J] . 池田　千慮, フォン　ヤオカイ, 内田　誠一電子情報通信学会技術研究報告 . 2010,第187期

机译：通过学习识别视频中的声源
4. TCCに基づく自己教師学習による特徴表現を用いた映像中の人物動作の検出に関する検討: 動作検出パラメータが与える影響に対する考察 [C] . 増田　毅, 藤後　廉, 小川　貴弘, マルチメディアストレージ研究会;映像表現＆コンピュータグラフィックス研究会;メディア工学研究会;画像工学研究会;ITS研究会 . 2021

机译：基于TCC的自主学习特征表示，通过特征表示检测视频的个人操作研究：操作检测参数影响的研究
5. 深層学習による分光反射スペクトルからの変質鉱物同定 [D] . 田中壮一郎, TANAKA Soichiro 2019

机译：通过深度学习从光谱反射光谱中识别出改变的矿物
6. 教育工学的手法による精神薄弱児の授業の研究 : 生活単元学習における映像教材の活用と学習反応の分析について [O] . 大野圀男 / 西野賢寿 / 大貫亘 / 本田えつ子 / 中崎静子 / 甲斐邦子 / 須藤清 / 佐々木正志 1983

机译：利用教育工程技术对弱智儿童课程的研究：视频教材的利用与生命单元学习中的学习反应分析

学習による映像中の一般音源同定

摘要

著录项

相似文献

相关主题

期刊订阅