首页> 外文期刊>電子情報通信学会技術研究報告 >ノンパラメトリックベイズアプローチに基づく音響ィベント検出
【24h】

ノンパラメトリックベイズアプローチに基づく音響ィベント検出

机译:基于非参数贝叶斯方法的声事件检测

获取原文
获取原文并翻译 | 示例
       

摘要

膨大な音や映像のメディアデータを自在に検索して活用するためには,付随するテキストデータに頼るだけではなく,それぞれの中身を表す情報を,音や映像自体から自動的に引き出す技術が必要不可欠である.本稿では,ノンパラメトリックベイズ手法を用いて,複数の音響イベントが重なり合った音響信号から,音響イベントの種類や数,各イベントの発音区間をすベて,教師なしで学習する手法を提案し,その評価実験結果を述べる.%As the amount of available multimedia data increases, the technique to automatically extract the significant information from audio or video files is crucial to application in multimedia search. In this paper, we propose a Bayesian unsupervised method for temporally locating overlapping audio events and learning the number of the events and the acoustic characteristics in an audio mixture signal. Experimental results show that our method characterizes the audio events effectively.
机译:为了自由地搜索和利用大量的声音和视频的媒体数据,不仅需要依赖于附带的文本数据,而且还需要从声音或视频本身自动提取表示每个内容的信息。在本文中,我们使用非参数贝叶斯方法来学习声音事件的类型和数量,每个事件的发声间隔以及从多个声音事件重叠的声音信号中进行无监督学习。随着可用多媒体数据量的增加,从音频或视频文件中自动提取重要信息的技术对于在多媒体搜索中的应用至关重要。本文提出了一种无监督贝叶斯算法通过时间定位重叠的音频事件并学习事件数量和混合信号中的声学特性,实验结果表明,该方法能够有效地表征音频事件。

著录项

  • 来源
    《電子情報通信学会技術研究報告》 |2012年第110期|37-42|共6页
  • 作者单位

    日本電信電話株式会社コミュニケーション科学基礎研究所 〒243-0198 神奈川県厚木市森の里若宮 3-1;

    大学共同利用機関法人 情報•システム研究機構 統計数理研究所 〒190-8562 東京都立川巿緑町 10-3;

    大学共同利用機関法人 情報•システム研究機構 統計数理研究所 〒190-8562 東京都立川巿緑町 10-3;

    日本電信電話株式会社コミュニケーション科学基礎研究所 〒243-0198 神奈川県厚木市森の里若宮 3-1;

    日本電信電話株式会社コミュニケーション科学基礎研究所 〒243-0198 神奈川県厚木市森の里若宮 3-1;

    日本電信電話株式会社コミュニケーション科学基礎研究所 〒243-0198 神奈川県厚木市森の里若宮 3-1;

    日本電信電話株式会社コミュニケーション科学基礎研究所 〒243-0198 神奈川県厚木市森の里若宮 3-1;

  • 收录信息
  • 原文格式 PDF
  • 正文语种 jpn
  • 中图分类
  • 关键词

    音響イベント検出; 非負値行列因子分解; ノンパラメトリックベイズ; スライスサンプリング;

    机译:声音事件检测;非负矩阵分解;非参数贝叶斯;切片采样;
  • 入库时间 2022-08-18 00:29:14

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号