...
首页> 外文期刊>電子情報通信学会技術研究報告. 応用音響. Engineering Acoustics >実環境における発話区間検出のための音響情報と画像情報の統合
【24h】

実環境における発話区間検出のための音響情報と画像情報の統合

机译:実環境における発話区間検出のための音響情報と画像情報の統合

获取原文
获取原文并翻译 | 示例
           

摘要

本報告では実環境での音声認識に有効であると考えられる発話区間検出の手法を提案する。この手法では、音響情報と画像情報をベイジアンネットワークを用いて統合して扱うことにより,複数の音声を含む音源が存在する状況において,話者の発話区間を検出することが可能である。この発話区間情報は,音声認識で用いられるのみでなく,音声認識の前処理として用いられる適応ビームフォーマの学習に用いられる。 適応ビームフォーマでは,話者位置を発話区間から,雑音の空間的特性を非発話区間から求めることにより,音源分離性能が大幅に向上する。 情報統合の手段としてベイジアンネットワークを用いることにより,①音響座標系と画像座標系の対応を学習により求めることができる,②入力ノードの追加により,情報源の追加を容易に行える,③状況依存性を表現できる,などの利点がある。
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号