...
首页> 外文期刊>電子情報通信学会技術研究報告. マルチメディア·仮想環境基礎. Multimedia and Virtual Environment >全周方向での音源位置推定および肌色情報との統合によ話者位置推定への適用
【24h】

全周方向での音源位置推定および肌色情報との統合によ話者位置推定への適用

机译:全周方向での音源位置推定および肌色情報との統合によ話者位置推定への適用

获取原文
获取原文并翻译 | 示例
           

摘要

ロボットがユーザとコミュニケーションをとるためには,まずユーザがどこにいるかを知る必要がある.この際,ユーザが常にロボットの正面にいるとは限らず,ロボットの後ろから声をかけられることも考えられる.そこで本論文では,全周方向での話者位置推定手法について述べる.まず,多チャネルのマイクロホンを用いて,音源からマイクロホンまでの音の到来時間差を利用して音源位置推定を行う.全周方向での3次元位置推定を行う際の推定精度と処理時間の観点から,最適なマイクロホン数と配置方法を導いた.次に,音源が話者であることを利用して音源位置推定の精度の向上を図る.様々な人種の肌色に適用できる色相,彩度に関するGMM(ガウス混合モデル)に対し,個別のシーンに適したGMMを学習により求め,シーン中の人物の肌色領域を安定して抽出できるようにした.音源位置推定結果と肌色尤度をベイジアン·ネットワークを用いて統合することにより,高精度の話者位置堆定法を実現した.実験により,本手法により全周方向での話者位置推定を効果的に行えることを確認した.
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号