首页> 外文会议>日本音響学会2018年秋季研究発表会講演論文集 >残響下でのDNNを用いた音源方向推定における入力長の影響の検討
【24h】

残響下でのDNNを用いた音源方向推定における入力長の影響の検討

机译:混响下使用DNN检验输入长度对声源方向估计的影响

获取原文
获取原文并翻译 | 示例

摘要

マイクロホンアレイを用いた音源方向推定技術は,rn会議録音や音声認識での雑音抑圧の前処理,監視カメrnラにおける音源追跡など様々な応用がなされている。rn音源方向推定には,各マイクロホン間の音声の到来時rn間差を推定し音源方向を算出する手法,ビームを走査rnして音源方向を検出する手法などがあるが,いずれもrn室内環境における残響の影響によって,推定精度が低rn下することが知られている。実社会での応用にはrnこの課題の解決が不可欠であり,推定精度の改善のたrnめに様々な手法が提案されている。その中に,DeeprnNeural Network(DNN)を用いる手法がある。本稿でrnは以降,DNN を用いた音源方向推定を“DNN 音源方rn向推定” と呼ぶ。DNN 音源方向推定には,一般化相rn互相関関数(GCC: Generalized Cross Correlation)rnを入力とするもの,各周波数成分の位相情報を入rn力するもの[4] などがある。本研究では,GCC の一rn種であるGCC-PHAT(GCC - Phase Transform)を入rn力とする残響下でのDNN 音源方向推定において,入rn力長が推定精度に与える影響について検討する。
机译:使用麦克风阵列的声源方向估计技术具有各种应用,例如在会议记录和语音识别中对噪声抑制进行预处理,以及在监视摄像机中进行声源跟踪。估计声源方向的方法有两种:一种通过估计麦克风之间的传入语音之间的差异来估计声源方向的方法,以及一种通过扫描波束来检测声源方向的方法。已知由于混响的影响,估计精度低。解决该问题对于在现实世界中的应用是至关重要的,并且已经提出了各种方法来提高估计精度。其中包括使用深度神经网络(DNN)的方法。在本文中,以下将使用rn将Dn称为“ DNN声源方向rn方向估计”。 DNN声源方向估计有两种类型:一种输入广义相位rn互相关函数(GCC)rn,另一种输入每个频率分量的相位信息[4]。在这项研究中,我们研究了输入rn力长度对GCC的rn种GCC-PHAT(GCC-Phase Transform)进行混响时DNN声源方向估计中输入rn力长度对估计精度的影响。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号