首页> 外文会议>日本音響学会;日本音響学会春季研究発表会 >深層学習を用いた音源方向推定における方向誤差最小化のための目的関数設計
【24h】

深層学習を用いた音源方向推定における方向誤差最小化のための目的関数設計

机译:使用深度学习在声源方向估计中最小化方向误差的目标函数设计

获取原文

摘要

マイクロホンアレイを用いた音源方向推定技術は音声認識システムにおける雑音抑圧や防犯カメラでの音源追跡などの応用がある。音源方向推定の主な手法には,MUltiple SIgnal Classifiation(MUSIC)[1] やGeneralized Cross Correlation (GCC)[2] といった方法がある。一方で音源方向推定は雑音や室内残響によってその推定精度が低下することが知られており,その推定精度を改善する手法が幾つか検討されているが,これといった手法が確立されていない。また近年のDeep Neural Network(DNN)[3] の成功から,音源方向推定技術への応用が検討されている[4, 5, 6]。DNN を用いた場合,方向推定は回帰の問題ではなく,多クラス分類の問題として考えることが多い。そのとき目的関数にはクロスエントロピー関数[7] を用いられてきた。これまで深層学習を用いた音源方向推定に対して入力特徴量やニューラルネットワークの構造に対する検討が行われてきた一方で,学習に用いる目的関数については考慮されてこなかった。本検討では学習ベースでの音源方向推定に多クラス分類を用いる場合の目的関数の問題について議論する。そして,従来のクロスエントロピー関数に加え,強化学習[8, 9] の枠組みである報酬関数を含めた目的関数を提案する。提案手法の性能はシミュレーションにて確認する。
机译:使用麦克风阵列的声源方向估计技术具有诸如语音识别系统中的噪声抑制和安全摄像机中的声源跟踪之类的应用。声源方向估计的主要方法包括多信号分类(MUSIC)[1]和广义互相关(GCC)[2]。另一方面,众所周知,声源方向估计的估计精度由于噪声和房间混响而降低,已经研究了几种方法来提高估计精度,但是尚未建立这种方法。另外,由于近年来深度神经网络(DNN)的成功[3],正在研究其在声源方向估计技术中的应用[4,5,6]。使用DNN时,方向估计通常被视为多类分类问题,而不是回归问题。那时,交叉熵函数[7]被用作目标函数。虽然已经研究了用于深度学习的声源方向估计的神经网络的输入特征和结构,但尚未考虑用于学习的目标函数。在这项研究中,我们讨论了在学习的基础上将多类分类用于声源方向估计时的目标函数问题。然后,除了常规的交叉熵函数,我们还提出了一个目标函数,其中包括奖励函数,这是强化学习的框架[8,9]。仿真结果验证了所提方法的性能。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号