...
首页> 外文期刊>電子情報通信学会技術研究報告. 信号処理. Signal Processing >ニューラルネットワークによる音源方向補正に基づく目的音源抽出のための適応ビームフォーマ
【24h】

ニューラルネットワークによる音源方向補正に基づく目的音源抽出のための適応ビームフォーマ

机译:基于神经网络声源方向校正的客观声源提取的自适应梁前

获取原文
获取原文并翻译 | 示例
           

摘要

本研究では,複数音声が混合した信号から方向情報に基づいて所望の音声を強調することを目的とし,ニューラルネットワークによる音源方向補正に基づく時間周波数マスクを用いた,マルチチャネル適応ビームフォーマを提案する.従来のマイク間の位相差に基づく音源方向推定では,マイク配置のズレや反響により方向推定結果の信頼性が下がるが,提案するニューラルネットワークでは,調波構造など,音声の特徴的な周波数構造を元に,ある周波数で誤った音源方向推定結果を他の周波数の方向推定結果から補正する.時間周波数マスクは音源方向推定結果に基づき,所望方向から到来する音声のみを通過させる.ニューラルネットワークは特定のマイクロホンアレイを用いて学習されるが,マイク配置依存の情報を落とした特徴量を入力することで,任意のマイクロホンアレイに適用できる.実験の結果,提案法は時間周波数マスクをより正確に推定でき,方向推定結果の補正前よりも歪みを少なく目的音を強調することを確認した.特に,既存の音源方向推定の精度が下がる直線アレイの端方向に所望方向がある時,音声強錮性能を大きく改善することを示した.
机译:在本研究中,我们的目的是基于与多个语音混合的信号的方向信息来强调所需的音频,并且基于神经网络的声源方向校正,使用时间频率掩模提出多通道自适应波束形成器。在基于传统磁镜之间的相位差的声源方向估计中,由于麦克风布置的偏差,方向估计结果的可靠性降低,但是所提出的神经网络具有语音的特征频率结构,例如a谐波结构。在原件下,从其他频率的方向估计结果校正了某个频率的误差误差。时间频率掩模仅基于声源方向估计结果通过来自所需方向的音频。使用特定麦克风阵列学习神经网络,但是可以通过输入丢弃麦克风排列依赖信息的特征量来应用于任何麦克风阵列。作为实验的结果,所提出的方法可以更准确地估计时间频率掩模并强调目标声音小于方向估计结果的校正之前的目标声音。特别地,当期望的方向在现有声源方向估计的端方向上具有期望的方向时,显示出显着提高声音损失。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号