首页> 外文期刊>電子情報通信学会技術研究報告. 音声. Speech >同時発話の高性能な音声認識-スペクトル減算による分離の高速化と分離音を用いた音響モデル学習
【24h】

同時発話の高性能な音声認識-スペクトル減算による分離の高速化と分離音を用いた音響モデル学習

机译:高性能语音识别分离和声学模型学习的同时语音分离使用孤立声音

获取原文
获取原文并翻译 | 示例
           

摘要

本研究の目的は,同時発話を高性能に音声認識することである.認識のためには音源分離が必要であるが,その過程で生じる音響的な歪みや残留雑音により,認識精度の改善幅はある水準に留まる.また,従来用いられてきた独立成分分析による分離は,処理時間が長いことも問題である.本研究では,歪みを含む分離音を用いて音響モデル学習を行うことと,混合音から推定した他者発話スペクトルを減算する音源分離手法を提案する.計算機シミュレーションによる認識実験で,提案法による分離音の認識精度は従来法に比べて約6%改善し,処理時間が約1/5に短縮された.また,分離音を学習データに用いることにより,認識精度がさらに約20%改善されることを示した.
机译:本研究的目的是言语识别同时语音高性能。 尽管识别所需的声源分离,但过程中产生的声应变和残余噪声保持在一定程度。 此外,通常使用的独立分量分析分离也是处理时间长的问题。 在本研究中,我们提出了一种用于执行声学模型学习的声源分离方法,并减去从混合声音估计的其他话语频谱,并使用包括失真的分离声音。 在通过计算机模拟的识别实验中,与常规方法相比,所提出的方法的分离声音的识别精度已经提高了约6%,并且处理时间缩短至约1/5。 此外,通过使用用于学习数据的分离声,识别精度进一步提高了约20%。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号