首页> 外文期刊>電子情報通信学会技術研究報告. 音声. Speech >複数残響特性下の音声を単一モデル学習に用いた未知残響環境に頑健な音声認識の検討
【24h】

複数残響特性下の音声を単一モデル学習に用いた未知残響環境に頑健な音声認識の検討

机译:在单一模型学习中使用多重混响特性下的语音在未知混响环境中的鲁棒语音识别测试

获取原文
获取原文并翻译 | 示例
       

摘要

残響環境下では音声認識性能は著しく著しく劣化する.これに対し,人工残響インパルス応答をクリーン音声に畳み込んで学習することで,認識率が向上することが知られている.しかし,どのような残響インパルス応答を畳み込んで学習すべきか,という点に関しては十分に議論がなされていない.本研究では,人工残響インパルス応答の残響時間パラメータと認識率の関係を残響音声認識評価基盤(CENSREC-4)を用いて詳細に調べ,認識率が大きく変わる残響時間パラメータの範囲がテスト環境より短い残響時間に分布していることを述べる.また,その範囲に基づいて人工残響インパルス応答を選択しマルチコンディション学習を行うことが,未知残響環境に対して頑健な音声認識であることを示す.
机译:在混响环境中,语音识别性能会大大降低。另一方面,已知可以通过将人工混响脉冲响应卷积为纯净的声音来学习来提高识别率。但是,对于应混叠哪种混响脉冲响应进行学习,目前还没有足够的讨论。在这项研究中,使用混响语音识别评估平台(CENSREC-4)详细研究了人工混响脉冲响应的混响时间参数与识别率之间的关系,其识别率变化明显的混响时间参数范围比测试环境短。描述了它在混响时间内分布。我们还表明,基于该范围选择人工混响脉冲响应并执行多条件学习对于未知混响环境来说是可靠的语音识别。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号