首页> 外文期刊>電子情報通信学会技術研究報告. 応用音響. Engineering Acoustics >雑音·残響指標NRSR-PD_nに基づく雑音·残響下音声認識の予測性能評価
【24h】

雑音·残響指標NRSR-PD_nに基づく雑音·残響下音声認識の予測性能評価

机译:基于噪声/混响指数NRSR-PD_n的噪声/混响语音识别预测性能评估

获取原文
获取原文并翻译 | 示例
           

摘要

実環境において音声認識システムを利用すると,雑音や残響などの外乱の影響を受けて音声認識性能が著しく劣化する.ここで外乱による性能劣化を事前に予測できれば,その結果に基づいて性能改善手法を前処理等に反映できる.これまでに雑音下ではPerceputual Evaluation of Speech Quality(PESQ)を,残響下では室内音響指標(D値)を用いて音声認識性能を予測する手法が提案されている.しかし,これらの手法には予測指標が表現できない外乱が混入すると音声認識性能の予測精度は著しく劣化する問題がある.そこで本研究では,PESQとD値を併用して雑音·残響下における頑健な音声認識性能の予測法を提案する.提案法では事前に計測した発話音声やインパルス応答を用いて算出したPESQ,D値,音声認識性能から雑音·残響指標Noisy and Reverberant Speech Recognition criteria with PESQ and D_n(NRSR-PD_n)を策定する.そしてNRSR-PD_nを用いて性能予測を行う発話位置におけるインパルス応答と発話音声から音声認識性能の予測を試みる.評価実験の結果,従来のPESQとD値を個別に用いで性能予測する手法よりもNRSR-PD_nは頑健に雑音·残響下音声認識性能を予測できることを確認した.
机译:当在真实环境中使用语音识别系统时,由于诸如噪声和混响之类的干扰的影响,语音识别性能大大降低。如果可以预先预测由于干扰引起的性能下降,则可以基于结果在预处理中反映出性能改善方法。到目前为止,已经提出了使用嘈杂条件下的语音质量感知评估(PESQ)和混响下的房间声学指数(D值)来预测语音识别性能的方法。然而,这些方法存在以下问题:当混合不能表达预测指标的干扰时,语音识别性能的预测精度显着降低。因此,在这项研究中,我们提出了一种通过结合使用PESQ和D值来预测在噪声和混响下鲁棒语音识别性能的方法。在提出的方法中,根据PESQ,D值和使用预先测量的口头语音和冲动响应计算出的语音识别性能,制定了具有PESQ和D_n(NRSR-PD_n)的噪声和回响语音识别标准。然后,我们尝试根据冲激响应和使用NRSR-PD_n预测性能的口头位置的语音来预测语音识别性能。作为评估实验的结果,证实了NRSR-PD_n可以比传统的通过单独使用PESQ和D值预测性能的方法更可靠地预测噪声/混响语音识别性能。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号