首页> 外文期刊>電子情報通信学会技術研究報告 >残響指標RSR-D_nに基づく残響環境下音声認識の予測性能評価
【24h】

残響指標RSR-D_nに基づく残響環境下音声認識の予測性能評価

机译:基于混响指标RSR-D_n的混响环境下语音识别的预测性能评估

获取原文
获取原文并翻译 | 示例
           

摘要

As no common reverberation criteria for the recognition of reverberant-speech have been proposed, it has been difficult to estimate this. We thus proposed new reverberation criteria, RSR-D_n (Reverberant Speech Recognition criteria with D_n) based on ISO3382 acoustic parameters. We first designed the suitable reverberation criteria with the relation between ISO3382 Annex A acoustic parameters and speech recognition performance. We then estimated the speech recognition performance based on our designed reverberation criteria, RSR-D_n. As a result of evaluation experiments, we could confirm that the recognition performance could be accurately and robustly estimated with proposed RSR-D_n.%近年,雑音および残響下における音声認識手法に関する研究が盛んに行われている.それに伴い雑音環境下で音声認識性能を頑健に予測可能な指標も多数提案されている.一方,残響環境下における音声認識性能の有力な予測指標は提案されておらず,残響下音声認識性能の頑健な予測指標の策定は急務である.これまでに残響下音声認識性能の優劣を判別する残響指標として残響時間が提案されているが,仮定音場と実環境との差異から残響時間だけでなく他の残響特性も変化するため,音声認識性能を予測する残響量の指標として不十分であることが問題視されている.そこで本研究では.ISO3382 Annex Aで説明されている室内音響指標を用いた残響下における頑健な音声認識性能の予測法を提案する.提案法では初期反射音と後続残響音の関係を表す室内音響指標の中でも特にDefinition(D値)に着目し,事前に様々な環境で複数箇所計測したインパルス応答を基に算出したD値と音声認識性能に基づき回帰分析を行うことで残響指標RSR-D_nを策定する.策定した残響指標RSR-D_nと性能予測を行う残響環境の発話位置におけるインパルス応答を基に残響下音声認識性能の予測を試みる.評価実験の結果,従来の残響時間に基づく手法と比較して残響指標RSR-D_nは,より頑健に残響下音声認識性能を予測できることを確認した.
机译:由于尚未提出用于识别混响语音的通用混响标准,因此很难对此进行估算,因此我们提出了基于ISO3382声学参数的新混响标准RSR-D_n(具有D_n的语音识别标准)。根据ISO3382 Annex A声学参数与语音识别性能之间的关系,设计了合适的混响标准,然后根据设计的混响标准RSR-D_n估算语音识别性能,通过评估实验,我们可以确定识别结果是否正确。使用建议的RSR-D_n。%可以准确,可靠地评估性能。近年来,在噪声和混响下对语音识别方法进行了大量研究。伴随于此,已经提出了许多可以在嘈杂环境中可靠地预测语音识别性能的指标。另一方面,尚未提出用于混响环境中的语音识别性能的有力的预测指标,并且迫切需要开发用于混响环境中的语音识别性能的鲁棒的预测指标。迄今为止,已经提出了混响时间作为混响指标,用于区分混响下语音识别性能的优劣。作为用于预测识别性能的混响量的指标,认为不足。因此在本研究中。我们提出了一种鲁棒的方法,该方法使用ISO3382附录A中所述的室内声学指标来预测混响下的语音识别性能。在提出的方法中,代表早期反射声和后续混响声之间关系的室内声学指标中,着眼于(D值),通过基于D值进行回归分析来建立混响指数RSR-D_n,该D值基于预先在各种环境中的各个位置处测量的冲激响应和语音识别性能而计算出。我们尝试基于已建立的混响指数RSR-D_n和混响环境中发声位置的冲激响应来预测混响语音识别性能,以进行性能预测。作为评估实验的结果,证实了与基于混响时间的传统方法相比,混响指数RSR-D_n可以更稳健地预测混响下的语音识别性能。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号