...
首页> 外文期刊>電子情報通信学会技術研究報告. 信号処理. Signal Processing >残響指標RSR-D_nに基づく残響環境下音声認識の予測性能評価
【24h】

残響指標RSR-D_nに基づく残響環境下音声認識の予測性能評価

机译:基于混响指数RSR-D_n的混响环境中语音识别的预测性能评估

获取原文
获取原文并翻译 | 示例

摘要

近年,雑音および残響下における音声認識手法に関する研究が盛んに行われている.それに伴い雑音環境下で音声認識性能を頑健に予測可能な指標も多数提案されている.一方,残響環境下における音声認識性能の有力な予測指標は提案されておらず,残響下音声認識性能の頑健な予測指標の策定は急務である.これまでに残響下音声認識性能の優劣を判別する残響指標として残響時間が提案されているが,仮定書場と実環境との差異から残響時間だけでなく他の残響特性も変化するため,音声認識性能を予測する残響量の指標として不十分であることが問題視されている.そこで本研究では,ISO3382 Annex Aで説明されている室内音響指標を用いた残響下における頑健な音声認識性能の予測法を提案する.提案法では初期反射音と後続残響音の関係を表す室内音響指標の中でも特にDefinition(D値)に着目し,事前に様々な環境で複数箇所計測したインパルス応答を基に算出したD値と音声認識性能に基づき回帰分析を行うことで残響指標RSR-D_nを策定する.策定した残響指標RSR-D_nと性能予測を行う残響環境の発話位置におけるインパルス応答を基に残響下音声認識性能の予測を試みる.評価実験の結果,従来の残響時間に基づく手法と比較して残響指標RSR-D_nは,より頑健に残響下音声認識性能を予測できることを確認した.
机译:近年来,关于噪声和混响下的语音识别方法的研究已经很活跃。伴随于此,还提出了许多可以在嘈杂环境中可靠地预测语音识别性能的指标。另一方面,尚未提出在混响环境下有力的语音识别性能的预测指标,因此迫切需要建立鲁棒的在混响环境下的语音识别性能的预测指标。已经提出将混响时间作为混响指标来确定在混响下语音识别性能的优劣,但是由于混响时间以及其他混响特性会由于假想书写位置与实际环境,语音之间的差异而改变,因此提出了混响时间。问题在于,它不足以作为预测识别性能的混响量指标。因此,在这项研究中,我们提出了一种使用ISO3382附录A中解释的房间声学指数来预测混响下鲁棒语音识别性能的方法。在提出的方法中,我们特别注意指示初始反射声音和随后的混响声音之间关系的房间声学指标中的定义(D值),并根据在各种环境中预先测量的冲激响应来计算D值和语音。通过基于识别性能进行回归分析来制定混响指数RSR-D_n。我们尝试基于已建立的混响指数RSR-D_n和预测性能的混响环境的语音位置的脉冲响应来预测混响下的语音识别性能。作为评估实验的结果,证实了混响指数RSR-D_n可以比基于混响时间的常规方法更可靠地预测混响语音识别性能。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号