首页> 外文期刊>電子情報通信学会技術研究報告 >残響下音声認識における発話様式の実験的分析と評価
【24h】

残響下音声認識における発話様式の実験的分析と評価

机译:混响语音识别中语音模式的实验分析和评估

获取原文
获取原文并翻译 | 示例
       

摘要

近年,音声認識技術の発展に伴って,ハンズフリー音声インターフェースが爆発的に普及している.残響環境下においてマイクロホンから離れて発話すると残響混入の影響により音声認識性能が著しく低下する問題がある.これに対して事前に音声認識システムの性能予測を行い,予測結果に基づいて音声認識システムの前処理に反映することで音声認識性能向上が期待できる.たとえば残響に頑健あるいは脆弱な話者を特定できれば,事前に各話者に適切な音響モデルを選択できる.そこで本研究では,残響下音声認識の性能向上を目指して音声認識性能の話者依存性について調査した.具体的には,多種の発話内容が収録されているCSRC連続音声データベースと残響環境のインパルス応答を用いて連続音素認識評価を行い,発話内容•発話様式と音声認識性能の関係を実験的に分析した.発話内容と音声認識性能の関係を評価した結果,明瞭に発声しやすい文章(天気予報文章など)は,残響の有無に関係なく音声認識性能が高いことを確認した.一方,発話様式と残響下音声認識性能の関係を評価した結果,両者間に顕著な傾向が確認できなかったことから,残響が発話様式に与える影響は小さいことがわかつた.%In recent years, a hands-free speech device has been developed with improving speech recognition techniques. The reverberant speech degrades the recognition performance in the field of distant-talking speech recognition. It is possibly addressed by taking preventive measures against the degradation of recognition performance by estimating the recognition performance. Identification of the speaker with robust or weak features against reverberation makes it possible to adapt acoustic model for each speaker toward improving the recognition performance. In this research, we investigated the speaker-dependence in the reverberant speech recognition toward improving recognition performance. We conducted the recognition experiments with CSRC continuous speech database in various conditions to evaluate the effect of reverberation on speaking-style. As a result of reverberant speech recognition experiment in each speaking-style, we could confirm the lower effects of reverberation on speaking-style since there was no clear tendency between reverberation and speech recognition performance.
机译:近年来,随着语音识别技术的发展,免提语音接口已经爆炸性地流行,并且存在以下问题:由于在混响环境中远离麦克风讲话时的混响的影响,语音识别性能显着降低。另一方面,通过预先预测语音识别系统的性能并基于该预测结果将其反映在语音识别系统的预处理中,可以期望语音识别性能提高,例如,可以确定健壮或易混响的扬声器。如果可能的话,可以预先为每个说话者选择合适的声学模型。因此,在本研究中,我们研究了说话者对语音识别性能的依赖性,目的是提高回响语音识别的性能。使用CSRC连续语音数据库进行连续音素识别评估,在该数据库中记录了话语内容和混响环境的冲激响应,并实验分析了话语内容和话语风格与语音识别性能之间的关系。通过评估演奏之间的关系的结果,证实了容易清楚地说出的句子(例如天气预报句子)具有高语音识别性能,而不管是否存在混响。评价的结果是,在两方之间没有确认到明显的趋势,并且发现混响对发声风格的影响很小。%近年来,已经开发了用于改善语音的免提语音设备。混响语音会降低远距离语音识别领域的识别性能,可能需要通过估计识别性能来采取预防措施来防止识别性能下降。混响使适应声学模型成为可能针对每个说话者,旨在提高其识别性能。在这项研究中,我们研究了混响语音识别中的说话者依赖性,以提高识别性能。我们使用CSRC连续语音数据库在各种条件下进行了识别实验,以评估混响对语音的影响作为每种口语风格的混响语音识别实验的结果,由于混响和语音识别性能之间没有明显的趋势,因此我们可以确认混响对口语风格的影响较小。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号