首页> 外文期刊>電子情報通信学会技術研究報告 >雑音抑圧とSPLICEを組み合わせた雑音環境下音声認識
【24h】

雑音抑圧とSPLICEを組み合わせた雑音環境下音声認識

机译:噪声抑制和SPLICE相结合的嘈杂环境下的语音识别

获取原文
获取原文并翻译 | 示例
       

摘要

近年携帯端末や力ーナビゲーシヨンシステムなどを,音声入力を用いて操作する場面が多くなつている.しかし実環境下での音声入力は様々な雑音が混入してしまい,クリーン環境で構築された音響モデルのみが使われていた場合,認識率の大きな低下を招くことになる.音声の特徴量から雑音の影響を取リ除く手法は特徴量正規化,特徴強調など様々な手法が提案されているが,単一の手法で影響をすべて取リ除くことは難しい.そこで本稿ではこれらの手法を組み合わせてよリ雑音に頑健な音声認識を目指す.SPLICE(Stereo-Piecewise LInear Compensation for Environments)は任意の特徴量を入力として扱える高い汎用性を持っている.そこで既存手法とSPLICEの組み合わせの中で,各手法の特性が有効に働くを組み合わせを検討する.Aurora-2データベースを用いた英語連続数字音声認識のタスクにおいて,AFE (Advanced Front-End), SPLICE, HEQ (Histogram EQualization)を順番に適用した特徴量がどの環境においても優れた性能を示した.%Recently, voices are often used as input modality to mobile terminals or car navigation systems. However, the voices recorded in actual environment frequently contain various kinds of noise and, because of that, the performance of automatic speech recognition systems is largely degraded. To reduce the influence of noise, various methods such as feature normalization or feature enhancement are proposed but a single method cannot reduce all types of the influence of noise. In this paper, we aim at noise robust recognition to combine those methods. SPLICE (Stereo-Piecewise Linear Compensation for Environments) has the characteristics to accept any type of features as its input. So, we investigate a good combination of the existing methods and SPLICE to maximize the performance and the robustness. In English connected digit recognition experiments performed on the Auroral-2 database, the combination of AFE, SPLICE and HEQ in this order showed the highest performance and robustness.
机译:近年来,存在许多使用语音输入来操作移动终端和力导航系统的情况,但是在真实环境中语音输入中混入了各种噪声,并且在干净的环境中构造了该噪声。如果仅使用声学模型,则会大大降低识别率,因此提出了多种方法,如特征量归一化和特征增强,以消除语音特征量中的噪声影响。但是,很难用一种方法来消除所有的影响,因此,本文旨在通过结合这些方法来实现鲁棒的语音识别,SPLICE(Stereo-Piecewise LInear环境补偿)是可选的。它具有很高的通用性,可以处理输入的特征量,因此,我们考虑了现有方法和SPLICE的结合,其中每种方法的特征都能有效发挥作用。使用Aurora-2数据库的英语连续数在语音识别任务中,应用AFE(高级前端),SPLICE和HEQ(直方图均等化)的功能在任何环境下均表现出出色的性能。%最近,语音通常被用作输入形式对于移动终端或汽车导航系统,然而,在实际环境中录制的语音经常包含各种噪声,因此,自动语音识别系统的性能会大大降低,为减少噪声的影响,可以使用多种方法来降低噪声的影响。提出了特征归一化或特征增强的方法,但是一种方法不能减少所有类型的噪声影响。噪声鲁棒识别将这些方法结合在一起.SPLICE(环境立体声线性补偿)具有接受任何类型的特征作为其输入的特征,因此,我们研究了现有方法与SPLICE的良好结合以最大化性能和在Auroral-2数据库上进行的英语关联数字识别实验中,按顺序排列的AFE,SPLICE和HEQ组合显示出最高的性能和鲁棒性。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号