雑音抑圧とSPLICEを組み合わせた雑音環境下音声認識

甲斐　常伸; 鈴木　雅之; 峯松　信明; 広瀬　啓吉

首页> 外文期刊>電子情報通信学会技術研究報告 >雑音抑圧とSPLICEを組み合わせた雑音環境下音声認識

【24h】

雑音抑圧とSPLICEを組み合わせた雑音環境下音声認識

机译：噪声抑制和SPLICE相结合的嘈杂环境下的语音识别

获取原文

获取原文并翻译 | 示例

掌桥外文数据库（机构版） >>

开具论文收录证明 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

近年携帯端末や力ーナビゲーシヨンシステムなどを，音声入力を用いて操作する場面が多くなつている.しかし実環境下での音声入力は様々な雑音が混入してしまい，クリーン環境で構築された音響モデルのみが使われていた場合，認識率の大きな低下を招くことになる.音声の特徴量から雑音の影響を取リ除く手法は特徴量正規化，特徴強調など様々な手法が提案されているが，単一の手法で影響をすべて取リ除くことは難しい.そこで本稿ではこれらの手法を組み合わせてよリ雑音に頑健な音声認識を目指す.SPLICE(Stereo-Piecewise LInear Compensation for Environments)は任意の特徴量を入力として扱える高い汎用性を持っている.そこで既存手法とSPLICEの組み合わせの中で，各手法の特性が有効に働くを組み合わせを検討する.Aurora-2データベースを用いた英語連続数字音声認識のタスクにおいて，AFE (Advanced Front-End), SPLICE, HEQ (Histogram EQualization)を順番に適用した特徴量がどの環境においても優れた性能を示した.%Recently, voices are often used as input modality to mobile terminals or car navigation systems. However, the voices recorded in actual environment frequently contain various kinds of noise and, because of that, the performance of automatic speech recognition systems is largely degraded. To reduce the influence of noise, various methods such as feature normalization or feature enhancement are proposed but a single method cannot reduce all types of the influence of noise. In this paper, we aim at noise robust recognition to combine those methods. SPLICE (Stereo-Piecewise Linear Compensation for Environments) has the characteristics to accept any type of features as its input. So, we investigate a good combination of the existing methods and SPLICE to maximize the performance and the robustness. In English connected digit recognition experiments performed on the Auroral-2 database, the combination of AFE, SPLICE and HEQ in this order showed the highest performance and robustness.

机译：近年来，存在许多使用语音输入来操作移动终端和力导航系统的情况，但是在真实环境中语音输入中混入了各种噪声，并且在干净的环境中构造了该噪声。如果仅使用声学模型，则会大大降低识别率，因此提出了多种方法，如特征量归一化和特征增强，以消除语音特征量中的噪声影响。但是，很难用一种方法来消除所有的影响，因此，本文旨在通过结合这些方法来实现鲁棒的语音识别，SPLICE（Stereo-Piecewise LInear环境补偿）是可选的。它具有很高的通用性，可以处理输入的特征量，因此，我们考虑了现有方法和SPLICE的结合，其中每种方法的特征都能有效发挥作用。使用Aurora-2数据库的英语连续数在语音识别任务中，应用AFE（高级前端），SPLICE和HEQ（直方图均等化）的功能在任何环境下均表现出出色的性能。％最近，语音通常被用作输入形式对于移动终端或汽车导航系统，然而，在实际环境中录制的语音经常包含各种噪声，因此，自动语音识别系统的性能会大大降低，为减少噪声的影响，可以使用多种方法来降低噪声的影响。提出了特征归一化或特征增强的方法，但是一种方法不能减少所有类型的噪声影响。噪声鲁棒识别将这些方法结合在一起.SPLICE（环境立体声线性补偿）具有接受任何类型的特征作为其输入的特征，因此，我们研究了现有方法与SPLICE的良好结合以最大化性能和在Auroral-2数据库上进行的英语关联数字识别实验中，按顺序排列的AFE，SPLICE和HEQ组合显示出最高的性能和鲁棒性。

著录项

来源
《電子情報通信学会技術研究報告》 |2012年第47期|161-166|共6页
作者
甲斐　常伸; 鈴木　雅之; 峯松　信明; 広瀬　啓吉;
展开▼
作者单位

東京大学　〒　113-8656　東京都文京区本郷　7-3-1;

東京大学　〒　113-8656　東京都文京区本郷　7-3-1;

東京大学　〒　113-8656　東京都文京区本郷　7-3-1;

東京大学　〒　113-8656　東京都文京区本郷　7-3-1;

展开▼
收录信息
原文格式 PDF
正文语种 jpn
中图分类
关键词
雑音環境下音声認識; HEQ; AFE; SPLICE;

机译：雑音环境下音声认识;HEQ;AFE;SPLICE;
入库时间 2022-08-18 00:29:08

相似文献

外文文献
中文文献
专利

1. 雑音抑圧とSPLICEを組み合わせた雑音環境下音声認識 [J] . 甲斐　常伸, 鈴木　雅之, 峯松　信明, 電子情報通信学会技術研究報告 . 2012,第48期

机译：噪声抑制和SPLICE相结合的嘈杂环境下的语音识别
2. 雑音抑圧とSPLICEを組み合わせた雑音環境下音声認識 [J] . 甲斐　常伸, 鈴木　雅之, 峯松　信明, 電子情報通信学会技術研究報告 . 2012,第49期

机译：噪声抑制和SPLICE相结合的嘈杂环境下的语音识别
3. 雑音抑圧とSPLICEを組み合わせた雑音環境下音声認識 [J] . 甲斐常伸, 鈴木雅之, 峯松信明, 電子情報通信学会技術研究報告. 信号処理. Signal Processing . 2012,第48期

机译：结合了噪音抑制和SPLICE的嘈杂环境中的语音识别
4. 雑音環境下のための音声案内システム: 周囲の雑音レベルに合わせた音量の自動調整 [C] . 鈴木光, 吉永眞宏, 小暮計貴, 情報処理学会全国大会;情報処理学会 . 2014

机译：嘈杂环境的语音指导系统：根据环境噪声水平自动调节音量
5. 身体運動と呼吸負荷を組み合わせたトレーニング時の呼吸循環応答と生理学的効果の特徴 [D] . 木戸, 聡史 2019

机译：运动与呼吸负荷训练相结合时的心肺反应特征和生理效应
6. 逐次雑音推定を用いた雑音環境下での音声認識 [O] . 澤井一貴 2016

机译：使用连续噪声估计的嘈杂环境中的语音识别

雑音抑圧とSPLICEを組み合わせた雑音環境下音声認識

摘要

著录项

相似文献

相关主题

期刊订阅