音声·非音声の信頼度を利用した雑音に頑健な音声認識デコーダの検討

大西翼; 岩野公司; 古井貞煕

首页> 外文期刊>電子情報通信学会技術研究報告. 音声. Speech >音声·非音声の信頼度を利用した雑音に頑健な音声認識デコーダの検討

【24h】

音声·非音声の信頼度を利用した雑音に頑健な音声認識デコーダの検討

机译：使用语音和非语音可靠性检查对噪声具有鲁棒性的语音识别解码器

获取原文

获取原文并翻译 | 示例

掌桥外文数据库（机构版） >>

开具论文收录证明 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

音声·非音声を判別するVoice Activity Detection（VAD）は，実環境で音声認識を行う上で基盤となる技術である．従来のフロントエンドでVADを行う音声認識手法とは異なるアプローチとして，音声·非音声の信頼度を利用して仮説スコアを調整する音声認識手法を提案する．また信頼度を高精度に計算するため音声·非音声のGMMを入力された発話·環境にオンラインで適応する手法を提案する．さらに適応データの信頼度に応じて更新するGMM のパラメータを重み付けして頑健な教師なし適応を行う手法，GMMから計算された統計量をキャッシュすることで，適応に関する計算量を削減する手法を提案する．Drivers’ Japanese Speech Corpus in a Car Environment（DJSC）を用いた実験で，従来のフロントエンドでVADを行う認識手法と比べて，大幅な認識精度の向上が得られることを確認した．さらに，信頼度に応じてGMMの更新パラメータを重み付けすることで，教師なし適応を行うためのパラメータの変動に対する頑健性を向上できること，統計量をキャッシュすることで，適応に関する計算量を大幅に削減できることを確認した．これらの結果から，本論文で提案する音声·非音声の信頼度を利用する適応的な音声認識手法を用いることで，雑音環境下における認識精度の大幅な改善を少ない計算量で実現できることを確認した．

机译：区分语音和非语音的语音活动检测（VAD）是在真实环境中进行语音识别的基本技术。作为与在前端执行VAD的常规语音识别方法不同的方法，我们提出了一种语音识别方法，该方法使用语音和非语音的可靠性来调整假设分数。我们还提出了一种将语音和非语音GMM在线适应输入语音和环境的方法，以高精度计算可靠性。此外，我们提出了一种方法，该方法通过根据自适应数据的可靠性对要更新的GMM参数进行加权来执行鲁棒的无监督自适应，以及通过缓存从GMM计算出的统计信息来减少与自适应相关的计算量的方法。去做。在使用驾驶员在汽车环境中的日语语音语料库（DJSC）的实验中，证实了与在前端执行VAD的常规识别方法相比，可以显着提高识别精度。此外，通过根据可靠性对GMM的更新参数进行加权，可以提高针对无监督自适应的参数波动的鲁棒性，并且通过缓存统计信息，可以大大减少与自适应相关的计算量。我确认可以做到。从这些结果可以证实，通过使用利用本文中提出的语音和非语音的可靠性的自适应语音识别方法，可以通过少量的计算就可以在嘈杂的环境中实现识别精度的显着提高。做到了。

著录项

来源
《電子情報通信学会技術研究報告. 音声. Speech》 |2010年第81期|共6页
作者
大西翼; 岩野公司; 古井貞煕;
展开▼
作者单位

展开▼
收录信息
原文格式 PDF
正文语种 jpn
中图分类电报、传真;
关键词
音声認識; 音声非音声判別; GMM適応;

机译：音声认识;音声非音声判别;GMM适応;

相似文献

外文文献
中文文献
专利

1. 音声·非音声の信頼度を利用した雑音に頑健な音声認識デコーダの検討 [J] . 大西翼, 岩野公司, 古井貞煕電子情報通信学会技術研究報告. 音声. Speech . 2010,第81期

机译：使用语音和非语音可靠性检查对噪声具有鲁棒性的语音识别解码器
2. 音声・非音声の信頼度を利用した雑音に頑健な音声認識デコーダの検討 [J] . 大西翼, 岩野公司, 古井貞照電子情報通信学会技術研究報告 . 2010,第81期

机译：使用语音和非语音可靠性的抗噪鲁棒语音识别解码器
3. 音声·非音声の信頼度を利用した雑音に頑健な音声認識デコーダの検討 [J] . 大西翼, 岩野公司, 古井貞煕電子情報通信学会技術研究報告. 音声. Speech . 2010,第81期

机译：使用语音和非语音可靠性检查全新语音识别解码器
4. 錯聴を利用した音声認識のためのデータ拡張：時間反転音声に基づく検討 [C] . 芦原孝典, 田中智大, 森谷崇史, 日本音響学会;日本音響学会研究発表会 . 2020

机译：语音识别的数据扩展使用听力：时间逆转声音的研究
5. 日本人の自然発話を対象とした音声感情認識 -感情音声の訓練サンプル数最適化を用いて- [D] . 市川朋輝 2020

机译：日本自然语音的语音情感识别-利用情感语音训练样本的优化-
6. 音声区間検出を用いた雑音環境下で頑健な単語音声認識に関する研究 [O] . 有冨智志 2016

机译：语音区间检测在嘈杂环境中的健壮词语音识别研究

音声·非音声の信頼度を利用した雑音に頑健な音声認識デコーダの検討

摘要

著录项

相似文献

相关主题

期刊订阅