...
首页> 外文期刊>電子情報通信学会技術研究報告. 音声. Speech >講演音声認識のための音響·言語モデルの検討
【24h】

講演音声認識のための音響·言語モデルの検討

机译:講演音声認識のための音響·言語モデルの検討

获取原文
获取原文并翻译 | 示例
           

摘要

現在,音声認識は不特定話者大語彙連続音声認識の枠組みにおいて,新聞記事などの読み上げ音声で実用化レベルまで精度が向上している.しかし,講演音声などのいわゆる話し言葉からなる自然発話は,認識を困難にさせる要素が多数存在し,まだまだ実用化の域には達していない.本研究の目的は,自然発話の認識が困難な要因について,音響的な観点と言語的な観点に着目し,自然発話用の音響モデルと言語モデルを作成することである.音響モデルに関しては,音声学習データ選択を行い,言語モデルに関しては,発音変形依存の形態素で学習することで高精度なモデルを作成した.適応を行わない認識率では31.4%のWERを得た.また,第2パス言語モデルに様々なカットオフや4gramを導入した.4gramによる効果は無く,カットオフの効果は0.6%であった.更に,音響モデルを話者適応し,3.2%の改善を得た.
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号