講演音声認識のための音響·言語モデルの検討

堤怜介; 加藤正治; 小坂哲夫好田正紀Ryousuke TsutsumiMasaharu KatohTetsuo KosakaMasaki Kohda

首页> 外文期刊>電子情報通信学会技術研究報告. 音声. Speech >講演音声認識のための音響·言語モデルの検討

【24h】

講演音声認識のための音響·言語モデルの検討

机译：講演音声認識のための音響·言語モデルの検討

获取原文

获取原文并翻译 | 示例

掌桥外文数据库（机构版） >>

开具论文收录证明 >>

文献代查 >>

页面导航

摘要
著录项
相关主题

摘要

現在，音声認識は不特定話者大語彙連続音声認識の枠組みにおいて，新聞記事などの読み上げ音声で実用化レベルまで精度が向上している．しかし，講演音声などのいわゆる話し言葉からなる自然発話は，認識を困難にさせる要素が多数存在し，まだまだ実用化の域には達していない．本研究の目的は，自然発話の認識が困難な要因について，音響的な観点と言語的な観点に着目し，自然発話用の音響モデルと言語モデルを作成することである．音響モデルに関しては，音声学習データ選択を行い，言語モデルに関しては，発音変形依存の形態素で学習することで高精度なモデルを作成した．適応を行わない認識率では31.4％のWERを得た．また，第2パス言語モデルに様々なカットオフや4gramを導入した．4gramによる効果は無く，カットオフの効果は0.6％であった．更に，音響モデルを話者適応し，3.2％の改善を得た．

著录项

来源
《電子情報通信学会技術研究報告. 音声. Speech》 |2002年第529期|117-122|共6页
作者
堤怜介; 加藤正治; 小坂哲夫好田正紀Ryousuke TsutsumiMasaharu KatohTetsuo KosakaMasaki Kohda;
展开▼
作者单位

展开▼
收录信息
原文格式 PDF
正文语种日语
中图分类电报、传真;
关键词
講演音声; 音響モデル; 音声学習データ選択; 言語モデル; 発音変形依存; 話者適応; Lecture speech; Acoustic model; Speech training data selection; Linguistic model; Pronunciation variant dependency; Speaker adaptation;

講演音声認識のための音響·言語モデルの検討

摘要

著录项

相关主题

期刊订阅