...
首页> 外文期刊>電子情報通信学会技術研究報告. 音声. Speech >日本語話し言葉音声認識における複数言語モデリング技術併用時の性能調査
【24h】

日本語話し言葉音声認識における複数言語モデリング技術併用時の性能調査

机译:日本語話し言葉音声認識における複数言語モデリング技術併用時の性能調査

获取原文
获取原文并翻译 | 示例
           

摘要

大語彙連続音声認識の枠組みで必要不可欠とされている言語モデルには,長らくブレークスルーがないというのが現状であろう.実用的な言語モデルとして広く利用されているn-gramモデルには,“モデル制約の居所性”,“モデルのタスク依存性”,“データスパースネス”といった問題があることは明白であるが,これらの問題を個々に解決するだけでは大幅な性能改善を得るに至っていない.この現状に対して我々は,大幅な性能改善を実現するために、は,これら複数の課題を同時に解決していくことが重要なのではないかと考えている.そこで本稿では,言語モデルの課題を全体的に解決できた場合に,どの程度の性能改善を実現できるのかを明らかにするために,これまで提案されてきた様々な言語モデリング技術を併用することを試みる.我々は現状の言語モデリング技術に対して,“1パスデコーディング”,“教師なし適応”,“リスコアリング”という3つの観点を設け,観点ごと,および全体で技術併用を行った場合の性能を調査する.

著录项

获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号