日本語話し言葉音声認識における複数言語モデリング技術併用時の性能調査

増村亮; 浅見太一; 大庭隆伸政瀧浩和阪内澄宇

首页> 外文期刊>電子情報通信学会技術研究報告. 音声. Speech >日本語話し言葉音声認識における複数言語モデリング技術併用時の性能調査

【24h】

日本語話し言葉音声認識における複数言語モデリング技術併用時の性能調査

机译：日本語話し言葉音声認識における複数言語モデリング技術併用時の性能調査

获取原文

获取原文并翻译 | 示例

掌桥外文数据库（机构版） >>

开具论文收录证明 >>

文献代查 >>

页面导航

摘要
著录项
相关主题

摘要

大語彙連続音声認識の枠組みで必要不可欠とされている言語モデルには，長らくブレークスルーがないというのが現状であろう．実用的な言語モデルとして広く利用されているn-gramモデルには，“モデル制約の居所性”，“モデルのタスク依存性”，“データスパースネス”といった問題があることは明白であるが，これらの問題を個々に解決するだけでは大幅な性能改善を得るに至っていない．この現状に対して我々は，大幅な性能改善を実現するために、は，これら複数の課題を同時に解決していくことが重要なのではないかと考えている．そこで本稿では，言語モデルの課題を全体的に解決できた場合に，どの程度の性能改善を実現できるのかを明らかにするために，これまで提案されてきた様々な言語モデリング技術を併用することを試みる．我々は現状の言語モデリング技術に対して，“1パスデコーディング”，“教師なし適応”，“リスコアリング”という3つの観点を設け，観点ごと，および全体で技術併用を行った場合の性能を調査する．

著录项

来源
《電子情報通信学会技術研究報告. 音声. Speech》 |2014年第151期|1-6|共6页
作者
増村亮; 浅見太一; 大庭隆伸政瀧浩和阪内澄宇;
展开▼
作者单位

日本電信電話株式会社NTTメディアインテリジェンス研究所;

展开▼
收录信息
原文格式 PDF
正文语种日语
中图分类电报、传真;
关键词
言語モデル; 1パスデコーディング; 教師なし適応; リスコアリング;

日本語話し言葉音声認識における複数言語モデリング技術併用時の性能調査

摘要

著录项

相关主题

期刊订阅