...
首页> 外文期刊>電子情報通信学会技術研究報告. 音声. Speech >N-best線形辞書探索と1-best近似木構造辞書探索の併用による大語彙連続音声認識
【24h】

N-best線形辞書探索と1-best近似木構造辞書探索の併用による大語彙連続音声認識

机译:n最佳线性词典搜索和1 - 最近似树结构字典Search Condurate词汇连续语音识别

获取原文
获取原文并翻译 | 示例
           

摘要

HMMに基づく大語彙連続音声認識システムでは,語彙数の増加に伴い認識時間が増加する。 そこでサブワード単位でプレフィクスを単語間で共有した木構造化辞書を用いることで状態数を削減する。 また認識過程において音声の各時刻における部分文仮説に接続しうる単語を次々とつないでいくと仮説数が急速に増大するため,単語境界や尤度の単語履歴依存性に対して近似手法を用いる。 まず,木構造辞書とバイグラムを用いた認識手法における単語履歴依存性の近似手法,および線形辞書を用いた認識手法について比較検討を行った。 1-best近似木構造辞書探索は効率が良いが探索仮定で最適な解が失われる可能性が高いこと,線形辞書に関しては最適な解は求められるが効率が悪い。 これらを踏まえ,木構造辞書を用いた1-best近似探索と,一部の単語を動的に線形に展開して探索する方法とを併用する手法を提案する。この手法を読み上げ音声およびニュース音声において実験的に評価した。その結果,全2万単語のうち250単語について線形辞書に動的に展開することによって,読み上げ音声では正解精度約5%および正解率約3%,ニュース音声では正解精度約2%,正解率約3%の性能の向上を得ることができた。
机译:在基于HMM的大型词汇连续语音识别系统中,随着词汇量增加的识别时间增加。因此,通过使用树结构化词典共享子境部单元中的前缀来减少状态的数量。另外,由于当假设的数量快速增加,如果通过连接可以在识别过程中的每次语音中连接到部分句子假设的单词,可以快速增加假设的数量,则假设的数量快速增加。字边界或可能性的假设和似然词历史依赖的数量。首先,我们使用树形结构字典和Bygra将单词历史依赖性近似方法和识别方法使用线性字典进行比较。 1 - 最佳近似木结构词典搜索是高效,但最佳解决方案可能会在搜索假设中丢失,并且线性词典需要最佳解决方案,但效率差。基于这些,我们提出了一种使用树结构词典使用1-最近似搜索的方法和动态扩展和搜索单个单词的方法。这种方法在语音和新闻演讲中实验评估。结果,通过动态部署所有20,000个单词的250个单词的线性词典,正确的答案精度约为5%,正确的答案率约为3%,正确的答案精度约为2%,并且正确率是正确的大约2%。我能够提高3%的表现。

著录项

相似文献

  • 外文文献
  • 中文文献
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号