...
首页> 外文期刊>電子情報通信学会技術研究報告. 音声. Speech >N-best線形辞書探索と1-best近似木構造辞書探索の併用による大語彙連続音声認識
【24h】

N-best線形辞書探索と1-best近似木構造辞書探索の併用による大語彙連続音声認識

机译:结合使用N最佳线性字典搜索和1最佳近似树形结构字典搜索进行大词汇量连续语音识别

获取原文
获取原文并翻译 | 示例

摘要

HMMに基づく大語彙連続音声認識システムでは,語彙数の増加に伴い認識時間が増加する。 そこでサブワード単位でプレフィクスを単語間で共有した木構造化辞書を用いることで状態数を削減する。 また認識過程において音声の各時刻における部分文仮説に接続しうる単語を次々とつないでいくと仮説数が急速に増大するため,単語境界や尤度の単語履歴依存性に対して近似手法を用いる。 まず,木構造辞書とバイグラムを用いた認識手法における単語履歴依存性の近似手法,および線形辞書を用いた認識手法について比較検討を行った。 1-best近似木構造辞書探索は効率が良いが探索仮定で最適な解が失われる可能性が高いこと,線形辞書に関しては最適な解は求められるが効率が悪い。 これらを踏まえ,木構造辞書を用いた1-best近似探索と,一部の単語を動的に線形に展開して探索する方法とを併用する手法を提案する。この手法を読み上げ音声およびニュース音声において実験的に評価した。その結果,全2万単語のうち250単語について線形辞書に動的に展開することによって,読み上げ音声では正解精度約5%および正解率約3%,ニュース音声では正解精度約2%,正解率約3%の性能の向上を得ることができた。
机译:在基于HMM的大词汇量连续语音识别系统中,识别时间随着词汇量的增加而增加。因此,通过使用树结构的字典来减少状态数,在字典中,子词单元中的词之间共享前缀。另外,由于在识别过程中当在语音的每个时间可以被连接到部分句子假设的词被一个接一个地连接时,假设的数量迅速增加,因此近似方法用于词边界和似然性的词历史依赖性。 ..首先,我们比较并研究了在使用树结构字典和bigram的识别方法中以及在使用线性字典的识别方法中的单词历史相关性近似方法。 1最佳近似树结构字典搜索是有效的,但是很有可能在搜索假设下失去最优解,并且线性字典需要最优解,但是效率低下。基于这些,我们提出了一种既使用1-最佳近似搜索(使用树结构字典)的方法,又使用动态扩展和线性搜索某些单词的方法。该方法已在朗读音频和新闻音频中进行了实验评估。结果,通过将所有20,000个单词中的250个单词动态扩展到线性词典中,朗读语音的正确答案准确性约为5%,正确答案率约为3%,新闻语音的正确答案准确性约为2%,正确答案率约为2%。我们能够将性能提高3%。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号