...
首页> 外文期刊>電子情報通信学会技術研究報告. 音声. Speech >可変長サブワードHMMに基づく未知語処理を導入した音声認識
【24h】

可変長サブワードHMMに基づく未知語処理を導入した音声認識

机译:基于变长子词HMM的未知词处理语音识别

获取原文
获取原文并翻译 | 示例
   

获取外文期刊封面封底 >>

       

摘要

一般に,大語彙連続音声認識では,認識装置に登録可能な語彙のサイズに制限があるため,語彙に登録されていない単語(未知語)は認識できないという問題がある.そこで本稿では,任意の長さのサブワードの連接からなるカナ文字列によってあらゆるパターンの未知語を表現し,認識結果を出力する手法を提案する.未知語を構成する可変長サブワード系列の出力確率は.一般的な長さ1のシンボルを出力するHMMを拡張し,最尤推定によって学習する.また,登録するサブワードの種類を削減するために,MDL規準によるサブワードの選択と出力確率の再推定を行う.認識時には,登録語彙によって構築した言語モデルと未知語用HMMを組み合わせ,未知語を含む音声区間をカナ文字列で出力する.自然ドキュメンタリー番組の音声認識突険の結果,未知譜を含む発話の単語誤り率は26.7%から18.4%に改善した.
机译:通常,大词汇量连续语音识别存在以下问题:由于可以在识别装置中注册的词汇量受到限制,因此无法识别未登记在词汇量中的单词(未知单词)。因此,在本文中,我们提出了一种由假名字符串表示所有模式的未知词的方法,该假名字符串由任意长度的子词的级联组成,并输出识别结果。组成未知单词的可变长度子单词系列的输出概率为。扩展输出长度为1的通用符号的HMM,并通过最大概率估计来学习。另外,为了减少要注册的子字的类型,选择子字并根据MDL标准重新估计输出概率。在识别时,将由注册词汇构建的语言模型与HMM结合在一起用于未知单词,并将包括未知单词的音频部分作为假名字符串输出。由于自然纪录片节目的语音识别冲动,包括未知分数在内的发声的单词错误率从26.7%提高到18.4%。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号