首页> 外文期刊>電子情報通信学会技術研究報告 >複数の言語情報を用いたCRFによる音声認識誤りの検出
【24h】

複数の言語情報を用いたCRFによる音声認識誤りの検出

机译:CRF使用多种语言信息进行语音识别错误检测

获取原文
获取原文并翻译 | 示例
       

摘要

Recently, a learning method of n-gram showing error tendency is focused on. In this method, it is difficult to learn low frequency n-gram appropriately. On the other hand, error detection method for content words was proposed that uses semantic similarity in neighboring recognition result. In this paper, we especially examine semantic score and propose a method for speech recognition error detection that integrates these information. As a result of evaluation experiment using the Corpus of Spontaneous Japanese, error detecting performance was improved for content words in particular. Moreover, semantic score is effectively used by combining with term-weight.%近年,音声認識誤りの検出訂正には,誤り傾向を示すn-gramを学習する「誤り傾向学習」という手法が注目されている.この手法には,出現頻度の低いn-gramに対しては適切に学習を行うことができないという問題があると考えられる.また,周辺の単語との意味的類似度をスコア化し,内容語の認識誤りを検出する手法が提案されている.本稿では,特に後者の意味スコアについて検討し,これらの情報を統合した音声認識誤りの検出法を提案する.日本語話し言葉コーパスによる評価実験の結果,「誤り傾向学習」で用いる素性に意味スコアを追加することで,特に内容諸において誤り検出性能の改善が得られた.また,単語重みと組み合わせることで意味スコアを有効に活用することができた.
机译:近年来,人们集中研究了一种表示错误趋势的n-gram的学习方法,这种方法很难适当地学习低频n-gram。另一方面,提出了一种利用语义相似度的内容词错误检测方法。在本文中,我们特别研究了语义分数,并提出了一种将这些信息整合在一起的语音识别错误检测方法。作为使用自发日语语料库的评估实验的结果,特别是对于内容单词的错误检测性能得到了改善。而且,近年来,作为检测和校正语音识别错误的方法,学习表示错误趋势的n-gram的称为“错误趋势学习”的方法引起了关注。该方法可能存在无法正确学习出现频率低的n-gram的问题。另外,已经提出了一种方法,其中对与周围单词的语义相似性进行评分并且检测内容单词的识别错误。在本文中,我们特别考虑了后者的语义分数,并提出了一种整合这些信息的语音识别错误检测方法。作为使用日语语料库的评估实验的结果,通过将语义评分添加到“错误倾向学习”中使用的功能中,特别是在各种内容中,错误检测性能得到了改善。此外,通过结合单词权重可以有效地使用语义分数。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号