首页> 外文期刊>電子情報通信学会論文誌 >音声理解を指向したペイズリスク最小化枠組みに基づく音声認識
【24h】

音声理解を指向したペイズリスク最小化枠組みに基づく音声認識

机译:基于暂停风险最小化框架的语音识别技术

获取原文
获取原文并翻译 | 示例
获取外文期刊封面目录资料

摘要

話し言葉の音声理解を指向した音声認識手法を提案する.音声理解の観点からは,従来の音声認識rnの評価尺度,すなわち,すべての語句の誤りを同等に扱って計数する尺度は適切でない.これは,発話中にはそrnの認識誤りが音声理解に及ぼす影響が大きい重要な語句と,そうでない語句が含まれるためである.このようなrn背景に基づき,本論文では,はじめに音声理解を困難にする単語の認識誤りを重要視する評価尺度である「重rnみ付き単語誤り率(WWER:Weighted Word Error Rate)」の提案を行う.その上で,重み付き単語誤り率のrn最小化を行う音声認識をペイズリスク最小化(MBR:Minimum Bayes-Risk)の枠組みに基づいて定式化する.rnCSJの学会講演からの重要文抽出及び自然言語で善かれたマニュアルの音声検索システムに提案手法を適用したrnところ,音声認識の精度(重み付き単語誤り率)の改善が得られ,それに伴い,音声認識の誤りによって生じたrn音声理解の精度低下のうちの約14%から17%を改善できた.
机译:我们提出一种语音识别方法,用于对口语的语音理解。从语音理解的角度来看,传统的语音识别评估标准rn,即平等对待所有单词错误并对其进行计数的标准是不合适的。这是因为在发声期间,包括了由于rn的识别错误而对语音理解有很大影响的重要单词和短语以及没有的重要单词和短语。基于这样的背景,本文首先提出“ WWER:加权词错误率”,这是一种评估量表,强调了使语音理解困难的词的识别错误。我做。然后,我们基于暂停风险最小化(MBR:Minimum Bayes-Risk)框架,制定将语音加权错误率rn最小化的语音识别。 rnCSJ从学术会议中提取了重要的句子,并将该方法应用于自然语言良好的手动语音检索系统中,从而提高了语音识别的准确性(加权词错误率),并进行了改进。由于识别错误,我们能够将语音理解的准确度降低约14%至17%。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号