首页> 外文期刊>電子情報通信学会技術研究報告 >単語の文脈一貫性と音響尤度を用いた音声ドキュメント認識信頼度の推定
【24h】

単語の文脈一貫性と音響尤度を用いた音声ドキュメント認識信頼度の推定

机译:使用词上下文一致性和声学似然估计语音文档识别的可靠性

获取原文
获取原文并翻译 | 示例
       

摘要

本稿では,音声ドキュメントに対して音声認識信頼度を付与する方法を提案し,性能評価実験の結果を報告する.音声ドキュメントデータベースからの情報抽出アプリケーションの実用性向上のためには,「精度の低い音声ドキュメント認識結果をいかに棄却するか」という問題の解決が重要だと考えている.提案法では,単語/発話よりも広範囲の音声認識結果を見渡して得られる単語の文脈一貫性と,入力音声と音声認識結果の一致度合いを表す音響尤度を用いて音声ドキュメント認識信頼度を算出する.電話会話音声に対して提案法によって信頼度を算出し,間借により音声ドキュメント単位での棄却を行うことで.受理された音声ドキュメントの平均文字正解率が79.56%から84.18%に向上,標準偏差が7.51から4.51に減少し,提案法により精度の高い音声ドキュメント認識結果を選択的に抽出できることを確認した.%This paper presents a confidence estimation method for spoken document verification. Rejection of spoken documents with poor transcripts is an important issue for the information retrieval applications utilizing spoken document database. The proposed confidence estimation method uses acoustic likelihood and word contextual coherence obtained from longer range of recognition result than word or utterance. We evaluated spoken document rejection performance on phone call speech. The results show that our spoken document confidence score can selectively extract well recognized transcripts of spoken documents. By the spoken document rejection, the mean of character correctness of accepted documents was improved from 79.56% to 84.18%, and the standard deviation was reduced from 7.51 to 4.51.
机译:在本文中,我们提出了一种在语音文档中增加语音识别可靠性的方法,并报告了性能评估实验的结果。为了提高应用程序从语音文档数据库中提取信息的实用性,重要的是解决“如何拒绝语音文档识别结果的准确性较低”的问题。在所提出的方法中,语音文件识别可靠性是通过使用单词上下文一致性来计算的,该上下文上下文一致性是通过查看比单词/发音更广泛的语音识别结果以及表示输入语音与语音识别结果之间匹配程度的声学似然性而得出的。做。通过所提出的方法计算电话交谈语音的可靠性,并通过借阅拒绝每个语音文档的可靠性。接受语音文档的平均字符正确率从79.56%提高到84.18%,标准差从7.51降低到4.51。确认可以将其提取。本文提出了一种用于语音文档验证的置信度估计方法,对于成绩单质量较差的语音文档的拒绝是使用语音文档数据库进行信息检索应用的重要问题,该建议的置信度估计方法利用了声音似然性和从较长距离获得的单词上下文相关性我们通过电话语音评估了语音文档拒绝性能,结果表明我们的语音文档置信度得分可以有选择地提取语音文档中公认的笔录。接受文件的数量从79.56%提高到84.18%,标准差从7.51降低到4.51。

著录项

  • 来源
    《電子情報通信学会技術研究報告》 |2010年第143期|p.43-48|共6页
  • 作者单位

    日本電信電話株式会社;

    NTTサイバースペース研究所 〒239-0847神奈川県境須賀市光の丘1-1;

    日本電信電話株式会社;

    NTTサイバースペース研究所 〒239-0847神奈川県境須賀市光の丘1-1;

    日本電信電話株式会社;

    NTTサイバースペース研究所 〒239-0847神奈川県境須賀市光の丘1-1;

    日本電信電話株式会社;

    NTTサイバースペース研究所 〒239-0847神奈川県境須賀市光の丘1-1;

    日本電信電話株式会社;

    NTTサイバースペース研究所 〒239-0847神奈川県境須賀市光の丘1-1;

  • 收录信息
  • 原文格式 PDF
  • 正文语种 jpn
  • 中图分类
  • 关键词

    音声認識; 信頼度; 音声ドキュメント; 文脈一貫性; 音響尤度;

    机译:语音识别;置信度;语音文档;语境一致性;声音似然;
  • 入库时间 2022-08-18 00:33:32

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号