首页> 外文期刊>電子情報通信学会技術研究報告 >文脈類似度と認識信頼度に基づく音声認識辞書の自動語彙適応
【24h】

文脈類似度と認識信頼度に基づく音声認識辞書の自動語彙適応

机译:基于上下文相似度和识别可靠性的语音识别词典自动词汇适配

获取原文
获取原文并翻译 | 示例
           

摘要

Out-Of-Vocabulary utterances are an unavoidable problem in speech recognition systems. And therefore, automatic vocabulary adaptation methods, which detect OOV words from relevant documents and register them with proper probability is an important technique. To improve recognition accuracy of OOV words, our method selects only relevant OOV words with target spoken documents, and prevents recognition error caused by irrelevant OOV words. We use semantic and acoustic similarity between each OOV word and spoken documents to select relevant OOV words. Furthermore, we propose proper probability estimation method for each OOV word using class language models and semantic similarity. Experimental shows that our method improves OOV word selection accuracy, and OOV word recognition accuracy about 5% in F-measure.%音声認識において,認識辞書にない単語(未知語)が発話されると誤認識を起こすという未知語問題は,重要な課題の一つである.特に音声認識の応用分野拡大に伴い,専門用語などが多く話されるようになり,対象音声データに必要な未知語を自動で登録する技術の重要性が高まっている.しかし,あらゆる未知語を認識辞書に登録すれば,対象音声データで発話されない単語が湧き出し誤りの原因となってしまう.特に話し言葉音声認識においては,冗長な単語エントリによる誤認識の影響が大きくなる.本稿では,認識辞書にない未知語を関連文書から自動抽出して登録する場合において,対象音声データで発話される未知語のみを選出することで,登録した単語による湧き出し誤りを抑えて高精度に認識する手法を提案する.未知語選出には,未知語と対象音声データの文脈的な適合度を表す文脈類似度と,音響的な適合度を表す認識信頼度を用いる.そして,両者の特徴量を融合し,必要な未知語を効果的に選出する.また,クラス言語モデルの枠組みと文脈類似度を利用し,登録する未知語に対して効果的に確率推定を行う.我々は電話会話音声を用いて,未知語選出精度,及び未知語認識精度の評価を行つた.その結果,未知語選出精度を従来手法に比べて大きく改善することができ,また未知語認識精度をF値で約5%改善した.
机译:词汇外语音是语音识别系统中不可避免的问题,因此,自动词汇自适应方法能够从相关文档中检测OOV单词并以适当的概率进行注册是一项重要技术。该方法只选择与目标语音文档相关的OOV单词,并防止由于不相关的OOV单词而引起的识别错误。我们使用每个OOV单词与语音文档之间的语义和声学相似性来选择相关的OOV单词。利用类语言模型和语义相似度对OOV单词进行了实验,实验表明,该方法提高了OOV单词选择的准确性,F测度的OOV单词识别精度约为5%。%在语音识别中,发出不在识别词典中的单词(未知单词)。重要的问题之一是使用时会引起错误识别的未知词问题,尤其是随着语音识别应用领域的扩大,人们说出许多技术术语,这对于目标语音数据是必不可少的。自动注册未知单词的技术变得越来越重要,但是如果所有未知单词都注册在识别字典中,则目标语音数据中未说出的单词可能会导致错误。尤其是在语音语音识别中,由于多余单词的输入而导致的错误识别的影响变大,因此,当从相关文档中自动提取并注册识别词典中没有的未知单词时,就会在目标语音数据中朗读。我们提出了一种仅通过选择未知词来抑制注册词产生的错误的高精度识别方法,在未知词选择中,表达了未知词与目标语音数据之间的上下文匹配程度。利用表示声音匹配的上下文相似度和识别可靠性,结合两者的特征,有效地选择所需的未知词,并采用类语言模型的框架和上下文相似度。有效地对未登录单词进行概率估计,并通过电话交谈语音对未知单词选择精度和未知单词识别精度进行了评价,结果进行了未知单词选择。与传统方法相比,该方法的准确性得到了显着提高,F值中未知单词识别的准确性提高了约5%。

著录项

  • 来源
    《電子情報通信学会技術研究報告》 |2012年第369期|1-6|共6页
  • 作者单位

    日本電信電話株式会社 NTTメディアインテリジェンス研究所 〒239-0847 神奈川県横須賀巿光の丘1-1;

    日本電信電話株式会社 NTTメディアインテリジェンス研究所 〒239-0847 神奈川県横須賀巿光の丘1-1;

    日本電信電話株式会社 NTTコミュニケーション科学基礎研究所 〒619-0237 京都府相楽郡精華町光台2-4;

    日本電信電話株式会社 NTTメディアインテリジェンス研究所 〒239-0847 神奈川県横須賀巿光の丘1-1;

    日本電信電話株式会社 NTTメディアインテリジェンス研究所 〒239-0847 神奈川県横須賀巿光の丘1-1;

    日本電信電話株式会社 NTTメディアインテリジェンス研究所 〒239-0847 神奈川県横須賀巿光の丘1-1;

  • 收录信息
  • 原文格式 PDF
  • 正文语种 jpn
  • 中图分类
  • 关键词

    音声認識; 未知語; 言語モデル; 語彙適応; 文脈類似度; 認識信頼度;

    机译:语音识别;未知词;语言模型;词汇适应;上下文相似度;识别可靠性;

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号