首页> 外文期刊>電子情報通信学会技術研究報告 >音声対話システムのためのキーワードの共起制約に基づくスポッティングアルゴリズムの評価
【24h】

音声対話システムのためのキーワードの共起制約に基づくスポッティングアルゴリズムの評価

机译:基于关键词共现约束的语音对话点测算法评价

获取原文
获取原文并翻译 | 示例
       

摘要

質問応答型の音声対話システムにおいて,ユーザ発話中のキーワードに基づいて応答を選択する場合,入力音声全体をデコードするよりも重要語であるキーワードのみを抽出することで頑健な発話理解が期待できる.また,発話の意図は複数のキーワードの組み合わせで表わされるとすると,それをセット単位で抽出することが望ましい.本研究では,音声対話システムのための複数キーワードのスポッティングアルゴリズムについて,大語彙ガーベージモデルを用いて,探索中にキーワード間にセットの共起制約を直接適用するアルゴリズムを提案する.制約を探索中に動的に適用することで,効率よく制約を与えることができ,頑健なキーワードセットの抽出が可能になると期待できる.この手法を大語彙音声認識エンジンJulius の第1パスおよび第2パスの両方に実装した.認識実験により,スポッティングは従来のディクテーションを使用した手法に比べてキーワードの抽出性能が向上したことを確認した.また,探索中にキーワード制約を与えないスポッティングよりも制約を与えたスポッティングは相対で最大約12.5%キーワード抽出性能が向上した.本稿では,150 キーワードの小規模タスク,およびたけまるくんのタスクにおける評価結果について報告する.%Question-answering dialogue system often choose a response sentence based on recognized keywords in a user's utterance. In such case, a robust utterance understanding can be achieved by recognizing only the keywords, skipping irrelevant part of speech, rather than decoding the whole input speech. Also, since the intention of an utterance can be expressed as combination of keywords (keyword set) rather than a set of single keyword, it is desirable to extract the keywords as keyword sets. In this study, we propose an algorithm which directly applies the keyword set constraints by consulting their co-occurrences during search using a large vocabulary garbage model. By applying the constraints dynamically while search, it suppresses unnecessary hypotheses and thus expected to perform more efficiently and result in more robust intention detection. The proposed keyword-set spotting algorithm is implemented on large vocabulary continuous speech recognition decoder "Julius" fully on both passes. We evaluated the performance of the proposed method. It was confirmed that the recognition rate of keywords by spotting was superior to the dictation-based method. In addition, keyword spotting constrained by co-occurrences improved the keyword extraction rate by about 12.5 % relatively at the maximum. In this paper, we report the evaluation results in a small task of 150 keywords and the Takemaru task.
机译:在问答型语音对话系统中,当基于用户话语中的关键词选择响应时,期望可以通过仅提取重要关键词而不是解码整个输入语音来期望对话语有充分的理解。如果说的意图是通过多个关键词的组合来表达的,则期望以设定的单位来提取它。在本文中,我们提出了一种针对口语对话系统的多关键字发现算法,该算法使用大型词汇垃圾模型,并在搜索过程中直接在关键字之间应用集合共现约束。通过在搜索过程中动态应用约束,可以期望可以有效地应用约束,并且可以提取健壮的关键字集。我们在大型词汇语音识别引擎Julius的第一遍和第二遍都实现了这种方法。通过识别实验,证实了斑点识别比传统的使用听写的方法具有更好的关键词提取性能。此外,在搜索过程中,具有约束条件的发现相对于没有关键字约束的发现相比在关键词提取性能方面提高了约12.5%。在本文中,我们报告了150个关键字小型任务和Takemaru-kun任务的评估结果。 %问答对话系统通常根据用户话语中识别出的关键词来选择响应语句,在这种情况下,仅识别关键词,跳过不相关的语音部分而不是对整个输入语音进行解码就可以实现强大的话语理解另外,由于说出的意图可以表示为关键字(关键字集)的组合而不是单个关键字的集合,因此希望将关键字提取为关键字集。在本研究中,我们提出了一种直接应用的算法。关键字通过使用大型词汇垃圾模型在搜索过程中查询共现来设置约束条件。通过在搜索时动态应用约束条件,它可以抑制不必要的假设,从而有望更有效地执行并导致更强大的意图检测。在大型词汇连续语音识别解码器“ Julius”上完全实现了集点算法es。我们评估了该方法的性能。证实了通过斑点识别的关键字识别率要优于基于听写的方法;此外,由于同时出现而受到限制的关键字斑点化使关键字的提取率提高了约12.5%本文以150个关键字的小任务和Takemaru任务报告评估结果。

著录项

  • 来源
    《電子情報通信学会技術研究報告》 |2010年第357期|p.25-30|共6页
  • 作者单位

    名古屋工業大学大学院工学研究科創成シミュレーション工学専攻 〒466-8555愛知県名古屋市昭和区御器所町;

    名古屋工業大学大学院工学研究科創成シミュレーション工学専攻 〒466-8555愛知県名古屋市昭和区御器所町;

    名古屋工業大学大学院工学研究科創成シミュレーション工学専攻 〒466-8555愛知県名古屋市昭和区御器所町;

    名古屋工業大学大学院工学研究科創成シミュレーション工学専攻 〒466-8555愛知県名古屋市昭和区御器所町;

  • 收录信息
  • 原文格式 PDF
  • 正文语种 jpn
  • 中图分类
  • 关键词

    対話システム; キーワード; 共起制約; スポッティング; ガーベージモデル;

    机译:对话系统;关键字;共现约束;发现;垃圾模型;
  • 入库时间 2022-08-18 00:34:34

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号