...
【24h】

音声対話システムのためのN-gramに基づくキーワードからの文生成

机译:从基于n克的基于n-gram的关键字进行语音交互系统

获取原文
获取原文并翻译 | 示例
   

获取外文期刊封面封底 >>

       

摘要

質問と応答の対応を文対文で統計的にモデル化する音声対話システムにおいては,学習のために大量の質問文と応答文のペアが必要である.しかし,質問文データを用意するためにユーザの実際の発話を収集·書き起こしするのはコストが高く,人手で可能な質問文のバリエーションを考えて収集するのも経験と労力を要する.本研究では,この統計的応答選択システムのための質問文をキーワードから自動生成する手法を提案する.文に含まれるべきキーワードが複数与えられたとき,それらのキーワード間の区間および両端に出現しうる尤度上位の単語列をN-gram 確率に基づいて探索し,区間ごとに得られた単語列を結合·再評価を行い,最終的にデータベースに与える文を選び出す.音声情報案内タスクの音声対話システムにおいて実験した結果,入力に音声認識結果を用いるときに,応答をキーワードと直接対応付ける場合に59.6%の応答正解率であったのが,そのキーワードから生成した文と対応付ける本手法を用いることで65.1%に改善された.さらに,タスク非依存の一般的なN-gramを使用した場合も,同様に性能の改善が見られた.生成する文数や,単語列探索時のビーム幅などの様々なパラメータによる性能の変化についても報告する.
机译:在一个语音对话系统中,在统计上模拟问题和响应的响应,统计上的响应,学习需要一对大量问题和响应判决。然而,收集和写入用户的实际话语是成本效益以准备问题数据数据,并考虑手持问题句子的变化并收集经验和努力。在本研究中,我们提出了一种自动生成来自关键字的统计响应选择系统的问题句子的方法。当句子中包含多个关键字多次时,基于n-gram概率搜索可以在这些关键字和两端之间的部分上出现的字符串,并且每个次数间隔组合并重新评估,最后选择最终将其提供给数据库的句子。由于音频信息引导任务的音频对话系统中的实验结果,当使用语音识别结果时,当响应直接使用关键字使用时,从关键字生成的语句是从其改进的关键字生成的语句通过使用此方法相关联65.1%。此外,即使使用任务无关的一般N-GRAM,也类似地看到了性能的提高。我们还通过各种参数报告生成的语句数量和性能变化,例如单词序列搜索时的波束宽度。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号