首页> 外文期刊>電子情報通信学会技術研究報告 >音声入力への応答タイミング決定のための強化学習の検討
【24h】

音声入力への応答タイミング決定のための強化学習の検討

机译:增强学习对语音输入响应时间决策的研究

获取原文
获取原文并翻译 | 示例
       

摘要

音声対話システムにおいて,ユーザの入力発話に対する応答の遅延を改善することは重要である.本研究では,ユーザ発話中に音声認識エンジンから得られる漸次的認識結果の利用を検討した.まず漸次的認識結果の信頼性を高めるためにサブワード語彙の利用を検討した.次に,誤認識を含む情報からユーザ発話内容を予測する問題を,逐次的に応答決定または待機を行う方策決定問題ととらえ,強化学習の適用を試みた.さらに,予測されたユーザ発話の終了に合わせてシステム発話を開始する手法を検討した.様々な苫声認識エラー率およびユーザ発話速度の条件でシミュレーションを行い,さらに音声認識と音声合成を用いた実験を行った結果,提案手法の有効性が示唆された.%In spoken dialog systems, it is important to reduce the delay of the response to the user's utterance. We investigated the use of incremental recognition results which can be obtained from speech recognition engine during the user's utterances. In order the system to respond correctly with incremental recognition results, the problem should be solved how to utilize the incremental results effectively, which are not enough reliable. We formulated this problem as a decision making task, in which the system makes choices iteratively either to answer using previous observations, or to wait until next observation. The reinforcement learning can be applied to this problem. Experimental results indicated that the users highly evaluated the system when it uses the estimation of completion time of user's utterance with the recognition results using sub-word vocabulary.
机译:在语音对话系统中,重要的是改善对用户输入话语的响应的延迟。在这项研究中,我们检查了用户话语期间从语音识别引擎获得的渐进识别结果的使用。首先,我们研究了使用子词词汇来提高逐步识别结果的可靠性。接下来,我们考虑从包括误识别在内的信息预测用户话语的内容的问题,该信息是作为顺序做出响应决策或待机的策略决策问题,并尝试应用强化学习。此外,我们研究了一种在预测的用户话语结束时启动系统话语的方法。通过在番茄语音识别错误率和用户语音率的各种条件下进行的仿真结果以及使用语音识别和语音合成的进一步实验,表明了该方法的有效性。 %在口语对话系统中,减少对用户话语响应的延迟很重要,我们研究了在用户话语期间可以从语音识别引擎获得的增量识别结果的使用,以便系统正确响应增量识别结果,应该解决该问题,即如何有效地利用增量结果,这是不够可靠的。我们将此问题表述为决策任务,在该任务中,系统会反复做出选择,以使用先前的观察结果进行回答,或者等待强化学习可以解决这个问题,实验结果表明,当用户使用子词词汇的识别结果对用户话语的完成时间进行估计时,用户对该系统进行了高度评价。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号