音声入力への応答タイミング決定のための強化学習の検討

盧　迪; 深山　覚; 西本　卓也; 嵯峨山茂樹

首页> 外文期刊>電子情報通信学会技術研究報告 >音声入力への応答タイミング決定のための強化学習の検討

【24h】

音声入力への応答タイミング決定のための強化学習の検討

机译：增强学习对语音输入响应时间决策的研究

获取原文

获取原文并翻译 | 示例

掌桥外文数据库（机构版） >>

开具论文收录证明 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

音声対話システムにおいて，ユーザの入力発話に対する応答の遅延を改善することは重要である．本研究では，ユーザ発話中に音声認識エンジンから得られる漸次的認識結果の利用を検討した．まず漸次的認識結果の信頼性を高めるためにサブワード語彙の利用を検討した．次に，誤認識を含む情報からユーザ発話内容を予測する問題を，逐次的に応答決定または待機を行う方策決定問題ととらえ，強化学習の適用を試みた．さらに，予測されたユーザ発話の終了に合わせてシステム発話を開始する手法を検討した．様々な苫声認識エラー率およびユーザ発話速度の条件でシミュレーションを行い，さらに音声認識と音声合成を用いた実験を行った結果，提案手法の有効性が示唆された．%In spoken dialog systems, it is important to reduce the delay of the response to the user's utterance. We investigated the use of incremental recognition results which can be obtained from speech recognition engine during the user's utterances. In order the system to respond correctly with incremental recognition results, the problem should be solved how to utilize the incremental results effectively, which are not enough reliable. We formulated this problem as a decision making task, in which the system makes choices iteratively either to answer using previous observations, or to wait until next observation. The reinforcement learning can be applied to this problem. Experimental results indicated that the users highly evaluated the system when it uses the estimation of completion time of user's utterance with the recognition results using sub-word vocabulary.

机译：在语音对话系统中，重要的是改善对用户输入话语的响应的延迟。在这项研究中，我们检查了用户话语期间从语音识别引擎获得的渐进识别结果的使用。首先，我们研究了使用子词词汇来提高逐步识别结果的可靠性。接下来，我们考虑从包括误识别在内的信息预测用户话语的内容的问题，该信息是作为顺序做出响应决策或待机的策略决策问题，并尝试应用强化学习。此外，我们研究了一种在预测的用户话语结束时启动系统话语的方法。通过在番茄语音识别错误率和用户语音率的各种条件下进行的仿真结果以及使用语音识别和语音合成的进一步实验，表明了该方法的有效性。％在口语对话系统中，减少对用户话语响应的延迟很重要，我们研究了在用户话语期间可以从语音识别引擎获得的增量识别结果的使用，以便系统正确响应增量识别结果，应该解决该问题，即如何有效地利用增量结果，这是不够可靠的。我们将此问题表述为决策任务，在该任务中，系统会反复做出选择，以使用先前的观察结果进行回答，或者等待强化学习可以解决这个问题，实验结果表明，当用户使用子词词汇的识别结果对用户话语的完成时间进行估计时，用户对该系统进行了高度评价。

著录项

来源
《電子情報通信学会技術研究報告》 |2011年第452期|p.61-66|共6页
作者
盧　迪; 深山　覚; 西本　卓也; 嵯峨山茂樹;
展开▼
作者单位

東京大学大学院情報理工学系研究科　〒113－8656東京都文京区本郷7－3－1;

東京大学大学院情報理工学系研究科　〒113－8656東京都文京区本郷7－3－1;

東京大学大学院情報理工学系研究科　〒113－8656東京都文京区本郷7－3－1;

東京大学大学院情報理工学系研究科　〒113－8656東京都文京区本郷7－3－1;

展开▼
收录信息
原文格式 PDF
正文语种 jpn
中图分类
关键词
音声対話; 音声認識; 漸次的認識結果; タイミング制御; 強化学習;

机译：口语对话;语音识别;逐步识别结果;定时控制;强化学习;
入库时间 2022-08-18 00:30:18

相似文献

外文文献
中文文献
专利

1. 音声入力への応答タイミング決定のための強化学習の検討 [J] . 盧迪, 深山覚, 西本卓也, 電子情報通信学会技術研究報告. 音声. Speech . 2010,第452期

机译：考试以增强学习，以确定对语音输入的响应时间
2. 音声入力への応答タイミング決定のための強化学習の検討 [J] . 盧迪, 深山覚, 西本卓也, 電子情報通信学会技術研究報告. 音声. Speech . 2010,第452期

机译：响应时间确定语音输入的加强学习检查
3. 応力降下量一定となる内陸地震のＭ_0～Ｓのスケーリングを考慮した強震動予測のための震源パラメータ設定に関する検討 [J] . 引間和人, 新村明広日本建築学会大会学術講演梗概集 . 2019,第2019期

机译：考虑M_0对内陆地震持续应力日期缩放的强化运动预测源参数设置研究
4. 呼吸運動のタイミング制御によるリラクゼーション手法の基礎検討：呼吸タイミングが自律神経活動へ及ぼす影響の測定とその応用 [C] . 中尾竜治, 中村壮亮, 橋本秀紀計測自動制御学会システムインテグレーション部門講演会 . 2015

机译：呼吸运动定时控制弛豫法的基本研究：呼吸时机对自主神经活动的影响及其应用
5. 強化学習に基づく知能システム : 価値体系を利用したパターン処理型知能マシンの検討利用統計を見る [D] . 山川宏 1992

机译：基于强化学习的智能系统：基于价值系统视图使用统计的模式处理型智能机研究
6. 基調講演1 : 会社力とマーケティング : 力強く利益を出し続けるために、マーケティングの重要性と活用（特集2 長岡大学地域研究センター2004年度シンポジウム : ビジネス成功の鍵を握るマーケティング力を語る : 経営のため、従業員のため、社会のためのマーケティングマインドの活用法） [O] . 長谷川和廣 2005

机译：主题演讲1：公司力量和市场营销：市场营销的重要性和利用继续强劲获利（专刊2长冈大学地区研究中心2004研讨会：讨论把握业务成功关键的市场营销力量：管理如何运用营销思想为员工和社会服务

音声入力への応答タイミング決定のための強化学習の検討

摘要

著录项

相似文献

相关主题

期刊订阅