Reinforcement Learning of Question-Answering Dialogue Policies for Virtual Museum Guides

机译：强化学习的虚拟博物馆指南的答疑对话政策

获取原文

页面导航

摘要
著录项
相似文献
相关主题

摘要

We use Reinforcement Learning (RL) to learn question-answering dialogue policies for a real-world application. We analyze a corpus of interactions of museum visitors with two virtual characters that serve as guides at the Museum of Science in Boston, in order to build a realistic model of user behavior when interacting with these characters. A simulated user is built based on this model and used for learning the dialogue policy of the virtual characters using RL. Our learned policy outperforms two baselines (including the original dialogue policy that was used for collecting the corpus) in a simulation setting.

机译：我们使用强化学习（RL）来学习真实应用程序的问答对话策略。我们分析了博物馆参观者与两个虚拟人物的互动语料，这些人物在波士顿科学博物馆作为指南，以便在与这些人物互动时建立真实的用户行为模型。基于此模型构建了一个模拟用户，该用户用于使用RL学习虚拟角色的对话策略。我们的学习策略在模拟设置中优于两个基准（包括用于收集语料库的原始对话策略）。

著录项

来源
《Annual meeting of the Special Interest Group on Discourse and Dialogue》|2012年|84-93|共10页
会议地点
作者
Teruhisa Misu; Kallirroi Georgila; Anton Leuski; David Traum;
展开▼
作者单位

展开▼
会议组织
原文格式 PDF
正文语种
中图分类
关键词

相似文献

外文文献
中文文献
专利

1. Towards integrated dialogue policy learning for multiple domains and intents using Hierarchical Deep Reinforcement Learning [J] . Saha Tulika, Gupta Dhawal, Saha Sriparna, Expert Systems with Application . 2020,第Deca期

机译：利用分层深度加强学习对多个域和意图的综合对话政策学习
2. Hybrid Reinforcement/Supervised Learning of Dialogue Policies from Fixed Data Sets [J] . Henderson J, Lemon O, Georgila K Computational linguistics . 2008,第4期

机译：从固定数据集混合强化/监督学习对话策略
3. Hybrid Reinforcement/supervised Learning Of Dialogue Policies From Fixed Data Sets [J] . James Henderson, Oliver Lemon, Kallirroi Georgila Computational linguistics . 2008,第4期

机译：从固定数据集中混合增强/监督学习对话策略
4. Reinforcement Learning of Question-Answering Dialogue Policies for Virtual Museum Guides [C] . Teruhisa Misu, Kallirroi Georgila, Anton Leuski, IGDIAL 2012 . 2012

机译：关于虚拟博物馆指南的问答对话政策的加强学习
5. Min-Max Inverse Reinforcement Learning for Learning Bi-Modal Dialogue Policies [D] . Patil, Gandharv. 2020

机译：用于学习双模对话策略的最大最大逆钢筋学习
6. Towards sentiment aided dialogue policy learning for multi-intent conversations using hierarchical reinforcement learning [O] . Tulika Saha, Sriparna Saha, Pushpak Bhattacharyya 2020

机译：利用等级强化学习的多意图对话的情感对话策略学习
7. Composite Task-Completion Dialogue Policy Learning via Hierarchical Deep Reinforcement Learning [O] . Peng, Baolin, Li, Xiujun, Li, Lihong, 2017

机译：通过分层深度复合任务完成对话策略学习强化学习

Reinforcement Learning of Question-Answering Dialogue Policies for Virtual Museum Guides

摘要

著录项

相似文献

相关主题

期刊订阅