首页> 外文期刊>Sprache und Datenverarbeitung >Multimodal, Contextual Dialog Management for Natural Speech in Car Environments
【24h】

Multimodal, Contextual Dialog Management for Natural Speech in Car Environments

机译:用于汽车环境中自然语音的多模式,上下文对话框管理

获取原文
获取原文并翻译 | 示例

摘要

Dieser Beitrag stellt einen effizienten und robusten Ansatz des multimodalen Dialogmanagements im automobilen Umfeld vor. Es wurde ein Dialogmanager entwickelt und evaluiert, der sowohl für Informations- und Kommunikationssysteme als auch für Fahrerassistenzsysteme genutzt werden kann. Dieser ermöglicht multimodale Bedienung auf Intentionsebene. In der aktuellen Version werden natürliche Sprache und taktile Eingaben genutzt. Der Dialogmanager wird genutzt, um ein bestehendes Framework um flexible und nutzer-zentrierte, kontextadaptive, natürlichsprachliche Dialoge zu erweitern. Zur Dialogkontrolle wurde der Frame-basierte Ansatz gewählt. Die Dialogdefinition erfolgt in XML in einem auf die Automobildomäne zugeschnittenen Format. Sprachausgaben wurden von einem TTS-Server synthetisiert. Es wurden daneben mehrere im Auto verbaute Displays angesteuert. In einer Usability-Studie zeigte sich bei den Teilnehmern eine erhöhte Effektivität und Bedienfreude durch die im Frame-basierten Ansatz gegebene Möglichkeit, eine beliebige Anzahl von Informationen in einem Bedienschritt einzugeben. Dies wurde als sehr komfortabel und wichtig bewertet.%This paper focuses on an efficient and robust approach to multimodal dialog management which is implemented in a framework for the automotive environment. A dedicated dialog manager for driver's interaction with infotainment and communication systems as well as driver assistance systems has been developed and tested. The dialog manager facilitates multimodal interaction, i.e. it allows for an efficient integration and combination of natural speech and classical tactile input. The main aim of the dialog manager is to provide flexible and user-centered speech dialogs and to support different interfaces, like buttons or turning knobs. For the dialog control, a frame-based approach is used. The dialog description is realized in XML which allows for a simple overview over the dialog structure. For speech output, a synthetic text-to-speech engine is used. Visual output is displayed on several screens in the car. The usability evaluation shows an improvement of effectiveness, a higher joy of use through the possibility of submitting several pieces of information in only one dialog step with natural speech comparing to a menu-based spoken dialog. The test persons rated this way of frame-based interaction as comfortable and important.
机译:本文介绍了一种在汽车环境中进行多模式对话框管理的有效而强大的方法。开发并评估了对话管理器,该对话管理器可用于信息和通信系统以及驾驶员辅助系统。这样就可以在意图级别进行多模式操作。在当前版本中,使用自然语言和触觉输入。对话管理器用于通过灵活的,以用户为中心的,上下文自适应的自然语言对话来扩展现有框架。选择基于框架的方法进行对话框控制。对话框定义采用XML,格式适合汽车领域。语音输出由TTS服务器合成。此外,还触发了安装在汽车中的多个显示器。在可用性研究中,由于基于帧的方法可以在一个操作步骤中输入任何数量的信息,因此参与者显示出更高的有效性和易用性。这被认为是非常舒适和重要。%本文着重于在汽车环境的框架中实施的多模式对话框管理的有效且健壮的方法。已经开发并测试了专用的对话管理器,用于驾驶员与信息娱乐和通信系统以及驾驶员辅助系统的交互。对话管理器促进了多模式交互,即它允许自然语音和经典触觉输入的有效集成和组合。对话框管理器的主要目的是提供灵活且以用户为中心的语音对话框,并支持不同的界面,例如按钮或旋钮。对于对话框控件,使用基于框架的方法。对话框描述以XML格式实现,可以对对话框结构进行简单的概述。对于语音输出,使用了合成的文本到语音引擎。视觉输出显示在汽车的多个屏幕上。与基于菜单的口头对话相比,使用自然语音仅在一个对话步骤中提交几条信息的可能性,可用性评估显示出有效性的提高和更高的使用乐趣。测试人员认为这种基于框架的交互方式既舒适又重要。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号