首页> 外文期刊>電子情報通信学会技術研究報告. 言語理解とコミュニケーション. Natural Language Understanding and Models of Communication >魅力ある音声インタラクションシステムを構築するためのオープンソースツールキットMMDAgent
【24h】

魅力ある音声インタラクションシステムを構築するためのオープンソースツールキットMMDAgent

机译:MMDAgent,一个用于构建有吸引力的语音交互系统的开源工具包

获取原文
获取原文并翻译 | 示例
           

摘要

音声特有の生き生きとしたインタラクティブ感のあるやりとりは,音声インタフェースの主要な魅力のひとつである.この音声インタフェースの有効性を引き出すには,タスク達成型の対話の研究に加えて,人を惹きつける魅力を持つ音声対話システムの成り立ちについて分析し,様々な実証実験を通じてそれを成立させる技術的な諸要素を明らかにしていくことが必要である.我々は,ユーザが多様な音声対話システムおよび音声インタフェースを自由に構築可能なオープンソースツールキットMMDAgentを構築した.本ツールキットは音声認識部にJulius,音声合成部にOpen JTalkを用い,表現力豊かな3-D CGエージェントを表示可能な3-DCG描画部を密統合している.動的なモーションの重ね合わせ,発話スタイル正規化学習を用いた音声合成,粒度の細かいイベント処理などが可能である.インターフェースとライセンスは高いオープン性とポータビリティ性を意識して設計されている.
机译:语音特有的生动互动交互是语音界面的主要吸引力之一。为了展示该语音界面的有效性,除了研究完成任务的对话外,我们还分析了具有吸引力的语音对话系统的形成,并通过各种经验实验从技术上建立了该对话系统。有必要澄清各种要素。我们构建了开源工具包MMDAgent,该工具包允许用户自由构建各种语音对话系统和语音界面。该工具包将Julius用于语音识别部分,将Open JTalk用于语音合成部分,并紧密集成了可以显示富有表现力的3-D CG代理的3-DCG绘图部分。可以叠加动态运动,使用语音样式归一化学习来合成语音,并处理细粒度的事件。接口和许可证在设计时考虑了高度的开放性和可移植性。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号