局所区間のマルチモーダル情報を用いたユーザ状態の推定に関する検討

千葉祐弥; 伊藤仁; 伊藤彰則

首页> 外文期刊>電子情報通信学会技術研究報告. 音声. Speech >局所区間のマルチモーダル情報を用いたユーザ状態の推定に関する検討

【24h】

局所区間のマルチモーダル情報を用いたユーザ状態の推定に関する検討

机译：局所区間のマルチモーダル情報を用いたユーザ状態の推定に関する検討

获取原文

获取原文并翻译 | 示例

掌桥外文数据库（机构版） >>

开具论文收录证明 >>

页面导航

摘要
著录项
相关主题

摘要

従来の音声対話システムの研究では，ユーザ発話の音声認識結果を処理することによって応答を決定するという対話システムの性質上，言語的情報の処理に重点が置かれることが多かった．しかしながら，実環境下においては，そもそも入力が観測できないという状況が度々起こるため，言語的情報のみに依存した対話制御では不十分である．このような状況でユニザに対して適切な応答を行うためには，従来の音声対話システムでは無視されていた「発話を行う前のユーザ状態」を考慮する必要がある．我々は，発話前のユーザ状態を2種類定義し，その推定手法について研究を行ってきた．ここまでの分析結果から，マルチモーダルな情報を用いることで対象とするユーザの状態をある程度推定できることが示唆されている．この結果を踏まえ，本報告では動画像と音声から得られる情報を統合し，ユーザの状態を推定する手法について検討を行う．ここでは，新たにマルチモーダルな特徴系列をクラスタリングしてBag-of-Words的に扱う方法を提案する．提案手法では，2つのユーザ状態を70％以上の精度で識別できることが確認できた．

著录项

来源
《電子情報通信学会技術研究報告. 音声. Speech》 |2013年第220期|27-32|共6页
作者
千葉祐弥; 伊藤仁; 伊藤彰則;
展开▼
作者单位

東北大学大学院工学研究科;

東北工業大学知能エレクトロニクス学科;

展开▼
收录信息
原文格式 PDF
正文语种日语
中图分类电报、传真;
关键词
音声対話システム; マルチモーダル情報処理; ユーザモデル;
入库时间 2024-01-25 00:17:46

局所区間のマルチモーダル情報を用いたユーザ状態の推定に関する検討

摘要

著录项

相关主题

期刊订阅