Kinect-based multimodal gesture recognition using a two-pass fusion scheme

机译：使用两遍融合方案的基于Kinect的多模式手势识别

获取原文

页面导航

摘要
著录项
相似文献
相关主题

摘要

We present a new framework for multimodal gesture recognition that is based on a two-pass fusion scheme. In this, we deal with a demanding Kinect-based multimodal dataset, which was introduced in a recent gesture recognition challenge. We employ multiple modalities, i.e., visual cues, such as colour and depth images, as well as audio, and we specifically extract feature descriptors of the hands' movement, handshape, and audio spectral properties. Based on these features, we statistically train separate unimodal gesture-word models, namely hidden Markov models, explicitly accounting for the dynamics of each modality. Multimodal recognition of unknown gesture sequences is achieved by combining these models in a late, two-pass fusion scheme that exploits a set of unimodally generated n-best recognition hypotheses. The proposed scheme achieves 88.2% gesture recognition accuracy in the Kinect-based multimodal dataset, outperforming all recently published approaches on the same challenging multimodal gesture recognition task.

机译：我们提出了一种基于两遍融合方案的多模式手势识别新框架。在此，我们处理了一个苛刻的基于Kinect的多峰数据集，该数据集是在最近的手势识别挑战中引入的。我们采用了多种模式，即视觉提示，例如彩色和深度图像以及音频，并且我们专门提取了手的运动，手形和音频频谱特性的特征描述符。基于这些功能，我们统计地训练了单独的单峰手势词模型，即隐马尔可夫模型，明确考虑了每种模态的动态性。未知手势序列的多模式识别是通过在后期的两遍融合方案中组合这些模型来实现的，该方案利用了一组单模生成的n最佳识别假设。所提出的方案在基于Kinect的多模态数据集中实现了88.2％的手势识别精度，胜过了同一挑战性多模态手势识别任务上所有最近发布的方法。

著录项

来源
《IEEE International Conference on Image Processing》|2014年|1495-1499|共5页
会议地点
作者
Pavlakos Georgios; Theodorakis Stavros; Pitsikalis Vassilis; Katsamanis Athanasios; Maragos Petros;
展开▼
作者单位

展开▼
会议组织
原文格式 PDF
正文语种
中图分类
关键词
feature extraction; gesture recognition; hidden Markov models; image fusion; interactive devices; HMM; Kinect-based multimodal gesture recognition; feature descriptor extraction; hidden Markov model; two-pass fusion scheme; Feature extraction; Gesture recognition; Hidden Markov models; Skeleton; Speech; Three-dimensional displays; Visualization; HMMs; multimodal fusion; multimodal gesture recognition; speech recognition;

机译：特征提取;手势识别;隐马尔可夫模型;图像融合;交互设备; HMM;基于Kinect的多模式手势识别;特征描述符提取;隐马尔可夫模型;两遍融合方案;特征提取;手势识别;隐马尔可夫模型;骨架语音三维显示可视化HMM多模态融合多模态手势识别语音识别;

相似文献

外文文献
中文文献
专利

1. Feature design scheme for Kinect-based DTW human gesture recognition [J] . Ding Ing-Jr, Chang Che-Wei Multimedia Tools and Applications . 2016,第16期

机译：基于Kinect的DTW手势识别特征设计方案
2. Hand gesture recognition using multimodal data fusion and multiscale parallel convolutional neural network for human–robot interaction [J] . Gao Qing, Liu Jinguo, Ju Zhaojie Expert Systems . 2021,第5期

机译：使用多模式数据融合和多尺度并联卷积神经网络进行人体机器人交互的手势识别
3. Gesture recognition based on multilevel multimodal feature fusion [J] . Journal of intelligent & fuzzy systems: Applications in Engineering and Technology . 2020,第3期

机译：基于多级多模式特征融合的手势识别
4. Kinect-based multimodal gesture recognition using a two-pass fusion scheme [C] . Pavlakos Georgios, Theodorakis Stavros, Pitsikalis Vassilis, IEEE International Conference on Image Processing . 2014

机译：基于Kinect的多媒体手势使用双通融合方案识别
5. A multimodal fusion approach for automatic postal address recognition system using Optical Character Recognition (OCR) and Automatic Speech Recognition (ASR) techniques. [D] . Singh, Amriteshwar. 2011

机译：一种使用光学字符识别（OCR）和自动语音识别（ASR）技术的自动邮政地址识别系统的多模式融合方法。
6. A comprehensive study on bilingual and multilingual speech emotion recognition using a two-pass classification scheme [O] . Panikos Heracleous, Akio Yoneyama 2012

机译：基于两遍分类方案的双语和多语语音情感识别的综合研究
7. A Kinect-Based Gesture Recognition Approach for a Natural Human Robot Interface [O] . Grazia Cicirelli, Carmela Attolico, Cataldo Guaragnella, 2015

机译：基于Kinect的自然人体机器人界面手势识别方法

Kinect-based multimodal gesture recognition using a two-pass fusion scheme

摘要

著录项

相似文献

相关主题

期刊订阅