Multimodal Multi-Stream Deep Learning for Egocentric Activity Recognition

机译：多峰多流深入学习，用于自我监测活动识别

获取原文

页面导航

摘要
著录项
相似文献
相关主题

摘要

In this paper, we propose a multimodal multi-stream deep learning framework to tackle the egocentric activity recognition problem, using both the video and sensor data. First, we experiment and extend a multi-stream Convolutional Neural Network to learn the spatial and temporal features from egocentric videos. Second, we propose a multistream Long Short-Term Memory architecture to learn the features from multiple sensor streams (accelerometer, gyroscope, etc.). Third, we propose to use a two-level fusion technique and experiment different pooling techniques to compute the prediction results. Experimental results using a multimodal egocentric dataset show that our proposed method can achieve very encouraging performance, despite the constraint that the scale of the existing egocentric datasets is still quite limited.

机译：在本文中，我们提出了一种多模式多流深入学习框架来解决视频和传感器数据的精神度活动识别问题。首先，我们尝试并扩展多流卷积神经网络，以了解从Egentric视频的空间和时间特征。其次，我们提出了一种多阵线长短期内存架构，以了解来自多个传感器流（加速度计，陀螺仪等）的特征。第三，我们建议使用双层融合技术并实验不同的汇集技术来计算预测结果。实验结果采用多模式的自主特征数据集显示我们所提出的方法可以实现非常令人鼓舞的性能，尽管存在现有的EnoCentric数据集的规模仍然相当有限。

著录项

来源
《IEEE Conference on Computer Vision and Pattern Recognition Workshops》|2016年|809p|共8页
会议地点
作者
Sibo Song; Vijay Chandrasekhar; Bappaditya Mandal; Liyuan Li; Joo-Hwee Lim; Giduthuri Sateesh Babu; Phyo Phyo San; Ngai-Man Cheung;
展开▼
作者单位

展开▼
会议组织
原文格式 PDF
正文语种
中图分类 TP391.41-53;
关键词
Optical sensors; Optical imaging; Machine learning; Optical network units; Visualization; Streaming media;

机译：光学传感器;光学成像;机器学习;光网络单元;可视化;流媒体;

相似文献

外文文献
中文文献
专利

1. Multi-Stream Deep Neural Networks for RGB-D Egocentric Action Recognition [J] . Tang Yansong, Wang Zian, Lu Jiwen, IEEE Transactions on Circuits and Systems for Video Technology . 2019,第10期

机译：用于RGB-D自我中心动作识别的多流深度神经网络
2. Deep appearance and motion learning for egocentric activity recognition [J] . Wang Xuanhan, Gao Lianli, Song Jingkuan, Neurocomputing . 2018,第JANa31期

机译：深度外观和动作学习，以自我为中心的活动识别
3. Multimodal Deep Learning for Group Activity Recognition in Smart Office Environments [J] . George Albert Florea, Radu-Casian Mihailescu Future Internet . 2020,第8期

机译：智能办公环境中群体活动识别的多模式深度学习
4. Multimodal Multi-Stream Deep Learning for Egocentric Activity Recognition [C] . Sibo Song, Vijay Chandrasekhar, Bappaditya Mandal, IEEE Conference on Computer Vision and Pattern Recognition Workshops . 2016

机译：多模式多流深度学习以自我为中心的活动识别
5. Human Activity Recognition from Egocentric Videos and Robustness Analysis of Deep Neural Networks [D] . Lu, Yantao. 2020

机译：从深神经网络的Egentric视频和鲁棒性分析的人类活动识别
6. Sensor Data Acquisition and Multimodal Sensor Fusion for Human Activity Recognition Using Deep Learning [O] . Seungeun Chung, Jiyoun Lim, Kyoung Ju Noh, 2019

机译：深度学习的人类活动识别传感器数据采集和多模式传感器融合
7. Gated spatio and temporal convolutional neural network for activity recognition: towards gated multimodal deep learning [O] . Novanto Yudistira, Takio Kurita 2017

机译：门控时空和时间卷积神经网络，用于活动识别：朝向所属的多模式深度学习

Multimodal Multi-Stream Deep Learning for Egocentric Activity Recognition

摘要

著录项

相似文献

相关主题

期刊订阅