Auxiliary criterion conversion via spatiotemporal semantic encoding and feature entropy for action recognition

Meng Xiaoyan; Zhang Guoliang; Jia Songmin; Li Xiuzhi; Zhang Xiangyin

首页> 外文期刊>The Visual Computer >Auxiliary criterion conversion via spatiotemporal semantic encoding and feature entropy for action recognition

【24h】

Auxiliary criterion conversion via spatiotemporal semantic encoding and feature entropy for action recognition

机译：辅助标准转换通过时空语义编码和特征熵进行动作识别

获取原文

获取原文并翻译 | 示例

掌桥外文数据库（机构版） >>

开具论文收录证明 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

Video-based action recognition in realistic scenes is a core technology for human-computer interaction and smart surveillance. Although the trajectory features with the bag of visual words have confirmed promising performance, spatiotemporal interactive information cannot be effectively encoded which is valuable for classification. To address this issue, we propose a spatiotemporal semantic feature (ST-SF) and implement the conversion of it to the auxiliary criterion based on the information entropy theory. First, we present a text-based relevance analysis method to estimate the textual labels of objects most relevant to actions, which are employed to train the more targeted detectors based on the deep network. False detections are optimized by the inter-frame cooperativity and dynamic programming to construct the valid tubes. Then, we design the ST-SF to encode the interactive information, and the concept and calculation of feature entropy are defined based on the spatial distribution of ST-SFs on the training set. Finally, we achieve a two-stage classification strategy using the resulting decision gains. Experimental results on three publicly available datasets demonstrate that our method is robust and improves upon the state-of-the-art algorithms.

机译：现实场景中基于视频的动作识别是人机互动和智能监控的核心技术。虽然具有袋子的轨迹特征已经确认了有希望的性能，但不能有效地编码时空交互式信息，这对分类有价值。为了解决这个问题，我们提出了一种时空语义特征（ST-SF）并基于信息熵理论将其转换为辅助标准。首先，我们提出了一种基于文本的相关性分析方法来估计与动作最相关的对象的文本标签，这些对象是基于深网络训练更具针对性的检测器的对象。通过帧间协作和动态编程来优化假检测以构造有效管。然后，我们设计ST-SF来编码交互信息，并且特征熵的概念和计算是根据训练集上的ST-SFS的空间分布来定义的。最后，我们使用由此产生的决策增益实现了两阶段的分类策略。在三个公共数据集上的实验结果表明，我们的方法是强大的，并改善了最先进的算法。

著录项

来源
《The Visual Computer》 |2021年第7期|1673-1690|共18页
作者
Meng Xiaoyan; Zhang Guoliang; Jia Songmin; Li Xiuzhi; Zhang Xiangyin;
展开▼
作者单位

Beijing Univ Technol Fac Informat Technol Beijing 100124 Peoples R China|Beijing Key Lab Computat Intelligence & Intellige Beijing 100124 Peoples R China|Minist Educ Engn Res Ctr Digital Community Beijing 100124 Peoples R China;

Beijing Univ Technol Fac Informat Technol Beijing 100124 Peoples R China|Beijing Key Lab Computat Intelligence & Intellige Beijing 100124 Peoples R China|Minist Educ Engn Res Ctr Digital Community Beijing 100124 Peoples R China;

Beijing Univ Technol Fac Informat Technol Beijing 100124 Peoples R China|Beijing Key Lab Computat Intelligence & Intellige Beijing 100124 Peoples R China|Minist Educ Engn Res Ctr Digital Community Beijing 100124 Peoples R China;

Beijing Univ Technol Fac Informat Technol Beijing 100124 Peoples R China|Beijing Key Lab Computat Intelligence & Intellige Beijing 100124 Peoples R China|Minist Educ Engn Res Ctr Digital Community Beijing 100124 Peoples R China;

Beijing Univ Technol Fac Informat Technol Beijing 100124 Peoples R China|Beijing Key Lab Computat Intelligence & Intellige Beijing 100124 Peoples R China;

展开▼
收录信息美国《科学引文索引》(SCI);美国《工程索引》(EI);
原文格式 PDF
正文语种 eng
中图分类
关键词
Action recognition; Spatiotemporal semantic feature; Feature entropy; Bag-of-visual-words model; Text-based relevance analysis;

机译：行动识别;时空语义特征;特征熵;袋 - 视觉单词模型;基于文本的相关性分析;

相似文献

外文文献
中文文献
专利

1. Spatiotemporal visual-semantic embedding network for zero-shot action recognition [J] . An Rongqiao, Miao Zhenjiang, Li Qingyu, Journal of electronic imaging . 2019,第2期

机译：零时空动作识别的时空视觉语义嵌入网络
2. Spatiotemporal visual-semantic embedding network for zero-shot action recognition [J] . An Rongqiao, Miao Zhenjiang, Li Qingyu, Journal of electronic imaging . 2019,第2期

机译：用于零射击动作识别的时空视觉语义嵌入网络
3. Intelligent Multimedia Annotation and Interaction Using Semantic Musical Features: Encoding Human-Centric Music Intelligence for Musically Plausible Human-Media Interactions [J] . Gang Ren, Zhe Wen, Xuchen Yang, International Journal of Soft Computing and Software Engineering . 2013,第3期

机译：使用语义音乐功能的智能多媒体注释和交互：对以人为中心的音乐智能进行编码，以实现音乐上合理的人机交互
4. STM: SpatioTemporal and Motion Encoding for Action Recognition [C] . Boyuan Jiang, Mengmeng Wang, Weihao Gan, International Conference on Computer Vision . 2019

机译：STM：用于动作识别的时空时空和运动编码
5. Feature Extraction and Encoding for Video Action Recognition [D] . Zuo, Zheming. 2020

机译：视频动作识别特征提取和编码
6. Feature Fusion of Deep Spatial Features and Handcrafted Spatiotemporal Features for Human Action Recognition [O] . Md Azher Uddin, Young-Koo Lee 2019

机译：深度空间特征与手工时空特征的特征融合用于人类动作识别
7. Feature Fusion of Deep Spatial Features and Handcrafted Spatiotemporal Features for Human Action Recognition [O] . Md Uddin, Young-Koo Lee 2019

机译：用于人类行动认可的深层空间特征和手工时空特征的特征融合
8. Evaluation of Entropy and JM-Distance Criterions as Features Selection Methods Using Spectral and Spatial Features Derived from LANDSAT Images [R] . Parada, N. D. J., Dutra, L. V., Ii, F. A. M., 1984

机译：利用LaNDsaT图像得到的光谱和空间特征评估熵和Jm距离准则作为特征选择方法

Auxiliary criterion conversion via spatiotemporal semantic encoding and feature entropy for action recognition

摘要

著录项

相似文献

相关主题

期刊订阅