Semantic embedding space for zero-shot action recognition

机译：零动作识别的语义嵌入空间

获取原文

页面导航

摘要
著录项
相似文献
相关主题

摘要

The number of categories for action recognition is growing rapidly. It is thus becoming increasingly hard to collect sufficient training data to learn conventional models for each category. This issue may be ameliorated by the increasingly popular “zero-shot learning” (ZSL) paradigm. In this framework a mapping is constructed between visual features and a human interpretable semantic description of each category, allowing categories to be recognised in the absence of any training data. Existing ZSL studies focus primarily on image data, and attribute-based semantic representations. In this paper, we address zero-shot recognition in contemporary video action recognition tasks, using semantic word vector space as the common space to embed videos and category labels. This is more challenging because the mapping between the semantic space and space-time features of videos containing complex actions is more complex and harder to learn. We demonstrate that a simple self-training and data augmentation strategy can significantly improve the efficacy of this mapping. Experiments on human action datasets including HMDB51 and UCF101 demonstrate that our approach achieves the state-of-the-art zero-shot action recognition performance.

机译：动作识别的类别数量正在迅速增长。因此，收集足够的训练数据以学习每种类别的常规模型变得越来越困难。日益流行的“零镜头学习”（ZSL）范例可能会改善此问题。在该框架中，在视觉特征和每个类别的人类可解释语义描述之间构建了映射，从而允许在没有任何训练数据的情况下识别类别。现有的ZSL研究主要集中在图像数据和基于属性的语义表示上。在本文中，我们使用语义词向量空间作为嵌入视频和类别标签的公共空间，来解决当代视频动作识别任务中的零镜头识别。这更具挑战性，因为包含复杂动作的视频的语义空间和时空特征之间的映射更加复杂且更难学习。我们证明了一种简单的自我训练和数据增强策略可以显着提高这种映射的功效。在包括HMDB51和UCF101在内的人类动作数据集上进行的实验表明，我们的方法实现了最新的零击动作识别性能。

著录项

来源
《IEEE International Conference on Image Processing》|2015年|63-67|共5页
会议地点
作者
Xu Xun; Hospedales Timothy; Gong Shaogang;
展开▼
作者单位

展开▼
会议组织
原文格式 PDF
正文语种
中图分类
关键词
Neural networks; Prototypes; Semantics; Training; Training data; Visualization; Yttrium; action recognition; zero-shot learning;

机译：神经网络;原型;语义学训练;培训数据;可视化;钇;动作识别;零镜头学习;

相似文献

外文文献
中文文献
专利

1. Spatiotemporal visual-semantic embedding network for zero-shot action recognition [J] . An Rongqiao, Miao Zhenjiang, Li Qingyu, Journal of electronic imaging . 2019,第2期

机译：零时空动作识别的时空视觉语义嵌入网络
2. Spatiotemporal visual-semantic embedding network for zero-shot action recognition [J] . An Rongqiao, Miao Zhenjiang, Li Qingyu, Journal of electronic imaging . 2019,第2期

机译：用于零射击动作识别的时空视觉语义嵌入网络
3. Coupling Adversarial Graph Embedding for transductive zero-shot action recognition [J] . Tian Yi, Huang Yaping, Xu Wanru, Neurocomputing . 2021,第Sepa10期

机译：耦合对抗性图形嵌入用于转换零射击动作识别
4. Semantic embedding space for zero-shot action recognition [C] . Xu Xun, Hospedales Timothy, Gong Shaogang IEEE International Conference on Image Processing . 2015

机译：零射击动作识别的语义嵌入空间
5. Zero-Shot Visual Recognition via Latent Embedding Learning [D] . Wang, Qian. 2018

机译：潜在嵌入学习的零发视觉识别
6. Characterizing Word Embeddings for Zero-Shot Sensor-Based Human Activity Recognition [O] . Moe Matsuki, Paula Lago, Sozo Inoue 2019

机译：表征词嵌入的基于零发散传感器的人类活动识别
7. SEMANTIC EMBEDDING SPACE FOR ZERO-SHOT ACTION RECOGNITION [O] . Xun Xu, Timothy Hospedales, Shaogang Gong 2016

机译：用于零背作用识别的语义嵌入空间

Semantic embedding space for zero-shot action recognition

摘要

著录项

相似文献

相关主题

期刊订阅