首页> 外文会议>Workshop on Beyond Vision and LANguage: inTEgrating Real-world kNowledge >Large-Scale Zero-Shot Image Classification from Rich and Diverse Textual Descriptions
【24h】

Large-Scale Zero-Shot Image Classification from Rich and Diverse Textual Descriptions

机译:来自丰富和多样化的文本描述的大规模零拍图像分类

获取原文

摘要

We study the impact of using rich and diverse textual descriptions of classes for zero-shot learning (ZSL) on ImageNet. We create a new dataset ImageNet-Wiki that matches each ImageNet class to its corresponding Wikipedia article. We show that merely employing these Wikipedia articles as class descriptions yields much higher ZSL performance than prior works. Even a simple model using this type of auxiliary data outperforms state-of-the-art models that rely on standard features of word embedding encodings of class names. These results highlight the usefulness and importance of textual descriptions for ZSL, as well as the relative importance of auxiliary data type compared to algorithmic progress. Our experimental results also show that standard zero-shot learning approaches generalize poorly across categories of classes.
机译:我们研究了在想象中对零射击学习(ZSL)级别的丰富和不同的文本描述的影响。 我们创建了一个新的DataSet ImageNet-Wiki,与每个想象一类与其相应的维基百科文章匹配。 我们展示仅仅采用这些维基百科文章,作为类描述会产生比先前作品更高的ZSL性能。 甚至使用这种类型的辅助数据的简单模型才能依赖于嵌入类名的标准特征的最先进的模型。 这些结果突出了ZSL文本描述的有用性和重要性,以及与算法进度相比的辅助数据类型的相对重要性。 我们的实验结果还表明,标准的零射击学习方法跨类别概括。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号