【24h】

Collective Generation of Natural Image Descriptions

机译:集体生成自然图像描述

获取原文

摘要

We present a holistic data-driven approach to image description generation, exploiting the vast amount of (noisy) parallel image data and associated natural language descriptions available on the web. More specifically, given a query image, we retrieve existing human-composed phrases used to describe visually similar images, then selectively combine those phrases to generate a novel description for the query image. We cast the generation process as constraint optimization problems, collectively incorporating multiple interconnected aspects of language composition for content planning, surface realization and discourse structure. Evaluation by human annotators indicates that our final system generates more semantically correct and linguistically appealing descriptions than two nontrivial baselines.
机译:我们提出了一种用于图像描述生成的整体数据驱动方法,该方法利用了网络上可用的大量(嘈杂)并行图像数据和相关的自然语言描述。更具体地说,在给定查询图像的情况下,我们检索用于描述视觉相似图像的现有人为组成的短语,然后有选择地组合这些短语以生成查询图像的新颖描述。我们将生成过程视为约束优化问题,将语言组成的多个相互关联的方面共同纳入内容规划,表面实现和话语结构中。由人类注释者进行的评估表明,与两个非平凡的基准相比,我们的最终系统在语义上更正确,在语言上更有吸引力。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号