CNN图像标题生成

摘要

图像标题生成是人工智能领域一个非常有挑战性的任务,该任务需要在给定一张图片的情况下能够生成与它内容相符的标题句子.它需要同时处理图像和文本两个模态的数据,并发现不同数据彼此间的关联.针对该任务通常采用一个编码器-解码器模型来解决,编码器则通常利用RNN网络来处理文本数据、CNN网络来处理图像数据.而本文则提出一个完全基于CNN的模型来同时处理两个模态的数据,通过在Flickr8k和Flickr30k数据上进行实验,实验结果表明了该模型的有效性,由于该模型是可并行运算的,在运行效率也有所提升.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号