首页> 中文期刊> 《计算机应用与软件》 >基于注意力机制的视觉问答任务研究

基于注意力机制的视觉问答任务研究

     

摘要

提出一种基于注意力机制的视觉问答系统,通过匹配图像中与问题相关的区域来回答基于图像的问题.通过拼接的方式将问题特征与图像特征映射到一个共享空间,再通过非线性层、线性层以及Softmax层来得到注意力权重.该方法将视觉问答任务视为一个多分类任务,将数据集中出现频率最高的1000个答案作为候选答案.利用预训练的VGG16模型提取图片特征,利用LSTM网络提取问题特征,采用VQA数据集进行训练和测试.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号