首页> 中文期刊>南昌航空大学学报(自然科学版) >基于优化注意力机制的图像字幕生成方法研究

基于优化注意力机制的图像字幕生成方法研究

     

摘要

在图像字幕生成任务中,注意力机制处理图像特征时会忽视图像中目标之间联系程度,从而影响到字幕生成质量.针对这一问题,在传统的多头注意力机制的基础上,引入注意力机制优化模块(Optimize Attention,OA)来测量图像中目标之间的关联程度,以引导字幕的产生过程.OA结合多头注意力机制的关注结果和当前上下文(即查询)生成"信息向量"和"注意门",然后将"注意门"应用于"信息向量"来构造一个新的注意力,并将新的注意力再与"信息向量"进行逐元素相乘以生成图像中目标和背景之间关联程度高的关注信息.在MS COCO数据集上对改进后的模型进行训练和验证,BLEU-1和METEOR评价指标分别达到了75.2%和27.5%.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号