基于视觉关联与上下文双注意力的图像描述生成方法

刘茂福; 施琦; 聂礼强

首页> 中文期刊> 《软件学报》 >基于视觉关联与上下文双注意力的图像描述生成方法

基于视觉关联与上下文双注意力的图像描述生成方法

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

图像描述生成有着重要的理论意义与应用价值,在计算机视觉与自然语言处理领域皆受到广泛关注.基于注意力机制的图像描述生成方法,在同一时刻融合当前词和视觉信息以生成目标词,忽略了视觉连贯性及上下文信息,导致生成描述与参考描述存在差异.针对这一问题,提出一种基于视觉关联与上下文双注意力机制的图像描述生成方法(visual relevance and context dual attention, VRCDA).视觉关联注意力在传统视觉注意力中增加前一时刻注意力向量以保证视觉连贯性,上下文注意力从全局上下文中获取更完整的语义信息,以充分利用上下文信息,进而指导生成最终的图像描述文本.在MSCOCO和Flickr30k两个标准数据集上进行了实验验证,结果表明所提出的VRCDA方法能够有效地生成图像语义描述,相比于主流的图像描述生成方法,在各项评价指标上均取得了较高的提升.

著录项

来源
《软件学报》 |2022年第9期|3210-3222|共13页
作者
刘茂福; 施琦; 聂礼强;
展开▼
作者单位

武汉科技大学计算机科学与技术学院;

山东大学计算机科学与技术学院;

展开▼
原文格式 PDF
正文语种 chi
中图分类信息处理（信息加工）;
关键词
图像描述生成; 双注意力机制; 视觉关联注意力; 上下文注意力;

相似文献

中文文献
外文文献
专利

1. 融合双注意力与多标签的图像中文描述生成方法 [J] . 田枫 ,孙小强 ,刘芳 . 计算机系统应用 . 2021,第7期
2. 基于改进的视觉注意力机制的图像描述方法 [J] . 王耀葛 ,文瑞森 ,庞贵杰 . 现代信息科技 . 2022,第9期
3. 基于一种视觉注意力机制的图像描述方法 [J] . 薛炜 ,刘惠义 . 信息技术 . 2020,第1期
4. 基于用户注意力与视觉注意力的社交图像描述 [J] . 褚晓亮 ,朱连章 ,吴春雷 . 计算机系统应用 . 2018,第8期
5. 结合视觉属性注意力和残差连接的图像描述生成模型 [J] . 周治平 ,张威 . 计算机辅助设计与图形学学报 . 2018,第008期
6. 一种基于视觉特征语义描述的图像分类检索方法 [C] . 夏定元 ,于昕梅 . 2003全国数字媒体与数字城市学术会议 . 2003
7. 基于视觉注意力的图像描述生成方法的研究 [A] . 樊凯旋 . 2020

基于视觉关联与上下文双注意力的图像描述生成方法

摘要

著录项

相似文献

相关主题

期刊订阅