基于堆叠交叉注意力的图像文本跨模态匹配方法

王红斌; 张志亮; 李华锋

首页> 中文期刊> 《信号处理》 >基于堆叠交叉注意力的图像文本跨模态匹配方法

基于堆叠交叉注意力的图像文本跨模态匹配方法

AI论文写作 >>

开具论文收录证明 >>

页面导航

摘要
著录项
引文网络
相似文献
相关主题

摘要

图像文本跨模态匹配是计算机视觉与自然语言处理交叉领域的一项重要任务,然而传统的图像文本跨模态匹配方法要么只考虑到全局图像与全局文本匹配,要么只考虑到局部图像与局部文本匹配,无法全面有效的考虑局部和全局信息,导致提取出来的特征信息不完善。或者只是简单的对全局图像与全局文本特征进行提取,局部细节信息无法凸显,导致全局特征无法充分表达其全局语义信息。针对该问题,本文提出一种基于堆叠交叉注意力的图像文本跨模态匹配方法。该方法在考虑局部图像与局部文本匹配的同时,将堆叠交叉注意力引进全局图像与全局文本匹配,通过注意力来进一步挖掘全局特征信息,让全局图像与全局文本特征得到优化,从而提升图像文本跨模态检索的效果。在Flickr30K和MS-COCO两个公共数据集上进行了实验验证,模型的总体性能R@sum(Recall@sum)较baseline(SCAN)分别提高了3.9%与3.7%。该模型与SCAN模型相比,R@sum表现较好。由此表明本文提出方法在图像文本跨模态检索任务上的有效性,并且与现有方法相比具有一定的优越性。

著录项

来源
《信号处理》 |2022年第2期|285-299|共15页
作者
王红斌; 张志亮; 李华锋;
展开▼
作者单位

昆明理工大学信息工程与自动化学院;

昆明理工大学云南省人工智能重点实验室;

展开▼
原文格式 PDF
正文语种 chi
中图分类检索机;
关键词
跨模态匹配; 局部细节信息; 全局语义信息; 堆叠交叉注意力; 图像文本特征;

相似文献

中文文献
外文文献
专利

1. 一致性协议匹配的跨模态图像文本检索方法 [J] . 宫大汉 ,陈辉 ,陈仕江 . 智能系统学报 . 2021,第006期
2. 基于BERT与图像自注意力机制的文本匹配模型 [J] . 宋爽 ,陆鑫达 . 计算机与现代化 . 2021,第011期
3. 基于注意力机制的TAI-CNN图文跨模态情感分类方法 [J] . 陈小敏 ,许华虎 ,方迪恺 . 计算机应用与软件 . 2021,第005期
4. 基于多模态注意力机制的图像理解描述新方法 [J] . 李学明 ,岳贡 ,陈光伟 . 电子科技大学学报 . 2020,第006期
5. 一种基于注意力机制与多模态的图像描述方法 [J] . NIU Bin ,LI Jin-ze ,FANG Chao . 辽宁大学学报（自然科学版） . 2019,第001期
6. 基于小波零交叉基元的多分辨率图像匹配方法 [C] . 普峦 ,张可黛 . 全国光电技术学术交流会 . 2000
7. 基于跨模态相关语义及注意力机制的图像-文本互译方法 [A] . 田明 . 2020

基于堆叠交叉注意力的图像文本跨模态匹配方法

摘要

著录项

引文网络

相似文献

相关主题

期刊订阅