融合物体空间关系机制的图像摘要生成方法

万璋; 张玉洁; 刘明童; 徐金安; 陈钰枫

首页> 中文期刊> 《北京大学学报：自然科学版》 >融合物体空间关系机制的图像摘要生成方法

融合物体空间关系机制的图像摘要生成方法

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

聚焦于图像中物体间位置关系这一特定信息,提出一种融合空间关系机制的神经网络图像摘要生成模型,以期为视觉问答和语音导航等下游任务提供物体方位或轨迹等关键信息。为了增强图像编码器的物体间位置关系学习能力,通过改进Transformer结构来引入几何注意力机制,显式地将物体间位置关系融合进物体外观信息中。为了辅助完成面向特定信息的抽取和摘要生成任务,进一步提出相对位置关系的数据制作方法,并基于SpatialSense数据集制作物体间位置关系的图像摘要数据集Re-Position。与5个典型模型的对比测评实验结果表明,所提模型的5个指标在公开测试集COCO上优于其他模型,全部6个指标在本文制作的Re-Position数据集上优于其他模型。

著录项

来源
《北京大学学报：自然科学版》 |2021年第1期|75-82|共8页
作者
万璋; 张玉洁; 刘明童; 徐金安; 陈钰枫;
展开▼
作者单位

北京交通大学计算机与信息技术学院;

北京100044;

展开▼
原文格式 PDF
正文语种 chi
中图分类计算技术、计算机技术;
关键词
图像摘要; 物体间位置关系; 注意力机制; Transformer结构;

相似文献

中文文献
外文文献
专利

1. 一种基于生成对抗网络与注意力机制的可见光和红外图像融合方法 [J] . 罗迪 ,王从庆 ,周勇军 . 红外技术 . 2021,第006期
2. 融合图像场景与目标显著性特征的图像描述生成方法 [J] . 盛豪 ,易尧华 ,汤梓伟 . 计算机应用研究 . 2021,第012期
3. 基于多流融合生成对抗网络的遥感图像融合方法 [J] . 雷大江 ,张策 ,李智星 . 电子与信息学报 . 2020,第008期
4. 基于多模态神经网络的图像中文摘要生成方法 [J] . 刘泽宇 ,马龙龙 ,吴健 . 中文信息学报 . 2017,第006期
5. 生成模型与判别方法相融合的图像分类方法 [J] . 郭立君 ,赵杰煜 ,史忠植 . 电子学报 . 2010,第005期
6. 基于多模态神经网络的图像中文摘要生成方法 [C] . 刘泽宇 ,马龙龙 ,吴健 . 第十六届全国计算语言学学术会议暨第五届基于自然标注大数据的自然语言处理国际学术研讨会 . 2017
7. 融合注意力机制的抽取式摘要生成技术研究 [A] . 刘艳丽 . 2020

融合物体空间关系机制的图像摘要生成方法

摘要

著录项

相似文献

相关主题

期刊订阅