面向跨模态数据协同分析的视觉问答方法综述

崔政; 胡永利; 孙艳丰; 尹宝才

首页> 中文期刊>北京工业大学学报 >面向跨模态数据协同分析的视觉问答方法综述

面向跨模态数据协同分析的视觉问答方法综述

开具论文收录证明 >>

期刊封面封底目录下载 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

协同分析和处理跨模态数据一直是现代人工智能领域的难点和热点,其主要挑战是跨模态数据具有语义和异构鸿沟.近年来,随着深度学习理论和技术的快速发展,基于深度学习的算法在图像和文本处理领域取得了极大的进步,进而产生了视觉问答(visual question answering,VQA)这一课题.VQA系统利用视觉信息和文本形式的问题作为输入,得出对应的答案,核心在于协同理解和处理视觉、文本信息.因此,对VQA方法进行了详细综述,按照方法原理将现有的VQA方法分为数据融合、跨模态注意力和知识推理3类方法,全面总结分析了VQA方法的最新进展,介绍了常用的VQA数据集,并对未来的研究方向进行了展望.

著录项

来源
《北京工业大学学报》|2022年第10期|1088-1099|共12页
作者
崔政; 胡永利; 孙艳丰; 尹宝才;
展开▼
作者单位

北京工业大学信息学部;

展开▼
原文格式 PDF
正文语种 chi
中图分类汽车理论;机房;
关键词
跨模态数据; 深度学习; 视觉问答; 数据融合; 跨模态注意力; 知识推理;

相似文献

中文文献
外文文献
专利

1. 面向视觉问答的跨模态交叉融合注意网络 [J] . 王茂 ,彭亚雄 ,陆安江 . 计算机应用 . 2022,第3期
2. 基于跨模态对比学习的视觉问答主动学习方法 [J] . 张北辰 ,李亮 ,查正军 . 计算机学报 . 2022,第8期
3. 深度学习驱动的跨模态视觉数据搜索研究综述 [J] . 朱维乔 . 高校图书馆工作 . 2022,第5期
4. 面向跨模态检索的音频数据库内容匹配方法研究 [J] . 张天 ,靳聪 ,帖云 . 信号处理 . 2020,第6期
5. 面向多数据中心跨节点环境的公安大数据分析方法 [J] . 杨杰 ,邓旭冉 ,翟春婕 . 中国人民公安大学学报（自然科学版） . 2020,第004期
6. 多模态时空大数据可视分析方法综述 [C] . ZHU Qing ,朱庆 ,FU Xiao . 2017测绘地理信息与导航高端论坛——《测绘学报》创刊60周年学术研讨会 . -1
7. 面向阿尔茨海默病的多模态影像数据融合分析方法 [A] . 姜煜 . 2021

面向跨模态数据协同分析的视觉问答方法综述

摘要

著录项

相似文献

相关主题

期刊订阅