机译:图像问题的多模式深融合
Jiaxing Univ Coll Math Phys & Informat Engn Jiaxing Zhejiang Peoples R China;
Chinese Acad Sci Inst Informat Engn Beijing Peoples R China;
Jiangnan Elect Commun Inst Jiaxing Zhejiang Peoples R China;
Jiangnan Elect Commun Inst Jiaxing Zhejiang Peoples R China;
Multimodal fusion; Image question answering; Graph neural networks;
机译:深度多模态强化网络,具有上下文指导的循环注意力,可回答图像问题
机译:通过关系推理和关注的多模式特征融合
机译:深度多峰融合自动化器,用于RGB-D图像的显着性预测
机译:Mutan:多模式Tucker融合用于视觉问题的回答
机译:深度学习中基于上下文的多图像视觉问答(VQA)
机译:中国医学智能问答系统的深度证据分数融合算法
机译:mUTaN:用于视觉问答的多模式Tucker融合