Visual question answering; Spatial attention; Memory network; Deep learning;
机译:使用术语加权问题的多层关注网络,用于视觉问题应答
机译:问题LED对象注意视觉问题应答
机译:R-VQA:学习具有语义关注的视觉关系事实,用于视觉问题应答
机译:询问,出席和答案:探索视觉问题应答的问候空间关注
机译:视觉问答中视觉上下文中的注意力纠正机制
机译:用于视觉问题的有效密集的联合网络
机译:在上下文中回答检查:用于视觉问题的多模态完全注意网络