Visual question answering; Neural tensor network; Open-ended VQA;
机译:视觉问题解答中的人类注意力:人类和深层网络是否看待同一地区?
机译:基于图形神经网络和语境关注的视觉问题应答模型
机译:使用术语加权问题的多层关注网络,用于视觉问题应答
机译:视觉问题解答中的人类注意力:人类和深层网络是否看待同一地区?
机译:视觉问答中视觉上下文中的注意力纠正机制
机译:用于视觉问题的有效密集的联合网络
机译:视觉问题答疑中的人文关注:做人与人 网络看同一个地区?