机译:视觉问题解答中的人类注意力:人类和深层网络是否看待同一地区?
Georgia Institute of Technology, Atlanta, GA, USA;
Virginia Tech, Blacksburg, VA, USA;
Facebook AI Research, Menlo Park, CA, USA;
Georgia Institute of Technology, Atlanta, GA, USA,Facebook AI Research, Menlo Park, CA, USA;
Georgia Institute of Technology, Atlanta, GA, USA,Facebook AI Research, Menlo Park, CA, USA;
Visual Question Answering; Attention;
机译:单词到区域的注意力网络,用于视觉提问
机译:使用术语加权问题的多层关注网络,用于视觉问题应答
机译:深度多模态强化网络,具有上下文指导的循环注意力,可回答图像问题
机译:视觉问题解答中的人类注意力:人类和深层网络是否看待同一地区?
机译:利用人类推理来理解和改进视觉问题的回答
机译:用于视觉问题的有效密集的联合网络
机译:视觉问题答疑中的人文关注:做人与人 网络看同一个地区?