机译:视觉问题解答:数据集,算法和未来挑战
Chester F. Carlson Center for Imaging Science, Rochester Institute of Technology, Rochester, NY 14623, USA;
Chester F. Carlson Center for Imaging Science, Rochester Institute of Technology, Rochester, NY 14623, USA;
Image understanding; Natural language processing; Vision and language;
机译:视觉问题解答:方法和数据集调查
机译:问题的多个答案:一种新的视觉问题接听方法
机译:带有候选答案推荐的问题感知预测,用于视觉问答
机译:clevr_hyp:挑战数据集和基线,用于在图像上用假设动作回答
机译:视觉问答中视觉上下文中的注意力纠正机制
机译:临床产生的有关放射影像的视觉问题和答案的数据集
机译:视觉问题回答:数据集,算法和未来挑战