机译:用于电影问题的整体多模态内存网络
ASTAR Inst Infocomm Res Singapore 138632 Singapore;
ASTAR Inst Infocomm Res Singapore 138632 Singapore;
ASTAR Inst Infocomm Res Singapore 138632 Singapore;
ASTAR Inst Infocomm Res Singapore 138632 Singapore;
Nanyang Technol Univ Sch Comp Sci & Engn Singapore 639798 Singapore;
ASTAR Inst Infocomm Res Singapore 138632 Singapore;
Knowledge discovery; Visualization; Videos; Hidden Markov models; Task analysis; Motion pictures; Semantics; Question answering; multi-modal learning; MovieQA;
机译:通过多模态条件对冲网络应答的开放式视频问题
机译:通过文本内存和绘图图回答的电影问题
机译:动态内存网络增强了对问题的理解,可用于文本问题解答
机译:在上下文中回答 - 检查:用于视觉问题的多模态完全注意网络
机译:推断回答质量,回答者专业知识以及对问题进行回答的社交网络的排名。
机译:用于视觉问题的多模态显式稀疏关注网络
机译:用于电影问题的整体多模态内存网络