机译:统一开放式视频问答的视频和问题注意
State Key Laboratory of CAD&CG, Zhejiang University, Hangzhou, China;
College of Computer Science, Zhejiang University, Hangzhou, China;
State Key Laboratory of CAD&CG, Zhejiang University, Hangzhou, China;
Knowledge discovery; Visualization; Adaptation models; Natural languages; Motion pictures; Coherence; Hair;
机译:基于关注的开放式视频问题应答系统的多模态融合架构
机译:通过多模态条件对冲网络应答的开放式视频问题
机译:视频问题回答的多粒子关注特征的分层时间融合
机译:通过分层卷积自我关注网络回答开放式长型视频问题
机译:视觉问题引起关注
机译:对即时反馈的反应差异以及对多项选择题和开放式问题的答案进行修改的机会
机译:超越RNNS:使用共同关注的位置自我关注视频问题应答
机译:连接对话的第一步:在自由文本问题和预先录制的视频答案之间进行调解