机译:具有双流融合的组成注意网络视频问题应答
Hangzhou Dianzi Univ Key Lab Complex Syst Modeling & Simulat Sch Comp Sci & Technol Hangzhou 310018 Peoples R China;
Hangzhou Dianzi Univ Key Lab Complex Syst Modeling & Simulat Sch Comp Sci & Technol Hangzhou 310018 Peoples R China;
Hangzhou Dianzi Univ Key Lab Complex Syst Modeling & Simulat Sch Comp Sci & Technol Hangzhou 310018 Peoples R China;
Univ Sydney Fac Engn & Informat Technol UBTECH Sydney Artificial Intelligence Ctr Darlington NSW 2008 Australia|Univ Sydney Sch Informat Technol Fac Engn & Informat Technol Darlington NSW 2008 Australia;
Visualization; Streaming media; Knowledge discovery; Feature extraction; Proposals; Task analysis; Semantics; Video question answering; spatiotemporal reasoning; compositional attention; uniform sampling stream; action pooling stream;
机译:通过时空注意和两流融合卷积网络的基于视频的人重新识别
机译:视频问题回答的多粒子关注特征的分层时间融合
机译:基于关注的开放式视频问题应答系统的多模态融合架构
机译:用于视频问题的结构化两流关注网络
机译:推断回答质量,回答者专业知识以及对问题进行回答的社交网络的排名。
机译:用于从视频序列中识别疼痛的两流注意力网络
机译:用于视频问题的结构化两流关注网络
机译:连接对话的第一步:在自由文本问题和预先录制的视频答案之间进行调解