机译:丰富的视觉和语言表示与视频标题的互补语义
Tongji Univ Dept Comp Sci & Technol Shanghai 201804 Peoples R China|Jinggangshan Univ Coll Math & Phys Jian 343009 Jiangxi Peoples R China;
Tongji Univ Dept Comp Sci & Technol Shanghai 201804 Peoples R China;
Tongji Univ Dept Comp Sci & Technol Shanghai 201804 Peoples R China|Lanzhou City Univ Dept Comp Sci Lanzhou 730070 Gansu Peoples R China;
Video captioning; long short term memory; convolutional neural network; sequential voting; complementary features;
机译:丰富的视觉和语言表示以及带有辅助语义的视频字幕
机译:通过增强视觉和语言表示将视频转换为语言
机译:在没有词汇知识的情况下从视觉基础的语言学习语义句子表示
机译:通过使用字幕视频训练语义解析器来掌握语言
机译:在台湾(中国)使用视频字幕作为外语英语(EFL)对大学生语言学习的影响。
机译:带或不带字幕的手语翻译视频中理解过程的比较
机译:用于视频字幕的时空动态和语义属性丰富的视觉编码
机译:用于深度视觉推理的具有暴露语义的丰富表示。