Feature extraction; Visualization; Decoding; Logic gates; Conferences; Robots; Mechatronics;
机译:基于分层注意的多模式融合,用于视频字幕
机译:基于残留注意力的LSTM用于视频字幕
机译:具有基于注意的LSTM和语义一致性的视频字幕
机译:基于关注的视频字幕生成的视觉音频融合
机译:在台湾(中国)使用视频字幕作为外语英语(EFL)对大学生语言学习的影响。
机译:观看旁白字幕和无声视频时的眼球运动
机译:具有视频和蕴涵生成的多任务视频字幕