机译:增强型神经体系结构的图像和视频字幕
Max Planck Institute of Informatics and Saarland University;
Aalto University School of Science and Tampere University of Technology;
Aalto University School of Science;
Feature extraction; Neural networks; Computational modeling; Multimedia communication; Object recognition; Detectors;
机译:具有字幕到图像语义构造函数的神经图像字幕模型
机译:从图像/视频的字幕文本检测方法,以有效地索引和检索多媒体数据
机译:具有音频增强功能的语义过滤的“软分割感知”视频字幕
机译:具有图像序列功能的多模式深度神经网络,用于视频字幕
机译:使用深度神经网络的自动视频字幕。
机译:基于卷积神经网络的可见光和热成像摄像机视频对人体图像的性别识别
机译:用于图像标题的多分支卷积神经网络的模块化体系结构
机译:训练数据集组合对神经图像字幕生成器性能的影响。