机译:统一在哪里看到和告诉什么:基于区域的注意力和特定于场景的上下文的图像字幕
Visualization; Feature extraction; Image classification; Context modeling; Adaptation models; Computational modeling; Data mining;
机译:使用基于区域的注意力联合时变注意力的图像字幕
机译:使用基于区域的注意力关节与时变关节的图像标题
机译:更加注意显着性:具有显着性和上下文注意的图像字幕
机译:通过自适应注意时间自适应地对准图像标题
机译:超 语境 : 最大化 更佳的图像 ,字幕生成 语境
机译:社交图像字幕:探索视觉注意力和用户注意力
机译:使用标题注意图的基于变化的自动统计器的多个图像标题