机译:VD-SAN:用于图像字幕生成的视觉密集语义注意网络
Huazhong Univ Sci & Technol, Sch Elect Informat & Commun, Wuhan, Hubei, Peoples R China;
Huazhong Univ Sci & Technol, Sch Elect Informat & Commun, Wuhan, Hubei, Peoples R China;
Huazhong Univ Sci & Technol, Sch Elect Informat & Commun, Wuhan, Hubei, Peoples R China;
Huazhong Univ Sci & Technol, Sch Elect Informat & Commun, Wuhan, Hubei, Peoples R China;
Image caption; Semantic attributes; Convolutional neural network; Long short-term memory networks;
机译:使用完全卷积网络的空间关系注意图片
机译:探索遥感图像标题的多级关注和语义关系
机译:对象感知图像标题注意的语义
机译:基于视觉和语义注意的图像字幕
机译:在深度神经网络上进行集成学习以生成图像字幕
机译:社交图像字幕:探索视觉注意力和用户注意力
机译:Stack-VS:图像字幕生成的堆叠视觉语义关注