Self-Guiding Multimodal LSTM—When We Do Not Have a Perfect Training Dataset for Image Captioning

Yang Xian; Yingli Tian

首页> 外文期刊>IEEE Transactions on Image Processing >Self-Guiding Multimodal LSTM—When We Do Not Have a Perfect Training Dataset for Image Captioning

【24h】

Self-Guiding Multimodal LSTM—When We Do Not Have a Perfect Training Dataset for Image Captioning

机译：自指导多峰LSTM-当我们没有完美的图像字幕训练数据集时

获取原文

获取原文并翻译 | 示例

掌桥外文数据库（机构版） >>

开具论文收录证明 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

In this paper, a self-guiding multimodal LSTM (sgLSTM) image captioning model is proposed to handle an uncontrolled imbalanced real-world image-sentence dataset. We collect a FlickrNYC dataset from Flickr as our testbed with 306,165 images and the origina

机译：本文提出了一种自导多模态LSTM（sgLSTM）图像字幕模型，用于处理不受控制的不平衡真实世界图像句子数据集。我们从Flickr收集了FlickrNYC数据集作为测试平台，其中包含306,165张图像和原始图像。

著录项

来源
《IEEE Transactions on Image Processing》 |2019年第11期|5241-5252|共12页
作者
Yang Xian; Yingli Tian;
展开▼
作者单位

Department of Computer Science Graduate Center The City University of New York New York NY USA;

展开▼
收录信息
原文格式 PDF
正文语种 eng
中图分类
关键词
Task analysis; Visualization; Training; Semantics; Flickr; Urban areas; Training data;

机译：任务分析;可视化;训练;语义学Flickr;城市地区;训练数据;

相似文献

外文文献
中文文献
专利

1. DAA: Dual LSTMs with adaptive attention for image captioning [J] . Xiao Fen, Gong Xue, Zhang Yiming, Neurocomputing . 2019,第Octa28期

机译：DAA：具有自适应注意力的双重LSTM用于图像字幕
2. DAA: Dual LSTMs with adaptive attention for image captioning [J] . Xiao Fen, Gong Xue, Zhang Yiming, Neurocomputing . 2019,第OCTa28期

机译：DAA：具有自适应注意力的双重LSTM用于图像字幕
3. Image Captioning Algorithm Based on Multi-Branch CNN and Bi-LSTM [J] . Shan HE, Yuanyao LU, Shengnan CHEN IEICE transactions on information and systems . 2021,第7期

机译：基于多分支CNN和BI-LSTM的图像标题算法
4. Automatic Indonesian Image Caption Generation using CNN-LSTM Model and FEEH-ID Dataset [C] . Edy Mulyanto, Esther Irawati Setiawan, Eko Mulyanto Yuniarno, IEEE International Conference on Computational Intelligence and Virtual Environments for Measurement Systems and Applications . 2019

机译：使用CNN-LSTM模型和FEEH-ID数据集自动生成印度尼西亚语图像字幕
5. Image Captioning: A Survey of Existing Issues on Datasets, Evaluation Metrics and Methods [D] . zhou, liwan . 2020

机译：图像字幕：对数据集的现有问题，评估度量和方法的调查
6. PASMVS: A perfectly accurate synthetic path-traced dataset featuring specular material properties for multi-view stereopsis training and reconstruction applications [O] . André Broekman, Petrus Johannes Gräbe 2020

机译：PASMVS：一种完美的合成良好的路径跟踪数据集具有用于多视图立体训练和重建应用的镜面材料特性
7. Self-Guiding Multimodal LSTM—When We Do Not Have a Perfect Training Dataset for Image Captioning [O] . Yang Xian, Yingli Tian 2019

机译：自我引导的多模态LsTm - 当我们没有完美的训练时图像字幕的数据集

Self-Guiding Multimodal LSTM—When We Do Not Have a Perfect Training Dataset for Image Captioning

摘要

著录项

相似文献

相关主题

期刊订阅