【24h】

Automatic Indonesian Image Caption Generation using CNN-LSTM Model and FEEH-ID Dataset

机译:使用CNN-LSTM模型和FEEH-ID数据集自动生成印度尼西亚语图像字幕

获取原文

摘要

Image captioning is a challenge in computer vision research. This paper extends research on automatic image captioning generation in the Indonesian dimension. Description in Indonesian sentences is generated for unlabeled images. The dataset used is FEEH-ID, this is the first Indonesian image captioning dataset. This research is crucial due to unavailability of a corpus for image captioning in Indonesian. This paper will compare the experimental results in the FEEH-ID dataset with English, Chinese and Japanese datasets using the CNN and LSTM models. The performance of the model proposed in the test set provides promising results of 50.0 for the BLEU-1 score and 23.9 for BLEU-3, which is above average of the Bleu evaluation results in other language datasets. The merging model between CNN and LSTM displays pretty good results for the FEEH-ID dataset. The experimental results will be better with a larger dataset.
机译:图像字幕是计算机视觉研究中的一个挑战。本文扩展了对印度尼西亚维自动图像字幕生成的研究。印度尼西亚文句子中的描述是针对未标记图像生成的。使用的数据集是FEEH-ID,这是第一个印度尼西亚图像字幕数据集。由于印尼语中没有用于图像字幕的语料库,因此这项研究至关重要。本文将使用CNN和LSTM模型将FEEH-ID数据集与英语,中文和日语数据集的实验结果进行比较。在测试集中提出的模型的性能为BLEU-1得分提供了50.0的有希望的结果,对于BLEU-3给出了23.9的有希望的结果,高于其他语言数据集中Bleu评估结果的平均值。 CNN和LSTM之间的合并模型对于FEEH-ID数据集显示了相当不错的结果。使用更大的数据集,实验结果将更好。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号