首页> 外文会议>電子情報通信学会;電子情報通信学会総合大会 >画像のCNN 特徴とLSTM のデンス結合構造を用いた画像キャプションの生成
【24h】

画像のCNN 特徴とLSTM のデンス結合構造を用いた画像キャプションの生成

机译:使用LSTM舞蹈绑定结构图像CNN特征和图像标题

获取原文

摘要

画像キャプション生成とは画像の内容をコンパクトに表現 理解し,画像に映る事象を言葉で説明できる文章を生成するタスクである.近年,深層学習を画像キャプション生成に応用し,多くの生成手法を提案されている.画像キャプション生成手法では,入力画像から畳み込みネットワーク(CNN) で表現特徴を抽出するEncoder と文章を生成するDecoder を構成したEncoder-Decoder の構造を主に用いられ,正しい文章の生成可能性を検証された.しかし,今までのEncoder-Decoder では,Encoder から得られたCNN 特徴をDecoder に一回だけ入力し,最初のkeyword のみを予測する.その後のkeyword 予測は前回得られたkeyword と回帰型ユニットの状態だけを用い,Encoder から得られた画像のCNN 特徴の有効的な活用ができないという問題がある.
机译:图像标题生成是紧凑的图像内容文本了解和解释图像中反映的事件它是要生成的任务。近年来,深度学习是图像捕获已经提出了许多一代方法申请生成。图片标题生成方法从输入图像复杂编码器和句子提取工作中的表示特征(CNN)配置要生成解码器的编码器解码器结构它主要用于验证是否可以生成正确的句子生成。但是,在编码器解码器中,来自编码器在解码器中仅输入获得的CNN特性一次只预测关键字。随后的关键词预测仅用于先前获得的关键字和回归单元从编码器获得的图像的CNN特征有效遇到了无法使用的问题。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号