画像のCNN 特徴とLSTM のデンス結合構造を用いた画像キャプションの生成

机译：使用LSTM舞蹈绑定结构图像CNN特征和图像标题

获取原文

页面导航

摘要
著录项
相似文献
相关主题

摘要

画像キャプション生成とは画像の内容をコンパクトに表現理解し，画像に映る事象を言葉で説明できる文章を生成するタスクである．近年，深層学習を画像キャプション生成に応用し，多くの生成手法を提案されている．画像キャプション生成手法では，入力画像から畳み込みネットワーク(CNN) で表現特徴を抽出するEncoder と文章を生成するDecoder を構成したEncoder-Decoder の構造を主に用いられ，正しい文章の生成可能性を検証された．しかし，今までのEncoder-Decoder では，Encoder から得られたCNN 特徴をDecoder に一回だけ入力し，最初のkeyword のみを予測する．その後のkeyword 予測は前回得られたkeyword と回帰型ユニットの状態だけを用い，Encoder から得られた画像のCNN 特徴の有効的な活用ができないという問題がある．

机译：图像标题生成是紧凑的图像内容文本了解和解释图像中反映的事件它是要生成的任务。近年来，深度学习是图像捕获已经提出了许多一代方法申请生成。图片标题生成方法从输入图像复杂编码器和句子提取工作中的表示特征（CNN）配置要生成解码器的编码器解码器结构它主要用于验证是否可以生成正确的句子生成。但是，在编码器解码器中，来自编码器在解码器中仅输入获得的CNN特性一次只预测关键字。随后的关键词预测仅用于先前获得的关键字和回归单元从编码器获得的图像的CNN特征有效遇到了无法使用的问题。

著录项

来源
《電子情報通信学会;電子情報通信学会総合大会》|2020年|75-75|共1页
会议地点
作者
寄元康平; 韓先花;
展开▼
作者单位

展开▼
会议组织
原文格式 PDF
正文语种
中图分类
关键词

相似文献

外文文献
中文文献
专利

1. NTTドコモは，2015年4 月28日の決算発表時に「中期目標に向けた新たな取り組み」と題して新たな事業ビジョンを発表しました．キーワードは「競争」から「協創」です．パートナーの皆様が保有する強みとドコモの強み（各種のビジネスアセット）を組み合わせて新たな価値を一緒に創造（協創）していきたいという思いです．この取り組みをドコモの頭文字をとって「+d（プラスディー）」と名付けました．本稿では，ドコモの「+d」の具体的な取り組みについて紹介します．本記事は，2016年2 月18～19日に開催された「NTT R&Dフォーラム2016」ワークショップでの講演を基に構成したものです． [J] . 阿佐美弘恭 NTT技術ジャーナル . 2016,第4期

机译：NTT DOCOMO宣布了2015年4月28日公布时题为“中期目标的新努力的新商业愿景。关键词是“竞争”的“合作”。我想我想结合合作伙伴的力量和DoCoMo（各种商业资产）的力量，并共同创造一个新价值。这项倡议被称为Docomo的首字母，并命名为“+ D（Plasdee）”。本文介绍了Docomo“+ D”的具体举措。本文基于2016年2月18日至196年2月18日至19日举行的“NTT研发论坛2016年”研讨会的讲座。
2. 画像特徴と単語の分散表現を活用した感性語を付与した画像キャプションの自動生成 [J] . 瀬口太郎, 萩原将文電子情報通信学会技術研究報告. ニュ-ロコンピュ-ティング. Neurocomputing . 2017,第508期

机译：利用图像特征和Word色散表示自动生成具有敏感单词的图像标题
3. キングジムスマホ連動のファイル「ショットドックス」A委員「日常生活に溶け込んだスマートフォンを使って、紙の情報を管理する仕掛けを広げるというコンセプトは有意義で面白い。一般のファイルとして使える汎用性の高さも注目されたのだろう。今後は、同様のことを高齢者が簡単にできるモデルが有望ではないか。ただ、スマホでの撮影に慣れていないと、きれいな画像を取り込めず、使い勝手は改善の余地がある」 [J] . 日経消費ウオツチャー Group 日経消費ウオツチャー . 2013,第51期

机译：King Jim与智能手机链接的文件“ Shot Docks”委员会“使用融合到日常生活中的智能手机扩展纸质信息管理机制的概念是有意义且有趣的。可用作通用文件的高通用性也引起了人们的注意。将来可能会出现一种让老年人轻松完成相同操作的模型，但是，如果您不习惯使用智能手机拍摄照片，将无法捕获漂亮的图像，并且在可用性方面还有改进的空间。 ”
4. 画像のCNN 特徴とLSTM のデンス結合構造を用いた画像キャプションの生成 [C] . 寄元康平, 韓先花電子情報通信学会;電子情報通信学会総合大会 . 2020

机译：使用LSTM舞蹈绑定结构图像CNN特征和图像标题
5. Ni(II)-Fe(II) 混成ヘモグロビンの研究 : Ni(II)プロトボルフィリンIXをデオキシヘムのモデルとして用いたヘモグロビンの酸素結合における中間状態の研究 [D] . 柴山, 修哉 1988

机译：Ni（II）-Fe（II）杂合血红蛋白的研究：使用Ni（II）原卟啉IX作为脱氧血红素模型研究血红蛋白氧结合的中间状态
6. 製品を製造するための間伐の若いチーク材機械的性質と特性 : ケーススタディ : インドネシア西ジャワ地区のチークプランテーションにおいて間伐される若いチーク材の有効利用への提案 [O] . IMAM Damar Djati, イマムダマルジャティ 2015

机译：减薄柚木木材机械性能和制造产品的特性：案例研究：关于在印度尼西亚西爪哇省柚木种植园有效利用减薄柚木木材的建议

画像のCNN 特徴とLSTM のデンス結合構造を用いた画像キャプションの生成

摘要

著录项

相似文献

相关主题

期刊订阅