首页> 中文学位 >基于深度学习的图像文本描述自动生成方法研究
【6h】

基于深度学习的图像文本描述自动生成方法研究

代理获取

目录

声明

第一章 绪论

1.1 研究背景与意义

1.1.1 研究背景

1.1.2 研究意义

1.2 国内外研究现状

1.2.1 基于模板的方法

1.2.2 基于检索的方法

1.2.3 基于编码-解码的方法

1.3 论文主要工作与结构

1.3.1 本文的主要工作

1.3.2 本文的组织结构

第二章 图像文本描述任务的基础知识

2.1 卷积神经网络

2.1.1 神经网络及后向传播(Back Propogation,BP)算法

2.1.2 卷积神经网络的基本操作

2.1.3 卷积神经网络中的BP算法

2.2 循环神经网络

2.2.1 循环神经网络模型及BP算法

2.2.2 LSTM的模型介绍

2.2.3 LSTM的BP算法

第三章 基于文本牵引的自适应注意力机制的CNN-RNN模型

3.1 编码-解码框架

3.1.1 编码部分

3.1.2 解码部分

3.2 视觉特征提取

3.2.1 ResNet模型介绍

3.2.2 图像局部和全局特征

3.3 最近邻图像集

3.3.1 VGG网络模型介绍

3.3.2 候选特征的选择

3.4 文本牵引的向量获取

3.4.1 一致性语句选择

3.4.2 文本向量的映射

3.5 文本牵引的注意力机制模型构建

3.5.1 视觉依赖门向量的构建

3.5.2 CNN-RNN结构下的文本牵引的自适应注意力机制

3.6 实验设计及结果分析

3.6.1 数据集

3.6.2 评价指标

3.6.3 网络参数设置

3.6.4 模型结果及分析

第四章 基于文本牵引的注意力机制的CNN-CNN模型结构

4.1 图像文本描述模型框架

4.1.1 单词向量特征提取

4.1.2 CNN-CNN 结构下的文本牵引的注意力机制

4.1.3 模型的预测模块

4.2 实验设计与分析

4.2.1 网络参数设置

4.2.2 模型结果及分析

第五章 总结与展望

5.1 主要工作总结

5.2 未来工作展望

致 谢

参考文献

作者在学期间取得的学术成果

展开▼

著录项

  • 作者

    刘爽;

  • 作者单位

    国防科学技术大学国防科技大学;

  • 授予单位 国防科学技术大学国防科技大学;
  • 学科 系统工程
  • 授予学位 硕士
  • 导师姓名 白亮,郭延明;
  • 年度 2018
  • 页码
  • 总页数
  • 原文格式 PDF
  • 正文语种 chi
  • 中图分类
  • 关键词

  • 入库时间 2022-08-17 11:22:14

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号