声明
第一章 绪论
1.1 研究背景与意义
1.1.1 研究背景
1.1.2 研究意义
1.2 国内外研究现状
1.2.1 基于模板的方法
1.2.2 基于检索的方法
1.2.3 基于编码-解码的方法
1.3 论文主要工作与结构
1.3.1 本文的主要工作
1.3.2 本文的组织结构
第二章 图像文本描述任务的基础知识
2.1 卷积神经网络
2.1.1 神经网络及后向传播(Back Propogation,BP)算法
2.1.2 卷积神经网络的基本操作
2.1.3 卷积神经网络中的BP算法
2.2 循环神经网络
2.2.1 循环神经网络模型及BP算法
2.2.2 LSTM的模型介绍
2.2.3 LSTM的BP算法
第三章 基于文本牵引的自适应注意力机制的CNN-RNN模型
3.1 编码-解码框架
3.1.1 编码部分
3.1.2 解码部分
3.2 视觉特征提取
3.2.1 ResNet模型介绍
3.2.2 图像局部和全局特征
3.3 最近邻图像集
3.3.1 VGG网络模型介绍
3.3.2 候选特征的选择
3.4 文本牵引的向量获取
3.4.1 一致性语句选择
3.4.2 文本向量的映射
3.5 文本牵引的注意力机制模型构建
3.5.1 视觉依赖门向量的构建
3.5.2 CNN-RNN结构下的文本牵引的自适应注意力机制
3.6 实验设计及结果分析
3.6.1 数据集
3.6.2 评价指标
3.6.3 网络参数设置
3.6.4 模型结果及分析
第四章 基于文本牵引的注意力机制的CNN-CNN模型结构
4.1 图像文本描述模型框架
4.1.1 单词向量特征提取
4.1.2 CNN-CNN 结构下的文本牵引的注意力机制
4.1.3 模型的预测模块
4.2 实验设计与分析
4.2.1 网络参数设置
4.2.2 模型结果及分析
第五章 总结与展望
5.1 主要工作总结
5.2 未来工作展望
致 谢
参考文献
作者在学期间取得的学术成果
国防科学技术大学国防科技大学;