声明
第一章 绪论
1.1 论文的背景以及意义
1.2 国内外研究历史和现状
1.3 本文的主要贡献与创新
1.4 本文的结构安排
第二章 相关理论基础
2.1 多标签图像分类
2.1.1 多标签图像识别任务
2.1.2 实验数据集
2.1.3 实验评估方法
2.2 深度学习基础知识
2.2.1 卷积神经网络
2.2.2 循环神经网络
2.3 注意力机制
2.4 标签关联算法
2.5 文本预处理
2.5.1 中文分词
2.5.2 文本嵌入
2.6 多模态特征融合
2.7 本章小结
第三章 基于立体注意力机制的多标签图像分类算法
3.1 图像特征提取模型
3.2 视觉注意力机制
3.2.1 空间注意力机制
3.2.2 通道注意力机制
3.2.3 混合注意力机制
3.3 基于立体视觉注意力机制多标签分类模型
3.4 立体注意力机制设计策略
3.4.1 基于对象区域的空间注意力机制
3.4.2 基于对象语义的通道注意力机制
3.4.3 立体注意力机制
3.4.4 层级多标签分类
3.5 实验数据集创建
3.6 实验设置与分析
3.6.1 实验设置
3.6.2 注意力图分析
3.6.3 实验结果
3.7 本章小结
第四章 基于文本辅助的多标签图像分类算法
4.1 自然语言处理中的注意力机制
4.2 特征融合方法
4.3 基于多模态融合与图像注意力机制的多标签分类模型
4.3.1 基于注意力机制的文本处理
4.3.2 联合注意力网络
4.4 实验设置与分析
4.4.1 实验设置
4.4.2 实验结果
4.5 本章小结
第五章 全文总结与展望
5.1 全文总结
5.2 后续工作展望
致谢
参考文献
电子科技大学;