首页> 中文学位 >基于深度学习的带标题图像多标签分类
【6h】

基于深度学习的带标题图像多标签分类

代理获取

目录

声明

第一章 绪论

1.1 论文的背景以及意义

1.2 国内外研究历史和现状

1.3 本文的主要贡献与创新

1.4 本文的结构安排

第二章 相关理论基础

2.1 多标签图像分类

2.1.1 多标签图像识别任务

2.1.2 实验数据集

2.1.3 实验评估方法

2.2 深度学习基础知识

2.2.1 卷积神经网络

2.2.2 循环神经网络

2.3 注意力机制

2.4 标签关联算法

2.5 文本预处理

2.5.1 中文分词

2.5.2 文本嵌入

2.6 多模态特征融合

2.7 本章小结

第三章 基于立体注意力机制的多标签图像分类算法

3.1 图像特征提取模型

3.2 视觉注意力机制

3.2.1 空间注意力机制

3.2.2 通道注意力机制

3.2.3 混合注意力机制

3.3 基于立体视觉注意力机制多标签分类模型

3.4 立体注意力机制设计策略

3.4.1 基于对象区域的空间注意力机制

3.4.2 基于对象语义的通道注意力机制

3.4.3 立体注意力机制

3.4.4 层级多标签分类

3.5 实验数据集创建

3.6 实验设置与分析

3.6.1 实验设置

3.6.2 注意力图分析

3.6.3 实验结果

3.7 本章小结

第四章 基于文本辅助的多标签图像分类算法

4.1 自然语言处理中的注意力机制

4.2 特征融合方法

4.3 基于多模态融合与图像注意力机制的多标签分类模型

4.3.1 基于注意力机制的文本处理

4.3.2 联合注意力网络

4.4 实验设置与分析

4.4.1 实验设置

4.4.2 实验结果

4.5 本章小结

第五章 全文总结与展望

5.1 全文总结

5.2 后续工作展望

致谢

参考文献

展开▼

著录项

  • 作者

    蔡江涛;

  • 作者单位

    电子科技大学;

  • 授予单位 电子科技大学;
  • 学科 计算机科学与技术
  • 授予学位 硕士
  • 导师姓名 王晓敏;
  • 年度 2020
  • 页码
  • 总页数
  • 原文格式 PDF
  • 正文语种 chi
  • 中图分类
  • 关键词

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号