首页> 中文学位 >基于深度学习的高效视觉问答研究与算法实现
【6h】

基于深度学习的高效视觉问答研究与算法实现

代理获取

目录

声明

目 录

第一章 绪论

1.1 研究工作的背景与意义

1.2 国内外研究现状

1.2.1 多模态特征融合

1.2.2 注意力机制

1.2.3 模型压缩方法

1.2.4 视觉问答数据集

1.3 本文的主要贡献与创新

1.4 本论文的结构安排

第二章 深度学习理论基础

2.1 人工神经网络

2.1.1 前馈神经网络与反向传播算法

2.1.2 卷积神经网络

2.1.3 循环神经网络

2.2 模型压缩技术

2.2.1 更精细的卷积结构

2.2.2 权值量化

2.2.3 知识蒸馏

2.3 本章小结

第三章 特征提取网络

3.1 提取问题特征

3.1.1 骨干循环神经网络

3.1.2 自注意力机制

3.2 提取图片特征

3.2.1 骨干卷积神经网络

3.2.2 层叠注意力机制

3.3 本章小结

第四章 视觉问答头部网络

4.1 特征融合模块

4.1.1 改进的多模双线性分解池化融合模块

4.2 答案分类网络

4.2.1 损失函数

4.3 本章小结

第五章 视觉问答模型压缩方法

5.1 图片特征提取网络的压缩潜力

5.2 基于卷积核一阶范数的剪枝

5.2.1 剪枝方法

5.2.2 剪枝策略

5.2.3 实验结果

5.3 本章小结

第六章 模型实现与测试结果

6.1.1 数据集概况

6.1.2 预处理数据集

6.1.3 模型评价方法

6.2 模型实现细节

6.3.1 模型的训练细节

6.3.2 模型的测试与结果对比

6.3.3 model ensemble 测试

6.4 本章小结

第七章 全文总结与展望

7.1 全文总结

7.2 后续工作展望

致 谢

参考文献

攻读硕士学位期间取得的成果

展开▼

著录项

  • 作者

    吝博强;

  • 作者单位

    电子科技大学;

  • 授予单位 电子科技大学;
  • 学科 软件工程
  • 授予学位 硕士
  • 导师姓名 田文洪;
  • 年度 2020
  • 页码
  • 总页数
  • 原文格式 PDF
  • 正文语种 chi
  • 中图分类
  • 关键词

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号