首页> 中文学位 >基于深度学习的视频--文本跨模态搜索
【6h】

基于深度学习的视频--文本跨模态搜索

代理获取

目录

声明

摘要

第1章绪论

1.1课题研究背景及意义

1.2国内外相关研究现状

1.2.1跨模态图像-文本搜索

1.2.2跨模态视频-文本搜索

1.3论文主要研究内容与创新点

1.4论文组织结构

1.5本章小结

第2章相关理论基础

2.1基于深度学习的视频、文本编码

2.1.1卷积神经网络

2.1.2循环神经网络

2.1.3 Transformer

2.1.4 BERT

2.2联合嵌入空间学习

第3章基于堆叠卷积深度编码网络的跨模态视频-文本搜索

3.1引言

3.2方法

3.2.1视频编码器

3.2.2文本编码器

3.2.3堆叠多尺度扩张卷积

3.3模型学习

3.4实验结果

3.4.1实验设置

3.4.2和前沿算法对比

3.4.3消融实验

3.5本章小结

第4章基于记忆增强嵌入学习的跨模态视频-文本搜索

4.1引言

4.2方法

4.2.1总体框架

4.2.2跨模态记忆模块

4.2.3文本中心记忆模块

4.3训练和测试

4.4实验结果

4.4.1实验设置

4.4.2和前沿算法的对比

4.4.3消融实验

4.4.4定性结果分析

4.5本章小结

第5章总结与展望

5.1本文的主要贡献

5.2研究展望

参考文献

致谢

在读期间发表的学术论文与取得的其他研究成果

展开▼

著录项

  • 作者

    赵瑞;

  • 作者单位

    中国科学技术大学;

  • 授予单位 中国科学技术大学;
  • 学科 控制科学与工程
  • 授予学位 硕士
  • 导师姓名 查正军;
  • 年度 2020
  • 页码
  • 总页数
  • 原文格式 PDF
  • 正文语种 chi
  • 中图分类
  • 关键词

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号