声明
1 概述
1.1 研究背景
1.2 国内外研究现状
1.3 本文主要工作
1.4 本文的章节安排
2 相关算法与理论基础
2.1 深度学习与神经网络
2.2 递归循环神经网络
2.3 跨模态问答
2.4 检测与识别
2.5 度量学习
3 基于文本与图像的视觉问答
3.1 问题提出
3.2 跨模态视觉问答网络
3.3 空间离散余弦哈希(Spatial-DCTHash)卷积层
3.4 实验结果与分析
4 基于包含文字图像的跨模态检索
4.1 问题提出
4.2 数据集采集
4.3 跨模态招牌检索算法
4.4 实验与结果分析
结论
参考文献
附录
附录1 数据集中杭州80条街道行政区
附录2 数据集图片部分示例(已裁剪)
附录3 中文招牌店铺GPS坐标分布
致谢
在读期间公开发表论文(著)及科研情况