声明
1 绪论
1.1 课题研究的背景与意义
1.2 相关领域的国内外研究现状
1.2.1 文本检测和识别技术面临挑战
1.2.2 场景文本定位研究现状
1.2.3 场景文本识别研究现状
1.3 本文的主要研究内容和论文安排
2 相关理论介绍
2.1 MSER原理介绍
2.2 卷积神经网络介绍
2.3循环神经网络介绍
2.4 数据库介绍
2.4.1 ICDAR2013数据集
2.4.2 MJSynth数据集
2.5 本章小结
3 基于MSER与多特征融合的场景文本定位
3.1 文本定位步骤
3.2提取字符候选区域
3.3 伪字符区域过滤
3.3.1候选区域预处理
3.3.2 HOG特征提取
3.3.3 LBP特征提取
3.3.4 CNN特征提取
3.3.5 基于SVM的伪字符区域过滤
3.4 文本行生成
3.5 实验结果与分析
3.5.1 文本定位算法衡量标准
3.5.2 实验结果分析
3.6本章小结
4 基于滑动卷积字符模型与LSTM的场景文本识别
4.1滑动卷积字符模型
4.2 基于滑动卷积字符模型与LSTM的场景文本识别
4.2.1 预处理
4.2.2 基于CNN序列特征提取
4.2.3 基于LSTM上下文特征提取
4.2.4 基于CTC转录
4.2.5 模型训练
4.3实验结果与分析
4.3.1文本识别结果评价标准
4.3.2结果分析
4.4 本章小结
5 总结与展望
5.1总结
5.2 展望
致谢
参考文献
攻读学位期间主要研究成果
西安理工大学;