自然场景图像中的文本检测与识别技术研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

自然场景图像中的文本含有丰富而准确的高层语义信息，这些语义信息对于盲人障碍导航系统、智能城市交通管理系统、汽车的无人驾驶系统、即时翻译系统都具有指导意义。因此，对自然场景图像中文本进行定位和识别具有极大的研究价值。本文针对自然场景下的文本定位与识别进行了深入研究，具体的工作如下： 1．传统MSER算法对光照敏感且在单一的灰度通道上进行文本候选区域提取时会出现文本漏检情况。针对此问题，本文提出了一种基于多通道光照均衡化的MSER算法。首先，分别在R、G、B通道下对图片做光照均衡化处理；然后，在对应通道下用MSER检测算子提取文本字符的MSER区域；最后，合并每个通道的MSER区域作为字符候选区域。经过实验验证，改进后的算法针对光照不均匀或不同复杂背景上的图片，都能检测到相对完整的字符区域，提高了算法的召回率。 2．传统MSER算法对于复杂背景的场景文本检测时会出现误检情况。针对此问题，本文提出一种基于多特征融合的伪字符区域过滤算法。首先，对字符候选区域分别提取HOG特征、LBP特征、CNN特征；然后，将这三种特征进行串形融合；最后，利用SVM训练一个字符判别器来过滤伪字符区域。经实验验证，此算法能剔除掉更多的伪字符区域，提高了算法的准确率。 3．滑动卷积字符模型是基于字符分类的识别，只关注字符的深度特征，而忽略了文本行中字符与字符之间的上下文关系，这使得算法的识别精度会大打折扣。针对此问题，本文深入研究了滑动卷积字符模型，在其基础上引入双向LSTM网络来进行场景文本识别。首先，去掉滑动卷积字符模型中的分类层；然后，使用CNN滑动窗口来提取输入图像的序列特征，将输出的序列特征输入到设计好双向LSTM网络中提取每个字符的上下文特征；最后，用CTC转录机制将LSTM的输出预测转录为实际的字符串。通过与其它算法对比，本文算法在识别精度上有显著的提升。

著录项

作者
周鹏飞;
展开▼
作者单位

西安理工大学;

展开▼
授予单位西安理工大学;
学科计算机技术
授予学位硕士
导师姓名张九龙,刘晓燕;
年度 2019
页码
总页数
原文格式 PDF
正文语种中文
中图分类计算技术、计算机技术;自动化基础理论;
关键词
自然场景图像; 文本检测;

相似文献

中文文献
外文文献
专利

1. 自然场景图像中的文本检测现状研究和展望 [J] . 刘洁芯 ,陈虹光 ,邓成梁 . 现代计算机（专业版） . 2021,第005期
2. 自然场景图像中的文本检测及定位算法研究——基于边缘信息与笔画特征 [J] . 李东勤 ,徐勇 ,周万怀 . 重庆科技学院学报（自然科学版） . 2019,第003期
3. 自然场景图像中的中文文本检测算法 [J] . 缪裕青 ,刘水清 ,张万桢 . 计算机工程与设计 . 2018,第003期
4. 自然场景图像中的文本检测综述 [J] . 王润民 ,桑农 ,丁丁 . 自动化学报 . 2018,第012期
5. 自然场景图像中的文本检测方法研究 [J] . 李东勤 ,王芳 ,周万怀 . 重庆科技学院学报（自然科学版） . 2016,第006期
6. 自然场景多方向文本检测方法 [C] . Yang Bin ,杨彬 ,Xia Siyu . 第十一届中国智能机器人会议 . 2015
7. 复杂自然场景图像中的文本检测与识别技术研究 [A] . 熊海朋 . 2017

自然场景图像中的文本检测与识别技术研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅