首页> 中文学位 >基于图像增强的多特征自然场景文本检测研究
【6h】

基于图像增强的多特征自然场景文本检测研究

代理获取

目录

声明

第1章 绪论

1.1 研究背景及意义

1.2 国内外研究现状

1.3 实验数据库

1.4 论文内容及组织结构

第2章 基于图像增强的多通道MSER提取

2.1 最大稳定极值区域提取

2.1.1 最大稳定极值区域定义

2.1.2 MSER计算流程

2.1.3 MSER检测性能的影响因素

2.2基于图像评估的对比度增强

2.2.1 基于峰值区域像素比的图像评估

2.2.2 基于梯度投影的图像评估

2.2.3 评估图像对比度增强

2.3 基于多通道的MSER改进

2.3.1 颜色空间通道变换

2.3.2 显著性通道提取

2.4 实验结果与分析

2.5 本章小结

第3章 基于笔画特征的候选区域分类

3.1 纹理特征提取及分析

3.1.1 Gabor特征提取及分析

3.1.2 LBP特征提取及分析

3.2.3 HOG特征提取及分析

3.2 笔画相关特征的提取及改进

3.2.1 边界角点数

3.2.2 笔画面积比

3.3 文本区域分类器

3.3.1 AdaBoost分类器

3.3.2 SVM分类器

3.4 实验结果与分析

3.4.1 训练样本及特征提取

3.4.2 性能测试

3.5 本章小结

第4章 基于通道融合的文本行聚合

4.1 基于区域合并的通道融合

4.2 文本行聚合

4.3 文本定位标准

4.4 实验结果与分析

4.5 本章小结

第5章 总结与展望

致谢

参考文献

攻读学位期间获得与学位论文相关的科研成果目录

展开▼

摘要

随着智能终端的普及以及网络技术的发展,移动互联网逐渐全面接轨人们的生活,文本信息正广泛地以图片的形式被记录和传播,因此从图像中提取文本为人们接收环境信息提供了极大的便捷。文本检测作为提取文本信息的基础,其鲁棒性和准确性将直接影响后续的文本识别和图像应用。自然场景图片存在大量干扰因素,给检测带来了诸多不确定性。所以自然场景文本检测具有挑战性和实用价值。本文的主要研究工作如下: (1)图像增强和候选区域提取。选用最稳定极值区域(Maximally Stable Extremal Regions,MSER)方法提取文本候选区域。通过分析MSER检测的局限性,发现MSER对低对比度图像的检测性能较差,且只检测灰度通道会损失大量图像信息。因此本文提出一种图像评估方法,根据灰度分布和边缘投影判断图像是否属于低对比度图,并对低对比度图像采取对比度增强处理。采用RGB和基于感知的光照不变(Perception-based IlluminationInvariant,PII)颜色通道以及显著图代替灰度通道实现多通道MSER检测,可以充分利用图像的颜色信息并消除细小遮挡物的影响。 (2)提取候选区域特征并分类。提取Gabor特征、局部二值模式(Local Binary Pattern,LBP)特征和方向梯度直方图(Histogram of Oriented Gradient,HOG)特征三种纹理特征,并针对纹理特征的局限性,结合使用笔画相关特征——边界角点数和笔画面积比。针对笔画相关特征在实际应用产生的检测偏差问题,提高分类效果。分别使用AdaBoost和支持向量机(Support Vector Machine,SVM)对不同特征结合进行性能测试,选取最佳特征组合和分类器。 (3)融合多通道信息并合并文本行。多通道MSER导致候选区域分布在各个通道且存在差异,针对这一问题采取多通道信息融合方法。融合后,单个字符对应多个候选区域,严重影响文本行聚合,通过分析候选区域的重叠类型和颜色变化率,对重叠的候选区域进行去重处理。针对文本行中字符的临近性原则和相似性,采取搜索范围约束方法,并结合霍夫变换原理将字符单量合并成文本行,得到最后的检测结果。使用ICDAR2015公开数据库对算法进行检测,可得到79.3%的准确率和72.8%的召回率,检测效果有所提升。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号