基于图像增强的多特征自然场景文本检测研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

随着智能终端的普及以及网络技术的发展，移动互联网逐渐全面接轨人们的生活，文本信息正广泛地以图片的形式被记录和传播，因此从图像中提取文本为人们接收环境信息提供了极大的便捷。文本检测作为提取文本信息的基础，其鲁棒性和准确性将直接影响后续的文本识别和图像应用。自然场景图片存在大量干扰因素，给检测带来了诸多不确定性。所以自然场景文本检测具有挑战性和实用价值。本文的主要研究工作如下：（1）图像增强和候选区域提取。选用最稳定极值区域(Maximally Stable Extremal Regions,MSER)方法提取文本候选区域。通过分析MSER检测的局限性，发现MSER对低对比度图像的检测性能较差，且只检测灰度通道会损失大量图像信息。因此本文提出一种图像评估方法，根据灰度分布和边缘投影判断图像是否属于低对比度图，并对低对比度图像采取对比度增强处理。采用RGB和基于感知的光照不变(Perception-based IlluminationInvariant,PII)颜色通道以及显著图代替灰度通道实现多通道MSER检测，可以充分利用图像的颜色信息并消除细小遮挡物的影响。（2）提取候选区域特征并分类。提取Gabor特征、局部二值模式(Local Binary Pattern,LBP)特征和方向梯度直方图(Histogram of Oriented Gradient,HOG)特征三种纹理特征，并针对纹理特征的局限性，结合使用笔画相关特征——边界角点数和笔画面积比。针对笔画相关特征在实际应用产生的检测偏差问题，提高分类效果。分别使用AdaBoost和支持向量机(Support Vector Machine,SVM)对不同特征结合进行性能测试，选取最佳特征组合和分类器。（3）融合多通道信息并合并文本行。多通道MSER导致候选区域分布在各个通道且存在差异，针对这一问题采取多通道信息融合方法。融合后，单个字符对应多个候选区域，严重影响文本行聚合，通过分析候选区域的重叠类型和颜色变化率，对重叠的候选区域进行去重处理。针对文本行中字符的临近性原则和相似性，采取搜索范围约束方法，并结合霍夫变换原理将字符单量合并成文本行，得到最后的检测结果。使用ICDAR2015公开数据库对算法进行检测，可得到79.3%的准确率和72.8%的召回率，检测效果有所提升。

著录项

作者
陈硕;
展开▼
作者单位

武汉理工大学;

展开▼
授予单位武汉理工大学;
学科电子科学与技术
授予学位硕士
导师姓名郑建彬;
年度 2018
页码
总页数
原文格式 PDF
正文语种中文
中图分类计算技术、计算机技术;遥感技术;
关键词
图像增强; 多特征; 自然; 场景文本;

相似文献

中文文献
外文文献
专利

1. 基于YOLOv3与MSER的自然场景中文文本检测研究与实现 [J] . 殷航 ,张智 ,王耀林 . 计算机应用与软件 . 2021,第010期
2. 基于自然场景的图像增强技术应用探究 [J] . 苗燕春1 . 白城师范学院学报 . 2019,第008期
3. 基于文本中心线的自然场景文本检测方法 [J] . 刘业鑫 ,卜巍 ,邬向前 . 智能计算机与应用 . 2020,第002期
4. 基于文本中心线的自然场景文本检测方法 [J] . 刘业鑫 ,卜巍 ,邬向前 . 智能计算机与应用 . 2020,第002期
5. 基于全局和局部多特征的图像增强算法 [J] . 刘玉洁 ,朱韶平 . 液晶与显示 . 2020,第005期
6. 一种基于多特征融合的场景文本检测方法 [C] . Xiao Chengqiu ,肖诚求 ,Ji Lixin . 第17届全国图象图形学学术会议 . 2014
7. 基于深度学习的自然场景文本检测研究 [A] . 郭闯 . 2020

基于图像增强的多特征自然场景文本检测研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅