首页> 中文学位 >基于多尺度Gabor滤波器和BP神经网络的文本检测算法研究
【6h】

基于多尺度Gabor滤波器和BP神经网络的文本检测算法研究

代理获取

目录

文摘

英文文摘

声明

第一章引言

1.1文本检测的研究背景

1.2国内外文本检测的研究现状

1.3本文的主要工作

1.4论文结构

第二章文本检测技术

2.1文本检测技术的应用

2.2文本检测技术的特性与难点

2.2.1文本的分类

2.2.2文本的特征

2.2.3文本检测技术的难点

2.3文本检测技术的分类

2.4文本检测技术的现存方案

2.4.1基于区域的方法

2.4.2基于边缘和梯度的方法

2.4.3基于纹理的方法

2.4.4基于学习的方法

2.4.5压缩域方法

2.4.6时空方法

2.4.7基于字符形状特征的方法

2.5文本检测技术存在的主要问题

第三章多尺度Gabor滤波器和BP神经网络的基本理论

3.1 Gabor滤波器理论

3.1.1函数的提出

3.1.2 2-D Gabor滤波器

3.1.3 Gabor变换及其函数特性

3.1.4 Gabor滤波器在特征提取中的应用研究

3.1.5相关领域Gabor的应用

3.2BP神经网络(误差逆向传播网络)

3.2.1神经网络概述

3.2.2误差逆向传播网络的定义、特点及应用

3.2.3误差逆向传播网络的实现

第四章基于多尺度Gabor滤波器和BP神经网络的文本检测算法

4.1图像预处理

4.1.1 HSI颜色空间

4.1.2图像预处理(局部图像增强)

4.2基于连通分量的文本粗检测

4.2.1边缘检测

4.2.2基于密度的区域增长

4.2.3用启发式信息初步滤除非文本区域

4.3基于纹理的文本细检测

4.3.1多尺度Gabor滤波和特征提取

4.3.2特征选择

4.3.3用BP神经网络分类

第五章实验和结论

5.1影响文本检测的因素

5.2本论文的实验结果

5.2.1彩色图像中的检测结果

5.2.2视频中的文本检测结果

5.2.3场景图像中的文本检测结果

5.3小结

第六章总结和展望

6.1总结

6.2展望

参考文献

致谢

在学期间公开发表论文及著作情况

展开▼

摘要

本文以现有的文本检测算法为基础,通过对文本特征研究现状的分析,实验表明了一些图像文本检测算法的不足之处:实验场景过于单一、鲁棒性差;对光照条件不好的图像处理能力较差等。 基于这些问题,提出了一个基于多尺度Gabor滤波器和BP神经网络相结合的文本检测算法。该算法首先对HSI颜色空间中的I分量图像进行预处理,利用Sobel边缘检测算子和基于灰度的区域增长算法对一些可能是文本的区域进行粗定位。其次,对这些候选文本区域进行Gabor滤波。运用多尺度的方法,在Gabor滤波后的子图中提取72个纹理特征。然后,用统计的方法对得到的特征进行筛选。最后,把筛选后的特征作为相应区域的特征向量输入BP神经网络,进行分类,得到真正的文本区域。 所提出的文本检测算法,进一步拓展了Gabor滤波器的研究领域,也显著提高了检测算法的准确性。同时对输入神经网络的纹理特征进行筛选,可以改良BP神经网络固有的训练速度慢的缺点。 本算法不仅准确的检测到了图像中的文本,而且达到了较高的检测率。在多种场景中的文本检测实验中验证了本文方法较现有经典方法而言具有更高的灵活性和鲁棒性,尤其在对图像和视频帧中的文本检测都具有良好的准确性,检测率达到96.3%。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号