首页> 中文学位 >基于图像背景复杂度模糊分类的文字检测算法研究
【6h】

基于图像背景复杂度模糊分类的文字检测算法研究

代理获取

目录

摘要

第一章 绪论

1.1 文字检测的研究背景及意义

1.2 国内外研究现状及发展趋势

1.3 文字的分类和特点

1.3.1 文字的分类

1.3.2 文字的特点

1.4 本文的主要内容和章节安排

1.4.1 本文的主要研究内容

1.4.2 本文的章节安排

第二章 常用的图像文字检测方法

2.1 基于纹理特征的方法

2.2 基于文字边缘特征的方法

2.3 基于统计特征的方法

第三章 构建基于背景复杂度的模糊分类器

3.1 分类器的总体设计流程

3.2 分类算法设计及分析

3.2.1 训练图像集的特征提取

3.2.2 模糊聚类

3.3 BP神经网络的训练

3.3.1 BP神经网络的算法思想

3.3.2 BP神经网络算法的学习机制

3.3.3 BP神经网络训练的实现

3.4 待检测图像的分类

3.5 结果及分析

3.5.1 -聚类结果及分析

3.5.2 分类结果及分析

第四章 针对不同背景复杂度的自适应视频文字检测算法

4.1 简单背景的文字检测和定位算法

4.1.1 基于笔画边缘特征算法

4.2 中等复杂背景的文字检测和定位算法

4.2.1 金字塔分解

4.2.2 基于金字塔分解的笔画边缘检测定位文本算法

4.2.3 实验结果

4.3 复杂背景文字检测和定位算法

4.3.1 笔画宽度变换

4.3.2 笔画宽度变换算法的实现

4.3.3 笔画宽度变换实验结果

4.3.4 改进连通域检测算法检测文本

4.3.5 自然场景图像文本的精确定位

4.4 三种算法的自适应选取

4.5 本章小结

第五章 总结和展望

5.1 全文总结

5.2 下一步工作展望

致谢

参考文献

声明

展开▼

摘要

近年来多媒体的发展和智能移动设备的普及更是使得数字图像、数字视频无处不在,相应的数字处理技术也有了很大的进步。人们的生活越来越离不开数字化的媒体,同时对数字化的媒体进行处理的技术的革新也有助于人们更轻松愉快的生活。
  文字是生活中必不可缺的内容,也是数字图像、数字视频中的重要组成部分。从数字图像、视频中定位并识别文本内容有助于快速理解图像或视频中的内容,有助于图像和视频的检索。在智能移动设备上的文本定位和识别可以辅助阅读,也可用于智能交通,旅游指路等用途。本论文主要研究了自然场景中的视频文本检测定位问题。主要研究内容为构建基于背景复杂度的模糊分类器和设计三种背景复杂程度的文本定位算法。
  自然场景中的文本图像的背景是千变万化的,针对各种各样的自然场景文本图像的复杂背景,单一的算法很难做到适用于所有复杂程度的背景,所以本文提出了构建基于自然场景背景复杂度的模糊分类器的方法。通过训练将自然场景文本图像根据背景的复杂程度分为简单背景图像、中等复杂背景图像和复杂背景图像,检测时分类器为检测到的文本图像根据背景的复杂程度分配类标签以标记该文本图像所属的类别。
  针对自然场景的简单背景文本图像采用笔画边缘检测和形态学的算法,由于背景非常简单,文本在图像中对比度大,通过检测自然场景图像的笔画特征和形态学运算可以定位到文本区域。针对中等复杂背景的自然场景文本图像采用基于金字塔分解的笔画边缘检测和形态学算法,利用金字塔分解克服中等复杂背景的文本图像中的字符大小不一和稍微复杂背景物体的干扰,定位出文本区域。针对复杂背景的文本图像采用笔画变换和连通域分析的算法,在复杂的背景的情况下根据文本字符的笔画宽度是相似不变的这一特征利用笔画宽度变换算法生成笔画宽度图像,再利用连通域分析和规则过滤掉噪声干扰,定位出文本区域。最后根据基于背景复杂度的模糊分类器的分类结果自适应的选择文本定位的算法进行文本定位,既保证了文本定位的准确性,又提高了检测的效率。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号