首页> 中文学位 >基于几何约束的笔划宽度变换(SWT)算法及其字幕文本定位应用
【6h】

基于几何约束的笔划宽度变换(SWT)算法及其字幕文本定位应用

代理获取

目录

封面

声明

中文摘要

英文摘要

目录

第一章 绪 论

1.1 研究背景及意义

1.2 文本定位面临的挑战

1.3 国内外研究现状

1.4 研究内容和章节安排

1.5 本章小结

第二章 基于文本检测的全局特征提取

2.1 文本检测

2.2 文本区域全局特征计算

2.3 本章小结

第三章 基于几何约束笔划宽度变换的文本定位

3.1 笔划宽度变换算法

3.2 基于区域生长的候选字符生成和启发式规则的验证算法

3.3 基于聚链的候选字符合并和启发式规则的验证算法

3.4 基于随机森林的候选字符和文本行分类

3.5 实验结果和算法性能分析

3.6 本章小结

第四章 几何约束笔划宽度变换在新闻视频字幕定位中的应用

4.1 系统原理介绍

4.2 系统模块设计

4.3 系统模块实现

4.4 本章小结

第五章 总结和展望

5.1 总结

5.2 展望

致谢

参考文献

攻读硕士学位期间取得的成果

展开▼

摘要

随着移动智能设备的发展,对自然场景图像中文本的提取和理解的需求越来越大,其结果可以广泛的应用于社会机器人导航和交互、图像检索等领域,然而传统的OCR技术只能分析扫描文档,无法直接应用于自然场景,关键原因就在于自然场景图像文本定位的问题,在自然场景图像中文本和非文本混合在一起,而且文本区域出现的位置随机,这给文本定位带来了很大的挑战。本文研究了自然场景图像文本定位技术,利用全局性特征度量和几何约束改进了传统笔划宽度变换算法,实现了文本定位整套系统,并在新闻视频字幕文本定位中进行了应用。
  本文的主要贡献有以下三个方面:
  首先,针对自然场景图像文本区域通常具有高视觉显著性、富边缘密度和颜色一致性的特性,本文提取了候选字符和文本行的全局显著性和边缘密度特征。此外,将文本区域的位置和尺寸信息也转换成了全局性的度量,弥补笔划宽度变换算法对局部噪声敏感的缺陷。
  其次,本文在传统的笔划宽度变换算法基础上进行改进,利用几何约束降低了候选字符黏连的情况。本文采用的的几何约束规则融合了笔画的宽度、颜色和方向特征,避免在笔划射线查找过程中由于边缘部分缺失而连接到非对称性边缘点上,从而形成黏连字符的情况。相比于传统的笔划宽度变换算法,对由于噪声、模糊、低对比度等造成的边缘缺失的情况下,几何约束笔划宽度变换提取出的笔划特征值比原始的笔划宽度变换算法更准确,形成的候选字符质量更高。由于几何约束减少了无效笔划射线的数量,使得候选文本像素更多的集中在文本区域,减少了非文本像素形成的候选字符区域,降低了字符水平和文本行水平过滤的复杂度,同时也避免了误判。
  最后,基于上述研究成果,结合新闻视频图像的特点和字幕文本排列的规律,本文将基于几何约束笔划宽度变换算法的文本定位在新闻视频字幕文本定位系统上进行了应用。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号