首页> 中文学位 >复杂背景下的文本定位算法研究与实现
【6h】

复杂背景下的文本定位算法研究与实现

代理获取

目录

声明

摘要

1 绪论

1.1 文本定位的研究背景及意义

1.2 国内外的研究现状

1.3 本文的算法流程及结构安排

1.3.1 本文算法流程

1.3.2 本文结构安排

2 颜色量化

2.1 引言

2.2 颜色量化

2.2.1 颜色空间转换

2.2.2 一维直方图图论算法

2.2.3 二维直方图图论算法

2.2.4 颜色量化后续处理

2.3 颜色量化用于文本定位

3 连通区域特征的选取

3.1 引言

3.2 二值图像预处理

3.3 基于连通区域的笔画宽度变换算法

3.4 连通区域的特征提取

3.5 连通区域特征在文本定位中的应用

4 基于稀疏分解和条件随机场的文本定位算法

4.1 引言

4.2 稀疏分解和条件随机场基本理论

4.2.1 稀疏分解基本理论

4.2.2 条件随机场模型理论

4.3 基于稀疏分解的水平文本候选粗定位

4.3.1 字典的训练

4.3.2 基于稀疏分解的水平文本粗定位

4.4 基于条件随机场的水平文本精细定位

4.4.1 构建条件随机场模型的参数准备

4.4.2 利用稀疏表示构建条件随机场模型

4.4.3 图割CRF模型对文本细定位

4.5 任意方向的文本定位

4.5.1 接近水平方向上的文本定位

4.5.2 接近垂直方向上的文本定位

4.5.3 任意方向上的单词合并

5 评价指标及实验结果分析

5.1 实验数据库的选择

5.2 评价指标

5.3 实验结果评价

结论

参考文献

附录

攻读硕士学位期间发表学术论文情况

致谢

展开▼

摘要

彩色图像中往往包含大量的文本信息,这些文本信息与图像的内容密不可分,定位文本信息是理解图像内容的关键。因此,文本定位在网络过滤、车牌检索、图像检索/分类方面有着广泛的应用前景。由于彩色图像的背景复杂多变,文本的大小、字体、方向等特征不固定,使得已有的光学字符识别技术对彩色图像中的文本定位和识别很难投入实际应用当中。因此,对具有复杂背景图像中的文本定位技术一直是该领域的研究热点。尽管已经取得了不错的进展,但是,由于背景和前景的复杂多变性使得该问题仍然没有得到完全的解决。
  本文在学习和总结已有算法的基础上,提出了一种新颖的文本定位算法,实现了彩色图像中文本的准确和全面的定位。本文的主要工作包括:(1)提出了一种新颖的计算笔画宽度的算法——基于连通域的笔画宽度变换算法;(2)将稀疏表示和条件随机场模型共同用于复杂场景下的文本定位,提高定位精度;(3)利用本文改进后的向前向后算法,实现了任意方向上的文本定位。
  基于连通域的笔画宽度变换算法是一种提取文字笔画宽度特征算法,通过对文本字符连通区域分析,本文提出了该算法。该算法能够快速提取文本特有的笔画宽度特征,为实现文本的精确定位提供了重要特征。稀疏表示和条件随机场模型是模式识别领域中的两个重要的理论工具。本文研究了稀疏表示理论和条件随机场模型的特点,采用候选字符的稀疏重构误差构建条件随机场的模型参数,最后,采用图割方法将待处理的候选区域分为文本和背景区域,实现文本信息的精确定位。对于复杂场景中任意方向的文本定位,本文改进了原有的向前向后算法,利用改进后的算法实现了任意方向上的文本定位,可以更加全面地定位出文本。
  为了评价本文算法的效果,本文利用2011ICDAR数据库进行仿真实验,结果表明本文算法与已有算法相比,在查全率和查准率两项指标上都有较大的提升,可以全面的、准确的定位出复杂背景中的文本。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号