首页> 中文学位 >基于稀疏编码特征的场景文本识别方法研究
【6h】

基于稀疏编码特征的场景文本识别方法研究

代理获取

目录

声明

摘要

第一章 绪论

1.1 选题背景与研究意义

1.2 场景文本识别的发展

1.3 面临的主要问题和挑战

1.4 本文主要工作和创新点

1.5 本文的组织结构

第二章 文本识别方法概述

2.1 场景文本识别基本方法

2.2 文本检测

2.2.1 文本检测方法

2.2.2 基于特征的检测方法

2.3 基于目标识别的文本识别方法

2.3.1 字符识别特征

2.3.2 字符分类器

2.3.3 单词识别方法

2.4 本章小结

第三章 图像特征

3.1 梯度方向直方图特征

3.2 稀疏编码直方图特征

3.2.1 局部稀疏编码表示

3.2.2 提取HSC特征

3.3 本章小结

第四章 基于稀疏编码直方图特征的文本识别方法

4.1 字符检测与识别

4.1.1 单字检测

4.1.2 非量大值抑制

4.2 单词识别

4.2.1 动态规划寻找量优匹配

4.2.2 量小分类错误法学习参数

4.3 本章小结

第五章 实验

5.1 实验数据库

5.2 实验结果

5.2.1 单字识别结果

5.2.2 单词识别结果

5.3 本章小结

第六章 工作总结和前景展望

6.1 工作总结

6.2 有待改进的地方

6.3 前景展望

参考文献

硕士期间参与的科研项目及发表论文

致谢

展开▼

摘要

场景文本识别主要研究的内容是识别出自然场景环境下拍摄的图像中所包含的文本。自然场景文本包括路牌、商业广告、杂货店店面和车牌号码等。随着计算机技术的发展,尤其是智能手机和数码相机的发展,先进的数码设备越来越在人民群众中普及,准确地识别图像中的文本也变得越来越有应用价值,这也促使了更多的研究人员投入到这项研究中来。
  本文主要描述了一种有效的基于稀疏编码特征的场景文本识别方法,即稀疏编码直方图特征(HSC)。整个识别方法分为单字识别以及单词识别两个阶段。在单字识别阶段,本文提出使用HSC特征代替梯度方向直方图(HOG)特征,HSC特征相比于HOG特征,能更详细表示图像的结构信息,在不增加时间复杂度的同时,又有效地提高了识别的精确度。在HSC特征的提取过程中,首先学习得到字典,该字典用来计算图像上每个像素的稀疏编码。字典的学习使用K-SVD分解方法,并按照类似HOG特征提取的方法聚集每个像素的稀疏编码形成局部直方图。在单词识别阶段,使用动态规划方法搜索最优匹配以得到识别结果。在动态规划的目标函数中集成了多种信息,包括候选字符区域的每个类的字符识别分数、候选字符区域之间的几何关系和单词包含的字符数。在搜索前,预先给定一定数量的单词,最终的识别结果是通过搜索所有给定单词中对应于目标函数最大值的路径得到。这个路径上的每一个点就是一个字符候选区域,最后顺序连接起来形成最终结果。目标函数中的参数通过最小分类错误(MCE)的训练方法学习得到。在ICDAR2003、ICDAR2011和SVT这三个国际通用数据库中的实验表明,基于稀疏编码直方图特征的场景文本识别方法明显优于基于梯度方向直方图的识别方法,并取得了较高的识别率。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号