首页> 中文学位 >基于HOG和多元语言模型的场景单词识别
【6h】

基于HOG和多元语言模型的场景单词识别

代理获取

目录

声明

摘要

第一章 绪论

第一节 研究背景和意义

第二节 国内外研究现状

1.2.1 文本定位方法

1.2.2 文字分割方法

1.2.3 文字识别方法

第三节 本文主要研究内容

第四节 本文组织结构

第二章 基于HOG特征的字符识别

第一节 彩色图转换为灰度图

第二节 特征提取算法

2.2.1 Gabor特征

2.2.2 SIFT特征

2.2.3 HOG特征

第三节 分类器设计

2.3.1 SVM分类器

2.3.2 AdaBoost分类器

2.3.3 最近邻分类器

第四节 字符识别方法

第三章 基于多元语言模型的单词识别

第一节 构建语言模型

3.1.1 HMM模型

3.1.2 CRF模型

3.1.3 多元语言模型

第二节 单词识别方法

3.2.1 滑动窗口

3.2.2 多尺度分解

3.2.3 单词识别

第四章 实验与分析

第一节 实验数据集

第二节 实验整体流程

第三节 字符识别结果及分析

第四节 单词识别结果及分析

第五章 总结与展望

第一节 总结

第二节 展望

参考文献

致谢

个人简历、在学期间发表的学术论文与研究成果

展开▼

摘要

随着移动电子设备在日常生活中的广泛使用,人们可以方便快捷地通过拍照获取图像,而图像中往往包含着内容丰富的文字信息,基于摄像头的应用产生了大量对拍摄场景内容理解的需求。图像中的文字作为一种重要的语义信息,是描述和理解客观世界相关环境的关键要素,正确识别这些文字对于人们的拍摄意图、基于内容的图像检索和分享、过滤等应用有着重要的现实意义。虽然针对传统扫描文档图像的OCR方法已经获得了很大的成功,但这种成熟的技术不一定适用于自然场景图像中的文字识别。由于自然场景图像受到多方面干扰因素的影响,大大增加了正确识别文字的难度。
  考虑到场景图像中文字的特点,对其进行识别时,直接利用已有的OCR软件很难获得良好的识别效果。而传统的场景文字提取工作中,往往分为文本检测、文字分割和文字识别三个部分,从而造成文字的识别由于分割不准确而误识较多。近年来,学术界开始关注一种新的文字提取方法,即文字的检测、分割和识别同时进行不再明显分开。针对场景图像中英文单词识别的复杂性,本文在学者们新近研究成果的基础上采用这种方法,即当定位到文本区域后,在矩形区域内同时检测和识别字符而不进行分割,然后按照一定的规则将识出字符组合成单词,提取文字表示的确切信息。
  本文提出了一种基于HOG和多元语言模型的场景单词识别方法。首先对训练样本字符图像进行预处理并提取HOG特征,然后基于多尺度分解和滑动窗口密集扫描测试单词图像,提取可能是字符位置的检测窗口的HOG特征,再利用最近邻分类器进行字符识别,最后根据提出的多元语言模型将识出字符组合成单词。实验结果表明,该方法具有一定的鲁棒性。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号