基于HOG和多元语言模型的场景单词识别

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

随着移动电子设备在日常生活中的广泛使用，人们可以方便快捷地通过拍照获取图像，而图像中往往包含着内容丰富的文字信息，基于摄像头的应用产生了大量对拍摄场景内容理解的需求。图像中的文字作为一种重要的语义信息，是描述和理解客观世界相关环境的关键要素，正确识别这些文字对于人们的拍摄意图、基于内容的图像检索和分享、过滤等应用有着重要的现实意义。虽然针对传统扫描文档图像的OCR方法已经获得了很大的成功，但这种成熟的技术不一定适用于自然场景图像中的文字识别。由于自然场景图像受到多方面干扰因素的影响，大大增加了正确识别文字的难度。
　　考虑到场景图像中文字的特点，对其进行识别时，直接利用已有的OCR软件很难获得良好的识别效果。而传统的场景文字提取工作中，往往分为文本检测、文字分割和文字识别三个部分，从而造成文字的识别由于分割不准确而误识较多。近年来，学术界开始关注一种新的文字提取方法，即文字的检测、分割和识别同时进行不再明显分开。针对场景图像中英文单词识别的复杂性，本文在学者们新近研究成果的基础上采用这种方法，即当定位到文本区域后，在矩形区域内同时检测和识别字符而不进行分割，然后按照一定的规则将识出字符组合成单词，提取文字表示的确切信息。
　　本文提出了一种基于HOG和多元语言模型的场景单词识别方法。首先对训练样本字符图像进行预处理并提取HOG特征，然后基于多尺度分解和滑动窗口密集扫描测试单词图像，提取可能是字符位置的检测窗口的HOG特征，再利用最近邻分类器进行字符识别，最后根据提出的多元语言模型将识出字符组合成单词。实验结果表明，该方法具有一定的鲁棒性。

著录项

作者
李成学;
展开▼
作者单位

南开大学;

展开▼
授予单位南开大学;
学科计算机软件与理论
授予学位硕士
导师姓名王庆人;
年度 2014
页码
总页数
原文格式 PDF
正文语种中文
中图分类 TP391.41;
关键词
场景图像; 多元语言模型; 单词识别; 文本检测;

相似文献

中文文献
外文文献
专利

1. 联机手写维吾尔文单词识别中两种语言模型的比较研究 [J] . 柳玲玲 ,赵晖 . 计算机应用与软件 . 2012,第009期
2. 基于多元HoG及无人机航拍图像的植被类型识别 [J] . 林志玮 ,丁启禄 ,涂伟豪 . 福建林学院学报 . 2018,第004期
3. 基于多元HoG及无人机航拍图像的植被类型识别 [J] . 林志玮 ,丁启禄 ,涂伟豪 . 森林与环境学报 . 2018,第004期
4. 基于词素的哈萨克语语言模型及其单词切分中的应用 [J] . 努尔波拉提·胡安 ,米吉提·阿不里米提 ,艾斯卡尔·艾木都拉 . 电脑知识与技术 . 2018,第011期
5. 基于单词分类的归一化神经网络语言模型研究 [J] . 陈铬亮 ,徐佳 . 福建工程学院学报 . 2016,第004期
6. 一种基于带语言模型并行音节解码器的语种识别系统 [C] . 索宏彬 ,李明 ,吕萍 . 2007年全国网络与信息安全技术研讨会 . 2007
7. 基于单词全局特征的印刷体英文单词识别系统研究 [A] . 吴晓峰 . 2005

基于HOG和多元语言模型的场景单词识别

目录

摘要

著录项

相似文献

相关主题

期刊订阅