基于局部特征的复杂背景图像内文本识别研究与实现

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

图像文本识别是数字图像处理和计算机视觉领域的研究热点与重要问题。与扫描图像相比，复杂背景和自然拍摄图像存在：1、文本字体和笔画粗细多样；2、文本字符排列布局多样；3、背景颜色和纹理复杂多样；4、相机视角与载体扭曲引起字符几何形变；5、光度不均与噪声导致图像解析度低下等特性。上述特性使得针对复杂背景和自然拍摄图像的文本识别成为一个具有困难和挑战的对象识别，而并非简单的光学字符识别(OCR)问题。OCR对输入图像在文本结构规范上的要求与限制，使得目前基于OCR技术的识别框架存在较大的局限性。虽然可以通过改进前期文本定位和预处理环节来为OCR提供结构化和规范化更好的输入从而获得识别率的一定提升，但这些环节的优化是困难和受限的。区别于基于OCR技术的识别框架，本文提出基于局部特征的文本识别框架。该框架利用图像检索原理和技术，通过构建模版字符图像库，采用图像局部特征匹配来实现复杂背景图像文本识别。针对局部特征的不同应用和处理手段，本文实现了基于Bag-of-Words Model和基于Point-to-Point Matching的识别系统。与基于OCR技术的框架相比：1、免除了区域增强，二值化，图层分析，几何归一化等一系列复杂的预处理环节；2、通过采用具有几何和光度不变性的局部特征，并引入针对性的投票算法和几何一致性验证，克服了OCR对于文字旋转，不规则排列，图像解析度不均，视角变换和扭曲等条件下识别的局限性；3、通过构建多语种和多字体的模版字幅图像库，实现识别在语种和字体上的透明与鲁棒性。本文重点以中文，日文，韩文，英文，阿拉伯文为基础，在单字符，多字符，自然拍摄图像上进行了大量对比实验，结果显示基于局部特征技术的识别框架在处理能力和识别准确率上都有良好的表现，更加适合复杂背景和自然拍摄图像文本识别。

著录项

作者
王会靖;
展开▼
作者单位

上海交通大学;

展开▼
授予单位上海交通大学;
学科通信与信息系统
授予学位硕士
导师姓名管海兵;
年度 2010
页码
总页数
原文格式 PDF
正文语种中文
中图分类 TP391.41;
关键词
局部特征; 复杂背景; 图像处理; 文本识别;

相似文献

中文文献
外文文献
专利

1. 基于迁移学习的语言文本识别分类研究与实现 [J] . 杨显华 ,丁春利 . 电子技术与软件工程 . 2019,第020期
2. 基于VB的文本识别技术的研究与实现 [J] . 钱文婷 . 电脑开发与应用 . 2013,第008期
3. 基于改进YOLOv5网络的复杂背景图像中茶尺蠖检测 [J] . 胡根生 ,吴继甜 ,鲍文霞 . 农业工程学报 . 2021,第021期
4. 基于深度学习的复杂背景图像分类方法研究 [J] . 程俊华 ,曾国辉 ,刘瑾 . 电子科技 . 2020,第012期
5. 复杂背景图像下基于边缘点校验的圆检测方法 [J] . 李军 ,程健 . 计算机工程 . 2018,第003期
6. 基于前景提取的复杂背景图像检索算法 [C] . FENG Zhe ,冯喆 ,XIA Hu . 第四届全国智能信息处理学术会议 . 2013
7. 基于光流场的复杂背景图像分割技术研究与实现 [A] . 呼延秀娟 . 2014

基于局部特征的复杂背景图像内文本识别研究与实现

目录

摘要

著录项

相似文献

相关主题

期刊订阅