复杂背景下的文本定位算法研究与实现

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

彩色图像中往往包含大量的文本信息，这些文本信息与图像的内容密不可分，定位文本信息是理解图像内容的关键。因此，文本定位在网络过滤、车牌检索、图像检索/分类方面有着广泛的应用前景。由于彩色图像的背景复杂多变，文本的大小、字体、方向等特征不固定，使得已有的光学字符识别技术对彩色图像中的文本定位和识别很难投入实际应用当中。因此，对具有复杂背景图像中的文本定位技术一直是该领域的研究热点。尽管已经取得了不错的进展，但是，由于背景和前景的复杂多变性使得该问题仍然没有得到完全的解决。
　　本文在学习和总结已有算法的基础上，提出了一种新颖的文本定位算法，实现了彩色图像中文本的准确和全面的定位。本文的主要工作包括:(1)提出了一种新颖的计算笔画宽度的算法——基于连通域的笔画宽度变换算法;(2)将稀疏表示和条件随机场模型共同用于复杂场景下的文本定位，提高定位精度;(3)利用本文改进后的向前向后算法，实现了任意方向上的文本定位。
　　基于连通域的笔画宽度变换算法是一种提取文字笔画宽度特征算法，通过对文本字符连通区域分析，本文提出了该算法。该算法能够快速提取文本特有的笔画宽度特征，为实现文本的精确定位提供了重要特征。稀疏表示和条件随机场模型是模式识别领域中的两个重要的理论工具。本文研究了稀疏表示理论和条件随机场模型的特点，采用候选字符的稀疏重构误差构建条件随机场的模型参数，最后，采用图割方法将待处理的候选区域分为文本和背景区域，实现文本信息的精确定位。对于复杂场景中任意方向的文本定位，本文改进了原有的向前向后算法，利用改进后的算法实现了任意方向上的文本定位，可以更加全面地定位出文本。
　　为了评价本文算法的效果，本文利用2011ICDAR数据库进行仿真实验，结果表明本文算法与已有算法相比，在查全率和查准率两项指标上都有较大的提升，可以全面的、准确的定位出复杂背景中的文本。

著录项

作者
姜洋;
展开▼
作者单位

大连理工大学;

展开▼
授予单位大连理工大学;
学科信号与信息处理
授予学位硕士
导师姓名李建华;
年度 2015
页码
总页数
原文格式 PDF
正文语种中文
中图分类文字信息处理;
关键词
文本定位算法; 稀疏表示; 条件随机场模型; 笔画宽度变换;

相似文献

中文文献
外文文献
专利

1. 复杂背景下的人脸检测算法研究与实现 [J] . 许鹏飞 ,贾银洁 ,朱梦洁 . 无线电通信技术 . 2016,第003期
2. 复杂背景下的图像文本区域定位方法研究 [J] . 周翔 ,陈会 ,张锴 . 计算机工程与应用 . 2013,第012期
3. 复杂背景下基于定位的人体动作识别算法 [J] . 刘长征 ,张荣华 ,郭理 . 实验室研究与探索 . 2016,第002期
4. 一种复杂背景下的汽车牌照快速定位算法 [J] . 陈智慧 ,董增寿 . 工业控制计算机 . 2013,第004期
5. 复杂背景下快速车牌定位算法 [J] . 方万元 ,梁久祯 . 计算机工程与应用 . 2012,第002期
6. 复杂背景下的车牌定位与快速分割算法 [C] . 古智超 ,孙季丰 . 第十三届全国图象图形学学术会议 . 2006
7. 复杂背景图像中的文本定位算法研究 [A] . 郑碧娟 . 2011

复杂背景下的文本定位算法研究与实现

目录

摘要

著录项

相似文献

相关主题

期刊订阅