复杂背景下的文本定位技术应用研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

图像中的文本对于整个图像的语义理解、图像检索等应用具有非常重要的作用，在诸如Internet环境下的图像检索、交通管理中的车牌识别等应用中也具有广阔的发展空间。要获取图像中的文本就需要利用文本定位方法。可以说文本定位是这些实践应用的基础。当前的文本定位技术还不成熟，无法满足实践应用的需要。因此本文就是来解决复杂背景下的文本定位问题。
　　本文首先对前人的相关工作进行了分析与研究，分别从基于特征提取、基于机器学习以及基于这两者相结合的方法三个方面对文本定位方法进行详细的阐述，并且对这三类方法的优缺点做出了简短的分析。其次本文以具有复杂背景的图像为实践应用对象，提出三种文本定位方法：
　　(1)提出了一种基于主动轮廓模型的文本定位方法。该方法首先将输入的图像经过sobel-laplacian锐化后再由gaussian-laplacian进行过滤。其次，预处理完成后的图片首先通过改进的主动轮廓模型得到初始轮廓，然后再通过算法的反复迭代扩大或缩小轮廓线得到最终轮廓，最后通过后处理尽量排除非文本块从而得到最终文本区。
　　(2)提出了基于显著性检测的文本定位方法。该方法首先以图像四边分别作为基准对输入的图像进行背景检测，然后以背景检测中得到的非背景区域作为基准，对输入的图像进行前景检测，获取较准确的备选文本区，最后结合中心分割算法，得到最终的文本区域。
　　(3)提出了结合边缘置信测度的文本定位方法。该方法首先引入置信测度并且将其用于于基于梯度的边缘检测中，然后通过梯度向量的估计、非极大值抑制、滞后性阈值三步骤的处理，最后得到文本区域。
　　文本定位是一个具有广阔应用前景的热点问题，目前许多定位方法对于背景复杂，文本形式多变的图像其定位效果并不理想。本文的实践应用结果表明，文中所提出的方法均可有效检测出图像中的文本，对于文本定位技术今后的发展具有一定的理论意义与实用价值。

著录项

作者
许肖;
展开▼
作者单位

南京邮电大学;

展开▼
授予单位南京邮电大学;
学科文本定位
授予学位硕士
导师姓名顾磊;
年度 2015
页码
总页数
原文格式 PDF
正文语种中文
中图分类 TP391.41;
关键词
文本定位; 特征提取; 复杂背景; 图像处理;

相似文献

中文文献
外文文献
专利

1. 复杂背景下的图像文本区域定位方法研究 [J] . 周翔 ,陈会 ,张锴 . 计算机工程与应用 . 2013,第012期
2. 复杂背景干扰下硅藻图像的深度网络识别与定位 [J] . 邓杰航 ,何冬冬 ,卓家鸿 . 南方医科大学学报 . 2020,第002期
3. PCB板复杂背景下的Data Matrix码定位与识别 [J] . 陆晓 ,包晓敏 ,沈永健 . 湖北民族学院学报（自然科学版） . 2019,第003期
4. 复杂背景下基于定位的人体动作识别算法 [J] . 刘长征 ,张荣华 ,郭理 . 实验室研究与探索 . 2016,第002期
5. 复杂背景下的快速车牌定位技术研究 [J] . 李羊 ,曹玉东 ,刘艳洋 . 辽宁工业大学学报（自然科学版） . 2016,第002期
6. 基于小波变换和形态学的复杂背景文本定位 [C] . 沈庆华 ,李树涛 ,李怡 . 第26届中国控制会议 . 2007
7. 复杂背景下的文本定位算法研究与实现 [A] . 姜洋 . 2015

复杂背景下的文本定位技术应用研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅