首页> 中文学位 >复杂背景下的文本定位技术应用研究
【6h】

复杂背景下的文本定位技术应用研究

代理获取

目录

封面

声明

中文摘要

英文摘要

目录

第一章 绪论

1.1研究背景和意义

1.2文本定位的国内外研究状况

1.3本文的研究内容

1.4本文的组织安排

第二章 文本定位研究概述

2.1基于特征提取的文本定位方法

2.2基于机器学习的文本定位方法

2.3特征提取与机器学习相结合的方法

2.4各类定位方法的比较

2.5评估方法介绍

2.6本章小结

第三章 基于主动轮廓模型的文本定位方法

3.1主动轮廓模型

3.2基于主动轮廓模型的文本定位方法

3.3实践应用结果与分析

3.4本章小结

第四章 基于显著性检测的文本定位方法

4.1中心分割算法的问题

4.2显著性检测算法

4.3文本定位方法步骤

4.4实践应用结果与分析

4.5本章小结

第五章 基于边缘置信测度的文本定位方法

5.1梯度估计与置信测度

5.2非极大值抑制与滞后性阈值设置

5.3文本定位方法步骤

5.4实践应用结果与分析

5.5本章小结

第六章 总结与展望

6.1论文工作总结

6.2进一步工作展望

参考文献

附录1 攻读硕士学位期间撰写的论文

附录2 攻读硕士学位期间参加的科研项目

致谢

展开▼

摘要

图像中的文本对于整个图像的语义理解、图像检索等应用具有非常重要的作用,在诸如Internet环境下的图像检索、交通管理中的车牌识别等应用中也具有广阔的发展空间。要获取图像中的文本就需要利用文本定位方法。可以说文本定位是这些实践应用的基础。当前的文本定位技术还不成熟,无法满足实践应用的需要。因此本文就是来解决复杂背景下的文本定位问题。
  本文首先对前人的相关工作进行了分析与研究,分别从基于特征提取、基于机器学习以及基于这两者相结合的方法三个方面对文本定位方法进行详细的阐述,并且对这三类方法的优缺点做出了简短的分析。其次本文以具有复杂背景的图像为实践应用对象,提出三种文本定位方法:
  (1)提出了一种基于主动轮廓模型的文本定位方法。该方法首先将输入的图像经过sobel-laplacian锐化后再由gaussian-laplacian进行过滤。其次,预处理完成后的图片首先通过改进的主动轮廓模型得到初始轮廓,然后再通过算法的反复迭代扩大或缩小轮廓线得到最终轮廓,最后通过后处理尽量排除非文本块从而得到最终文本区。
  (2)提出了基于显著性检测的文本定位方法。该方法首先以图像四边分别作为基准对输入的图像进行背景检测,然后以背景检测中得到的非背景区域作为基准,对输入的图像进行前景检测,获取较准确的备选文本区,最后结合中心分割算法,得到最终的文本区域。
  (3)提出了结合边缘置信测度的文本定位方法。该方法首先引入置信测度并且将其用于于基于梯度的边缘检测中,然后通过梯度向量的估计、非极大值抑制、滞后性阈值三步骤的处理,最后得到文本区域。
  文本定位是一个具有广阔应用前景的热点问题,目前许多定位方法对于背景复杂,文本形式多变的图像其定位效果并不理想。本文的实践应用结果表明,文中所提出的方法均可有效检测出图像中的文本,对于文本定位技术今后的发展具有一定的理论意义与实用价值。

著录项

  • 作者

    许肖;

  • 作者单位

    南京邮电大学;

  • 授予单位 南京邮电大学;
  • 学科 文本定位
  • 授予学位 硕士
  • 导师姓名 顾磊;
  • 年度 2015
  • 页码
  • 总页数
  • 原文格式 PDF
  • 正文语种 中文
  • 中图分类 TP391.41;
  • 关键词

    文本定位; 特征提取; 复杂背景; 图像处理;

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号