基于图像背景复杂度模糊分类的文字检测算法研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

近年来多媒体的发展和智能移动设备的普及更是使得数字图像、数字视频无处不在，相应的数字处理技术也有了很大的进步。人们的生活越来越离不开数字化的媒体，同时对数字化的媒体进行处理的技术的革新也有助于人们更轻松愉快的生活。
　　文字是生活中必不可缺的内容，也是数字图像、数字视频中的重要组成部分。从数字图像、视频中定位并识别文本内容有助于快速理解图像或视频中的内容，有助于图像和视频的检索。在智能移动设备上的文本定位和识别可以辅助阅读，也可用于智能交通，旅游指路等用途。本论文主要研究了自然场景中的视频文本检测定位问题。主要研究内容为构建基于背景复杂度的模糊分类器和设计三种背景复杂程度的文本定位算法。
　　自然场景中的文本图像的背景是千变万化的，针对各种各样的自然场景文本图像的复杂背景，单一的算法很难做到适用于所有复杂程度的背景，所以本文提出了构建基于自然场景背景复杂度的模糊分类器的方法。通过训练将自然场景文本图像根据背景的复杂程度分为简单背景图像、中等复杂背景图像和复杂背景图像，检测时分类器为检测到的文本图像根据背景的复杂程度分配类标签以标记该文本图像所属的类别。
　　针对自然场景的简单背景文本图像采用笔画边缘检测和形态学的算法，由于背景非常简单，文本在图像中对比度大，通过检测自然场景图像的笔画特征和形态学运算可以定位到文本区域。针对中等复杂背景的自然场景文本图像采用基于金字塔分解的笔画边缘检测和形态学算法，利用金字塔分解克服中等复杂背景的文本图像中的字符大小不一和稍微复杂背景物体的干扰，定位出文本区域。针对复杂背景的文本图像采用笔画变换和连通域分析的算法，在复杂的背景的情况下根据文本字符的笔画宽度是相似不变的这一特征利用笔画宽度变换算法生成笔画宽度图像，再利用连通域分析和规则过滤掉噪声干扰，定位出文本区域。最后根据基于背景复杂度的模糊分类器的分类结果自适应的选择文本定位的算法进行文本定位，既保证了文本定位的准确性，又提高了检测的效率。

著录项

作者
陈明山;
展开▼
作者单位

北京印刷学院;

展开▼
授予单位北京印刷学院;
学科信号与信息处理
授予学位硕士
导师姓名游福成;
年度 2014
页码
总页数
原文格式 PDF
正文语种中文
中图分类算法理论;
关键词
文字检测; 图像背景复杂度; 模糊分类; 笔画边缘检测; 笔画宽度变换; 数字图像;
入库时间 2022-08-17 10:14:17

相似文献

中文文献
外文文献
专利

1. 基于图像邻域复杂度的红外小目标检测算法研究 [J] . 单巍 ,王江涛 ,李峥 . 宿州学院学报 . 2018,第003期
2. 基于图像块复杂度和分段距离函数的人眼定位算法研究 [J] . 程磊 ,郑鑫 . 价值工程 . 2011,第021期
3. 基于图像复杂度的PCNN边缘检测新算法 [J] . 王晓军 ,王崴 ,刘晓卫 . 弹箭与制导学报 . 2015,第004期
4. 基于图像复杂度和分类器融合的通用盲检测 [J] . 万宝吉 ,张涛 . 计算机应用 . 2014,第001期
5. RDSC_IC:一种基于图像复杂度的实时场景切换检测算法 [J] . 金星 ,宗瑜 . 安徽科技学院学报 . 2014,第006期
6. 低复杂度多调制指数连续相位调制序列检测算法研究 [C] . ZHANG Ru ,张茹 ,ZHONG Sheng . 四川省电子学会曙光分会第十七届学术年会暨中物院第十届电子技术青年学术交流会 . 2014
7. 基于图像背景重构和水平集的TFT-LCD缺陷检测算法研究与应用 [A] . 陈廉政 . 2016

基于图像背景复杂度模糊分类的文字检测算法研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅