基于数字图像处理的彩色标记区域提取方法的研究

代理获取

页面导航

摘要
著录项
相似文献
相关主题

摘要

随着办公自动化、电子政务等实际需求的发展,文档资料的处理逐渐由纸质文档手工处理向数字文档图像自动化处理发展。数字图像处理技术的发展为其提供了有效的技术支持。研究文档图像的自动化处理技术有着重要的现实意义。
　　本文的研究目的是提取文档图像中的彩色标记区域,以实现文档图像中的信息提取。论文对数字图像处理技术在文档图像处理中的应用进行了深入研究,首先分析了数字图像处理和文档图像处理的一般步骤和经典算法。在此基础上,将彩色标记区域提取分成三步:文档图像预处理、彩色区域提取与表示、特征值计算与区域识别。然后从这三个步骤入手,根据文档图像中彩色标记区域的特殊性质,设计出适用于各类文档图像的彩色标记区域提取的方法。
　　 1.文档图像预处理:着重解决文档图像的二值化问题,主要包括图像缩放、彩色图像的灰度化和文档图像的二值化。通过对全局阈值和局部阈值二值化方法的对比分析,提出了一种改进的基于全局阈值的二值化方法:首先利用彩色图像中的颜色信息对图像进行分割,得到彩色区域图像和非彩色区域图像;然后利用全局阈值法对分割得到的两类图像进行二值化。
　　 2.彩色区域提取与表示:着重解决彩色区域的提取和直角多边形表示。通过对连通区域提取相关算法的研究,提出了两种彩色区域提取方法:基于区域标记的方法和基于边缘检测的方法。基于区域标记的提取方法,先将彩色区域分割成一个个线段区域,然后利用区域标记思想提取线段区域,最后将各个线段区域合并成直角多边形。基于边缘检测的提取方法,则是利用Rafael的直线检测算法获取区域的边缘线段,然后将这些线段合并成一个个线段区域,最后将各个线段区域合并成直角多边形。
　　 3.特征值计算与区域识别:着重解决彩色标记区域和彩色图片区域的识别问题。通过分析彩色标记区域和彩色图片区域的不同特征,提出了两种分别基于颜色特征值和像素密度的标记区域识别方法。前者计算HSV和RGB两个颜色空间的颜色特征值,并利用各个子区域的颜色特征值的方差大小,来区分标记区域和图片区域。后者计算彩色标记像素密度、区域内文本像素密度和子区域彩色像素密度,并结合区域几何信息来识别彩色标记区域。
　　最后,为了验证本文提出的彩色标记区域提取方法的有效性,从文档图片库中选取了大量图片进行实验,并将实验结果与Scale Saliency算法进行了对比。结果表明,本文提出的提取方法效果要优于Scale Saliency算法。进一步的测试表明,本文提出的方法能够适用于大多数文档图像,基于区域标记的提取方法比较适合于含有虚线标记区域的文档图像,而基于边缘检测的方法更加适合于含有彩色图片的文档图像,两种方法具有一定的互补性。
　　本文研究得到了某高科技研究开发中心的研发项目“数字文档系统”的支持。

著录项

作者
沈建勋;
展开▼
作者单位

东南大学;

展开▼
授予单位东南大学;
学科软件工程
授予学位硕士
导师姓名吴国新,董永强,乐宁;
年度 2011
页码
总页数
原文格式 PDF
正文语种中文
中图分类 TP391.41;
关键词
数字图像处理; 彩色标记区域; 信息提取; 文档图像; 二值化; 边缘检测;

相似文献

中文文献
外文文献
专利

1. 基于数字图像处理的颗粒流厚度动态提取方法研究 [J] . 吴越 ,李坤 ,程谦恭 . 水文地质工程地质 . 2021,第004期
2. 基于数字图像处理的人员运动参数提取方法研究 [J] . 刘轩 ,宋卫国 ,马剑 . 火灾科学 . 2008,第004期
3. 基于标记分水岭和区域合并的彩色图像分割 [J] . 余旺盛 ,侯志强 ,宋建军 . 电子学报 . 2011,第005期
4. 基于数字图像处理技术的裸岩率提取方法——以蒙自断陷盆地高原面为例 [J] . 殷哲 ,单志杰 ,秦伟 . 广东林业科技 . 2020,第006期
5. 基于数字图像处理技术的裸岩率提取方法——以蒙自断陷盆地高原面为例 [J] . 殷哲 ,单志杰 ,秦伟 . 林业与环境科学 . 2020,第006期
6. 基于像素标记的Mean Shift海岛(礁)岸线快速提取方法 [C] . 韩祥磊 ,张宏伟 . 全国测绘科技信息网中南分网第二十六次学术交流会 . 2012
7. 基于数字图像处理的路面裂缝提取方法研究 [A] . 李润青 . 2020

基于数字图像处理的彩色标记区域提取方法的研究

摘要

著录项

相似文献

相关主题

期刊订阅