首页> 中文学位 >基于数字图像处理的彩色标记区域提取方法的研究
【6h】

基于数字图像处理的彩色标记区域提取方法的研究

代理获取

摘要

随着办公自动化、电子政务等实际需求的发展,文档资料的处理逐渐由纸质文档手工处理向数字文档图像自动化处理发展。数字图像处理技术的发展为其提供了有效的技术支持。研究文档图像的自动化处理技术有着重要的现实意义。
   本文的研究目的是提取文档图像中的彩色标记区域,以实现文档图像中的信息提取。论文对数字图像处理技术在文档图像处理中的应用进行了深入研究,首先分析了数字图像处理和文档图像处理的一般步骤和经典算法。在此基础上,将彩色标记区域提取分成三步:文档图像预处理、彩色区域提取与表示、特征值计算与区域识别。然后从这三个步骤入手,根据文档图像中彩色标记区域的特殊性质,设计出适用于各类文档图像的彩色标记区域提取的方法。
   1.文档图像预处理:着重解决文档图像的二值化问题,主要包括图像缩放、彩色图像的灰度化和文档图像的二值化。通过对全局阈值和局部阈值二值化方法的对比分析,提出了一种改进的基于全局阈值的二值化方法:首先利用彩色图像中的颜色信息对图像进行分割,得到彩色区域图像和非彩色区域图像;然后利用全局阈值法对分割得到的两类图像进行二值化。
   2.彩色区域提取与表示:着重解决彩色区域的提取和直角多边形表示。通过对连通区域提取相关算法的研究,提出了两种彩色区域提取方法:基于区域标记的方法和基于边缘检测的方法。基于区域标记的提取方法,先将彩色区域分割成一个个线段区域,然后利用区域标记思想提取线段区域,最后将各个线段区域合并成直角多边形。基于边缘检测的提取方法,则是利用Rafael的直线检测算法获取区域的边缘线段,然后将这些线段合并成一个个线段区域,最后将各个线段区域合并成直角多边形。
   3.特征值计算与区域识别:着重解决彩色标记区域和彩色图片区域的识别问题。通过分析彩色标记区域和彩色图片区域的不同特征,提出了两种分别基于颜色特征值和像素密度的标记区域识别方法。前者计算HSV和RGB两个颜色空间的颜色特征值,并利用各个子区域的颜色特征值的方差大小,来区分标记区域和图片区域。后者计算彩色标记像素密度、区域内文本像素密度和子区域彩色像素密度,并结合区域几何信息来识别彩色标记区域。
   最后,为了验证本文提出的彩色标记区域提取方法的有效性,从文档图片库中选取了大量图片进行实验,并将实验结果与Scale Saliency算法进行了对比。结果表明,本文提出的提取方法效果要优于Scale Saliency算法。进一步的测试表明,本文提出的方法能够适用于大多数文档图像,基于区域标记的提取方法比较适合于含有虚线标记区域的文档图像,而基于边缘检测的方法更加适合于含有彩色图片的文档图像,两种方法具有一定的互补性。
   本文研究得到了某高科技研究开发中心的研发项目“数字文档系统”的支持。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号