首页> 外文期刊>Document Numerique >Approche hybride de segmentation de pages à base d'un descripteur de traits
【24h】

Approche hybride de segmentation de pages à base d'un descripteur de traits

机译:基于特征描述符的混合页面分割方法

获取原文
获取原文并翻译 | 示例
       

摘要

Nous présentons une approche complète de segmentation de pages de documents numérisés permettant d'identifier et d'extraire les régions de texte, de lignes et de photos. L'approche est composée de deux étapes principales : la première étape consiste à détecter une éventuelle inclinaison afin d'ajuster l'image et ainsi diminuer les contraintes pour la segmentation. La deuxième étape se focalise sur une nouvelle méthode hybride pour la segmentation de pages basée sur les composantes connexes et sur l'analyse de régions. Nous décrivons d'abord notre nouvelle méthode de détection d'inclinaison. Ensuite, nous présentons notre descripteur de traits qui permet de détecter les candidats de texte et des lignes par la squelettisation de l'image du document binarisé. Un modèle de contours actifs est appliqué pour segmenter le reste de l'image en photos et arrière plan. Cette classification est vérifiée par l'étude de la variation photométrique de chacune des régions détectées. Enfin, les candidats de texte sont classifiés à l'aide de la technique du clustering du mean-shift en fonction de leurs tailles et nous présentons une approche adaptative d'analyse du profil de projection pour recueillir séparément les régions de texte horizontales et verticales. Cette méthode est appliquée pour la segmentation des images réelles des documents numérisés qui contiennent du texte, lignes et des régions de photos. Nous évaluons les performances de notre approche en la comparant avec des méthodes existantes sur des benchmarks connus.%In this paper we present a full document image segmentation approach in order to identify and extract text, lines and photo regions. This approach is composed of two main steps. The first step consists in detecting a possible skew. Then, a new hybrid page segmentation approach based on connected component and region analysis is proposed. For that, we first describe our stroke descriptor that detects text and line component candidates using the skeleton of the binarized document image. Then, an active contour model is applied to segment the rest of the image into photo and background regions. This classification is verified by studying the variation of each detected region. Finally, we cluster the text candidates using mean-shift analysis technique according to their corresponding sizes and we present our multiscale projection profile approach to gather separately horizontal and vertical text regions. We evaluate the performances of our approach by comparing it to the existing methods on well-known benchmarks.
机译:我们提供了一种对扫描文档的页面进行细分的综合方法,以识别和提取文本,线条和照片的区域。该方法由两个主要步骤组成:第一步包括检测可能的倾斜度以调整图像,从而减少分割的约束。第二步着重于基于相关组件和区域分析的一种新的页面分割混合方法。我们首先描述我们的新倾斜检测方法。接下来,我们介绍我们的特征描述符,该特征描述符可以通过使二值化文档的图像骨架化来检测文本和行的候选。应用活动轮廓模型将图像的其余部分分割为照片和背景。通过研究检测到的每个区域的光度变化,可以验证这种分类。最后,使用均值漂移聚类技术根据候选文本的大小对候选文本进行分类,我们提出了一种自适应投影轮廓分析方法来分别收集水平和垂直文本区域。此方法适用于分割包含文本,线条和照片区域的扫描文档的实际图像。我们通过将其与已知基准上的现有方法进行比较来评估该方法的性能。%在本文中,我们提出了一种完整的文档图像分割方法,以识别和提取文本,线条和照片区域。此方法包括两个主要步骤。第一步是检测可能的偏斜。然后,提出了一种基于连通分量和区域分析的混合页面分割新方法。为此,我们首先描述我们的笔画描述符,它使用二值化文档图像的骨架来检测文本和行成分候选。然后,使用主动轮廓模型将图像的其余部分分割为照片和背景区域。通过研究每个检测到的区域的变化,可以验证此分类。最后,我们使用均值漂移分析技术根据文本候选的相应大小对文本候选​​进行聚类,并提出了多尺度投影轮廓方法来分别收集水平和垂直文本区域。通过将其与已知基准上的现有方法进行比较,我们评估了该方法的性能。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号