首页> 外文会议>IAPR International Conference on Document Analysis and Recognition >Automatic Static/Variable Content Separation in Administrative Document Images
【24h】

Automatic Static/Variable Content Separation in Administrative Document Images

机译:行政文档图像中的自动静态/变量内容分离

获取原文

摘要

In this paper we present an automatic method for separating static and variable content from administrative document images. An alignment approach is able to unsupervisedly build probabilistic templates from a set of examples of the same document kind. Such templates define which is the likelihood of every pixel of being either static or variable content. In the extraction step, the same alignment technique is used to match an incoming image with the template and to locate the positions where variable fields appear. We validate our approach on the public NIST Structured Tax Forms Dataset.
机译:在本文中,我们提出了一种自动方法,用于将静态和可变内容从管理文档图像分离。对准方法能够从同一文档类型的一组示例中毫无化地构建概率模板。这样的模板定义了哪个是静态或可变内容的每个像素的可能性。在提取步骤中,相同的对准技术用于将传入图像与模板匹配,并定位出现可变字段的位置。我们在公共NIST结构纳税表格数据集上验证了我们的方法。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号