首页> 外文会议>IAPR International Conference on Document Analysis and Recognition >Automatic Static/Variable Content Separation in Administrative Document Images
【24h】

Automatic Static/Variable Content Separation in Administrative Document Images

机译:管理文档图像中的自动静态/可变内容分离

获取原文

摘要

In this paper we present an automatic method for separating static and variable content from administrative document images. An alignment approach is able to unsupervisedly build probabilistic templates from a set of examples of the same document kind. Such templates define which is the likelihood of every pixel of being either static or variable content. In the extraction step, the same alignment technique is used to match an incoming image with the template and to locate the positions where variable fields appear. We validate our approach on the public NIST Structured Tax Forms Dataset.
机译:在本文中,我们提出了一种从管理文档图像中分离静态和可变内容的自动方法。对齐方法能够从同一文档类型的一组示例中无监督地构建概率模板。这样的模板定义了每个像素是静态内容还是可变内容的可能性。在提取步骤中,使用相同的对齐技术将传入的图像与模板进行匹配,并定位出现可变字段的位置。我们在公开的NIST结构化税表数据集上验证了我们的方法。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号