【24h】

Field layout analysis for Russian forms

机译:俄罗斯形式的现场布局分析

获取原文
获取原文并翻译 | 示例
       

摘要

This article is about the structural analysis of the text in OCR and form processing systems. The authors propose universal approach for layout understanding in the text lines, equally suitable for unstructured typewritten sheets and fields of documents (forms). Developed algorithm is robust to distortions, typical for flatbed scanners as well as for cameras, incorporated to mobile devices. It was implemented in C++ and integrated to Cognitive Forms 2.0 system. The methodology of this work is based on auto-classification, cluster analysis and histogram analysis. This article is focused on precise estimating of text line positions and word finding in forms.
机译:本文是关于OCR和表格处理系统中文本的结构分析。 作者提出了在文本线中的布局理解的普遍方法,同样适用于非结构化打字的纸张和文档领域(表格)。 发达的算法对扭曲具有鲁棒性,典型的平板扫描仪以及包含在移动设备上的摄像机。 它以C ++实现并集成到认知表格2.0系统。 本工作的方法基于自动分类,集群分析和直方图分析。 本文专注于精确估计文本线路位置和形式的单词。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号