首页> 外文会议>IEEE International Conference on Big Data >Scalable Document Image Information Extraction with Application to Domain-Specific Analysis
【24h】

Scalable Document Image Information Extraction with Application to Domain-Specific Analysis

机译:可扩展文档图像信息提取及其在领域分析中的应用

获取原文

摘要

Document images are ubiquitous, but existing methods mainly focus on the text reading but not information understanding. In this paper, we propose a novel document image information extraction framework with application to domain-specific analysis. Key gains of our system result from the modularized implementation of the document analysis modules needed for different document analysis problems. Further, we provide an efficient text recognition approach that makes a trade-off between performance and running speed for document images and a novel information extraction method with both visual and semantic information. Our framework is scalable and customizable, and only a few annotations of the keyword-content mapping is needed towards domain-specific document analysis.
机译:文档图像无处不在,但是现有的方法主要集中在文本阅读而不是信息理解上。在本文中,我们提出了一种新颖的文档图像信息提取框架,并将其应用于特定领域的分析。我们系统的主要收益来自不同文档分析问题所需的文档分析模块的模块化实施。此外,我们提供了一种有效的文本识别方法,可以在文档图像的性能和运行速度之间进行权衡,并提供一种兼具视觉和语义信息的新颖信息提取方法。我们的框架具有可扩展性和可自定义性,对于特定于域的文档分析,只需要对关键字-内容映射进行一些注释即可。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号