首页> 外国专利> SYSTEMS AND METHODS FOR GENERATING AND USING SEMANTIC IMAGES IN DEEP LEARNING FOR CLASSIFICATION AND DATA EXTRACTION

SYSTEMS AND METHODS FOR GENERATING AND USING SEMANTIC IMAGES IN DEEP LEARNING FOR CLASSIFICATION AND DATA EXTRACTION

机译:在深度学习中用于分类和数据提取的语义图像生成和使用的系统和方法

摘要

Disclosed is a new document processing solution that combines the powers of machine learning and deep learning and leverages the knowledge of a knowledge base. Textual information in an input image of a document can be converted to semantic information utilizing the knowledge base. A semantic image can then be generated utilizing the semantic information and geometries of the textual information. The semantic information can be coded by semantic type determined utilizing the knowledge base and positioned in the semantic image utilizing the geometries of the textual information. A region-based convolutional neural network (R-CNN) can be trained to extract regions from the semantic image utilizing the coded semantic information and the geometries. The regions can be mapped to the textual information for classification/data extraction. With semantic images, the number of samples and time needed to train the R-CNN for document processing can be significantly reduced.
机译:公开了一种新的文档处理解决方案,该解决方案结合了机器学习和深度学习的功能,并利用了知识库的知识。可以利用知识库将文档输入图像中的文本信息转换为语义信息。然后可以利用语义信息和文本信息的几何形状来生成语义图像。可以通过利用知识库确定的语义类型来编码语义信息,并且可以利用文本信息的几何形状将语义信息定位在语义图像中。可以训练基于区域的卷积神经网络(R-CNN),以利用编码的语义信息和几何图形从语义图像中提取区域。可以将区域映射到文本信息以进行分类/数据提取。使用语义图像,可以大大减少训练R-CNN用于文档处理所需的样本数量和时间。

著录项

  • 公开/公告号US2020242348A1

    专利类型

  • 公开/公告日2020-07-30

    原文格式PDF

  • 申请/专利权人 OPEN TEXT SA ULC;

    申请/专利号US202016842097

  • 发明设计人 UWE AST;

    申请日2020-04-07

  • 分类号G06K9;G06N5/04;G06N3/08;G06N20;G06K9/62;G06N3/04;G06F40/30;

  • 国家 US

  • 入库时间 2022-08-21 11:21:56

相似文献

  • 专利
  • 外文文献
  • 中文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号