首页> 外国专利> SYSTEMS AND METHODS FOR GENERATING AND USING SEMANTIC IMAGES IN DEEP LEARNING FOR CLASSIFICATION AND DATA EXTRACTION

SYSTEMS AND METHODS FOR GENERATING AND USING SEMANTIC IMAGES IN DEEP LEARNING FOR CLASSIFICATION AND DATA EXTRACTION

机译:用于在深度学习中生成和使用语义图像进行分类和数据提取的系统和方法

摘要

Disclosed is a new document processing solution that combines the powers of machine learning and deep learning and leverages the knowledge of a knowledge base. Textual information in an input image of a document can be converted to semantic information utilizing the knowledge base. A semantic image can then be generated utilizing the semantic information and geometries of the textual information. The semantic information can be coded by semantic type determined utilizing the knowledge base and positioned in the semantic image utilizing the geometries of the textual information. A region-based convolutional neural network (R-CNN) can be trained to extract regions from the semantic image utilizing the coded semantic information and the geometries. The regions can be mapped to the textual information for classification/data extraction. With semantic images, the number of samples and time needed to train the R-CNN for document processing can be significantly reduced.
机译:公开了一种新的文档处理解决方案,它结合了机器学习和深度学习的权力,并利用了知识库的知识。文档的输入图像中的文本信息可以使用知识库转换为语义信息。然后可以利用文本信息的语义信息和几何形状生成语义图像。语义信息可以通过利用知识库确定的语义类型,并利用文本信息的几何形状定位在语义图像中。可以训练基于区域的卷积神经网络(R-CNN)以利用编码的语义信息和几何形状从语义图像中提取区域。可以将区域映射到分类/数据提取的文本信息。利用语义图像,可以显着降低培训用于文档处理的R-CNN所需的样本和时间的数量。

著录项

  • 公开/公告号US2021073533A1

    专利类型

  • 公开/公告日2021-03-11

    原文格式PDF

  • 申请/专利权人 OPEN TEXT SA ULC;

    申请/专利号US202017081705

  • 发明设计人 UWE AST;

    申请日2020-10-27

  • 分类号G06K9;G06N5/04;G06N3/08;G06N20;G06K9/62;G06N3/04;G06F40/30;

  • 国家 US

  • 入库时间 2022-08-24 17:38:21

相似文献

  • 专利
  • 外文文献
  • 中文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号