首页> 外国专利> SYSTEMS AND METHODS FOR GENERATING AND USING SEMANTIC IMAGES IN DEEP LEARNING FOR CLASSIFICATION AND DATA EXTRACTION

SYSTEMS AND METHODS FOR GENERATING AND USING SEMANTIC IMAGES IN DEEP LEARNING FOR CLASSIFICATION AND DATA EXTRACTION

机译:在分类和数据提取的深度学习中生成和使用语义图像的系统和方法

摘要

Disclosed is a new document processing solution that combines the powers of machine learning and deep learning and leverages the knowledge of a knowledge base. Textual information in an input image of a document can be converted to semantic information utilizing the knowledge base. A semantic image can then be generated utilizing the semantic information and geometries of the textual information. The semantic information can be coded by semantic type determined utilizing the knowledge base and positioned in the semantic image utilizing the geometries of the textual information. A region-based convolutional neural network (R-CNN) can be trained to extract regions from the semantic image utilizing the coded semantic information and the geometries. The regions can be mapped to the textual information for classification/data extraction. With semantic images, the number of samples and time needed to train the R-CNN for document processing can be significantly reduced.
机译:本发明公开了一种新的文档处理解决方案,它结合了机器学习和深度学习的能力,并利用了知识库的知识。文档输入图像中的文本信息可以利用知识库转换为语义信息。然后,可以利用文本信息的语义信息和几何图形生成语义图像。语义信息可以通过利用知识库确定的语义类型进行编码,并利用文本信息的几何结构定位在语义图像中。基于区域的卷积神经网络(R-CNN)可以利用编码的语义信息和几何信息从语义图像中提取区域。这些区域可以映射到文本信息以进行分类/数据提取。使用语义图像,可以显著减少训练R-CNN进行文档处理所需的样本数量和时间。

著录项

  • 公开/公告号US2022139099A1

    专利类型

  • 公开/公告日2022-05-05

    原文格式PDF

  • 申请/专利权人 OPEN TEXT SA ULC;

    申请/专利号US202217579339

  • 发明设计人 UWE AST;

    申请日2022-01-19

  • 分类号G06V30/414;G06N5/04;G06N3/08;G06N20;G06K9/62;G06N3/04;G06F40/30;G06V30/40;G06V30/413;G06V30/416;

  • 国家 US

  • 入库时间 2022-08-25 00:49:47

相似文献

  • 专利
  • 外文文献
  • 中文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号