首页> 外国专利> Processing structured documents using convolutional neural networks

Processing structured documents using convolutional neural networks

机译:使用卷积神经网络处理结构化文档

摘要

Structured documents are processed using convolutional neural networks. One of the methods includes receiving a rendered form of a structured document; mapping a grid of cells to the rendered form; assigning a respective numeric embedding to each cell in the grid, comprising, for each cell: identifying content in the structured document that corresponds to a portion of the rendered form that is mapped to the cell, mapping the identified content to a numeric embedding for the identified content, and assigning the numeric embedding for the identified content to the cell; generating a matrix representation of the structured document from the numeric embeddings assigned to the cells of the grids; and generating neural network features of the structured document by processing the matrix representation of the structured document through a subnetwork comprising one or more convolutional neural network layers.
机译:使用卷积神经网络处理结构化文档。方法之一包括接收结构化文档的呈现形式;将单元格网格映射到呈现的表单;向网格中的每个单元格分配相应的数字嵌入,包括针对每个单元格:在结构化文档中标识与映射到该单元格的呈现形式的一部分相对应的内容,将标识的内容映射到网格的数字嵌入标识的内容,并将标识的内容的数字嵌入分配给单元;根据分配给网格单元的数字嵌入生成结构化文档的矩阵表示;并通过包括一个或多个卷积神经网络层的子网处理结构化文档的矩阵表示,生成结构化文档的神经网络特征。

著录项

  • 公开/公告号US10387531B1

    专利类型

  • 公开/公告日2019-08-20

    原文格式PDF

  • 申请/专利权人 GOOGLE LLC;

    申请/专利号US201514829525

  • 发明设计人 VINCENT O. VANHOUCKE;

    申请日2015-08-18

  • 分类号G06F16/958;G06F17/24;G06N3/04;G06K9;

  • 国家 US

  • 入库时间 2022-08-21 12:15:42

相似文献

  • 专利
  • 外文文献
  • 中文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号