首页> 外国专利> REGION PROPOSAL NETWORKS FOR AUTOMATED BOUNDING BOX DETECTION AND TEXT SEGMENTATION

REGION PROPOSAL NETWORKS FOR AUTOMATED BOUNDING BOX DETECTION AND TEXT SEGMENTATION

机译:区域提案网络用于自动边界框检测和文本分段

摘要

Arbitrary image data may be transformed into data suitable for optical character recognition (OCR) processing. A processor may generate a plurality of intermediate feature layers of an image using convolutional neural network (CNN) processing. For each intermediate feature layer, the processor may generate at least one text proposal using a region proposal network (RPN). The at least one text proposal may comprise a portion of the intermediate feature layer that is predicted to contain text. The processor may merge the text proposals with one another to form a patch of the image that is predicted to contain text. The processor may determine outer coordinates of the patch. The outer coordinates may comprise at least leftmost, rightmost, topmost, and bottommost coordinates. The processor may generate a quadrilateral of the image that is a smallest quadrilateral including the leftmost, rightmost, topmost, and bottommost coordinates.
机译:可以将任意图像数据转换为适合于光学字符识别(OCR)处理的数据。 处理器可以使用卷积神经网络(CNN)处理生成图像的多个中间特征层。 对于每个中间特征层,处理器可以使用区域提议网络(RPN)生成至少一个文本提议。 至少一个文本提议可以包括预测包含文本的中间特征层的一部分。 处理器可以将文本提案彼此合并以形成预测包含文本的图像的补丁。 处理器可以确定补丁的外部坐标。 外部坐标可以包括至少最偏僻的,最右边的,最顶层和最底部的坐标。 处理器可以生成图像的四边形,该图像是最小的四边形,包括最左边的,最右边,最顶层和最底部坐标。

著录项

  • 公开/公告号EP3864576A1

    专利类型

  • 公开/公告日2021-08-18

    原文格式PDF

  • 申请/专利权人 INTUIT INC.;

    申请/专利号EP20200735820

  • 发明设计人 TORRES TERRENCE J.;FOROUGHI HOMA;

    申请日2020-06-17

  • 分类号G06K9;G06K9/32;G06K9/34;G06K9/62;

  • 国家 EP

  • 入库时间 2022-08-24 20:39:37

相似文献

  • 专利
  • 外文文献
  • 中文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号