首页> 外国专利> Automating creation of accurate OCR training data using specialized UI application

Automating creation of accurate OCR training data using specialized UI application

机译:使用专门的UI应用程序自动创建准确的OCR训练数据

摘要

Systems of the present disclosure generate accurate training data for optical character recognition (OCR). Systems disclosed herein generates images of a text passage as displayed piecemeal in a user interface (UI) element rendered in a selected font type and size, determine accurate dimensions and locations of bounding boxes for each character pictured in the images, stitch together a training image by concatenating the images, and associate the training image, the bounding box dimensions and locations, and the text passage together in a collection of training data. The collection of training data also includes a computer-readable master copy of the text passage with newline characters inserted therein.
机译:本公开的系统生成用于光学字符识别(OCR)的准确训练数据。本文公开的系统生成文本段落的图像,该文本段落显示为以所选字体类型和大小呈现的用户界面(UI)元素中的零碎显示,为图像中描绘的每个字符确定边框的准确尺寸和位置,将训练图像缝合通过串联图像,并将训练图像,边界框的尺寸和位置以及文本段落关联在一起,形成训练数据集合。训练数据的收集还包括文本段落的计算机可读主副本,其中插入了换行符。

著录项

  • 公开/公告号US10289905B2

    专利类型

  • 公开/公告日2019-05-14

    原文格式PDF

  • 申请/专利权人 INTUIT INC.;

    申请/专利号US201816112190

  • 申请日2018-08-24

  • 分类号G06K9;G06K9/46;G06K9/52;G06K9/62;G06T7/60;G06T11/60;G06T7/73;G06T7/13;G06T7/70;G06F3/0481;G06F17/21;

  • 国家 US

  • 入库时间 2022-08-21 12:15:43

相似文献

  • 专利
  • 外文文献
  • 中文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号