首页> 外国专利> MULTI-HEAD TEXT RECOGNITION MODEL FOR MULTI-LINGUAL OPTICAL CHARACTER RECOGNITION

MULTI-HEAD TEXT RECOGNITION MODEL FOR MULTI-LINGUAL OPTICAL CHARACTER RECOGNITION

机译:多语言光学字符识别的多头文本识别模型

摘要

This application is directed to performing optical character recognition (OCR) using deep learning techniques. An electronic device receives an image and a language indicator that indicates that the textual content in the image corresponds to a first language. The electronic device processes the image using a multilingual text recognition model applicable to a plurality of languages. The electronic device generates a feature sequence including a plurality of probability values corresponding to the textual content of the image. The feature sequence includes a plurality of feature subsets that correspond to the plurality of languages. For each feature subset, each probability value indicates a probability that a respective textual content corresponds to a respective character in a dictionary of the corresponding language. The electronic device constructs a sparse mask based on the first language and combines the feature sequence and the sparse mask to determine the textual content.
机译:该应用程序旨在使用深度学习技术执行光学字符识别(OCR)。 电子设备接收图像和语言指示符,其指示图像中的文本内容对应于第一语言。 电子设备使用适用于多种语言的多语言文本识别模型来处理图像。 电子设备生成包括与图像的文本内容相对应的多个概率值的特征序列。 特征序列包括对应于多种语言的多个特征子集。 对于每个特征子集,每个概率值表示相应的文本内容对应于对应语言字典中的相应字符的概率。 电子设备基于第一语言构造稀疏掩模,并组合特征序列和稀疏掩模以确定文本内容。

著录项

  • 公开/公告号WO2021081562A3

    专利类型

  • 公开/公告日2021-12-09

    原文格式PDF

  • 申请/专利权人 INNOPEAK TECHNOLOGY INC.;

    申请/专利号WO2021US14171

  • 发明设计人 ZHANG KAIYU;LIN YUAN;

    申请日2021-01-20

  • 分类号G06K9/20;G06N3/04;G06N3/08;

  • 国家 US

  • 入库时间 2022-08-24 22:45:46

相似文献

  • 专利
  • 外文文献
  • 中文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号