首页> 中国专利> 基于文本文档的文字识别方法、装置、设备及存储介质

基于文本文档的文字识别方法、装置、设备及存储介质

摘要

本发明涉及人工智能领域,公开了一种基于文本文档的文字识别方法、装置、设备及存储介质,用于提高文本识别效率。所述基于文本文档的文字识别方法包括:接收待识别的文本文档,并对文本文档进行预处理,得到标准化的文本图像;基于预置的光学字符识别引擎,对标准化的文本图像进行文字识别,得到标准化的文本图像对应的初始文本信息;对标准化的文本图像进行分割,得到多个文本图像片段;对多个文本图像片段和初始文本信息进行文本向量化处理,得到初始图像向量和初始文本向量;获取初始文本向量对应的标注信息,并根据标注信息确定各初始图像向量对应的目标文本信息。此外,本发明还涉及区块链技术,目标文本信息可存储于区块链节点中。

著录项

  • 公开/公告号CN113569833A

    专利类型发明专利

  • 公开/公告日2021-10-29

    原文格式PDF

  • 申请/专利权人 平安科技(深圳)有限公司;

    申请/专利号CN202110853330.5

  • 发明设计人 曾博;王燕蒙;王少军;

    申请日2021-07-27

  • 分类号G06K9/20(20060101);G06K9/40(20060101);G06K9/62(20060101);G06N3/02(20060101);G06F40/289(20200101);

  • 代理机构11321 北京市京大律师事务所;

  • 代理人姚维

  • 地址 518033 广东省深圳市福田区福田街道福安社区益田路5033号平安金融中心23楼

  • 入库时间 2023-06-19 13:02:24

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号