首页> 中国专利> 用于OCR识别的数据增广方法、装置、设备及存储介质

用于OCR识别的数据增广方法、装置、设备及存储介质

摘要

本发明适用于字符识别技术领域,提供了一种用于OCR识别的数据增广方法、装置、设备及存储介质,该方法包括:通过建立识别字典,基于识别字典和已获取的开源数据集建立第一词频字典,基于第一词频字典建立合成数据集文本文档,基于已建立的数据集属性、OCR识别的应用场景以及合成数据集文本文档对当前数据集进行数据增广,得到增广后的基础数据集,从而在降低OCR深度算法中获取训练样本的成本的同时,提高了数据增广的针对性。

著录项

  • 公开/公告号CN113435426B

    专利类型发明专利

  • 公开/公告日2021-11-16

    原文格式PDF

  • 申请/专利权人 珠海亿智电子科技有限公司;

    申请/专利号CN202110991555.7

  • 发明设计人 不公告发明人;

    申请日2021-08-27

  • 分类号G06K9/00(20060101);G06K9/62(20060101);G06F40/216(20200101);G06F40/242(20200101);

  • 代理机构44350 深圳青年人专利商标代理有限公司;

  • 代理人吴桂华

  • 地址 519000 广东省珠海市高新区唐家湾镇港乐路8号大洲科技园B区厂房803室

  • 入库时间 2022-08-23 12:48:00

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号