首页> 中国专利> 一种基于图像结构信息的OCR数据合成方法

一种基于图像结构信息的OCR数据合成方法

摘要

本发明公开了一种基于图像结构信息的的OCR数据合成方法,其步骤包括:首先收集自然场景图像,建立图像背景库;接着构建图像结构信息预测网络,并对背景图像中的每一张图片都进行预测,构建图像结构信息库;然后统计真实数据中的前景与背景的颜色分布,建立前景背景颜色库;最后根据背景图像的三维信息选择一个合适位置,将文字嵌入到背景图像中去。本发明能快速合成海量的逼真文本图像,并解决OCR领域训练数据匮乏的问题,从而提升文本检测与识别模型的准确率与鲁棒性。

著录项

  • 公开/公告号CN112949755A

    专利类型发明专利

  • 公开/公告日2021-06-11

    原文格式PDF

  • 申请/专利权人 中国科学院合肥物质科学研究院;

    申请/专利号CN202110334545.6

  • 发明设计人 汪增福;吴仕莲;

    申请日2021-03-29

  • 分类号G06K9/62(20060101);G06T11/60(20060101);G06T11/00(20060101);G06K9/32(20060101);G06K9/34(20060101);G06N3/04(20060101);G06N3/08(20060101);

  • 代理机构34101 安徽省合肥新安专利代理有限责任公司;

  • 代理人陆丽莉;何梅生

  • 地址 230031 安徽省合肥市蜀山区蜀山湖路350号

  • 入库时间 2023-06-19 11:22:42

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2022-09-13

    授权

    发明专利权授予

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号