首页> 中国专利> 基于词库的OCR语义校正方法、系统、介质、设备、终端

基于词库的OCR语义校正方法、系统、介质、设备、终端

摘要

本发明公开一种基于词库的OCR语义校正方法、系统、介质、设备、终端,涉及语义网络技术领域。过滤出所有字符识别置信度小于阈值0.4的字符,每个字符记录前5的结果;分别对置信度小于阈值0.4的字符的5种结果提取嫌疑词,最终对应得到5组嫌疑词,每组嫌疑词会有1个或多个嫌疑词;按照置信度顺序从高到低的顺序,分别对5组嫌疑词和词库进行匹配,分别计算匹配距离,匹配距离采用编辑距离评估;以匹配距离最小的结果作为结果输出。本发明结合字符识别结果top5和词库,精准定位识别错误字符,有针对性地对识别错误字符进行高效率纠错,保证识别结果的语义正确性。

著录项

  • 公开/公告号CN113704403A

    专利类型发明专利

  • 公开/公告日2021-11-26

    原文格式PDF

  • 申请/专利权人 深圳市网联安瑞网络科技有限公司;

    申请/专利号CN202110984517.9

  • 发明设计人 廖伟;石珺;李志鹏;郭认飞;

    申请日2021-08-25

  • 分类号G06F16/33(20190101);G06F16/335(20190101);G06F40/30(20200101);

  • 代理机构44804 广东普润知识产权代理有限公司;

  • 代理人寇闯

  • 地址 518000 广东省深圳市福田区华富街道新田社区深南大道1006号深圳国际创新中心(福田科技广场)D栋七层

  • 入库时间 2023-06-19 13:24:42

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号