首页> 中国专利> 一种富格式文档的图形识别方法和系统

一种富格式文档的图形识别方法和系统

摘要

本发明公开了一种富格式文档的图形识别方法和系统,属于图形识别技术领域,所述方法包括:识别文档页面中图形的区域和类别;基于所述图形类别,获得图形区域中的对象,所述对象包括:形状对象、文本块和连线;根据文本块所在的位置,建立文本块与形状对象或连线的关联;根据连线的端点,找到连线的邻近对象;根据连线的类别,将相邻连线进行整合,获得整合连线;建立所述整合连线、邻近形状对象和文本块的关联,并获得结构化信息。图形类别不同,对象的形式和连接形式不同,基于图形类别的图形识别,可以有效提高识别的准确性;根据连线的类别,将连线的各个连线进行整合,获得整合连线,利于识别复杂图形中对象之间连接关系。

著录项

  • 公开/公告号CN114724165A

    专利类型发明专利

  • 公开/公告日2022-07-08

    原文格式PDF

  • 申请/专利权人 南京吾道知信信息技术有限公司;

    申请/专利号CN202210477699.5

  • 发明设计人 王俊;乔美萱;向俊夫;侯启予;

    申请日2022-05-05

  • 分类号G06V30/414;G06V30/413;G06N3/08;G06N3/04;G06K9/62;G06V10/764;G06V10/82;G06V10/25;

  • 代理机构北京棘龙知识产权代理有限公司;

  • 代理人李改平

  • 地址 211100 江苏省南京市江宁区东麒路33号东山国际企业总部园E座307

  • 入库时间 2023-06-19 15:57:08

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2022-07-08

    公开

    发明专利申请公布

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号