首页> 中国专利> 表格提取方法与表格提取系统

表格提取方法与表格提取系统

摘要

本发明涉及图像处理技术领域,公开一种表格提取方法与系统。所述方法包括:通过图像分割模型对表格图像进行分割,以获得标记有各个像素点处的线属性的掩膜图像;采用图像学方法对掩膜图像进行处理,以获取每个单元格的顶点坐标、起始行索引、起始列索引、终止行索引与终止列索引;通过文本识别模型对表格图像进行识别,以获得每个文本的最小外接矩形的顶点坐标与文本内容;根据每个单元格的顶点坐标与每个文本的最小外接矩形的顶点坐标,确定每个单元格内的文本内容;以及根据上述行索引与列索引及文本内容,生成以目标文件呈现的表格。本发明在表格印刷的不清楚或噪音干扰较大的情况下,仍可精准地提取任何版式的表格。

著录项

  • 公开/公告号CN114663897A

    专利类型发明专利

  • 公开/公告日2022-06-24

    原文格式PDF

  • 申请/专利权人 贝壳找房网(北京)信息技术有限公司;

    申请/专利号CN202210364491.2

  • 发明设计人 路浩南;

    申请日2022-04-07

  • 分类号G06V30/412;G06V20/62;G06V10/26;G06V30/148;G06V30/10;

  • 代理机构北京润平知识产权代理有限公司;

  • 代理人王晓晓

  • 地址 101520 北京市密云区经济开发区兴盛南路8号开发区办公楼501室-1834(经济开发区集中办公区)

  • 入库时间 2023-06-19 15:44:42

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2022-06-24

    公开

    发明专利申请公布

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号