首页> 中国专利> 自动识别分栏的PDF文档处理方法、装置、设备及存储介质

自动识别分栏的PDF文档处理方法、装置、设备及存储介质

摘要

本公开提供了一种自动识别分栏的PDF文档处理方法,包括:S1、获取目标PDF文档的目标页面中的字符位置信息;S2、基于字符位置信息,在不连续的字符后设置标签;S3、判断标签中是否包含至少一组第一阈值数量以上的特征标签;S4、如果标签中包含至少一组第一阈值数量以上的特征标签,则判定目标页面中存在至少一个分栏特征;以及S5、获取至少一个分栏特征的左边界位置值以及右边界位置值。本公开还提供了自动识别分栏的PDF文档处理装置、电子设备以及存储介质。

著录项

  • 公开/公告号CN112380824B

    专利类型发明专利

  • 公开/公告日2022-02-22

    原文格式PDF

  • 申请/专利权人 北京中科凡语科技有限公司;

    申请/专利号CN202011074947.9

  • 发明设计人 周玉;李小青;

    申请日2020-10-09

  • 分类号G06F40/174(20200101);G06F40/18(20200101);G06V30/414(20220101);G06V30/412(20220101);

  • 代理机构11807 北京庚致知识产权代理事务所(特殊普通合伙);

  • 代理人韩德凯;李晓辉

  • 地址 100190 北京市海淀区知春路63号51号楼10层1006

  • 入库时间 2022-08-23 13:08:45

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2022-12-23

    著录事项变更 IPC(主分类):G06F40/174 专利申请号:2020110749479 变更事项:发明人 变更前:周玉李小青 变更后:周玉

    著录事项变更

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号