首页> 外国专利> METHOD FOR PARSING TABLE DATA IN PDF FILE

METHOD FOR PARSING TABLE DATA IN PDF FILE

机译:PDF文件中的表格数据解析方法

摘要

The present invention relates to a method for parsing table data targeting a PDF file. The present invention extracts data from the PDF file and analyzes the file structure to generate a parse tree for the PDF file, and using the generated parse tree to search for a location of a page containing a headword of a table to be searched. , Based on the coordinates (x, y) assigned to the headword of the table to be searched, including the step of setting a parsing range within the searched page and parsing the table data targeting the set parsing range. It is characterized. According to the present invention, there is an advantage that target table data can be accurately parsed from a PDF file.
机译:本发明涉及一种用于解析以PDF文件为目标的表格数据的方法。本发明从PDF文件中提取数据并分析文件结构以生成用于PDF文件的解析树,并且使用所生成的解析树来搜索包含要搜索的表的关键词的页面的位置。 ,基于分配给要搜索表的标题的坐标(x,y),包括在搜索页面内设置解析范围并解析以设置的解析范围为目标的表数据的步骤。它的特点。根据本发明,具有可以从PDF文件准确地解析目标表数据的优点。

著录项

  • 公开/公告号KR102171325B1

    专利类型

  • 公开/公告日2020-10-28

    原文格式PDF

  • 申请/专利权人

    申请/专利号KR1020200004927

  • 发明设计人 구다해;김동훈;

    申请日2020-01-14

  • 分类号G06F16/22;

  • 国家 KR

  • 入库时间 2022-08-21 11:03:27

相似文献

  • 专利
  • 外文文献
  • 中文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号