首页> 外国专利> Systems, methods, and computer readable media for extracting data from portable document format(PDF) files

Systems, methods, and computer readable media for extracting data from portable document format(PDF) files

机译:用于从便携式文档格式(PDF)文件中提取数据的系统,方法和计算机可读介质

摘要

According to one method, the method occurs at a data file analyzer. The method includes identifying at least one document identifier associated with a first document in a portable document format (PDF) file. The method further includes determining, using the at least one document identifier, a reference point identifier for identifying a reference point in the first document, an offset value for indicating a location of a first detection area in the first document, and size information for indicating a size of the first detection area in the first document. The method also includes identifying, using a reference point identifier, the reference point in the first document. The method further includes identifying, using the offset value and the size information, the first detection area in the first document and extracting, by processing binary data of the PDF file, data within the first detection area of the first document.
机译:根据一种方法,该方法在数据文件分析器处发生。该方法包括以便携式文档格式(PDF)文件识别与第一文档相关联的至少一个文档标识符。该方法还包括:使用至少一个文档标识符,确定用于识别第一文档中的参考点的参考点标识符,用于指示第一检测区域在第一文档中的位置的偏移值以及用于指示第一文档的尺寸信息。第一文档中第一检测区域的大小。该方法还包括使用参考点标识符来识别第一文档中的参考点。该方法还包括使用偏移值和尺寸信息来识别第一文档中的第一检测区域,并且通过处理PDF文件的二进制数据来提取第一文档的第一检测区域内的数据。

著录项

  • 公开/公告号GB2563175A

    专利类型

  • 公开/公告日2018-12-05

    原文格式PDF

  • 申请/专利权人 SAGEWORKS INC;

    申请/专利号GB20180014984

  • 发明设计人 TIMOTHY FRANCIS KEOGH;BRIAN HAMITON;

    申请日2017-03-10

  • 分类号G06K9;G06K9/20;

  • 国家 GB

  • 入库时间 2022-08-21 11:43:12

相似文献

  • 专利
  • 外文文献
  • 中文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号