首页> 外国专利> TABLE STRUCTURE ANALYZING APPARATUS, TABLE STRUCTURE ANALYZING METHOD, AND TABLE STRUCTURE ANALYZING PROGRAM

TABLE STRUCTURE ANALYZING APPARATUS, TABLE STRUCTURE ANALYZING METHOD, AND TABLE STRUCTURE ANALYZING PROGRAM

机译:表结构分析装置,表结构分析方法和表结构分析程序

摘要

A table structure analyzing apparatus extracts first row data and second row data in table data. Similarity between the data is computed based on Levenshtein distance or the number of characters. Further, similarity between the first row and the second row as a whole is determined. When the similarity is equal or less than a predetermined threshold value, it is determined that the boundary between the first and second rows is the boundary between a header part and a substantive part. A similar determination is made in the direction of columns.
机译:表格结构分析装置提取表格数据中的第一行数据和第二行数据。数据之间的相似性是根据Levenshtein距离或字符数计算的。此外,确定第一行和第二行整体上的相似性。当相似度等于或小于预定阈值时,确定第一行和第二行之间的边界是头部部分和实质部分之间的边界。在列的方向上做出类似的确定。

著录项

  • 公开/公告号US2009313205A1

    专利类型

  • 公开/公告日2009-12-17

    原文格式PDF

  • 申请/专利权人 TAKANORI HINO;SHINGO OCHI;

    申请/专利号US20090477670

  • 发明设计人 TAKANORI HINO;SHINGO OCHI;

    申请日2009-06-03

  • 分类号G06N5/02;

  • 国家 US

  • 入库时间 2022-08-21 18:53:44

相似文献

  • 专利
  • 外文文献
  • 中文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号