首页> 外国专利> DUPLICATE DATA DETECTION PROGRAM, DUPLICATE DATA DETECTION METHOD, AND DUPLICATE DATA DETECTOR

DUPLICATE DATA DETECTION PROGRAM, DUPLICATE DATA DETECTION METHOD, AND DUPLICATE DATA DETECTOR

机译:重复数据检测程序,重复数据检测方法和重复数据检测器

摘要

PPROBLEM TO BE SOLVED: To provide a duplicate data detection program, a duplicate data detection method and a duplicate data detector, faciliting data refinement for detecting duplicate data in a short time. PSOLUTION: A computer 1 has the following functions. A syntactic tree construction means 2 constructs a syntactic tree for each of data with a plurality of characters at predetermined non-adjacent positions of a character string. A duplicate data detection means 2 determines, for each leaf node of the syntactic tree, whether two or more data reaching the leaf node are present or not, and detects data which reach the same leaf node as duplicate data candidates. PCOPYRIGHT: (C)2008,JPO&INPIT
机译:

要解决的问题:提供一种重复数据检测程序,一种重复数据检测方法和一种重复数据检测器,有助于简化数据,以便在短时间内检测重复数据。

解决方案:计算机1具有以下功能。句法树构造装置2为在字符串的预定的非相邻位置处具有多个字符的每个数据构造句法树。复制数据检测装置2针对句法树的每个叶节点确定是否存在到达该叶节点的两个或多个数据,并且检测到达相同叶节点的数据作为复制数据候选。

版权:(C)2008,日本特许厅&INPIT

著录项

  • 公开/公告号JP2008033728A

    专利类型

  • 公开/公告日2008-02-14

    原文格式PDF

  • 申请/专利权人 FUJITSU LTD;

    申请/专利号JP20060207904

  • 发明设计人 ASAI TATSUYA;OKAMOTO AOSHI;

    申请日2006-07-31

  • 分类号G06F17/30;G06F17/27;

  • 国家 JP

  • 入库时间 2022-08-21 20:23:51

相似文献

  • 专利
  • 外文文献
  • 中文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号