首页> 外国专利> RELIABILITY OF DUPLICATE DOCUMENT DETECTION ALGORITHMS

RELIABILITY OF DUPLICATE DOCUMENT DETECTION ALGORITHMS

机译:双重文件检测算法的可靠性

摘要

In a single-signature duplicate document system, a secondary set of attributes is used in addition to a primary set of attributes so as to improve the precision of the system. When the projection of a document onto the primary set of attributes is below a threshold, then a secondary set of attributes is used to supplement the primary lexicon so that the projection is above the threshold.
机译:在单签名重复文档系统中,除了主要属性集之外,还使用了辅助属性集,以提高系统的精度。当文档在主要属性集上的投影低于阈值时,则使用辅助属性集来补充主要词典,以使投影在阈值以上。

著录项

相似文献

  • 专利
  • 外文文献
  • 中文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号