首页> 美国卫生研究院文献>Journal of the American Medical Informatics Association : JAMIA >A benchmark comparison of deterministic and probabilistic methods for defining manual review datasets in duplicate records reconciliation
【2h】

A benchmark comparison of deterministic and probabilistic methods for defining manual review datasets in duplicate records reconciliation

机译:在重复记录对账中定义手动审核数据集的确定性方法和概率方法的基准比较

代理获取
本网站仅为用户提供外文OA文献查询和代理获取服务,本网站没有原文。下单后我们将采用程序或人工为您竭诚获取高质量的原文,但由于OA文献来源多样且变更频繁,仍可能出现获取不到、文献不完整或与标题不符等情况,如果获取不到我们将提供退款服务。请知悉。

摘要

IntroductionClinical databases require accurate entity resolution (ER). One approach is to use algorithms that assign questionable cases to manual review. Few studies have compared the performance of common algorithms for such a task. Furthermore, previous work has been limited by a lack of objective methods for setting algorithm parameters. We compared the performance of common ER algorithms: using algorithmic optimization, rather than manual parameter tuning, and on two-threshold classification (match/manual reviewon-match) as well as single-threshold (matchon-match).
机译:简介临床数据库需要准确的实体解析(ER)。一种方法是使用将可疑案例分配给人工审核的算法。很少有研究比较这种任务的通用算法的性能。此外,由于缺乏用于设置算法参数的客观方法,以前的工作受到了限制。我们比较了通用ER算法的性能:使用算法优化而不是手动参数调整,并且使用了两个阈值分类(匹配/手动审核/不匹配)以及单个阈值(匹配/不匹配)。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号