机译:基于n元语法的方法,用于检测近似重复的数据库记录
Department of Computer Science, Fudan University, Shanghi, 200433, P.R. China;
duplicate elimination; N-gram; edit distance; data quality;
机译:使用无数据库方法检测高通量测序数据中的分散重复项
机译:使用BAT算法和模糊分类器的健康信息学统一检测记录重复的方法
机译:在大型数据集中检测重复记录和近重复记录
机译:在数据库中检测大约重复的记录
机译:电子病历中的电子文档支持工具和文本复制。
机译:在多系统电子健康记录数据库中检测到SARCOPENIAFRAIRTY和CACHEXIA患者
机译:使用基于字符n-gram的功能检测重复的错误报告
机译:利用多元统计方法检测气候记录的年际变率与生态时间序列之间的关系 - 北海地区的四个案例研究