data mining; knowledge based systems; data warehouses; sorting; natural languages; data mining; data discovery; knowledge discovery; data centralization; data warehousing; data quality; data cleansing tool; duplicate data detection; multiple data source;
机译:DuplicateDetector,使用NGS数据进行重复检测的轻量级工具
机译:Genomon ITDetector:从癌症基因组测序数据进行体细胞内部串联重复检测的工具
机译:使用基于令牌的数据仓库方法检测和消除重复数据:一种基于聚类的方法
机译:重复记录检测以进行数据库清理
机译:在线数据流上的新型类检测和跨语言重复检测
机译:Gencore:一种有效的工具可以生成共识读以抑制错误并重复删除NGS数据
机译:一种有效的数据清理重复记录检测算法