首页> 中文期刊> 《计算机应用》 >数据仓库ETL中相似重复记录的检测方法及应用

数据仓库ETL中相似重复记录的检测方法及应用

     

摘要

检测和消除数据仓库中的相似重复记录是数据清洗和提高数据质量要解决的主要问题之一.将位置编码技术引入到数据仓库ETL中,提出了一种相似重复记录的检测算法PCM(位置编码方法).该算法不仅可以应用到西文字符集中,而且也成功的应用到了中文字符集中,实例表明该算法具有很好的效果.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号