首页> 中文期刊> 《工业控制计算机》 >基于大数据的ETL中的数据清洗方案研究

基于大数据的ETL中的数据清洗方案研究

         

摘要

ETL,又被称为数据仓库技术,是指数据源经过抽取(Extract)、转换(Transform)、加载(Load)的过程.在运用ETL技术的过程中,会产生一些有着错误属性的数据,特别是在大数据时代的背景下,这种错误数据量往往十分庞大,传统的数据清洗方案效果不甚理想.设计一种基于大数据的ETL的高效数据清洗方案,通过对27组数据的清洗,将数据清洗方案与传统数据清洗方案进行对比,实验结果表明:该数据清洗方案能够有效提高数据清洗的效率,并且保持较高的准确性.

著录项

  • 来源
    《工业控制计算机》 |2018年第12期|108-110|共3页
  • 作者单位

    广东工业大学自动化学院;

    广东 广州 510006;

    广东工业大学自动化学院;

    广东 广州 510006;

    广东工业大学自动化学院;

    广东 广州 510006;

    广东工业大学自动化学院;

    广东 广州 510006;

    广东工业大学自动化学院;

    广东 广州 510006;

  • 原文格式 PDF
  • 正文语种 chi
  • 中图分类
  • 关键词

    数据清洗; ETL技术; 海量数据;

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号