首页> 外文学位 >A pre and post data warehouse cleaning technique.
【24h】

A pre and post data warehouse cleaning technique.

机译:数据仓库之前和之后的清洁技术。

获取原文
获取原文并翻译 | 示例

摘要

A data warehousing system is a single data repository, which integrates already existing information from different data sources belonging to an enterprise over a long time period. One of the main tasks in building a data warehouse is to ensure that data drawn from several data sources contain no structural and semantic conflicts before being loaded into the data warehouse. Representing the same real world object in numerous ways is just one form of data disparity (dirt) to be resolved in a data warehouse. Data cleaning is a complex process, which uses multidisciplinary techniques to remove all the conflicts inherent in warehouse data.; This thesis proposes two data cleaning algorithms. The first algorithm, designed for initial data warehouse cleaning, uses the token keys composed from record fields for comparison of records. The second algorithm is designed to subsequently clean an existing data warehouse in a timely fashion. The algorithms achieve optimal cleaning correctness in a good time.
机译:数据仓库系统是单个数据存储库,它集成了很长一段时间内来自属于企业的不同数据源的现有信息。建立数据仓库的主要任务之一是确保从多个数据源中提取的数据在加载到数据仓库之前不包含任何结构和语义冲突。以多种方式表示同一真实世界的对象只是要在数据仓库中解决的数据差异(污点)的一种形式。数据清理是一个复杂的过程,它使用多学科技术来消除仓库数据中固有的所有冲突。本文提出了两种数据清理算法。设计用于初始数据仓库清理的第一种算法使用由记录字段组成的令牌密钥来比较记录。第二种算法旨在随后及时清理现有数据仓库。该算法可在很短的时间内达到最佳清洁正确性。

著录项

  • 作者

    Ohanekwu, Timothy Emenike.;

  • 作者单位

    University of Windsor (Canada).;

  • 授予单位 University of Windsor (Canada).;
  • 学科 Computer Science.
  • 学位 M.Sc.
  • 年度 2002
  • 页码 82 p.
  • 总页数 82
  • 原文格式 PDF
  • 正文语种 eng
  • 中图分类 自动化技术、计算机技术;
  • 关键词

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号