...
首页> 外文期刊>Automatika >A Generic Procedure for Integration Testing of ETL Procedures
【24h】

A Generic Procedure for Integration Testing of ETL Procedures

机译:ETL过程集成测试的通用过程

获取原文
获取原文并翻译 | 示例

摘要

Kako bi se ostvarila određena razina povjerenja u kvalitetu podataka potrebno je obaviti niz provjera. Postoje brojne komponente (I aspekti) skladišta podataka koji se mogu testirati. U ovom radu smo se usredotočili na testiranje ETL procedura. S obzirom na složenost sustava skladišta podataka, testovi ETL procedura se pišu posebno za svako skladište podataka I rijetko se mogu ponovo upotrebljavati. Ovdje se obrađuje taj problem I predlaže općenita procedura za integracijsko testiranje određenih aspekata ETL procedura. Predloženi pristup tretira ETL procedure kao crnu kutiju, te se procedure testiraju tako što se uspoređuju ulazni I izlazni skupovi podataka. Uspoređuju se skupovi podataka s tri lokacije: podaci iz izvorišta podataka, podaci iz konsolidiranog pripremnog područja te podaci iz skladišta podataka. Predložena procedura je općenita I može se primijeniti na bilo koje skladište podatka koje koristi dimenzijski model pri čemu podatke dobavlja iz relacijskih baza podataka. Predložene provjere se odnose samo na određene aspekte problema kvalitete podataka koji se mogu pojaviti u sustavu skladišta podataka, te služe za uspostavljanje osnovnog skupa provjera ili uvećanje mogućnosti provjere postojećih sustava. Predloženi postupak se komentira u kontekstu potpunog I inkrementalnog učitavanja podataka u skladište podataka.%In order to attain a certain degree of confidence in the quality of the data in the data warehouse it is necessary to perform a series of tests. There are many components (and aspects) of the data warehouse that can be tested, and in this paper we focus on the ETL procedures. Due to the complexity of ETL process, ETL procedure tests are usually custom written, having a very low level of reusability. In this paper we address this issue and work towards establishing a generic procedure for integration testing of certain aspects of ETL procedures. In this approach, ETL procedures are treated as a black box and are tested by comparing their inputs and outputs - datasets. Datasets from three locations are compared: datasets from the relational source(s), datasets from the staging area and datasets from the data warehouse. Proposed procedure is generic and can be implemented on any data warehouse employing dimensional model and having relational database(s) as a source. Our work pertains only to certain aspects of data quality problems that can be found in DW systems. It provides a basic testing foundation or augments existing data warehouse system's testing capabilities. We comment on proposed mechanisms both in terms of full reload and incremental loading.
机译:为了在数据质量上达到一定的置信度,有必要执行一系列检查。可以测试数据仓库的许多组件(和方面)。在本文中,我们专注于测试ETL过程。考虑到数据仓库系统的复杂性,ETL过程测试是针对每个数据仓库分别编写的,很少重复使用。这里解决了这个问题,并提出了用于ETL过程某些方面的集成测试的通用过程。所提出的方法将ETL过程视为黑匣子,并且通过比较输入和输出数据集来测试这些过程。比较了来自三个位置的数据集:来自数据源的数据,来自合并准备区域的数据以及来自数据仓库的数据。所提出的过程是通用的,并且可以使用维模型从关系数据库获取数据的方式应用于任何数据仓库。提议的检查仅涉及可能在数据仓库系统中发生的数据质量问题的某些方面,并用于建立基本的检查集或提高检查现有系统的能力。在将数据完整和增量加载到数据仓库中的情况下,对建议的过程进行了注释。%为了对数据仓库中的数据质量有一定的信心,必须执行一系列测试。可以测试数据仓库的许多组件(和方面),在本文中,我们重点关注ETL过程。由于ETL过程的复杂性,ETL过程测试通常是自定义编写的,具有很低的可重用性。在本文中,我们解决了这个问题,并努力建立通用的过程来对ETL过程的某些方面进行集成测试。在这种方法中,ETL过程被视为黑盒,并通过比较其输入和输出-数据集进行测试。比较了来自三个位置的数据集:相对源的数据集,暂存区的数据集和数据仓库的数据集。提议的过程是通用的,可以在任何使用维模型并以关系数据库为源的数据仓库上实施。我们的工作仅涉及DW系统中可能出现的数据质量问题的某些方面。它提供了基本的测试基础或增强了现有数据仓库系统的测试功能。我们从完全重新加载和增量加载的角度对提议的机制进行评论。

著录项

  • 来源
    《Automatika》 |2011年第2期|p.169-178|共10页
  • 作者单位

    Department of Applied Computing, Faculty of Electrical Engineering and Computing, University of Zagreb, Unska 3, HR-10000, Zagreb, Croatia;

    Department of Applied Computing, Faculty of Electrical Engineering and Computing, University of Zagreb, Unska 3, HR-10000, Zagreb, Croatia;

    Department of Applied Computing, Faculty of Electrical Engineering and Computing, University of Zagreb, Unska 3, HR-10000, Zagreb, Croatia;

  • 收录信息
  • 原文格式 PDF
  • 正文语种 eng
  • 中图分类
  • 关键词

    data quality; data warehouse; dimensional model; ETL testing;

    机译:数据质量;数据仓库;尺寸模型;ETL测试;

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号