首页> 外文会议>International Conference on Information Technology Systems and Innovation >Data profiling for data quality improvement with OpenRefine
【24h】

Data profiling for data quality improvement with OpenRefine

机译:使用OpenRefine进行数据剖析以提高数据质量

获取原文

摘要

Data profiling is an information analysis technique on data stored inside database. Data profiling purpose is to ensure data quality by detecting whether the data in the data source compiles with the established business rules. Profiling could be performed using multiple analysis techniques depending on the data element to be analyzed. The analysis process also influenced by the data profiling tool being used. This paper describes tehniques of profiling analysis using open-source tool OpenRefine. The method used in this paper is case study method, using data retrieved from BPOM Agency website for checking commodity traditional medicine permits. Data attributes that became the main concern of this paper is Nomor Ijin Edar (NIE / distribution permit number) and registrar company name. The result of this research were suggestions to improve data quality on NIE and company name, which consists of data cleansing and improvement to business process and applications.
机译:数据概要分析是对数据库内部存储的数据的一种信息分析技术。数据概要分析的目的是通过检测数据源中的数据是否符合已建立的业务规则来确保数据质量。可以使用多种分析技术来执行分析,具体取决于要分析的数据元素。分析过程还受到所使用的数据分析工具的影响。本文介绍了使用开放源代码工具OpenRefine进行性能分析的技术。本文使用的方法是案例研究方法,它使用从BPOM Agency网站检索的数据来检查商品传统药物许可。成为本文主要关注对象的数据属性是Nomor Ijin Edar(NIE /发行许可证编号)和注册服务商公司名称。这项研究的结果是提高NIE和公司名称的数据质量的建议,其中包括数据清理以及对业务流程和应用程序的改进。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号