首页> 外文会议>International Conference on Advances in Information Mining and Management >Automatic KDD Data Preparation Using Multi-criteria Features
【24h】

Automatic KDD Data Preparation Using Multi-criteria Features

机译:使用多标准功能自动KDD数据准备

获取原文

摘要

We present a new approach for automatic data preparation, applicable in most Knowledge Discovery and Data Mining systems, and using statistical features of the studied database. First, we detect outliers using an approach based on whether data distribution is normal or not. We outline further that, when trying to find the most appropriate discretization method, what is important is not the law followed by a column, but the shape of its density function. That is why we propose an automatic choice for finding the best discretization method based on a multi-criteria (Entropy, Variance, Stability) analysis. Experimental evaluations validate our approach: The very same discretization method is never always the most appropriate.
机译:我们为自动数据准备提供了一种新的方法,适用于大多数知识发现和数据挖掘系统,并使用研究数据库的统计功能。 首先,我们使用基于数据分布是正常的方法来检测异常值。 我们进一步概述了,当试图找到最合适的离散化方法时,重要的是不是法律,然后是一列,而是其密度函数的形状。 这就是为什么我们提出基于多标准(熵,方差,稳定性)分析来查找最佳离散化方法的自动选择。 实验评估验证了我们的方法:非常相同的离散化方法永远不会总是最合适的。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号