首页> 外文会议>IEEE International IOT, Electronics and Mechatronics Conference >Imputation Analysis of Central Tendencies for Classification
【24h】

Imputation Analysis of Central Tendencies for Classification

机译:中央倾向进行分类的归责分析

获取原文

摘要

In real-world datasets missing values are so common. Most Machine Learning algorithms won't work with missing values, and so they should be handled before training the model. It is a common practice to impute the missing values with central tendencies (Mean, Median, Mode), but choosing a particular one among them is not an easy choice to make. This paper analyzes the impact of using each central tendency for different distributions of data. Skewness and the presence of outliers are considered for selecting the data for analysis. Certain presumptions have been made before the examination, and performance metrics such as accuracy, AUC-ROC, precision, recall, and F1 score are analyzed to prove/disprove the assumptions.
机译:在真实的数据集中缺少值是如此常见。 大多数机器学习算法无法使用缺失值,因此应在培训模型之前处理它们。 它是一种常见的做法,赋予中央倾向(平均值,中位数,模式)赋予缺失的值,但在其中选择特定的趋势不是一个简单的选择。 本文分析了使用每个中央趋势对不同数据分布的影响。 偏斜和异常值的存在被认为是选择分析数据。 在考试之前已经进行了某些推定,并分析了准确性,AUC-ROC,精确,召回和F1分数等性能指标以证明/反驳假设。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号