首页> 中文期刊> 《软件导刊 》 >融合聚类过采样算法的信贷不平衡数据分类

融合聚类过采样算法的信贷不平衡数据分类

         

摘要

不平衡数据往往会导致信用机构对“坏客户”的识别率较低。针对传统聚类过采样算法的边界样本损失问题,提出一种融合改进的K中心点算法的过采样方法——KmediodSMOTE,通过引入聚类准则函数和边界阈值以减少边界样本损失,并提出一种适用于非平衡数据的K值选取方法——UET-SSE。首先,根据Pearson相关系数和少数类K近邻确定边界阈值,然后划分适合聚类采样的区域,并使用UET-SSE方法选取K值进行聚类,最后引入“中心度”的概念进行加权过采样。实验结果表明,该方法与经典过采样算法SMOTE、BorderlineSMOTE、KmeansSMOTE相比,在RF分类器下的G-means全为最高,F1-measure在4组数据中有3组最高,有效提高了不平衡数据的分类准确率。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号