首页> 中文期刊> 《计算机系统应用》 >面向软件缺陷预测的过采样方法

面向软件缺陷预测的过采样方法

     

摘要

为了缓解软件缺陷预测的类不平衡问题,避免过拟合影响缺陷预测模型的准确率,本文提出一种面向软件缺陷预测的基于异类距离排名的过采样方法 (HDR).首先,对少数类实例进行3类实例区分,去除噪声实例,减少噪声数据导致的过拟合的情况,然后基于异类距离将实例进行排名,选取相似度高的实例两两组合产生新实例,以此来提升新实例的多样性,之后将有价值的被删除的少数类实例恢复.实验将HDR算法与SMOTE算法和BorderlineSMOTE算法进行比较,采用RF分类器在NASA的8个实际项目数据集上进行,结果显示在F1-measure和G-Mean两项指标上分别有7.7%和10.6%的性能提升,实验表明HDR算法在处理数据量大并且不平衡率高的软件缺陷预测数据集上明显优于其他两种算法.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号