首页> 中文期刊> 《数码设计(下)》 >不平衡数据的一种新采样方法

不平衡数据的一种新采样方法

         

摘要

不平衡数据分类是数据挖掘领域一个重要方向,其难点在于在对于不平衡数据进行分类时分类边界容易向少数类样本方向研究倾斜,且容易受到噪声影响,极大地影响分类器效果.本文在传统数据层面算法的基础上,提出一种新的不平衡数据混合采样方法即NMS-SMOTE算法,先将少数类样本根据K-近邻规则分为安全集、边界集与噪声集,其次对安全集少数类样本采用RM-SMOTE[2]算法进行过采样,对边界集利用空间插值方法[4]进行过采样,对于噪声集予以删除,最后用近邻清理规则对过采样处理之后的整个样本数据集进行欠采样操作,得到所需要的样本数据集.实验结果显示,该方法在处理不平衡样本时与以往同类采样方法相比具有较好的效果.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号