首页> 中文会议>第17届全国图象图形学学术会议 >一种新的集成采样不均衡数据分类方法

一种新的集成采样不均衡数据分类方法

摘要

针对不均衡数据分类中正类(少类)分类准确率低的问题,本文提出了一种新的集成采样技术以平衡正负类数据分布,进而提高正类分类准确率.首先采用偏置支持向量机对不均衡训练集进行分类,找出正负类中的支持向量和非支持向量.然后对去噪后的正类支持向量集采用SMOTE过采样,对负类中非支持向量集进行随机欠采样,同时修剪负类中的支持向量集.实验证明,建议的集成采样技术与欠采样、SMOTE过采样、随机过采样等采样方法相比,总体分类准确率仅能反映分类器对所有样本分类的情况,难以体现对正类和负类的分类准确性,因此混合矩阵被提出用于评价不均衡数据。在混合矩阵中,TP是分类正确的正类样本,FP是分类错误的正类样本,FN是分类错误的负类样本,TN是分类正确的负类样本。实验表明gmeans越大,分类器在不均衡数据集上的分类性能越好。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号