首页> 中文期刊> 《计算机工程》 >一种基于欠采样的不平衡数据分类算法

一种基于欠采样的不平衡数据分类算法

         

摘要

Imbalanced Data Learning(IDL) problem is one of the research issues in machine learning.This paper presents a classification algorithm based on undersampling, which algorithm undersamples the majority examples, and retains the majority examples near the classify border.With the AUC as the optimization objectives.It chooses the most appropriate domain radius to balance the data set, and trains the Bayesian classifier by the use of the examples after undersampling.Using AUC as a measure of classifier performance evaluation, the experiments on simulation data and UCI data sets show that undersampling is effective.%针对不平衡数据学习问题,提出一种基于欠采样的分类算法.对多数类样例进行欠采样,保留位于分类边界附近的多数类样例.以AUC为优化目标,选择最恰当的邻域半径使数据达到平衡,利用欠采样后的样例训练贝叶斯分类器,并采用AUC评价分类器性能.仿真数据及UCI数据集上的实验结果表明,该算法有效.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号