一种基于欠采样的不平衡数据分类算法

程险峰; 李军; 李雄飞

首页> 中文期刊> 《计算机工程》 >一种基于欠采样的不平衡数据分类算法

一种基于欠采样的不平衡数据分类算法

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

Imbalanced Data Learning(IDL) problem is one of the research issues in machine learning.This paper presents a classification algorithm based on undersampling, which algorithm undersamples the majority examples, and retains the majority examples near the classify border.With the AUC as the optimization objectives.It chooses the most appropriate domain radius to balance the data set, and trains the Bayesian classifier by the use of the examples after undersampling.Using AUC as a measure of classifier performance evaluation, the experiments on simulation data and UCI data sets show that undersampling is effective.%针对不平衡数据学习问题,提出一种基于欠采样的分类算法.对多数类样例进行欠采样,保留位于分类边界附近的多数类样例.以AUC为优化目标,选择最恰当的邻域半径使数据达到平衡,利用欠采样后的样例训练贝叶斯分类器,并采用AUC评价分类器性能.仿真数据及UCI数据集上的实验结果表明,该算法有效.

著录项

来源
《计算机工程》 |2011年第13期|147-149|共3页
作者
程险峰; 李军; 李雄飞;
展开▼
作者单位

长春市公安局交通警察支队;

长春;

130011;

长春理工大学数学系;

长春;

130022;

吉林大学符号计算与知识工程教育部重点实验室;

长春;

130012;

吉林大学符号计算与知识工程教育部重点实验室;

长春;

130012;

展开▼
原文格式 PDF
正文语种 chi
中图分类自动推理、机器学习;
关键词
机器学习; 分类算法; 不平衡数据; 欠采样; 邻域;

相似文献

中文文献
外文文献
专利

1. 基于欠采样和代价敏感的不平衡数据分类算法 [J] . 王俊红 ,闫家荣 . 计算机应用 . 2021,第001期
2. 一种基于特征选择的不平衡数据分类算法 [J] . 肖鹰 ,吴哲夫 ,张彤 . 集成技术 . 2016,第001期
3. 一种基于聚类提升的不平衡数据分类算法 [J] . 胡小生 ,张润晶 ,钟勇 . 集成技术 . 2014,第002期
4. 一种基于聚类的不平衡数据分类算法 [J] . 陈兴稣 ,王雪峰 . 信息技术 . 2013,第008期
5. 基于谱聚类的不平衡数据欠采样方法研究 [J] . 杨晓月 . 计算机与数字工程 . 2021,第011期
6. 一种基于改进SMOTE的不平衡数据集主动学习SVM分类算法 [C] . ZHAO Xiao-qiang ,赵小强 ,LIU Meng-yi . 2016年第27届中国过程控制会议 . 2016
7. 基于无监督智能欠采样方法的不平衡数据分类算法研究 [A] . 罗英 . 2019

一种基于欠采样的不平衡数据分类算法

摘要

著录项

相似文献

相关主题

期刊订阅