一种基于混合策略的失衡数据集分类方法

李鹏; 王晓龙; 刘远超; 王宝勋

首页> 中文期刊> 《电子学报》 >一种基于混合策略的失衡数据集分类方法

一种基于混合策略的失衡数据集分类方法

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

提出了一种有效应用于失衡数据集的分类方法,其核心思想是从样本预处理和分类器改进两方面入手,为失衡数据集的分类问题提供全面的解决方案.首先创造性地采用动态自组织映射聚类的方法对失衡数据集进行重采样,这种采样方法,有效地解决了传统重采样的方法随机性强,人为主观干扰以及信息损失等弊端.随后借助K-近邻规则的思想,对新采集的样本进行剪枝,有效地解决了实际存在的数据混叠现象.算法对SVM的核函数进行等角变换,由此对类边界进行了校准,以适应样本类别失衡的情况.通过对三种算法的对比实验证明了算法在失衡数据集分类上的有效性.本文的算法已经在答案抽取技术中得到了成功应用,并在TREC2006国际QA评测中得到了客观充分的验证.

著录项

来源
《电子学报》 |2007年第11期|2161-2165|共5页
作者
李鹏; 王晓龙; 刘远超; 王宝勋;
展开▼
作者单位

哈尔滨工业大学计算机科学与技术学院,黑龙江哈尔滨,150001;

哈尔滨工业大学计算机科学与技术学院,黑龙江哈尔滨,150001;

哈尔滨工业大学计算机科学与技术学院,黑龙江哈尔滨,150001;

哈尔滨工业大学计算机科学与技术学院,黑龙江哈尔滨,150001;

展开▼
原文格式 PDF
正文语种 chi
中图分类翻译机;
关键词
失衡数据集; 分类; 支持向量机; 动态自组织映射; K-近邻;

相似文献

中文文献
外文文献
专利

1. 基于改进决策树算法的失衡数据集分类方法 [J] . 潘燕 . 长春工程学院学报（自然科学版） . 2019,第004期
2. 一种基于信息保持的跨数据集图像分类方法 [J] . 朱广堂 ,周向东 . 计算机工程 . 2016,第004期
3. 一种基于过抽样技术的非平衡数据集分类方法 [J] . 王春玉 ,苏宏业 ,渠瑜 . 计算机工程与应用 . 2011,第001期
4. 一种基于核SMOTE的非平衡数据集分类方法 [J] . 曾志强 ,吴群 ,廖备水 . 电子学报 . 2009,第011期
5. 基于混合策略的关联分类方法 [J] . 李学明 ,付萌 ,李宾飞 . 计算机应用研究 . 2013,第003期
6. 面向主题的GEO基因表达数据集自动分类方法研究 [C] . 徐超 ,李姣 . 中华医学会第十九次全国医学信息学术会议 . 2013
7. 面向失衡数据集的集成学习分类方法及其应用研究 [A] . 黄久玲 . 2015

一种基于混合策略的失衡数据集分类方法

摘要

著录项

相似文献

相关主题

期刊订阅