基于密度的kNN分类器训练样本裁剪方法的改进

熊忠阳; 杨营辉; 张玉芳

首页> 中文期刊>计算机应用 >基于密度的kNN分类器训练样本裁剪方法的改进

基于密度的kNN分类器训练样本裁剪方法的改进

开具论文收录证明 >>

期刊封面封底目录下载 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

在文本分类中,训练集的分布状态会直接影响k-近邻(kNN)分类器的效率和准确率.通过分析基于密度的kNN文本分类器训练样本的裁剪方法,发现它存在两大不足:一是裁剪之后的均匀状态只是以ε为半径的球形区域意义上的均匀状态,而非最理想的均匀状态即两两样本之间的距离相等;二是未对低密度区域的样本做任何处理,裁剪之后仍存在大量不均匀的区域.针对这两处不足,提出了以下两点改进:一是优化了裁剪策略,使裁剪之后的训练集更趋于理想的均匀状态;二是实现了对低密度区域样本的补充.通过实验对比,改进后的方法在稳定性和准确率方面都有明显提高.

著录项

来源
《计算机应用》|2010年第3期|799-801,817|共4页
作者
熊忠阳; 杨营辉; 张玉芳;
展开▼
作者单位

重庆大学,计算机学院,重庆,400044;

重庆大学,计算机学院,重庆,400044;

重庆大学,计算机学院,重庆,400044;

展开▼
原文格式 PDF
正文语种 chi
中图分类信息处理（信息加工）;
关键词
文本分类; k-近邻; 快速分类; 样本裁剪; 样本补充;
入库时间 2023-07-24 18:50:56

相似文献

中文文献
外文文献
专利

1. 基于密度的kNN文本分类器训练样本裁剪方法 [J] . 李荣陆 ,胡运发 . 计算机研究与发展 . 2004,第004期
2. 基于聚类和密度的KNN分类器训练样本约减方法 [J] . 艾英山 ,张德贤 . 计算机与数字工程 . 2009,第005期
3. 基于密度的KNN分类器样本裁剪算法 [J] . 苟和平 ,景永霞 ,冯百明 . 佳木斯大学学报（自然科学版） . 2013,第002期
4. 基于冗余度的KNN训练样本裁剪新算法 [J] . 王子旗 ,何锦雯 ,蒋良孝 . 计算机工程与应用 . 2019,第022期
5. 一种新的基于密度的k-最近邻文本分类器训练样本约减方法 [J] . 徐义峰 ,陈春明 ,徐云青 . 计算机系统应用 . 2007,第011期
6. 基于粗糙集和分布密度理论的KNN分类样本选取方法 [C] . 刘毅 ,杨燕 . 2006年全国信息、电子与控制技术学术会议(IECT'2006) . 2006
7. 基于密度裁剪的SVM与AdaBoost-KNN结合的分类算法研究 [A] . 范支菊 . 2019

基于密度的kNN分类器训练样本裁剪方法的改进

摘要

著录项

相似文献

相关主题

期刊订阅