首页> 中文期刊>计算机应用研究 >大数据下的快速 KN N分类算法

大数据下的快速 KN N分类算法

     

摘要

针对K最近邻算法测试复杂度至少为线性,导致其在大数据样本情况下的效率很低的问题,提出了一种应用于大数据下的快速KN N分类算法。该算法创新性地在K最近邻算法中引入训练过程,即通过线性复杂度聚类方法对大数据样本进行分块,然后在测试过程中找出与待测样本距离最近的块,并将其作为新的训练样本进行K最近邻分类。这样的过程大幅度地减少了K最近邻算法的测试开销,使其能在大数据集中得以应用。实验表明,该算法在与经典KN N分类准确率保持近似的情况下,分类的速度明显快于经典KN N算法。%Aiming at the problems of the K-nearest neighbor algorithm,testing complex is linear at least,and lead to the ac-curacy is low when the samples are large.This paper proposed a fast KNN classification algorithm faster than the traditional KNN did.The proposed algorithm innovatively introduced the training process during the KNN method,i.e.,the algorithm blocked the big data by linear complexity clustering.Then,the algorithm selected the nearest cluster as new training samples and established a classification model.This process reduced the KNN algorithm testing overhead,which made the proposed al-gorithm could be applied to big data.Experiments result shows that the accuracy of the proposed KNN classification is similari-ty than the traditional KNN,but the classification speed has been significantly improved.

著录项

  • 来源
    《计算机应用研究》|2016年第4期|1003-10061023|共5页
  • 作者单位

    广西师范学院 计算机与信息工程学院;

    南宁530023;

    广西师范大学 广西多源信息挖掘与安全重点实验室和广西区域多源信息集成与智能处理协同创新中心;

    广西 桂林541004;

    广西师范大学 广西多源信息挖掘与安全重点实验室和广西区域多源信息集成与智能处理协同创新中心;

    广西 桂林541004;

    广西师范大学 广西多源信息挖掘与安全重点实验室和广西区域多源信息集成与智能处理协同创新中心;

    广西 桂林541004;

  • 原文格式 PDF
  • 正文语种 chi
  • 中图分类 算法理论;
  • 关键词

    K最近邻; 测试复杂度; 大数据; 分块; 聚类中心;

  • 入库时间 2022-08-18 05:02:29

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号