基于区域划分的改进KNN分类算法

代理获取

页面导航

摘要
著录项
相似文献
相关主题

摘要

数据分类是数据挖掘的重要组成部分，主要用来提取用于判定数据对象类型的模型。数据分类的目标是构造一个分类器，来预测数据对象的类别。KNN是一种比较常用的分类算法，准确率高，原理简单，实现起来方便，并且能够对超维数据空间建模。但是直接在训练集上使用KNN算法，计算量较大，并且随着数据对象数量和维数的增加，计算量呈指数增长。
　　为了提高KNN算法的效率，针对不同的应用场景，本文提出了基于超球区域划分和基于超长方体区域划分两种不同的KNN改进算法。在训练阶段，根据训练样本的分布情况，使用某种区域划分方法将训练样本空间划分成若干个区域，并在划分区域的基础上构造基于区域划分的初级分类器；在测试分类阶段，利用初级分类器确定待测样本的新训练集，然后在新训练集上使用KNN算法确定待测样本的类别。由于新训练集中样本数量小于原始训练集中的样本数量，因此测试分类阶段KNN算法的计算量会大大下降。在基于超球区域划分的改进算法中，使用模拟退火算法来控制初级分类器中超球的数量，从而降低算法的计算量；在基于超长方体区域划分的改进算法中，通过降维，来控制超长方体的数量，从而降低算法的计算量和存储开销。
　　在七个数据集上进行实验，使用本文所提出的算法对待测样本进行分类，并与经典KNN分类算法在准确率与分类时间方面进行了比较。实验证明，本文所提的改进KNN分类算法是高效的。

著录项

作者
胡敬伟;
展开▼
作者单位

青岛大学;

展开▼
授予单位青岛大学;
学科软件工程
授予学位硕士
导师姓名张公敬;
年度 2016
页码
总页数
原文格式 PDF
正文语种中文
中图分类 TP311.13;
关键词
数据分类; KNN算法; 初级分类器; 超长方体区域划分; 超球区域划分;

相似文献

中文文献
外文文献
专利

1. 基于区域划分的kNN文本快速分类算法研究 [J] . 胡元 ,石冰 . 计算机科学 . 2012,第010期
2. 基于超球区域划分的改进KNN算法 [J] . 郝卫杰 ,王艳飞 ,胡敬伟 . 青岛大学学报（自然科学版） . 2017,第001期
3. 基于高斯函数的改进KNN分类算法研究 [J] . 田曙光 ,宋耀莲 . 数据通信 . 2021,第003期
4. 基于聚类改进的Fisher与KNN判别分类算法对比研究 [J] . 朱景福 ,李芳 ,鹿保鑫 . 安徽农业科学 . 2019,第001期
5. 基于改进K-modes聚类的KNN分类算法 [J] . 王志华 ,刘绍廷 ,罗齐 . 计算机工程与设计 . 2019,第008期
6. 基于MapReduce的KNN分类算法的改进在动车组中的应用 [C] . GUO Ming-liang ,郭明亮 ,ZHANG Jun-wen . 中国计算机用户协会网络应用分会2014年第十八届网络新技术与应用年会 . 2014
7. 基于区域划分的KNN文本快速分类算法研究 [A] . 胡元 . 2012

基于区域划分的改进KNN分类算法

摘要

著录项

相似文献

相关主题

期刊订阅