基于K近邻方法的密度峰值点快速搜索聚类算法研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

人工智能理论和技术飞速发展，其中最重要的领域之一，数据挖掘和机器学习，正在不断地影响和改变人们的工作和生活。迄今为止，机器学习已被应用到很多的领域，例如电商的CRT预估，股票的量化交易，文本或声音信息的处理，图像识别与自动驾驶，个性化推荐等等。这些技术无疑会使我们的生活更加便捷。在众多应用领域中，聚类分析是一类重要的应用技术。　　2014年出现的密度峰值点快速搜索聚类算法(DPC)是一种新颖的聚类算法，它利用样本的密度和不同样本间的距离实现聚类，整个过程简单高效。但是，传统DPC算法在识别不同密度类簇、发现任意形状的类簇和噪声去除方面存在不足。本文结合K近邻法的思想，针对这两个不足，提出了两种DPC算法的改进算法。论文的主要工作如下：　　（1）针对传统DPC算法无法有效识别不同密度类簇的不足，利用K近邻图，提出一种基于K近邻图的密度峰值点快速搜索聚类算法(KG-DPC)。改进算法定义了一种新的密度估计函数，计算样本的K近邻样本集合与K近邻距离集合，通过给定样本的K近邻距离估计样本密度。再计算样本距离，使用决策图选择聚类中心，根据改进的样本分配法则进行聚类。最后，根据K近邻集合完成二次聚类。实验结果表明，KG-DPC算法相较于DPC算法在区分不同密度类簇方面有明显提升，在对人脸数据集聚类的实验中表示其准确率优于DPC算法。　　（2）针对DPC算法识别噪声数据和难以发现任意形状类簇的不足，结合K近邻方法和DBSCAN算法，提出基于噪声去除的密度峰值点快速搜索聚类算法(NR-DPC)。NR-DCP算法使用K近邻距离集合估计样本噪声指标，对数据集进行分层，选择密度较高样本。再使用噪声指标估计样本密度，计算样本距离，使用决策图选择聚类中心。最后使用DBSCAN算法策略从密度最高的聚类中心为起点扩张类簇。实验结果表明，NR-DPC算法在大多数的指标中都优于DPC算法。对文本试题数据的聚类结果显示，NR-DPC算法的准确率提升明显，具有实际应用意义。

著录项

作者
贾培灵;
展开▼
作者单位

山东科技大学;

展开▼
授予单位山东科技大学;
学科计算机应用技术
授予学位硕士
导师姓名樊建聪;
年度 2018
页码
总页数
原文格式 PDF
正文语种 chi
中图分类
关键词
密度峰值点快速搜索聚类算法,K近邻法,噪声去除,密度类簇,形状类簇;

相似文献

中文文献
外文文献
专利

1. 基于二阶k近邻的密度峰值聚类算法研究 [J] . 王大刚 ,丁世飞 ,钟锦 . 计算机科学与探索 . 2021,第008期
2. 基于K近邻的模糊密度峰值聚类算法研究 [J] . 支元 ,李忠 . 软件 . 2017,第004期
3. 一种基于簇边界的密度峰值点快速搜索聚类算法 [J] . 贾培灵 ,樊建聪 ,彭延军 . 南京大学学报：自然科学版 . 2017,第2期
4. 签到位置数据的密度峰值快速搜索与聚类方法 [J] . 刘萌 ,邬群勇 ,邱端昇 . 测绘学报 . 2017,第004期
5. 基于密度峰值快速搜索聚类的多场景分布式电源规划 [J] . 武晓朦 ,时政 ,付子义 . 河南理工大学学报（自然科学版） . 2022,第002期
6. 基于快速搜索密度峰值聚类的智能故障诊断 [C] . WEI Zexian ,韦泽贤 ,WANG Yanxue . 2016年全国设备监测诊断与维护学术会议、第十五届全国设备故障诊断学术会议、第十七届全国设备监测与诊断学术会议、2016年全国设备诊断工程会议 . 2016
7. 基于快速搜索和发现的密度峰值聚类算法研究与应用 [A] . 吕闯 . 2019

基于K近邻方法的密度峰值点快速搜索聚类算法研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅