划分聚类与基于密度聚类算法的改进方法研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

数据挖掘就是从大量的、不完全的、有噪音的、模糊的、随机的数据中，提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。聚类分析是数据挖掘领域中重要的研究课题，用于发现大规模数据集中未知的对象类。因此，聚类算法的研究具有重要的意义和广阔的前景。本文针对传统K-means聚类算法和基于密度聚类算法进行了重点研究并对所存在的问题提出了改进算法。 K-means聚类算法在数据挖掘领域具有非常重要的应用价值。但随着应用领域的拓展和新的问题需求，K-means本身存在的局限越来越突出。首先，随机选取的初始值可能会导致不同的聚类结果，甚至会造成无解。其次，K-means算法采用了典型的爬山搜索方法，易于陷入局部最优。本文针对K-means聚类算法存在的缺陷提出了KSNN聚类算法。KSNN在数据集中搜索中心点，依据中心点查找数据集个数，为K-means聚类提供参数。有效克服了K-means需要人工设定聚类个数的问题，同时具有较好的全局收敛性。其次，为了解决数据集密度分布不均匀等实际应用问题，本文改进了基于密度的聚类算法，提出了CABONW聚类算法。CABONW首先利用最近邻居节点的方法构建出数据集中节点间的自然链接关系，然后建立节点间优先级，并将其用于对数据节点的有效关系进行排序，生成顺序表。最后，通过对顺序表的深度优先搜索生成最终的簇。通过与DBSCAN、OPTICS等基于密度聚类算法的对比实验证明，CABONW很好地解决了密度分布不均匀的数据集的处理，执行效率优于DBSCAN和OPTICS等基于密度的聚类算法。最后，本文设计了聚类分析系统原型，并将KSNN和CABONW等聚类算法加入到系统中。此原型系统可用于教学对比和实际数据集的分析，具有实际应用价值。通过理论分析和实验结果证明，KSNN和CABONW能够很好的解决K-means聚类算法和基于密度聚类算法所存在的缺陷，并且在聚类分析系统原型中得到了验证。

著录项

作者
张业嘉诚;
展开▼
作者单位

大连理工大学;

展开▼
授予单位大连理工大学;
学科软件工程
授予学位硕士
导师姓名江贺;
年度 2007
页码
总页数
原文格式 PDF
正文语种中文
中图分类算法理论;
关键词
数据挖掘; 聚类分析; 数据节点; 数据集;

相似文献

中文文献
外文文献
专利

1. 基于MapReduce和改进密度峰值的划分聚类算法 [J] . 黄学雨 ,向驰 ,陶涛 . 计算机应用研究 . 2021,第010期
2. 基于一种改进聚类算法的雷达导引头产品功能模块划分方法研究 [J] . 毛雨辉 . 中国机械工程 . 2010,第003期
3. 基于改进密度聚类算法的交通事故地点聚类研究 [J] . 黄钢 ,瞿伟斌 ,许卉莹 . 交通运输系统工程与信息 . 2020,第005期
4. 基于小波变换和改进快速密度峰值聚类算法的负荷曲线聚类研究 [J] . 刘凤魁 ,邓春宇 ,王新迎 . 电力信息与通信技术 . 2017,第003期
5. 基于小波变换和改进快速密度峰值聚类算法的负荷曲线聚类研究 [J] . 刘凤魁 ,邓春宇 ,王新迎 . 电力信息化 . 2017,第003期
6. 一种基于划分和密度的快速聚类算法 [C] . . 第二十五届中国数据库学术会议(NDBC2008) . 2008
7. 基于密度聚类算法的改进方法研究 [A] . 高昇 . 2007

划分聚类与基于密度聚类算法的改进方法研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅