数据挖掘中几种划分聚类算法的比较及改进

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

数据挖掘技术是一种多学科交叉的新兴技术，它是随着数据的大量积累以及市场竞争对信息与知识的迫切需求而产生和发展起来的，并逐渐成为人们关注的热点。聚类分析是数据挖掘领域中一个较活跃且极具挑战性的研究方向。目前聚类算法中比较流行且应用比较广泛的划分聚类算法主要有K-均值、K-调和均值、模糊C-均值和谱聚类等划分算法。但这些算法自身都存在一些缺陷，例如对初始点敏感、不适用于大数据以及收敛速度慢等。主成分分析是一种将分散在一组变量上的信息集中到某几个综合指标(主成分)上的探索性统计分析方法，同时也是一种数据降维处理技术。本文借助主成分分析的一些优点，提出一种基于最大或次大特征值的主成分分析(PCA)聚类算法。该算法同时结合主成分分析以及所选择的聚类算法的优点，通过数值实验表明该算法是一个有效可行的算法。同时，根据聚类分析中距离度量的重要性，本文在K-均值算法中引用了一种新的距离度量，得到了改进的K-均值聚类算法。该算法通过一个参数的调节可以达到非常好的聚类效果。本文首先是阐述了聚类分析以及主成分分析的一些理论基础，分析和比较了几类较流行的划分聚类算法，并在说明现有算法的不足的基础上提出了两类改进的聚类算法。通过MATLAB编程进行数值实验，数值实验结果表明，基于最大或次大特征值的PCA聚类算法在计算时间、迭代次数以及聚类结果上都有一定优势，而改进的K-调和均值算法通过调节参数也可以得到很好的聚类效果，同时在聚类时间和迭代次数方面比传统的K-调和均值算法更具优势。

著录项

作者
彭丽;
展开▼
作者单位

大连理工大学;

展开▼
授予单位大连理工大学;
学科运筹学与控制论
授予学位硕士
导师姓名郭崇慧;
年度 2008
页码
总页数
原文格式 PDF
正文语种中文
中图分类 TP311.13;
关键词
数据挖掘技术; 聚类分析; MATLAB编程; 主成分分析; 划分聚类算法;

相似文献

中文文献
外文文献
专利

1. 数据挖掘中几种聚类算法的分析比较 [J] . 谢昊 ,王学明 . 信息与电脑 . 2018,第24期
2. 数据挖掘中聚类算法比较及在武警网络中的应用研究 [J] . 田杰 ,周晓娟 ,吕建新 . 现代电子技术 . 2008,第008期
3. 基于划分的数据挖掘K-means聚类算法分析 [J] . 曾俊 . 现代电子技术 . 2020,第003期
4. 大数据中数据挖掘模型的模糊改进聚类算法 [J] . 李小红 ,常振云 . 现代电子技术 . 2020,第003期
5. 改进聚类算法在公交数据挖掘中的应用研究 [J] . 刘凯 ,龚兰兰 ,凌兴宏 . 计算机技术与发展 . 2020,第006期
6. 基于web数据挖掘的几种模糊聚类算法浅析 [C] . 张乐媛 ,刘伟 . 2007年北京地区高校研究生学术交流会 . 2008
7. 数据挖掘中的聚类算法在工业园区经济发展中的比较应用——基于统计视角 [A] . 张倩 . 2013

数据挖掘中几种划分聚类算法的比较及改进

目录

摘要

著录项

相似文献

相关主题

期刊订阅