基于初始点选择的K-均值聚类改进算法及应用研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

数据挖掘是从海量的数据中发现有用的信息或知识，它已在许多领域得到广泛运用。聚类分析是数据挖掘领域最重要的技术手段之一，聚类分析算法有很多，其中以K-均值算法最为经典。
　　K-均值算法的优点是思想简单，算法简洁，收敛性好，对大规模数据进行聚类时效率较高。但该算法也有很多不足，如对初始中心敏感，K值需要预先给定等。
　　本文主要深入研究与分析K-均值算法，总结其优点与不足，针对K-均值聚类算法对初始点依赖提出两种新的改进算法并将第二种算法应用在基因表达数据中。
　　本文主要研究内容及成果如下:
　　(1)提出了一种基于初始点选择的DNC值K-均值聚类算法。该算法有效剔除了孤立点并改善了K-均值聚类算法初始中心随机选择而导致的聚类结果不稳定。本文通过大量对比实验，证明该改进算法的有效性。
　　(2)提出一种基于初始点选择的改进加权欧氏距离K-均值聚类算法。该算法对初始聚类中心的选择进行了改进，使得选出的中心点能在一定程度上代表不同簇，克服了K-均值算法中随机选择的初始点可能过于邻近的不好情况。另外根据不同特征对聚类贡献大小不同，采用加权欧氏距离将数据对象分配到相应的聚类中心，提高聚类效率。通过UCI数据集进行试验及对比，分析并证明改进算法的有效性。最后本文将该算法应用在两种基因表达数据中，取得一定效果。

著录项

作者
周娟;
展开▼
作者单位

湖南大学;

展开▼
授予单位湖南大学;
学科计算机技术
授予学位硕士
导师姓名卢新国;
年度 2015
页码
总页数
原文格式 PDF
正文语种中文
中图分类 TP311.131;
关键词
数据挖掘; K-均值聚类算法; 加权处理; 初始点选择;

相似文献

中文文献
外文文献
专利

1. 基于孤立点和初始质心选择的k-均值改进算法 [J] . 顾洪博 ,张继怀 . 长江大学学报（自然版）理工卷 . 2009,第001期
2. 基于空间分布优选初始聚类中心的改进K-均值聚类算法 [J] . 宋仁旺 ,苏小杰 ,石慧 . 科学技术与工程 . 2021,第019期
3. 基于图的K-均值聚类法中初始聚类中心选择 [J] . 周海岩 ,白晓林 . 计算机测量与控制 . 2010,第009期
4. 基于K-均值聚类的改进非选择算法研究 [J] . 屈建平 ,罗文坚 ,王煦法 . 计算机工程与应用 . 2005,第028期
5. 基于初始中心点K均值聚类算法的改进方法研究 [J] . 卜天然 . 通化师范学院学报 . 2017,第001期
6. 一种基于改进k-均值聚类算法的LTE基站需求选点方法 [C] . 李亚 ,薛伟 ,叶敏 . 中国移动通信集团设计院第23届新技术论坛 . 2017
7. K-中心点和K-均值聚类算法研究 [A] . 黄翔 . 2012

基于初始点选择的K-均值聚类改进算法及应用研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅