首页> 中文学位 >基于正态分布的密度峰聚类算法的研究
【6h】

基于正态分布的密度峰聚类算法的研究

代理获取

目录

封面

声明

中文摘要

英文摘要

目录

第1章 绪论

1.1 引言

1.2 课题研究背景和目的

1.3 国内外研究现状

1.4 本文研究的主要内容和论文结构

1.5 本章小结

第2章 发现密度峰值的聚类

2.1 密度峰聚类的描述

2.2 密度峰聚类的缺陷分析

2.3 本章小结

第3章 基于正态分布的聚类中心搜索

3.1 聚类中心衡量指标

3.2 正态分布及其估计

3.3 多元变量的正态分布

3.4 基于正态分布的簇心搜索方法

3.5 本章小结

第4章 实验分析

4.1 实验设置

4.2 性能评估

4.3 实验结果

4.4 本章小结

第5章 结论与展望

5.1 结论

5.2 展望

参考文献

附录

附录一 密度峰算法主程序

附录二 基于正态分存的簇心搜索程序

附录三 评价聚类结果程序

致谢

展开▼

摘要

聚类算法是一种根据相似特征将数据集分为几个类别的重要机器学习算法。聚类分析广泛应用于机器学习,模式识别,生物信息学和图像处理。
  2014年,Alex Rodriguez等人在《Science》上提出了一种新的基于密度的密度峰聚类(DPC)算法。该算法借助了数据点的密度以及其到具有更高密度点的距离这两个特征来发现潜在的簇心。密度峰聚类算法简洁明了,能一步得到聚类结果,且聚类效果较佳。但是该算法在聚类过程中需要人为参与分析决策图并选取潜在的簇心,这降低了算法的效率。
  为了实现自动聚类的目的,本文针对各个点在决策图上的特点,提出了采用密度与距离的乘机Z为新的判断指标来选择潜在的簇心并采用概率统计的方法来筛选簇心的方法。由于只有潜在的簇心具有较高的密度与较大的距离,因此它们的Z值远远大于非簇心点。假设Z的分布是正态分布,因此可以借助概率统计的方法来确定一个上界。超过该上界的值所对应的点将自动被视为簇心点。
  实验结果表明,采用正态分布这样概率统计方法能正确识别出潜在的簇心点,且该方法选取簇心的方式与人为分析决策图选取潜在簇心的方法相似,与其他优秀的聚类算法相比,基于正态分布的密度峰聚类算法在应对不同形状的数据集的方面具有更优秀的性能,能得到较好的聚类结果。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号