基于正态分布的密度峰聚类算法的研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

聚类算法是一种根据相似特征将数据集分为几个类别的重要机器学习算法。聚类分析广泛应用于机器学习，模式识别，生物信息学和图像处理。
　　2014年，Alex Rodriguez等人在《Science》上提出了一种新的基于密度的密度峰聚类（DPC）算法。该算法借助了数据点的密度以及其到具有更高密度点的距离这两个特征来发现潜在的簇心。密度峰聚类算法简洁明了，能一步得到聚类结果，且聚类效果较佳。但是该算法在聚类过程中需要人为参与分析决策图并选取潜在的簇心，这降低了算法的效率。
　　为了实现自动聚类的目的，本文针对各个点在决策图上的特点，提出了采用密度与距离的乘机Z为新的判断指标来选择潜在的簇心并采用概率统计的方法来筛选簇心的方法。由于只有潜在的簇心具有较高的密度与较大的距离，因此它们的Z值远远大于非簇心点。假设Z的分布是正态分布，因此可以借助概率统计的方法来确定一个上界。超过该上界的值所对应的点将自动被视为簇心点。
　　实验结果表明，采用正态分布这样概率统计方法能正确识别出潜在的簇心点，且该方法选取簇心的方式与人为分析决策图选取潜在簇心的方法相似，与其他优秀的聚类算法相比，基于正态分布的密度峰聚类算法在应对不同形状的数据集的方面具有更优秀的性能，能得到较好的聚类结果。

著录项

作者
郑倞;
展开▼
作者单位

浙江工业大学;

展开▼
授予单位浙江工业大学;
学科电子与通信工程
授予学位硕士
导师姓名何熊熊;
年度 2016
页码
总页数
原文格式 PDF
正文语种中文
中图分类自动推理、机器学习;算法理论;
关键词
正态分布; 密度峰聚类算法; 决策图; 机器学习;

相似文献

中文文献
外文文献
专利

1. 基于投票法的密度峰聚类算法 [J] . 黄文康 ,杨苏杭 ,范梦婷 . 太赫兹科学与电子信息学报 . 2021,第003期
2. 基于投票法的密度峰聚类算法 [J] . 黄文康 ,杨苏杭 ,范梦婷 . 太赫兹科学与电子信息学报 . 2021,第003期
3. 基于共享逆近邻与指数核的密度峰聚类算法 [J] . 高月 ,杨小飞 ,马盈仓 . 纺织高校基础科学学报 . 2020,第002期
4. 基于密度峰和划分的快速聚类算法 [J] . 琚书存 ,程文杰 ,徐建鹏 . 计算机与现代化 . 2018,第008期
5. 基于共享近邻相似度的密度峰聚类算法 [J] . 鲍舒婷 ,孙丽萍 ,郑孝遥 . 计算机应用 . 2018,第006期
6. 叠加正态分布曲线对拖尾峰的拟合研究 [C] . JIANG Wen-di ,姜文迪 ,ZHANG Li-ya . 2014第三届环渤海色谱质谱学术报告会 . 2014
7. 密度峰聚类算法研究及其在社团发现中的应用 [A] . 丁佳骏 . 2019

基于正态分布的密度峰聚类算法的研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅