基于不相似性度量优化的密度峰值聚类算法

丁世飞; 徐晓; 王艳茹

首页> 中文期刊> 《软件学报》 >基于不相似性度量优化的密度峰值聚类算法

基于不相似性度量优化的密度峰值聚类算法

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

密度峰值聚类(clustering by fast search and find of density peaks,简称DPC)是一种基于局部密度和相对距离属性快速寻找聚类中心的有效算法.DPC通过决策图寻找密度峰值作为聚类中心,不需要提前指定类簇数,并可以得到任意形状的簇聚类.但局部密度和相对距离的计算都只是简单依赖基于距离度量的相似度矩阵,所以在复杂数据上DPC聚类结果不尽如人意,特别是当数据分布不均匀、数据维度较高时.另外,DPC算法中局部密度的计算没有统一的度量,根据不同的数据集需要选择不同的度量方式.第三,截断距离dc的度量只考虑数据的全局分布,忽略了数据的局部信息,所以dc的改变会影响聚类的结果,尤其是在小样本数据集上.针对这些弊端,提出一种基于不相似性度量优化的密度峰值聚类算法(optimized density peaks clustering algorithm based on dissimilarity measure,简称DDPC),引入基于块的不相似性度量方法计算相似度矩阵,并基于新的相似度矩阵计算样本的K近邻信息,然后基于样本的K近邻信息重新定义局部密度的度量方法.经典数据集的实验结果表明,基于不相似性度量优化的密度峰值聚类算法优于DPC的优化算法FKNN-DPC和DPC-KNN,可以在密度不均匀以及维度较高的数据集上得到满意的结果;同时统一了局部密度的度量方式,避免了传统DPC算法中截断距离dc对聚类结果的影响.

著录项

来源
《软件学报》 |2020年第11期|3321-3333|共13页
作者
丁世飞; 徐晓; 王艳茹;
展开▼
作者单位

中国矿业大学计算机科学与技术学院江苏徐州221116;

中国科学院计算技术研究所智能信息处理重点实验室北京 100190;

中国矿业大学计算机科学与技术学院江苏徐州221116;

中国矿业大学计算机科学与技术学院江苏徐州221116;

展开▼
原文格式 PDF
正文语种 chi
中图分类理论、方法;
关键词
密度峰值聚类; 局部密度; 决策图; 不相似性度量; 密度不均匀;

相似文献

中文文献
外文文献
专利

1. 基于优化密度峰值聚类算法的城市公共设施热点分布研究 [J] . 康磊 ,刘海砚 ,陈晓慧 . 测绘与空间地理信息 . 2021,第003期
2. 基于密度峰值和近邻优化的聚类算法 [J] . 何云斌 ,董恒 ,万静 . 计算机科学与探索 . 2020,第004期
3. 基于高斯核优化的密度峰值聚类算法 [J] . 王舰 . 电脑知识与技术 . 2020,第028期
4. 基于SH-ESD优化的密度峰值快速搜索聚类算法 [J] . 崔世琦 ,刘冰 ,李勇 . 长春工业大学学报（自然科学版） . 2020,第002期
5. 基于密度峰值优化的谱聚类算法 [J] . 薛丽霞 ,孙伟 ,汪荣贵 . 计算机应用研究 . 2019,第007期
6. 基于z值的分布式密度峰值聚类算法 [C] . Lu Jing ,卢晶 ,Duan Yong . 第33届中国数据库学术会议（NDBC2016 ） . 2016
7. 基于密度峰值的聚类算法优化研究 [A] . 刘振宇 . 2021

基于不相似性度量优化的密度峰值聚类算法

摘要

著录项

相似文献

相关主题

期刊订阅