基于共享近邻亲和度的聚类算法的研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

数据挖掘是指从大量数据中挖掘出隐含的、未知的并具有较大潜在价值的信息的过程，从不同的角度和层面对数据进行分析处理，并将挖掘出的有用信息和模式应用在生产实践中。聚类分析是数据挖掘的主要任务之一，通过将给定的数据集划分成互不相交的非空子集，从而更好的分析数据的内部结构，发现具有同类特征的模式，同时可以获得数据的分布状况，观察每一个聚类中数据韵特征，对特定的簇集作进一步的分析。聚类分析在数据挖掘、模式识别、机器学习、信息处理等诸多领域都具有广泛的应用。
　　本文在研究现有聚类算法的基础上，从密度聚类方法中所需的相似性度量展开研究，分析了现有相似性度量不能准确反映数据分布的问题，提出一种新的相似性度量，并据此提出一种基于共享近邻亲和度的聚类算法。另一方面，本文研究了现有的聚类边界算法，分析了聚类边界的分布特征，在基于矩阵模型进行边界检测算法的基础上，将边界检测算法作为聚类处理的预处理方法，使用提取出的边界信息指导聚类过程。
　　本文的主要创新工作如下:
　　(1)结合k近邻和共享近邻给出了共享近邻亲和度的定义，以该定义为基础提出了一种局部密度度量模型。
　　(2)按照先对核心点进行聚类，后对非核心点进行指派的聚类思想，提出了基于共享近邻亲和度的聚类算法。实验结果表明，该算法能够发现任意形状、大小和密度的聚类，与同类算法相比，该算法在处理多密度数据集和高维数据时具有较高的聚类准确率。
　　(3)提出了使用MMC(基于矩阵模型的高维聚类边界检测技术，Clustering boundary detection based on matrix model)提取边界点，然后对核心点和边界点由内而外的形成聚类的思想。
　　(4)提出了一种基于矩阵模型进行边界检测的聚类技术，实验选取了分布特征各不相同的数据集，实验结果表明该算法可以有效的识别出聚类边界并取得较好的聚类结果。

著录项

作者
辛杭;
展开▼
作者单位

郑州大学;

展开▼
授予单位郑州大学;
学科计算机科学与技术
授予学位硕士
导师姓名邱保志;
年度 2018
页码
总页数
原文格式 PDF
正文语种中文
中图分类 TP311.13;
关键词
数据挖掘; 聚类算法; 共享近邻亲和度; 边界检测;

相似文献

中文文献
外文文献
专利

1. 一种基于共享近邻亲和度的聚类算法 [J] . 邱保志 ,辛杭 . 计算机工程与应用 . 2018,第018期
2. 基于共享最近邻的客户交易数据聚类算法 [J] . 李遥 ,荀亚玲 . 计算机技术与发展 . 2022,第1期
3. 基于共享最近邻的密度自适应邻域谱聚类算法 [J] . 葛君伟 ,杨广欣 . 计算机工程 . 2021,第008期
4. 基于共享近邻的多视角谱聚类算法 [J] . 宋艳 ,殷俊 . 计算机应用 . 2020,第011期
5. 基于共享逆近邻与指数核的密度峰聚类算法 [J] . 高月 ,杨小飞 ,马盈仓 . 纺织高校基础科学学报 . 2020,第002期
6. 基于k最近邻划分的聚类算法研究 [C] . 刘大有 ,刘杰 ,金弟 . 中国人工智能学会第12届全国学术年会 . 2007
7. 基于共享最近邻的聚类算法的研究与应用 [A] . 孙千婷 . 2015

基于共享近邻亲和度的聚类算法的研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅