首页> 中文学位 >基于共享近邻亲和度的聚类算法的研究
【6h】

基于共享近邻亲和度的聚类算法的研究

代理获取

目录

声明

摘要

图目录

表目录

1 绪论

1.1 研究背景与意义

1.2 研究现状

1.3 本文主要研究内容

1.4 论文的组织结构

2 基于共享近邻亲和度的聚类算法

2.1 研究目的

2.2 相关定义

2.3 算法描述

2.4 实验结果分析

2.4.1 实验设计

2.4.2 实验环境

2.4.3 数据集描述

2.4.4 实验评价指标

2.4.5 数据集实验结果

2.5 算法参数和性能分析

2.6 本章小结

3 基于矩阵模型进行边界检测的聚类技术

3.1 研究目的

3.2 相关知识

3.3 算法描述

3.4 实验结果及分析

3.4.1 实验设计

3.4.2 实验环境

3.4.3 数据集上的实验

3.4.4 算法分析

4 总结与展望

4.1 总结

4.2 展望

参考文献

个人简历、在学期间发表的学术论文及研究成果

致谢

展开▼

摘要

数据挖掘是指从大量数据中挖掘出隐含的、未知的并具有较大潜在价值的信息的过程,从不同的角度和层面对数据进行分析处理,并将挖掘出的有用信息和模式应用在生产实践中。聚类分析是数据挖掘的主要任务之一,通过将给定的数据集划分成互不相交的非空子集,从而更好的分析数据的内部结构,发现具有同类特征的模式,同时可以获得数据的分布状况,观察每一个聚类中数据韵特征,对特定的簇集作进一步的分析。聚类分析在数据挖掘、模式识别、机器学习、信息处理等诸多领域都具有广泛的应用。
  本文在研究现有聚类算法的基础上,从密度聚类方法中所需的相似性度量展开研究,分析了现有相似性度量不能准确反映数据分布的问题,提出一种新的相似性度量,并据此提出一种基于共享近邻亲和度的聚类算法。另一方面,本文研究了现有的聚类边界算法,分析了聚类边界的分布特征,在基于矩阵模型进行边界检测算法的基础上,将边界检测算法作为聚类处理的预处理方法,使用提取出的边界信息指导聚类过程。
  本文的主要创新工作如下:
  (1)结合k近邻和共享近邻给出了共享近邻亲和度的定义,以该定义为基础提出了一种局部密度度量模型。
  (2)按照先对核心点进行聚类,后对非核心点进行指派的聚类思想,提出了基于共享近邻亲和度的聚类算法。实验结果表明,该算法能够发现任意形状、大小和密度的聚类,与同类算法相比,该算法在处理多密度数据集和高维数据时具有较高的聚类准确率。
  (3)提出了使用MMC(基于矩阵模型的高维聚类边界检测技术,Clustering boundary detection based on matrix model)提取边界点,然后对核心点和边界点由内而外的形成聚类的思想。
  (4)提出了一种基于矩阵模型进行边界检测的聚类技术,实验选取了分布特征各不相同的数据集,实验结果表明该算法可以有效的识别出聚类边界并取得较好的聚类结果。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号