首页> 中文学位 >基于秩约束的自适应聚类方法
【6h】

基于秩约束的自适应聚类方法

代理获取

目录

封面

声明

中文摘要

英文摘要

目录

1绪论

1.1研究背景和意义

1.2国外研究现状

1.3国内研究现状

1.4本文研究工作

1.5本文体系结构

2相似度测量与聚类

2.1相似度测量

2.1.1欧氏距离

2.1.2曼哈顿距离

2.1.3 KL距离

2.1.4余弦相似度

2.1.5相关系数法

2.2聚类定义及聚类过程

2.2.1聚类定义

2.2.2聚类过程

2.3聚类方法

2.3.1 k-means算法

2.3.2 k-medoids算法

2.3.3谱聚类算法

2.3.4 DBSCAN算法

2.4本章小结

3基于秩约束密度敏感距离的自适应聚类算法

3.1基于密度敏感的距离

3.2自适应聚类算法

3.2.1构造相似矩阵

3.2.2引入秩约束

3.3参数λ的取值分析

3.4算法描述

3.5实验结果与分析

3.5.1人工仿真数据集

3.5.2真实数据集

3.6本章小结

结论

参考文献

攻读硕士学位期间发表学术论文情况

致谢

展开▼

摘要

聚类分析技术能够辨识数据的内在结构,随着计算机技术的发展,聚类技术的应用也越来越广泛,无论是学校、商场、研究中心还是政府办公等一系列的领域都出现了聚类技术的身影。因此,近年来聚类技术已经成为学术界的一个着重研究的内容,得到了学者的关注。
  本文介绍了数据挖掘技术和聚类分析技术的背景和现状,对常见的相似性测量方法和经典的聚类方法进行总结,分析出它们的优缺点,本文对数据挖掘技术和聚类分析技术中相似度矩阵和聚类划分方面进行深入研究,本文研究工作的主要内容如下:
  第一、聚类基于数据的相似矩阵划分数据组,因此聚类结果的优劣高度依赖于数据相似矩阵的好坏,构建相似矩阵的方法有许多,其中用的比较多的构造法使用欧式距离测量,很多情况下单纯把欧式距离测量对象之间的距离作为衡量对象之间相似度的标准往往会造成测量结果出现很大的误差,也就使最后的聚类结果并不理想。本文提出一种基于密度敏感距离构造相似矩阵的测量方法,该方法具有扩大不同簇对象之间的长减小同簇对象的长的作用,并且能够提高聚类的准确率。
  第二、如果要把一个含有n个样本的数据集划分为k类会有kn种可能,聚类作为一种无监督的学习算法,如何使聚类划分出的结果更优,或用什么方法能够使聚类结果更准确是聚类研究人员一直关注的,本文提出了一种在相似矩阵的拉普拉斯矩阵上施加秩约束的方法,该方法使相似矩阵的连通区域数等于聚类数,直接将样本点分到正确的类中,进而完成数据集的聚类任务,实验证明这种方法可行且在一定程度上提高了聚类性能。
  每一种聚类算法都融入了研究者的心血,在某种程度上改进已有的聚类算法的一些不足,很多聚类算法虽然已经被广泛的应用,但依然存在一些不足,所以,探索更高性能的聚类算法一直是研究者的目标。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号