首页> 中文学位 >一种基于主动学习的半监督谱聚类算法研究
【6h】

一种基于主动学习的半监督谱聚类算法研究

代理获取

目录

封面

声明

致谢

中文摘要

英文摘要

目录

1绪论

1.1研究背景和意义(Background and Significance)

1.2相关研究现状(The related research status)

1.3本文的研究内容(Research content)

1.4本文组织结构(Paper structure)

2聚类分析技术

2.1 数据挖掘技术(Data mining technology)

2.2聚类分析(Cluster analysis)

2.3 K-means聚类(K-means clustering)

2.4 本章小结(Chapter summary)

3谱聚类理论及算法

3.1谱图理论(Spectral graph theory)

3.2图划分准则(Graph partitioning criterion)

3.3相似矩阵、度矩阵及Laplacian矩阵(The similarity matrix、stiffness matrix and Laplacian matrix)

3.4谱聚类算法(Spectral clustering algorithm)

3.5谱聚类算法存在的问题(Spectral clustering problems)

3.6本章小结(Chapter summary)

4基于主动学习的半监督谱聚类算法

4.1半监督学习(Semi supervised learning)

4.2半监督聚类(Semi supervised clustering)

4.3主动学习策略(Active learning strategies)

4.4基于成对约束的主动学习方法(Active learning method based on constraints)

4.5 基于主动学习的半监督谱聚类算法( Active learning semi-supervised spectral clustering algorithm)

4.6本章小结(Chapter summary)

5实验结果及分析

5.1实验流程设计(The experimental process design)

5.2实验评判标准(The experimental evaluation standard)

5.3实验数据选取(The experimental data)

5.4人工数据集上的实验对比(Contrast experiments on artificial data sets)

5.5 UCI 数据集上的实验对比(Contrast experiment on the UCI data set)

5.6本章小结(Chapter summary)

6总结与展望

参考文献

作者简历

学位论文数据集

展开▼

摘要

近年来,数据挖掘技术引起了人们的广泛关注和深入研究,而聚类技术是数据挖掘相关研究中最为常用的技术之一,得到了越来越多的关注。但是传统的聚类算法在处理样本空间的形状不呈现凸状时容易陷入局部最优解,谱聚类算法应运而生。谱聚类算法基于谱图划分理论,可以在非凸形状分布的样本空间中实现聚类,而且能够避免陷入局部最优解,收敛于全局最优,但是在类边界点的划分上不够明晰。
  本文对传统谱聚类进行了改进,将半监督学习技术与谱聚类算法相融合。半监督学习可以利用带标签数据进行监督学习也可以利用无标签数据进行无监督学习,半监督学习的性能取决于监督信息,本文根据用户需要在谱聚类算法中加入成对约束信息Must?link和Cannot?link监督信息指导聚类过程。在此基础上,使用主动学习策略,提出了一种基于成对约束的主动学习方法,在数据样本类边界上通过计算函数选择特定边界点添加成对约束监督信息,从而提高聚类的正确率。最终,本文通过对传统谱聚类的改进提出了一种基于主动学习的半监督谱聚类算法(SC-ALS),并详细介绍了算法的流程。本文使用SC-ALS算法、传统谱聚类算法以及 K-means算法分别在人工数据集和UCI基准数据集上进行聚类实验。通过聚类评价标准Accuracy的对比,当成对约束数目达到一定值时,SC-ALS算法聚类的正确率上优于另外两种算法,实现了良好的聚类效果。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号