首页> 中文学位 >基于概率模型的聚类集成算法
【6h】

基于概率模型的聚类集成算法

代理获取

目录

摘要

第一章 引言

1.1 研究背景

1.2 研究现状

1.3 本文的研究工作和主要组织结构

第二章 聚类集成研究

2.1 聚类集成的概念和主要流程

2.2 聚类集合的生成

2.3 聚类集合的选择

2.3.1 聚类差异性的评估

2.3.2 聚类结果的质量评估

2.3.3 聚类集合的选择

2.4 共识函数设计

2.4.1 基于对象共同出现信息的算法

2.4.2 基于聚类标签的聚类集成算法

2.5 小结

第三章 潜聚类分析算法

3.1 潜聚类模型的定义

3.2 潜聚类模型的求解

3.3 算法设计

3.3.1 参数初始化

3.3.2 潜模型的生成

3.3.3 参数重估计

3.3.4 收敛性测试

3.4 K-LACA

3.5 小结

第四章 实验结果总结与分析

4.1 实验设计

4.1.1 数据集

4.1.2 聚类集合的生成

4.1.3 评价指标的选择

4.2 合成数据集上的实验结果分析

4.3 真实数据集上的实验结果分析

4.3.1 与EAC-AL比较

4.3.2 和CSPA,HGPA和MCLA等算法比较

4.4 小结

第五章 总结与展望

5.1 总结

5.2 进一步的工作

参考文献

致谢

声明

展开▼

摘要

聚类分析是一种用于探索数据的内在结构的重要技术,该技术在许多需要分析和处理多变量数据的研究中得到了应用。聚类算法通常按照一定的优化准则对数据进行划分,使得相似的数据被划分到同一个组,而不相似的数据被划分到不同的组。然而,由于大部分的聚类算法都对数据集的内在结构存在一定隐含的或者明确的假设,因而没有一个聚类算法适用于所有的数据集。因此,有学者提出了利用聚类集成技术,即通过结合多个聚类结果得到一个共识聚类的技术,来生成具有鲁棒性和高质量的聚类结果。
  目前对聚类集成技术研究主要集中在聚类集合的生成,聚类集合的选择和共识函数设计这几个方面。在这篇论文中,详细分析和比较了现有的聚类集成技术的特点。另外,提出了一种从概率角度进行分析的聚类集成算法。假设所有的观察到的聚类结果都是由同一个潜在的聚类模型在两个不同的概率参数的控制下生成的。然后使用一种EM风格的算法来寻找具有最大似然的潜模型。实验结果表明,我们的算法比一些已有的算法例如CSPA,HGPA,MCLA和EAC-AL的表现更好。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号