首页> 中文学位 >融入边信息的多变量IB方法的多视角聚类算法研究
【6h】

融入边信息的多变量IB方法的多视角聚类算法研究

代理获取

目录

声明

摘要

图目录

表目录

1 绪论

1.1 研究背景与现状

1.2 本文工作概述

1.3 本文内容与结构

2 背景知识

2.1 相关定义

2.1.1 符号约定

2.1.2 熵

2.1.3 互信息和多信息

2.1.4 KL距离

2.1.5 JS距离

2.1.6 贝叶斯网络

2.2 IB方法

2.3 多变量IB方法

2.3.1 多变量IB方法的实体化模型

2.4 边信息

2.5 信息度量

2.5.1 共现数据信息度量

2.5.2 欧氏空间数据信息度量

2.6 本章小结

3 融入边信息的多变量IB方法的多视角聚类算法—SmIB

3.1 SmIB算法模型

3.2 SmIB算法描述

3.2.1 共现数据合并代价

3.2.2 欧氏空间数据合并代价

3.3 SmIB算法时间复杂度分析

3.4 本章小结

4 实验与性能分析

4.1 实验设计

4.1.1 对比算法

4.1.2 评估方法

4.2 人工数据集实验

4.3 WebKB数据集实验

4.4 CMUFace数据集实验

4.5 其他真实数据集实验

4.6 参数选择实验

4.7 本章小结

5 总结与展望

参考文献

致谢

个人简历、在学校期间发表的学术论文与研究成果

展开▼

摘要

在当前的大多数实际应用中,数据往往是复杂的、高维的。这些复杂数据中通常蕴含多种合理的聚类模式,从多种不同的视角对这些数据进行聚类分析,能够更全面地理解数据。然而,传统的聚类算法只关注于挖掘数据中蕴含的一种聚类模式,很难对复杂数据做出一个准确的分析。这一问题促进了多视角聚类研究领域的快速发展。多视角聚类方法试图挖掘数据中蕴含的多种聚类模式。现有的多视角聚类算法存在不能或仅能融入一种已知聚类模式的先验知识、适用的数据类型有限、需要预先指定不易选取的参数等方面的问题。针对这些问题,本文在多变量IB方法中融入边信息,提出了一种新的基于目标函数的迭代多视角聚类算法:SmIB,在已知一种或多种聚类模式的条件下顺序地挖掘数据中蕴含的其它无冗余的高质量聚类模式。
  SmIB算法将已知聚类模式作为边信息融入到多变量IB方法中:一方面,基于多变量IB方法的思想,采用两个贝叶斯网络分别表示数据的压缩与相关信息的保存,在聚类过程最大化地保存数据的相关特征信息,以确保目标聚类结果高质量;另一方面,将已知聚类模式作为边信息融入到上述贝叶斯网络中,以约束目标聚类结果,确保目标聚类结果与已知聚类模式之间无冗余。SmIB算法采用互信息和无参的平均微分熵估计法度量相关特征信息的保存量,不仅适宜于分析共现数据,而且适宜于分析欧氏空间非共现数据,既能挖掘数据中蕴含的线性划分模式,又能发现数据中蕴含的非线性划分模式。在二维人工数据集、共现数据集、欧氏空间非共现数据集上的实验结果表明:SmIB算法能够有效地挖掘出各种类型的数据中蕴含的多种合理的聚类模式,总体性能优于三种经典的传统聚类算法和三种现有的多视角聚类算法。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号