首页> 中文会议>第二十三届中国数据库学术会议(NDBC2006) >数据立方体切片的核心聚类分析方法

数据立方体切片的核心聚类分析方法

摘要

对立方体数据的分析挖掘由于具有广泛的现实应用而日益得到人们的重视.基于对立方体切片数据的分析应用问题,提出了一种新的核心聚类分析方法.核心聚类分析主要针对传统聚类模型得到的结果类簇不够紧密和需要预先定义类簇的数目等不足之处,而点对敏感聚类模型(pair-wise cluster)算法复杂度是NP难的问题而设计.核心聚类模型将数据集合中的点划分为若干不相交的核心点集和边界点集,同一核心点集内任意点对的相似度大于阈值σ,而不同核心点集的点对相似度小于阈值σ.核心聚类模型挖掘出的核心点集是紧密类簇,并且具备良好的分类性质.由于采用了局部优化算法,核心聚类模型的算法复杂度为O(n2),较点对敏感的最大相关成员簇聚类模型大大降低.同时,可以通过核心点集和边界点集构造最大相关成员簇的上界,这就在一定程度上保证了核心聚类模型结果的完备性.实验和分析对比说明核心聚类模型具有较高的算法效率,可扩展性强,结果表示合理,能够很好地解决现实应用问题.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号