【24h】

K-means properties on six clustering benchmark datasets

机译:K-均值六个聚类基准数据集上的属性

获取原文
获取原文并翻译 | 示例
获取外文期刊封面目录资料

摘要

This paper has two contributions. First, we introduce a clustering basic benchmark. Second, we study the performance of k-means using this benchmark. Specifically, we measure how the performance depends on four factors: (1) overlap of clusters, (2) number of clusters, (3) dimensionality, and (4) unbalance of cluster sizes. The results show that overlap is critical, and that k-means starts to work effectively when the overlap reaches 4% level.
机译:本文有两项贡献。 首先,我们介绍群集基本基准。 其次,我们研究了使用此基准测试的K-Meance的性能。 具体而言,我们测量性能如何取决于四个因素:(1)簇重叠,(2)簇数,(3)维度和(4)簇大小的不平衡。 结果表明,重叠是至关重要的,并且当重叠达到4%的级别时,k均值开始有效地工作。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号