...
首页> 外文期刊>Journal of software >An Efficient Parallel Clustering Algorithm for Large Scale Database
【24h】

An Efficient Parallel Clustering Algorithm for Large Scale Database

机译:大型数据库的高效并行聚类算法

获取原文
   

获取外文期刊封面封底 >>

       

摘要

In this paper, we propose a new parallel clusteringalgorithm, named Stem-Leaf-Point Plot ClusteringAlgorithm (SLPPCA). SLPPCA tends to produce clusters ofdifferent shapes and sizes, and according to our experiments,it can produces clusters more efficiently than traditionalmethods. SLPPCA can fully exploits the data-parallelism ofdata objects, and adopts a task decomposition design step tobalance the workloads of multi-core processors to achievea high speedup. We implemented SLPPCA to large scaledata base on duo-core processor and quad-core processorbased computer separately and analyzed its performance.The experimental results show that the clusters it producedwere particularly good either in different density or shapes,furthermore, with the parallel pattern used in SLPPCA onmulti-core platform, the speedup was almost linear withthe numbers of cores in processor and the number of datapoints. Moreover, SLPPCA can generate satisfactory clusternumber automatically in clustering process.
机译:在本文中,我们提出了一种新的并行聚类算法,即词干-叶点图聚类算法(SLPPCA)。 SLPPCA倾向于产生不同形状和大小的簇,并且根据我们的实验,它可以比传统方法更有效地产生簇。 SLPPCA可以充分利用数据对象的数据并行性,并采用任务分解设计步骤来平衡多核处理器的工作负载,从而实现较高的加速比。我们分别在双核处理器和基于四核处理器的计算机上对大型数据库实现了SLPPCA,并对其性能进行了分析。实验结果表明,所生成的集群在不同密度或形状上均表现出色,并且采用了并行模式。 SLPPCA在多核平台上,其加速几乎与处理器中的核数和数据点数成线性关系。而且,SLPPCA可以在聚类过程中自动生成令人满意的聚类编号。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号