【24h】

Parallel K-prototypes for Clustering Big Data

机译:用于大数据聚类的并行K原型

获取原文

摘要

Big data clustering has become an important challenge in data mining. Indeed, Big data are often characterized by a huge volume and a variety of attributes namely, numerical and categorical. To deal with these challenges, we propose the parallel k-prototypes method which is based on the Map-Reduce model. This method is able to perform efficient groupings on large-scale and mixed type of data. Experiments realized on huge data sets show the performance of the proposed method in clustering large-scale of mixed data.
机译:大数据集群已成为数据挖掘中的重要挑战。确实,大数据通常具有庞大的数量和各种属性,即数值和分类属性。为了应对这些挑战,我们提出了基于Map-Reduce模型的并行k-原型方法。此方法能够对大规模和混合类型的数据执行有效的分组。在海量数据集上进行的实验表明,该方法在大规模混合数据聚类中的性能。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号