首页> 外文期刊>Pattern recognition letters >In search of optimal centroids on data clustering using a binary search algorithm
【24h】

In search of optimal centroids on data clustering using a binary search algorithm

机译:使用二进制搜索算法在数据聚类上搜索最佳质心

获取原文
获取原文并翻译 | 示例
           

摘要

Data clustering is an important technique in data mining. It is a method of partitioning data into clusters, in which each cluster must have data of great similarity and different clusters must have data of high dissimilarity. A lot of clustering algorithms are found in the literature. In general, there is no single algorithm that is suitable for all types of data, conditions and applications. Each algorithm has its own advantages, limitations and shortcomings. Therefore, introducing novel and effective approaches for data clustering is an open and active research area. This paper presents a novel binary search algorithm for data clustering that not only finds high quality clusters but also converges to the same solution in different runs. In the proposed algorithm a set of initial centroids are chosen from different parts of the test dataset and then optimal locations for the centroids are found by thoroughly exploring around of the initial centroids. The simulation results using six benchmark datasets from the UCI Machine Learning Repository indicate that proposed algorithm can efficiently be used for data clustering.
机译:数据聚类是数据挖掘中的重要技术。这是一种将数据划分为群集的方法,其中每个群集必须具有高度相似的数据,而不同的群集必须具有高度不相似的数据。在文献中发现了很多聚类算法。通常,没有一种适用于所有类型的数据,条件和应用程序的算法。每种算法都有其自身的优点,局限性和缺点。因此,引入新颖有效的数据聚类方法是一个开放而活跃的研究领域。本文提出了一种新颖的用于数据聚类的二进制搜索算法,该算法不仅可以找到高质量的聚类,而且可以在不同的运行中收敛到相同的解决方案。在提出的算法中,从测试数据集的不同部分中选择了一组初始质心,然后通过全面探索初始质心来找到质心的最佳位置。使用来自UCI机器学习存储库的六个基准数据集进行的仿真结果表明,所提出的算法可以有效地用于数据聚类。

著录项

  • 来源
    《Pattern recognition letters》 |2012年第13期|p.1756-1760|共5页
  • 作者

    Abdolreza Hatamlou;

  • 作者单位

    Islamic Azad University, Khoy Branch, Iran,Data Mining and Optimization Research Group, Center for Artificial Intelligence Technology, Universiti Kebangsaan Malaysia, 43600 Bangi, Selangor, Malaysia;

  • 收录信息 美国《科学引文索引》(SCI);美国《工程索引》(EI);
  • 原文格式 PDF
  • 正文语种 eng
  • 中图分类
  • 关键词

    A binary search algorithm; optimal centroids; data clustering;

    机译:二进制搜索算法;最佳质心数据聚类;

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号