首页> 外文期刊>International journal of knowledge engineering and soft data paradigms >Information criterion-based non-hierarchical clustering
【24h】

Information criterion-based non-hierarchical clustering

机译:基于信息准则的非层次聚类

获取原文
获取原文并翻译 | 示例
           

摘要

In the analysis of actual data, it is important to determine whether there are clusters in the data. This can be done using one of several methods of cluster analysis, which can be roughly divided into hierarchical and nonhierarchical clustering methods. Nonhierarchical clustering can be applied to more types of data than can hierarchical clustering (see e.g., Saito and Yadohisa, 2006), and hence, in this paper, we focus on nonhierarchical clustering. In nonhierarchical clustering, the results heavily depend on the number of clusters, and thus it is very important to select the appropriate number of clusters. Bozdogan (1986) and Manning et al. (2009, Section 16.4.1) used formal information criteria, e.g., Aakaike's information criterion (AIC) and so on, for selecting the number of clusters. In this paper, we verify that such formal information criteria work poorly for selecting the number of clusters by conducting numerical examinations. I lence, we extend a formal AIC by adding a new penalty term, and search for an additional penalty with an acceptable selection-performance through numerical experiments.
机译:在分析实际数据时,重要的是确定数据中是否存在聚类。可以使用几种聚类分析方法之一来完成此操作,可以将聚类分析大致分为分层聚类方法和非分层聚类方法。与分层聚类相比,非分层聚类可以应用于更多类型的数据(请参见例如Saito和Yadohisa,2006),因此,在本文中,我们将重点放在非分层聚类上。在非分层聚类中,结果很大程度上取决于聚类的数量,因此选择适当的聚类数量非常重要。 Bozdogan(1986)和Manning等人。 (2009年,第16.4.1节)使用正式的信息标准(例如Aakaike的信息标准(AIC)等)来选择聚类数量。在本文中,我们通过进行数值检验,验证了这种形式的信息标准在选择聚类数量方面效果不佳。因此,我们通过添加新的惩罚项来扩展正式的AIC,并通过数值实验寻找具有可接受的选择性能的其他惩罚。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号