【24h】

Minimum Information Loss Cluster Analysis for Categorical Data

机译:分类数据的最小信息损失聚类分析

获取原文
获取原文并翻译 | 示例

摘要

The EM algorithm has been used repeatedly to identify latent classes in categorical data by estimating finite distribution mixtures of product components. Unfortunately, the underlying mixtures are not uniquely identifiable and, moreover, the estimated mixture parameters are starting-point dependent. For this reason we use the latent class model only to define a set of "elementary" classes by estimating a mixture of a large number components. We propose a hierarchical "bottom up" cluster analysis based on unifying the elementary latent classes sequentially. The clustering procedure is controlled by minimum information loss criterion.
机译:通过估计产品成分的有限分布混合物,EM算法已被反复用于识别分类数据中的潜在类别。不幸的是,潜在的混合物不是唯一可识别的,而且,估计的混合物参数与起点有关。因此,我们仅使用潜在类模型通过估计大量组件的混合来定义一组“基本”类。我们提出了基于顺序统一基本潜在类的分层“自下而上”的聚类分析。聚类过程由最小信息丢失准则控制。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号