首页> 外文会议> >CLUMP: a scalable and robust framework for structure discovery
【24h】

CLUMP: a scalable and robust framework for structure discovery

机译:CLUMP:用于结构发现的可扩展且强大的框架

获取原文

摘要

We introduce a robust and efficient framework called CLUMP (CLustering Using Multiple Prototypes) for unsupervised discovery of structure in data. CLUMP relies on finding multiple prototypes that summarize the data. Clustering the prototypes enables our algorithm to scale up to extremely large and high-dimensional domains such as text data. Other desirable properties include robustness to noise and parameter choices. In this paper, we describe the approach in detail, characterize its performance on a variety of datasets, and compare it to some existing model selection approaches.
机译:我们引入了一个强大而有效的框架,称为CLUMP(使用多个原型进行聚类),用于无监督地发现数据结构。 CLUMP依赖于找到汇总数据的多个原型。通过对原型进行聚类,我们的算法可以扩展到超大型和高维域,例如文本数据。其他理想的属性包括对噪声的鲁棒性和参数选择。在本文中,我们将详细描述该方法,表征其在各种数据集上的性能,并将其与一些现有的模型选择方法进行比较。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号