首页> 外文期刊>Neurocomputing >Clustering in applications with multiple data sources-A mutual subspace clustering approach
【24h】

Clustering in applications with multiple data sources-A mutual subspace clustering approach

机译:具有多个数据源的应用程序中的群集-相互子空间群集方法

获取原文
获取原文并翻译 | 示例
           

摘要

In many applications, such as bioinformatics and cross-market customer relationship management, there are data from multiple sources jointly describing the same set of objects. An important data mining task is to find interesting groups of objects that form clusters in subspaces of the data sources jointly supported by those data sources. In this paper, we study a novel problem of mining mutual subspace clusters from multiple sources. We develop two interesting models and the corresponding methods for mutual subspace clustering. The density-based model identifies dense regions in subspaces as clusters. The bottom-up method searches for density-based mutual subspace clusters systematically from low-dimensional subspaces to high-dimensional ones. The partitioning model divides points in a data set into k exclusive clusters and a signature subspace is found for each cluster, where k is the number of clusters desired by a user. The top-down method interleaves the well-known k-means clustering procedures in multiple sources. We use experimental results on synthetic data sets and real data sets to report the effectiveness and the efficiency of the methods.
机译:在许多应用程序中,例如生物信息学和跨市场客户关系管理,存在来自多个来源的数据,它们共同描述了同一组对象。一项重要的数据挖掘任务是找到有趣的对象组,这些对象组在这些数据源共同支持的数据源子空间中形成簇。在本文中,我们研究了一个从多个来源挖掘相互子空间簇的新问题。我们开发了两个有趣的模型以及相互子空间聚类的相应方法。基于密度的模型将子空间中的密集区域识别为聚类。自底向上方法从低维子空间到高维子空间系统地搜索基于密度的互子空间簇。分区模型将数据集中的点划分为k个互斥群集,并为每个群集找到一个签名子空间,其中k是用户所需的群集数。自上而下的方法在多个源中交错了众所周知的k均值聚类过程。我们使用合成数据集和真实数据集上的实验结果来报告方法的有效性和效率。

著录项

  • 来源
    《Neurocomputing》 |2012年第2012期|133-144|共12页
  • 作者

    Ming Hua; Jian Pei;

  • 作者单位

    Facebook Inc., Palo Alto, CA, USA;

    Simon Fraser University, Burnaby, BC, Canada;

  • 收录信息 美国《科学引文索引》(SCI);美国《工程索引》(EI);
  • 原文格式 PDF
  • 正文语种 eng
  • 中图分类
  • 关键词

    Clustering; Multiple sources;

    机译:集群;多种来源;

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号