首页> 外文OA文献 >Subspace clustering of high-dimensional data: a predictive approach
【2h】

Subspace clustering of high-dimensional data: a predictive approach

机译:子空间聚类高维数据:预测方法

代理获取
本网站仅为用户提供外文OA文献查询和代理获取服务,本网站没有原文。下单后我们将采用程序或人工为您竭诚获取高质量的原文,但由于OA文献来源多样且变更频繁,仍可能出现获取不到、文献不完整或与标题不符等情况,如果获取不到我们将提供退款服务。请知悉。

摘要

In several application domains, high-dimensional observations are collectedand then analysed in search for naturally occurring data clusters which mightprovide further insights about the nature of the problem. In this paper wedescribe a new approach for partitioning such high-dimensional data. Ourassumption is that, within each cluster, the data can be approximated well by alinear subspace estimated by means of a principal component analysis (PCA). Theproposed algorithm, Predictive Subspace Clustering (PSC) partitions the datainto clusters while simultaneously estimating cluster-wise PCA parameters. Thealgorithm minimises an objective function that depends upon a new measure ofinfluence for PCA models. A penalised version of the algorithm is alsodescribed for carrying our simultaneous subspace clustering and variableselection. The convergence of PSC is discussed in detail, and extensivesimulation results and comparisons to competing methods are presented. Thecomparative performance of PSC has been assessed on six real gene expressiondata sets for which PSC often provides state-of-art results.
机译:在几个应用领域中,收集高维观测值,然后进行分析以搜索自然发生的数据集群,这可能会提供有关问题性质的更多见解。在本文中,我们描述了一种用于划分此类高维数据的新方法。我们的假设是,在每个聚类中,可以通过借助主成分分析(PCA)估计的线性子空间很好地近似数据。提出的算法,预测子空间聚类(PSC)将数据划分为多个聚类,同时估计聚类PCA参数。该算法使目标函数最小化,该目标函数取决于对PCA模型的影响的新度量。还描述了该算法的一种惩罚形式,用于承载我们同时进行的子空间聚类和变量选择。详细讨论了PSC的收敛性,并给出了广泛的仿真结果以及与竞争方法的比较。 PSC的比较性能已在六个真实的基因表达数据集上进行了评估,而PSC通常可以提供最新的结果。

著录项

  • 作者单位
  • 年度 2013
  • 总页数
  • 原文格式 PDF
  • 正文语种 {"code":"en","name":"english","id":9}
  • 中图分类

相似文献

  • 外文文献
  • 中文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号