首页> 外文OA文献 >treeClust: an R package for tree-based clustering dissimilarities
【2h】

treeClust: an R package for tree-based clustering dissimilarities

机译:treeClust:R包,用于基于树的聚类差异

代理获取
本网站仅为用户提供外文OA文献查询和代理获取服务,本网站没有原文。下单后我们将采用程序或人工为您竭诚获取高质量的原文,但由于OA文献来源多样且变更频繁,仍可能出现获取不到、文献不完整或与标题不符等情况,如果获取不到我们将提供退款服务。请知悉。

摘要

This paper describes treeClust, an R package that produces dissimilarities useful for clustering.These dissimilarities arise from a set of classification or regression trees, one with each variable inthe data acting in turn as a the response, and all others as predictors. This use of trees produces dissimilarities that are insensitive to scaling, benefit from automatic variable selection, and appear to performwell. The software allows a number of options to be set, affecting the set of objects returned in the call;the user can also specify a clustering algorithm and, optionally, return only the clustering vector. Thepackage can also generate a numeric data set whose inter-point distances relate to the treeClust ones;such a numeric data set can be much smaller than the vector of inter-point dissimilarities, a usefulfeature in big data sets.
机译:本文描述了treeClust,这是一个R包,它会产生可用于聚类的相异性。这些相异性是由一组分类树或回归树引起的,一组分类树或回归树将数据中的每个变量依次用作响应,所有其他变量用作预测变量。对树的这种使用会产生对缩放不敏感的差异,可以从自动变量选择中受益,并且表现良好。该软件允许设置许多选项,从而影响调用中返回的对象集;用户还可以指定聚类算法,并且可以选择仅返回聚类向量。程序包还可以生成一个数字数据集,该数据集的点间距离与treeClust的距离有关;此类数字数据集可以比点间不相似向量大得多,这在大数据集中很有用。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号