首页> 外文学位 >Comprehensive density-based cluster analysis.
【24h】

Comprehensive density-based cluster analysis.

机译:全面的基于密度的聚类分析。

获取原文
获取原文并翻译 | 示例

摘要

Clustering is one of the primary techniques in data mining. Clustering in data mining is a discovery process that partitions the data set into groups such that data points within a group have high similarity in comparison to one another but are very dissimilar to points in other groups. Clustering has the following several challenges: (1) clusters with arbitrary shapes, (2) minimal domain knowledge to determine the input parameters, and (3) scalability for large data sets.; Density-based clustering has been recognized as a powerful approach for discovering arbitrary-shape clusters. However, the other two challenges still remain in most existing clustering algorithms. The goal of this dissertation is to explore comprehensive clustering methods to meet the current challenges. We conquer the second challenge by two attempts: (1) to reduce input parameters in the density-based partitioning algorithm and (2) to eliminate input parameters by means of hierarchical clustering. We meet the third challenge by improving the speed by means of the vertical P-tree structures and pruning techniques.
机译:群集是数据挖掘中的主要技术之一。数据挖掘中的聚类是一种发现过程,该过程将数据集划分为多个组,以使一个组中的数据点彼此之间具有高度相似性,但与其他组中的点却非常不同。聚类具有以下几个挑战:(1)具有任意形状的聚类;(2)用于确定输入参数的最少领域知识;(3)大数据集的可伸缩性。基于密度的聚类已被认为是发现任意形状聚类的有效方法。但是,其他两个挑战仍然存在于大多数现有的聚类算法中。本文的目的是探索综合的聚类方法来应对当前的挑战。我们通过两次尝试来克服第二个挑战:(1)减少基于密度的分区算法中的输入参数,(2)通过分层聚类消除输入参数。我们通过垂直P树结构和修剪技术提高速度来迎接第三个挑战。

著录项

  • 作者

    Wang, Baoying (Elizabeth).;

  • 作者单位

    North Dakota State University.;

  • 授予单位 North Dakota State University.;
  • 学科 Computer Science.
  • 学位 Ph.D.
  • 年度 2005
  • 页码 99 p.
  • 总页数 99
  • 原文格式 PDF
  • 正文语种 eng
  • 中图分类 自动化技术、计算机技术;
  • 关键词

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号