首页> 外文学位 >Feature cluster selection for high-dimensional data analysis.
【24h】

Feature cluster selection for high-dimensional data analysis.

机译:用于高维数据分析的特征簇选择。

获取原文
获取原文并翻译 | 示例

摘要

This thesis address the gaps between traditional data mining tasks, feature selection and clustering, and the knowledge desired by domain experts in real-world applications. It illustrates two particular gaps using microarray data analysis: the gap between a near-optimal feature subset and a candidate set of interesting features, and the gap between good clusters and relevant clusters. This thesis proposes to bridge such gaps by a new data mining task, feature cluster selection, which aims to select and group all relevant features in a data set into a small number of coherent clusters. It provides both formal definition and empirical formulation for the new problem, and describes an efficient solution based on Max-relevance, Max-cohesion, and Min-separation criteria. Experiments on microarray data verify that the solution can discover relevant feature clusters of statistical significance as well as select representative feature subsets of high accuracy.
机译:本文解决了传统数据挖掘任务,特征选择和聚类以及领域专家在实际应用中所需的知识之间的空白。它使用微阵列数据分析说明了两个特定的缺口:接近最佳特征子集和一组有趣特征的候选之间的缺口,以及良好聚类和相关聚类之间的缺口。本文提出了通过新的数据挖掘任务特征聚类选择来弥合这种差距,特征聚类选择旨在将数据集中的所有相关特征选择并分组为少量一致的聚类。它提供了新问题的正式定义和经验公式,并描述了基于最大相关性,最大内聚性和最小分离标准的有效解决方案。对微阵列数据的实验证明,该解决方案可以发现具有统计意义的相关特征簇,并可以选择具有代表性的高精度特征子集。

著录项

  • 作者

    Li, Hao.;

  • 作者单位

    State University of New York at Binghamton.$bComputer Science.;

  • 授予单位 State University of New York at Binghamton.$bComputer Science.;
  • 学科 Computer Science.
  • 学位 M.S.
  • 年度 2007
  • 页码 49 p.
  • 总页数 49
  • 原文格式 PDF
  • 正文语种 eng
  • 中图分类 自动化技术、计算机技术;
  • 关键词

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号