首页> 外文OA文献 >Gene selection for high dimensional data using k-means clustering algorithm and statistical approach
【2h】

Gene selection for high dimensional data using k-means clustering algorithm and statistical approach

机译:使用K-Means聚类算法和统计方法的高维数据的基因选择

代理获取
本网站仅为用户提供外文OA文献查询和代理获取服务,本网站没有原文。下单后我们将采用程序或人工为您竭诚获取高质量的原文,但由于OA文献来源多样且变更频繁,仍可能出现获取不到、文献不完整或与标题不符等情况,如果获取不到我们将提供退款服务。请知悉。

摘要

Microarray technology can measure thousands of genes which are useful for biologist to study and classify the cancer cells.However, this high dimensional data consists of large number of genes to be examined in regard of small samples size. Thus, selection of relevant genes is a challenging issue in microarray data analysis and has been a central research focus.This study proposed kmeans clustering algorithm to groups the relevant genes. Several statistical techniques such as Fisher criterion, Golub signal-to-noise, Mann Whitney rank and t-test have been used in deciding the clusters are well separated from one and others. Those genes with high discriminative score will later be used to train the k-NN classifier.The experimental results showed that the proposed gene selection methods able to identify differentially expressed genes with 0.86 ROC score.
机译:微阵列技术可以测量有助于生物学家的数千个基因,以研究和分类癌细胞。然而,这种高尺寸数据包括大量基因,以便在小样品尺寸方面进行检查。因此,相关基因的选择是微阵列数据分析中的一个具有挑战性的问题,并且已经是一个中央研究焦点。本研究提出了奎群组织聚类算法来分组相关基因。已经使用了几种统计技术,例如Fisher标准,Golub信号对噪声,Mann Whitney等级和T检验,用于确定簇与一个和其他群体很好地分离。稍后将使用具有高鉴别性评分的那些基因来训练K-NN分类器。实验结果表明,所提出的基因选择方法能够鉴定具有0.86 ROC评分的差异表达基因。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号