首页> 外文学位 >Random forests and gene selection to classify Arabidopsis thaliana ecotypes.
【24h】

Random forests and gene selection to classify Arabidopsis thaliana ecotypes.

机译:随机森林和基因选择以对拟南芥生态型进行分类。

获取原文
获取原文并翻译 | 示例

摘要

This thesis discusses the classification and gene selection of ecotype data for Arabidopsis thaliana. Gene expressions from Oligonucleotide gene expression arrays were used to classify Arabidopsis thaliana ecotypes using statistical methods. The hierarchical cluster method was used to group ecotypes according to latitude and altitude to distinguish ecotypes. Limma was used to select differentially expressed genes. The Random Forest algorithm provides a ranking of genes to indicate how well they can discriminate between ecotypes.;We focus on the Random Forest algorithm. It is an efficient approach and can deal with a large number of predictor variables in a classification process. Parameters are optimal to achieve a small classification error rate.;The final selection of genes may play an important role in adaptation to stress conditions. They were further examined for gene function and evidence regarding stress resistance.;Keywords: Arabidopsis thaliana, Microarray Data, Hierarchical Cluster, Limma, Random Forest, Classification.
机译:本文讨论了拟南芥生态型数据的分类和基因选择。来自寡核苷酸基因表达阵列的基因表达用于使用统计学方法对拟南芥生态型进行分类。采用层次聚类法根据纬度和海拔对生态类型进行分组,以区分生态类型。使用Limma选择差异表达的基因。随机森林算法提供了一个基因排名,以指示它们如何区分生态型。;我们关注随机森林算法。这是一种有效的方法,可以在分类过程中处理大量的预测变量。参数是实现较小分类错误率的最佳选择。基因的最终选择可能在适应胁迫条件中起重要作用。进一步检查了它们的基因功能和有关抗逆性的证据。关键词:拟南芥,芯片数据,层次聚类,利马,随机森林,分类。

著录项

  • 作者

    Yeh, Hsueh-han.;

  • 作者单位

    Michigan State University.;

  • 授予单位 Michigan State University.;
  • 学科 Statistics.
  • 学位 M.S.
  • 年度 2007
  • 页码 61 p.
  • 总页数 61
  • 原文格式 PDF
  • 正文语种 eng
  • 中图分类 统计学;
  • 关键词

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号