首页> 中文学位 >决策树膜型在冠心病全基因组关联研究中的应用
【6h】

决策树膜型在冠心病全基因组关联研究中的应用

代理获取

目录

声明

摘要

1 引言

1.1 问题背景

1.2 GWAS的设计与数据分析方法

1.3 本论文的研究内容

2 决策树方法简介

2.1 基本概念

2.2 决策树的构建

2.3 决策树的剪枝

2.4 决策树的评估

2.5 常用决策树算法

3 实证分析

3.1 初筛自变量

3.2 建立决策树模型

3.3 随机二次抽样

3.4 结果比较

4 总结和讨论

参考文献

致谢

附录

展开▼

摘要

冠心病是一类由遗传与环境因素相互作用引起的复杂疾病,是世界范围内死亡和致残的一个重要原因。对冠心病的全基因组关联研究是近年来的研究热点。
  以往的冠心病全基因组关联研究大多采用一些经典的统计方法。然而,由于全基因组数据量大,自变量远多于观测数,使得经典方法往往不适用。
  本文分析的是来源于WTCCC的冠心病数据,包含了4864名被试者的393474个基因位点的信息和被试者是否患病的0-1变量。其中有1926例冠心病病例和2938名对照,冠心病病例占总观测40%左右。每个位点有三种单核甘酸形态,为无序属性变量。采用决策树方法来分析这批数据对冠心病GWAS的两类问题,一是寻找与冠心病相关联的易感位点,二是预测是否患病。决策树对于这类问题的分析有不少的优点,它是一种非参数方法,所作的先验假设较少;易于处理离散型的数据;自变量之间的相关对建模及预测的影响不大。我们查阅了GWAS的有关文献,未找到使用决策树模型的文献。
  针对WTCCC的冠心病数据,本文使用决策树模型挑选出了5个与冠心病相关联的易感位点(自变量),使用多种评估方法得到的准确率都稳定在74%左右,这比已有文献报导的预测准确率要高。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号