首页> 中文学位 >SNP定位的一种降维及变量选择方法
【6h】

SNP定位的一种降维及变量选择方法

代理获取

目录

文摘

英文文摘

第1章 引言

1.1 遗传学研究背景综述

1.1.1 SNP单体型概率的估计

1.2 统计研究背景综述

1.2.1 几种常见的变量选择方法

1.3 本文的结果以及构造

第2章 SNP数据致病位点定位的一种方法

2.1 统计模型

2.2 高维数据变量选择方法回顾

2.2.1 SIS方法

2.2.2 TS方法

2.3 变量选择准则

2.3.1 EBIC准则简介

2.3.2 EDC准则

2.4 动态分割定位方法及算法实现

2.4.1 新的变量选择方法

2.4.2 算法实现

2.4.3 新的算法中需要注意的问题

第3章 数据模拟及结果讨论

3.1 衡量变量选择优良性的准则:PSR和FDR

3.2 数据模拟

3.2.1 数据模拟1

3.2.2 数据模拟2

第4章 总结与展望

4.1 总结

4.2 展望

参考文献

致谢

展开▼

摘要

人类拥有46条染色体,每条染色体由载有人类遗传信息的DNA和蛋白质构成。由于DNA是双螺旋结构,且每个DNA又由4种不同的碱基构成,而这些碱基的数目众多,称那些出现变异的碱基对为单核苷酸多态性(SNP),人类大约拥有30万的SNP标记,但是在现实研究中,可以用到的样本人数往往只有百人左右,而真正的致病的SNP也只有数个,如何从数万到几十万个SNPs中选出真正的致病的位点,是一个典型的满足稀疏性的高维数据变量选择的问题。
   本文主要研究高维数据的降维问题,即“小n大P”问题,传统的变量选择方法往往都是适用于“大n小P”的情况,对于“小n大P”问题往往不能使用。这就需要先进行降维处理,然后才能使用传统的选择方法。本文中我们提出一种新的变量筛选方法-动态分割法,同时介绍两种改进的BIC准则:EBIC及EDC准则,并将其运用到变量选择中。
   引入衡量变量选择优良性的准则FDR和PSR,针对所提出的算法进行数据模拟,比较算法的优劣,同时比较EBIC、EDC、BIC准则选择的优劣。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号