首页> 中文学位 >两样本问题中差异表达基因的筛选研究
【6h】

两样本问题中差异表达基因的筛选研究

代理获取

目录

声明

摘要

第一章 引言

1.1 课题的研究背景、目的和意义

1.1.1 研究背景

1.1.2 研究目的

1.1.3 研究意义

1.2 本文结构

第二章 筛选基因的常用方法

2.1 t-检验

2.2 倍数分析

2.3 SAM法

2.4 方差分析

2.5 Efron的分析方法

2.6 本文的方法

第三章 支持向量机

3.1 两分类问题

3.2 线性可分

3.3 最大间隔法

3.4 用支持向量机建立分类器

3.4.1 线性可分支持向量机分类器

3.4.2 线性支持向量机分类器

3.5 非线性支持向量机分类器

3.6 核函数

第四章 数据分析

4.1 数据结构说明

4.2 数据预处理

4.3 用常用方法对模拟数据进行分析

4.3.1 SAM法

4.3.2 用Efron的方法处理模拟数据

4.4 本文方法分析模拟数据

4.4.1 分析结果

4.4.2 结合变量的p值分析结果

4.4.3 不带罚项选择变量时的结果

4.5 分析Golub数据集

4.5.1 SAM法

4.5.2 EFron的方法

4.5.2 本文方法分析Golub数据

4.5.3 用SVM对样本进行分类

第五章 结论

5.1 模拟数据分析

5.2 Golub数据分析

5.3 创新点

5.4 缺点

参考文献

致谢

攻读学位期间主要的研究成果

展开▼

摘要

本文从变量相关性角度、对变量被选概率添加罚因子的思想提出基因特征选择的方法,根据基因被选次数来决定其是否差异表达。结合常用的SAM(Significance Analysis of Microarray)法和Bradley Efron提出的方法,比较分析了两组数据。
   模拟数据的前20个变量被标识为差异表达。SAM法筛选出17个变量,都来自目标变量,未被选出的三个变量是12号、18号和19号。当fdr<0.2时,Efron的方法筛选出18个变量,都属于被标识的差异变量,12、18号未被选出。本文方法筛选结果中,频数排在前17位的都是目标变量,其余三个目标变量19号、18号、12号的频数分别位于第19、22、24位。前24位中目标外的四个变量分别是第841、371、140和492号。从两样本t统计量的p-value分析,以上四个目标外变量的p-value确实比12号、18号要小,其余18个目标变量的p-value位于前18位,这说明这四个变量的出现是合理的。用Efron的方法筛选基因结果优于SAM法,而本文方法能更准确地对变量排序。
   本文比较了变量筛选概率添加罚因子和不添加时的结果。添加罚因子时,目标变量累积出现次数比重为68%,只有3个目标变量未出现,12个频数大于1的变量都是目标变量。不添加罚因子时,未出现变量达到9个,频数大于1的7个变量中只有5个是目标变量。这说明添加了罚因子提高筛选效率和准确度。
   第二组数据是Golub的白血病数据。SAM法筛选出了76个基因。Efron法在fdr<0.2,只筛选出6个基因;当fdr<0.4时,得到23个基因。本文方法选择频数大于38的基因共74个,有41个出现在SAM法的结果中。排在前5位的分别是X95735_at、M27891_at、M23197_at、Y12670 at和M16038_at,从t统计量的p-value分析,这5个基因的p-value排在前6位。选择排在前20位的基因做进一步分析,添加罚因子运行一次时,出现次数大于1的基因中,70%出现在总结果中的前20位,有7个出现在Efron的方法结果中。不添加罚因子时,只有38%位于前20位,且只有6个位于Efron的方法结果中。从与总结果、Efron法的结果比较来看,添加罚因子效果更佳。
   用SAM法筛选的基因建立支持向量机分类器时,错分率为0,支持向量个数达到31。当fdr<0.2,Efron法筛选出的6个基因建立分类器错分率为2.63%,支持向量个数19个;当fdr<0.4,筛选出的23个基因建立分类器时,虽然错分率为0,但是支持向量为20个。而本文方法筛选出的前20个基因建立分类器时,不仅错分率为0,而且仅12个支持向量。
   本文方法不仅能更准确地筛选出目标基因,而且能对基因的差异表达排序。添加罚因子时筛选效果更佳。Golub数据集中,本文方法筛选的基因建立SVM分类器错分率为0,支持向量数最少。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号