首页> 中文学位 >基因表达谱芯片校正批次效应算法的比较及网络分析在精神分裂症研究中的应用
【6h】

基因表达谱芯片校正批次效应算法的比较及网络分析在精神分裂症研究中的应用

代理获取

摘要

基因表达谱芯片作为一种高通量的基因组研究手段,在生物医学领域应用极其广阔。然而,每年有数以干计的基于芯片的研究,其数据都被“批次效应”所混杂。批次效应是指由于芯片在不同的实验批次处理而产生的系统误差。它在以前的芯片研究中鲜有提及。虽然批次效应可以通过缜密的实验设计缓解,但除非所有样本都可以在同一批次中处理完成,否则它不可能消除。
  我们首先从多个平台的实验数据中证明了了批次效应的存在,并且从多方面解析了该混杂效应对生物因素的严重影响。接下来我们从基因芯片的实验步骤入手,通过详细介绍基因芯片的实验过程,指出批次效应可能的来源。因为批次效应可以严重影响基因表达的实验结果,一系列校正批次的方法被发展出来。对目前比较流行的几种批次校正的方法,我们从方差比例,精度,准度,以及总体评价等方面进行了系统的比较,发现ComBat--一个基于经验贝叶斯的分析方法,多数指标优于其他五个算法,而且针对每个批次中含有样本量较小的数据时仍有优异的表现。我们推荐ComBat作为对不同批次的数据进行批次效应校正的最佳统计算法。另外我们还建议在比较重复样本和非重复样本之间关联的时候,有必要在探针水平进行标准化校正,从而降低非重复样本之间的被虚夸了的相关性。
  我们的另一部分工作是利用基因表达谱芯片数据探寻精神分裂症的发病机制。目前已经有很多基于基因表达谱芯片的精神分裂症的研究,发现了很多的候选基因,但几乎没有基因可以通过多重校正并且从不同的实验中重复出来。这可能是因为人类大脑基因表达的异质性或因为基因表达在病人中的改变较小.我们设想基于基因基因相互作用的网络或者通路会在病人大脑中的改变会更加一致,在这个研究中,我们利用基因共表达网络来分析不同来源的5组脑组织数据。
  首先我们对基因表达谱芯片数据进行了严格的质量控制,除了利用ComBat校正批次效应外,我们还通过MAS算法对探针质量进行控制,通过修改的RMA算法剔除单核苷酸多态位点对探针的影响,剔出种族差异对基因表达的影响等。之后我们通过基因共表达网络的方法构建基因网络,利用每组基因网络的特征向量,我们使用了两种不同的统计算法,校正年龄,性别,大脑pH值等变量后,挖掘是否存在某一组基因的表达水平变化与精神分裂症有强关联。
  结果发现在5组数据中,金属硫蛋白家族的部分基因,MTlE,MTIF,MTIG,MTIM,MTIX,MT2A的表达量在精神分裂症患者中都有显著的提高。如此一致的结果证明金属硫蛋白家族基因确实参与了精神分裂症发病的过程,或是病因,或是症状。金属硫蛋白富含半胱氨酸,在人体中的主要作用是通过结合重金属离子调节体内微量元素,以及神经受损后的免疫反应和氧化应激等。氧化应激已经被报道与精神分裂发病机制有关。己知重金属锌(zn)在神经发育,情绪控制和保护细胞免受损伤等方面发挥作用。另外其他重金属,铜(Cu)也推测有精神分裂症有关。我们猜测重金属的调控失调,氧化应激和组织受损等可能参与在精神分裂症的发病机理之中。
  除此之外,我们还从遗传学和表观遗传学角度,分别利用eQTL的方法和DNA甲基化的数据对金属硫蛋白表达量变化进行了简要的分析。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号