首页> 中文学位 >复杂性状遗传风险预测的统计方法研究
【6h】

复杂性状遗传风险预测的统计方法研究

代理获取

摘要

这篇博士论文主要研究基于复杂性状或疾病的,构建风险预测模型的统计遗传学方法。随着复杂疾病研究的不断深入,研究者检测并收集了大量与复杂疾病相关联的遗传变异(如单核苷酸多态性等)。而基于这些探测到的遗传或环境风险因子而构建成的遗传风险预测模型将推进医学和临床的发展。但是迄今为止,用现有方法构建的遗传风险预测模型的精确度都不理想。而与此同时,全基因组关联分析的发展也激发了研究者基于高维数据构建风险预测模型的兴趣。本论文提出了同时适用于基于现有的风险遗传变异或环境因子的,以及基于全基因组高维序列数据的非参数风险预测模型。此外,该风险预测模型可以考虑到基因与基因,基因与环境之间的互作,从而进一步提高了风险预测的精确度。其中“前向ROC”方法主要适用于病例与对照的序列数据的分析需求,而CORC方法则适用于基于家系产生序列数据的遗传风险预测。
   第一章引导和概述了复杂疾病研究的发展和现状。特别阐述了用于检测在疾病形成过程中具有重要作用的遗传因子而展开的全基因组关联分析的发展。在此基础上,本论文介绍了疾病遗传风险预测的发展历史,从最初的孟德尔性状到如今的常见复杂疾病,分析了复杂性状与孟德尔性状在预测上存在的差异。最后,简要阐述了ROC曲线的理论以及其在现代医学诊断中所发挥的作用,其中最优化ROC曲线的理论,构成了本论文中构建复杂疾病的风险预测模型的基础和根基。
   第二章主要介绍了适用于病例与对照的高维序列数据的遗传风险预测方法(前向ROC方法)。该方法基于最优化的ROC曲线提出,采用向前选择法选取具有预测效应的遗传或环境因子,通过最优化ROC曲线下的AUC值进行筛选,最终构建出面向复杂性状或疾病的风险预测模型。该方法不仅适用于基于现有因子的风险预测,也可用于基于全基因组的风险预测,并从大量的候选因子中筛选出有效的预测因子,并同时考虑基因与基因之间,基因与环境之间的互作,提高预测的精确度。通过仿真试验比较了该方法与常用的几种风险预测方法在不同疾病模型下的优劣。同时,对风湿性关节炎进行了基于现有风险因子和基于全基因组的两种风险预测模型的构建,挖掘了HLA-DRB1和PTPN22在风湿性关节炎的风险预测中的重要位置。
   第三章主要介绍了适用于家系来源的序列数据的遗传风险预测模型(CORC方法)。迄今为止,遗传风险预测的方法,尤其是基于家系的风险预测模型的构建方法还相当的有限,因此在之前提出的基于病例与对照的风险预测方法(前向ROC方法)的基础上,引入聚类的技术,同时考虑家系内部的个体相关性,构建出用于家系数据的复杂性状或疾病的风险预测模型。该方法同样可以分析高维数据,并考虑基因与基因、基因与环境之间的互作,达到较好的精确度。通过仿真试验,本研究比较了该方法与常用的几种基于家系的风险预测方法在不同的家系结构和疾病模型下表现的优劣。同时,以儿童品行障碍疾病(Conduct Disorders)的家系序列为实例,应用该新方法在家系数据上构建了遗传风险预测的模型,其预测的精确度AUC值为0.6908。
   第四章总结和归纳了基于复杂疾病的风险预测模型的特征,并展望了其未来的应用前景和一些潜在的可以进一步提高的方面。尤其是在研究一些缺乏先验信息,或没有展开大量研究工作的少数族群上,或者一些疾病的亚型性状上,本论文的方法可能会有较好的应用。总得来说,本论文提出的两种方法均有较好的功效,而且在高维数据的风险预测时表现稳健,且可以分别应用于病例与对照数据,以及家系数据。而通过涵盖大量的遗传或环境因子,以及它们之间的互作,新方法可以从一定程度上促进未来风险预测的发展。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号