作物复杂性状遗传关联分析及基于线性模型的多因素维度缩减方法的开发

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

剖析复杂性状、复杂疾病的遗传机理，对作物高效育种和精准医疗有非常重要的意义。连锁分析和关联分析是剖析复杂性状的两种主要途径。其中，连锁分析利用家系内目标位点与分子标记的连锁共分离信息来定位目标位点区段，在过去的二十多年被广泛应用。近来，随着高通量测序技术发展，全基因组测序数据（如单核苷酸多态性标记—SNP）大量涌现，掀起了人类疾病和作物复杂性状全基因组关联的研究(GWAS)热潮。这些研究中，有一些已经取得不错的结果，但大多数GWAS研究都未解决“遗传率丢失”的问题。所谓的“遗传率丢失”现象指的是通过GWAS定位找到的目标SNP只能解释传统家系研究估计得到的总遗传变异方差（遗传率）的一小部分。由于当前大部分GWAS研究通常只考虑单位点效应，忽视了基因间互作、基因与环境互作，这被认为是造成这种差异的一种可能解释。
　　在本研究中，根据已有数据特性，我们探索和设计了一些新的关联策略来应对这一挑战。这些方法策略分别应用于棉花、水稻和烟草的全基因组关联分析。此外，本研究还使用线性模型框架重构了MDR方法（多因素维度缩减方法）的核心算法，开发了称为LMDR的新方法。本文共分五个章节，其主要内容概括如下。
　　第一章首先介绍了GWAS的一些基本概念和遇到的挑战，以及对于这些挑战我们提出的一些应对策略。
　　第二章中，基于316份陆地棉品种测得的约40万个SNP标记，我们对四个纤维产量性状进行了全基因组关联分析。棉花是常异花授粉作物，在这份数据中我们也发现了一些杂合基因型，但GWAS常用的简单加模型不能处理这些杂合基因型。因此，我们采用了全模型来探索陆地棉产量性状的遗传基础，该全模型同时包含了加性，显性，上位性以及环境互作效应的检测。分析结果显示，虽然杂合子的比例并不高（约0.07），显性相关的效应却贡献了大部分的总遗传率。这表明少数的杂合基因型仍对表型变异有较大的影响，并在分子水平上揭示了杂合优势对棉花产量性状的重要性。此外，通过全模型与相应简化模型结果的比较，该研究也为“遗传率丢失”提供一个可能解释。
　　第三章中，我们采取了多种全基因组关联策略来研究超级杂交稻协优9308高产的遗传基础;所用材料为由协优9308衍生的重组自交系(RIL)群体，我们对138份重组自交系后代进行了重测序，并开展关联分析。由于GWAS研究通常是基于自然群体，首先我们就GWAS研究在这个实验群体的可行性进行了检查和讨论。随后，我们同时采取三种关联研究策略（包括传统的无先验知识的全基因组关联分析，和两个分别基于先验QTL和已注释基因的关联分析）对株高和抽穗期两个性状进行一个整体比较分析。研究结果发现，多种关联策略共同找到的位点相对比较可靠，可优先用于后续研究。此外，作为一个例子，这项研究表明了GWAS不仅可以在实验群体中进行，而且多策略关联分析还可以补充或精细以前的QTL定位结果，以更精确的QTL信息为后续基因克隆和分子标记辅助选择服务。
　　第四章中，我们以烟叶中铬含量和总糖含量为例，对四组学数据（即基因组学，转录组学，蛋白质组学和代谢组学）和复杂表型间的关联进行了探讨，以确定相应的数量性状SNP(QTSs)，数量性状转录本(QTTs)，数量性状蛋白(QTPs)和数量性状代谢物(QTMs)。这些中间分子表型（或内表型）有助于阐明复杂性状的遗传变异机理。
　　最后一章中，我们使用线性模型框架重建了MDR的核心算法。MDR是一种基于机器学习的检测基因互作方法。然而，它缺乏明确的统计性质，例如p值是通过置换检验或中心极限定理得到的。LMDR克服这些限制。通过模拟研究，我们发现，LMDR不仅能提供合理的统计性质，而且不需要置换检验就可以得到p值，所以计算效率高;此外，LMDR也更易拓展到meta分析和条件分析。同时，LMDR非常容易实现，兼容目前MDR的大多数扩展方法。

著录项

作者
周莉媛;
展开▼
作者单位

浙江大学;

展开▼
授予单位浙江大学;
学科生物信息学
授予学位博士
导师姓名朱军;
年度 2016
页码
总页数
原文格式 PDF
正文语种中文
中图分类 S501;
关键词
农作物; 复杂性状; 遗传关联分析; 混合线性模型; 全基因组学; 多因素维度缩减法;

相似文献

中文文献
外文文献
专利

1. 基于多因素关联关系的油田开发措施结构优化方法研究 [J] . 侯春华 . 西南石油大学学报（自然科学版） . 2006,第003期
2. 基于多因素线性模型的项目级路面养护目标确定方法 [J] . 何海鹰 ,曾胜 ,赵健 . 铁道科学与工程学报 . 2011,第004期
3. 基于熵权的多目标关联分析及其作物区试综合评估方法与应用 [J] . 周忠军 ,张尊沛 ,张浩 . 中国农学通报 . 2009,第21期
4. 基于混合线性模型估算杉木生长性状遗传参数 [J] . 陈兴彬 ,肖复明 ,余林 . 福建林学院学报 . 2018,第004期
5. 基于混合线性模型估算杉木生长性状遗传参数 [J] . 陈兴彬 ,肖复明 ,余林 . 森林与环境学报 . 2018,第004期
6. 复杂性状遗传度置信区间的全基因组估计方法 [C] . 唐明生 ,黄水平 . 2017年中国卫生统计学学术年会 . -1
7. 面向复杂性状遗传性缺失的关联分析方法研究 [A] . 郭颖婕 . 2019

作物复杂性状遗传关联分析及基于线性模型的多因素维度缩减方法的开发

目录

摘要

著录项

相似文献

相关主题

期刊订阅