摘要
第一章 绪论
1.1 测序技术的产生和进展
1.1.1 第一代测序技术的产生
1.1.2 第二代测序技术的产生
1.2 第二代测序目前的主要应用
1.2.1 第二代测序在检测全基因组加倍中的应用
1.2.2 第二代测序在转录组学中的应用
1.2.3 第二代测序在环境基因组学中的应用
1.2.4 第二代测序在其他方面的应用
1.3 本研究的目的和意义
第二章 被子植物中多倍化事件是普遍存在的
2.1 背景介绍
2.1.1 全基因组多倍化的定义和意义
2.1.2 全基因组加倍的普遍性
2.1.3 被子植物的重要地位
2.2 数据和方法
2.2.1 全基因组测序物种的收集和转录组物种的测序
2.2.2 转录组测序,拼接以及蛋白质预测
2.2.3 基因家族的识别和基因树的构建
2.2.4 同义替换速率的计算(Ks)和混合模型拟合
2.2.5 全基因组加倍事件的发现
2.2.6 保留基因的GO(Gene Ontology)功能分析
2.3 基于Ks的方法验证已经发现的和识别新的全基因组加倍事件
2.3.1 已知全基因组加倍事件的验证
2.3.2 多个新全基因组加倍事件的发现
2.4 基于系统发生树的方式来发现和定位全基因组加倍事件
2.4.1 蔷薇类植物全基因组加倍事件
2.4.2 菊类植物全基因组加倍事件
2.4.3 单子叶植物全基因组加倍事件
2.4.4 木兰类及金鱼藻,金粟兰植物全基因组加倍事件
2.5 保留的重复基因的功能偏好性分析
2.5.1 十字花科的alpha(α)和beta(β)重复以后的保留的重复基因
2.5.2 豆科祖先基因组重复后保留基因的功能分析
2.5.3 禾本科的两次重复后保留的重复基因
2.6 gamma(γ)事件以后不同分支的丢失比较
2.7 本章小结
2.8 附图和附表
第三章 拟南芥早期花发育转录组中可变剪切分析
3.1 背景介绍
3.1.1 可变剪切研究的历史
3.1.2 可变剪切的主要形式
3.1.3 植物中的可变剪切
3.1.4 可变剪切的功能
3.2 材料与方法
3.2.1 拟南芥早期花转录组的收集,RNA提取和测序
3.2.2 测序片段比对和转录本拼接,表达量估计
3.2.3 可变剪切基因识别
3.2.4 寻找差异表达的可变剪切基因
3.2.5 差异表达基因的聚类和功能分析
3.2.6 未注释转录区域的识别
3.3 拟南芥早期花发育转录组的描述
3.4 表达量的估计
3.5 可变剪切事件的识别
3.6 不同发育时期差异表达的可变剪切基因
3.6.1 差异表达可变剪切基因的聚类分析
3.6.2 时期特异的可变剪切基因
3.7 新的转录区域的识别
3.7.1 序列拼装Cufflinks识别新的转录区域
3.8 本章小结
3.9 附图和附表
第四章 基于二代测序和组分特征的宏基因组学的研究方法
4.1 背景介绍
4.2 材料和方法流程
4.2.1 下载已有的细菌和真菌微生物的蛋白质组
4.2.2 构建参考基因的K串数据库
4.2.3 比较目标短串和参考基因数据库
4.2.4 对目标短串进行分类注释和功能注释
4.2.5 构建154个属中的不同长度的短串序列模拟数据
4.2.6 构建428个物种的不同长度的短串序列模拟数据
4.2.7 124个人类的肠道环境基因组
4.3 比较MetaCV与其他三种方法的敏感度和特异性(模拟数据一)
4.4 比较MetaCV与其他三种方法在随机数据集中的表现(模拟数据二)
4.5 评价MetaCV对于环境其他真核生物的污染的稳定性
4.6 利用MetaCV可以快速处理海量真实人类肠道的环境基因组数据
4.7 本章小结
4.8 附图和附表
参考文献
致谢
攻读博士期间所获奖励
攻读博士学位期间(待)发表的学术论文
博士期间给下列杂志审过稿件
声明
复旦大学;