首页> 中文学位 >RNA-Seq分析流程的完美以及基于RNA-Seq数据分析新基因在爪蟾发育阶段中的作用
【6h】

RNA-Seq分析流程的完美以及基于RNA-Seq数据分析新基因在爪蟾发育阶段中的作用

代理获取

目录

声明

摘要

第一章 高通量转录组学研究概述

一、高通量测序简述

二、RNA-Seq原理

三、RNA-Seq的应用

四、转录组分析方法

第二章 RNA-Seq流程的完善

一、背景

二、RNA-Seq流程的完善

三、小结

第三章 新基因研究概述

一、新基因起源的研究

二、新基因功能研究

三、总结与展望

第四章 新基因在爪蟾胚胎发育阶段中的作用

一、研究背景

二、材料与方法

三、结果与分析

四、讨论

总结

参考文献

致谢

准备中的论文

展开▼

摘要

二代测序技术的发展给转录组学的研究带来了巨大的飞跃,扩大了我们对真核生物中转录组的认识。目前RNA-Seq已经成为基因表达和转录组分析的重要手段,广泛被运用于寻找新的转录本、检测基因表达水平变化、研究转录本可变剪接差异、RNA编辑位点变化等方面。RNA-Seq快速发展的同时也给我们带来了挑战——如何处理高通量数据,这对生物信息学带来巨大的挑战。
  针对有参考基因组的转录组数据的基础分析,Trapnell等人开发了广受欢迎和认可的“Tophat-Cufflinks-Cuffcompare-Cuffdiff”流程。基于实际使用过程中我们发现的一些问题以及我们科研工作中的需求,我们对这个转录组分析流程进行了修改和补充。通过自编Perl脚本程序,我们做了四个方面完善:①短读段映比对到基因组上的处理:通过读取没有比对到基因组的序列的信息,根据polyA和碱基质量情况对测序序列进行相应处理,然后进行最终的序列比对;②转录本拼装过滤:通过自编Perl脚本程序,利用FPKM值、建库长度、Class Code及表达量等对不可信转录本进行过滤,并利用比对信息对拼装结果的5'与3'端的位置信息进行校正以及对GENE ID进行修改;③长链非编码转录本分析:通过CPC对新拼装的基因进行编码能力评判,再利用自编脚本,提取相应的信息,判断新拼装的基因的编码能力,并通过分析新基因与已知蛋白编码基因的位置关系对lncRNA进行分类;④可变剪接结构差异分析及可变剪接水平分析:通过Perl脚本编程写了两个分析程序,用来快速检测样本中可变剪切的差异及根据FPKM值计算不同样本中外显子可变剪切水平。上述工作提高了我们后续的数据分析的速度并为相关研究提供了一个很好的解决办法。
  新基因是生物进化的原材料。研究表明新基因在发育阶段有着重要的功能。胚胎发育阶段存在着大量的表观遗传修饰活动,如H3K4me3显著富集及CpG岛去甲基化,这提供了新基因可能产生于胚胎发育阶段这一可能性。基于上述完善的RNA-Seq数据分析流程,我们分析了热带爪蟾的不同发育时期的转录组数据,并构建了基因共表达网络模块。我们发现年轻新基因显著富集在合子基因组激活(ZGA)后的发育阶段,并且随着合子基因组激活后的发育阶段进行,重复新基因的富集水平呈现下降趋势,而且这些新基因显示了组织特异性和发育阶段特异性富集。我们的数据支持新基因在发育过程中的重要作用。另外我们还鉴定出一些爪蟾特有的孤儿基因和lncRNA基因,这些基因也显示了组织特异性富集和发育阶段特异性富集,揭示了其组织特异性表达模式。我们的数据支持了前面我们提出的假说,即一些年轻新基因产生于胚胎发育阶段并获得对发育阶段非常重要的新功能。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号