首页> 中文学位 >基于Z曲线理论的编码和非编码区序列分析
【6h】

基于Z曲线理论的编码和非编码区序列分析

代理获取

目录

文摘

英文文摘

声明

第一章绪论

1.1人类基因组计划和模式生物基因组计划

1.3非编码区及其功能简介

1.3生物学数据库简介

1.4生物信息学及其主要研究内容

1.5本文的研究工作

第二章 DNA序列的Z曲线理论及其应用

2.1 DNA序列的Z曲线理论

2.1.1考虑DNA序列内部相邻碱基相关性的Z曲线理论

2.1.2描述基因组GC含量沿序列分布的Z′曲线

2.2 Z曲线理论的应用

2.2.1基于可视化的Z曲线分析和比较基因组

2.2.2细菌、古细菌复制起始位点识别

2.2.3冠状病毒酶切位点预测及进化关系分析

2.2.4利用相位特异性的Z曲线进行基因识别

2.3 Z曲线方法的优势

2.3.1与 G1immer 2.02对比

2.3.2与马尔科夫链模型比较

第三章 Z曲线对禽流感病毒编码序列的分析

3.1引言

3.2禽流感病毒简介

3.2材料与方法

3.3结果与讨论

第四章 Z曲线方法对非编码RNA序列分析

4.1引言

4.2材料及方法

4.2 Z曲线方法对非编码RNA序列的分析

4.2.1与两类疾病相关的ncRNA序列Z曲线

4.2.2几类功能不同的ncRNA序列Z曲线的统计分析

4.3结果与讨论

第五章 Z曲线方法对非编码区基因的识别

5.1引言

5.2材料与方法

5.2.1数据库

5.2.2相位特异性的Z曲线

5.2.3主成分分析

5.2.4 K-means聚类方法

5.3对Aeropyrum pernix K1非编码基因的Z曲线识别

5.4结果与讨论

第六章结论

附录

参考文献

攻读硕士学位期间发表论文及科研情况

致谢

展开▼

摘要

面对各种基因组计划和蛋白质组计划所得到的海量生物学数据,如何分析并从中获得生物学信息是后基因组时代的首要任务。DNA序列作为一种遗传语言,不仅体现在编码序列之中,而且隐含在非编码序列之中。非编码区广泛存在于真核生物中(例如,人的基因组中非编码区占有高达95%-97%的比例)。如此众多的非编码区在生命活动中具有广泛的调控作用。目前,各种生物的大量基因和非编码区还没有完全定位,所以对编码区和非编码区的研究是后基因组时代的重要任务之一。 本论文主要应用张春霆院士提出的Z曲线理论和相关的生物信息学方法对禽流感病毒的蛋白质编码区和几种功能不同的非编码区序列进行分析。论文以数据库NCBI和NONCODE中的禽流感H5N1病毒序列和四类功能不同的ncRNA序列为研究对象,利用相应的绘图软件Z-plotter绘制出与所选择编码或非编码序列一一对应的Z曲线,分别计算出DNA序列中各种碱基的数量及在DNA序列中所占比例,进而求得每一序列的G+C含量。然后利用统计学的方法对所得曲线进行分析、比较,从而得到相关结论并以此作为预测非编码RNA功能的依据。然后论文又对Aeropyrum pernix K1基因组中原始注释为可能基因的2694个ORFs进行了重新识别。按照聚类算法中的编码指标AZ,依据AZ>0或AZ<0来判定ORFs属于编码或非编码ORFs。重新注释的结果是,Aeropyrum pernix基因组中编码基因的数目被重新确定为1581个,其余的1113个被判定为非编码基因。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号