首页> 中文学位 >原核与真核生物蛋白质编码区识别及基因组分析
【6h】

原核与真核生物蛋白质编码区识别及基因组分析

代理获取

目录

文摘

英文文摘

独创性声明和学位论文版权使用授权书

第一章绪论Introduction

1.1原核生物及真核生物基因组

1.2生物信息学及其主要研究内容

1.3原核及真核生物基因识别算法

1.4本论文的主要工作

第二章DNA序列的Z曲线理论 The Z curve Theory for DNA Sequence

2.1 DNA序列的Z曲线理论

2.2考虑密码子内部相邻碱基近程相关性的Z曲线理论

2.3描述基因组GC含量沿序列分布的zn曲线

2.4 Z曲线理论的应用

第三章细菌和古细菌基因组中可疑ORFs的基因识别算法

3.1引言

3.2材料与方法

3.2.1材料

3.2.2方法

3.3结果

3.3.1十重交叉检验(Ten-fold cross-validationtests)

3.3.2最终Fi sher系数及第十一重交叉检验

3.4讨论

3.4.1用Z曲线方法得到高识别精度的原因

3.4.2 57个细菌、古细菌基因组中Fi sher系数和GC含量的关系

3.5网上服务及补充材料

第四章七个亲缘关系很远的高GC含量微生物基因组采用相似的密码子使用模式 Seven GC-rich microbial genomes adopt similar codon usage patterns regardless of their phylogenetic lineages

4.1引言

4.2材料与方法

4.3结果与讨论

4.3.1算法的识别精度及Fisher系数在第一组中的通用性

4.3.2十个基因组中碱基在三个密码子位的分布模式

4.3.3第一组中三个参数的重要性排序以及C.crescentus与Halobacterium.sp.NRC的GC2-GC3图

第五章冠状病毒基因识别软件ZCURVE CoV及其在SARS冠状病毒基因组分析中的应用 ZCURVE_CoV:a new system to recognize protein-coding genes and predict proteinase cleavage sites in coronavirus genomes,and its applications in analyzing SARS-CoV genomes

5.1引言

5.2材料与方法

5.2.1数据库

5.2.2基因识别算法

5.3结果与讨论

5.3.1比较ZCURVE_CoV和GeneMark.hmm

5.3.2应用ZCURVE_CoV分析SARS-CoV基因组

5.3.3多序列比对6个可能的非结构蛋白编码基因

5.3.4冠状病毒基因组多聚蛋白酶切位点预测结果

5.3.5网上服务及补充材料

5.4结论

第六章拟南芥基因组的isochore结构分析 An isochore map and some features of the Arabidopsis thaliana genome revealed by the Z curve method

6.1引言

6.2材料与方法

6.2.1材料

6.2.2 Z’曲线方法

6.3结果与讨论

6.3.1拟南芥五条染色体的Z’曲线及isochore的特征

6.3.2 isochore的一些生物学特征

6.4结论

第七章基于Z曲线方法的真核生物基因识别软件Zcurve_E Zcurve_E:a new system for recognizing protein-coding genes in eukaryotic genomic sequences

7.1引言

7.2材料与方法

7.2.1训练和检验集

7.2.2算法描述

7.3结果与讨论

7.3.1基于四个物种检验集的基因识别预测结果

7.3.2联合使用Zcurve_E和Genscan

7.4网站介绍

7.5结论

总结论Conlusions

参考文献

发表论文及参加科研情况说明

附录

致谢

附件

展开▼

摘要

本论文主要致力于原核生物与真核生物及冠状病毒蛋白质编码基因识别以及基因组分析方面的工作.论文第一部分介绍了生物信息学的发展背景及主要研究内容、原核生物与真核生物基因的结构特点、主要的蛋白质编码基因识别算法以及DNA序列的Z曲线理论及应用.论文的第二部分是原核生物及冠状病毒的基因识别和分析.首先我们提出了一种方法从细菌、古细菌基因组中注释较好的已知基因出发训练参数,进而确定注释不完善的ORFs中可能不编码蛋白质的ORFs,在此基础上开发了一套细菌、古细菌基因识别软件ZCURVE C并提供网上服务.论文的第三部分是真核生物基因识别和基因组结构分析.首先,我们基于Z曲线的非窗口技术分析了拟南芥基因组的isochore结构,画出了拟南芥五条染色体的Z'曲线图.详细分析了2号染色体上找到的两个isochore,其中一个位于核仁组织区,另外一个是线粒体DNA插入片断,我们可以精确的确定它的大小和在染色体中的位置.其次,我们开发了基于Z曲线方法的真核生物从头预测基因识别软件Zcurve_E.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号