文摘
英文文摘
独创性声明和学位论文版权使用授权书
第一章绪论Introduction
1.1原核生物及真核生物基因组
1.2生物信息学及其主要研究内容
1.3原核及真核生物基因识别算法
1.4本论文的主要工作
第二章DNA序列的Z曲线理论 The Z curve Theory for DNA Sequence
2.1 DNA序列的Z曲线理论
2.2考虑密码子内部相邻碱基近程相关性的Z曲线理论
2.3描述基因组GC含量沿序列分布的zn曲线
2.4 Z曲线理论的应用
第三章细菌和古细菌基因组中可疑ORFs的基因识别算法
3.1引言
3.2材料与方法
3.2.1材料
3.2.2方法
3.3结果
3.3.1十重交叉检验(Ten-fold cross-validationtests)
3.3.2最终Fi sher系数及第十一重交叉检验
3.4讨论
3.4.1用Z曲线方法得到高识别精度的原因
3.4.2 57个细菌、古细菌基因组中Fi sher系数和GC含量的关系
3.5网上服务及补充材料
第四章七个亲缘关系很远的高GC含量微生物基因组采用相似的密码子使用模式 Seven GC-rich microbial genomes adopt similar codon usage patterns regardless of their phylogenetic lineages
4.1引言
4.2材料与方法
4.3结果与讨论
4.3.1算法的识别精度及Fisher系数在第一组中的通用性
4.3.2十个基因组中碱基在三个密码子位的分布模式
4.3.3第一组中三个参数的重要性排序以及C.crescentus与Halobacterium.sp.NRC的GC2-GC3图
第五章冠状病毒基因识别软件ZCURVE CoV及其在SARS冠状病毒基因组分析中的应用 ZCURVE_CoV:a new system to recognize protein-coding genes and predict proteinase cleavage sites in coronavirus genomes,and its applications in analyzing SARS-CoV genomes
5.1引言
5.2材料与方法
5.2.1数据库
5.2.2基因识别算法
5.3结果与讨论
5.3.1比较ZCURVE_CoV和GeneMark.hmm
5.3.2应用ZCURVE_CoV分析SARS-CoV基因组
5.3.3多序列比对6个可能的非结构蛋白编码基因
5.3.4冠状病毒基因组多聚蛋白酶切位点预测结果
5.3.5网上服务及补充材料
5.4结论
第六章拟南芥基因组的isochore结构分析 An isochore map and some features of the Arabidopsis thaliana genome revealed by the Z curve method
6.1引言
6.2材料与方法
6.2.1材料
6.2.2 Z’曲线方法
6.3结果与讨论
6.3.1拟南芥五条染色体的Z’曲线及isochore的特征
6.3.2 isochore的一些生物学特征
6.4结论
第七章基于Z曲线方法的真核生物基因识别软件Zcurve_E Zcurve_E:a new system for recognizing protein-coding genes in eukaryotic genomic sequences
7.1引言
7.2材料与方法
7.2.1训练和检验集
7.2.2算法描述
7.3结果与讨论
7.3.1基于四个物种检验集的基因识别预测结果
7.3.2联合使用Zcurve_E和Genscan
7.4网站介绍
7.5结论
总结论Conlusions
参考文献
发表论文及参加科研情况说明
附录
致谢
附件
天津大学;