首页> 中文学位 >原核生物基因识别算法研究和基因组进化分析
【6h】

原核生物基因识别算法研究和基因组进化分析

代理获取

目录

文摘

英文文摘

独创性声明及学位论文版权使用授权书

绪论

1.1原核生物基因组

1.2生物信息学

1.3基因识别算法

1.4论文的主要工作

第一章原核和真核生物基因组Z曲线数据库的建立

1.1引言

1.2 DNA序列的Z曲线理论

1.3 Z曲线数据库的建立

1.4 Z曲线数据库的软件服务

1.5结论

第二章高G+C含量细菌基因组ORFs的碱基分布模型

2.1引言

2.2材料与方法

2.2.1数据库

2.2.2数据分析方法

2.3结果与讨论

2.3.1高G+C含量基因组ORFs碱基分布模型

2.3.2密码子位G+C含量和基因组G+C含量的关系

2.3.3不同G+C含量基因组ORFs碱基分布模型的比较

2.3.4密码子位G+C含量和密码子偏好模式

2.3.5高G+C含量细菌基因组ORFs的FCM聚类分析

2.4结论

第三章细菌和古细菌基因组蛋白质编码基因的识别算法

3.1引言

3.2材料与方法

3.2.1寻找种子ORFs和候选ORFs

3.2.2基因识别的核心算法

3.2.3排除重叠ORFs的策略

3.2.4基因翻译起始位点的预测方法

3.3结果与讨论

3.3.1基因预测能力的评价指标

3.3.2比较ZCURVE 1.0和Glimmer 2.02

3.3.3联合使用ZCURVE 1.0和Glimmer 2.02

3.3.4高G+C含量基因组的多次Fisher判别算法

3.4结论

第四章细菌基因翻译起始位点的预测

4.1引言

4.2材料与方法

4.2.1数据库

4.2.2分析基因起始位点附近碱基分布模式

4.2.3基因起始位点识别变量

4.2.4自训练方法及种子ORFs

4.3结果与讨论

4.3.1用高可信度数据库检验自训练方法

4.3.2基因识别软件的后处理程序

4.3.3分析识别变量

4.4结论

第五章细菌基因组水平转移基因的分布

5.1引言

5.2材料与方法

5.2.1描述沿基因组G+C含量分布的z'n曲线

5.2.2小波变换和信号多尺度分解

5.2.3预测水平转移基因

5.3结果与讨论

5.3.1描述沿基因组G+C含量分布的不同方法

5.3.2小波变换参数及阈值

5.3.3两个致病性E.coli基因组的异常区域

5.3.4 E.coli K12基因组的水平转移基因

5.3.5水平转移基因的密码子偏向性

5.4结论

第六章微生物必需基因数据库DEG的建立

6.1引言

6.2数据库的描述

6.2.1微生物必需基因的收集

6.2.2微生物必需基因数据库的建立

6.2.3微生物必需基因数据库的应用

6.3结论

第七章冠状病毒基因识别软件ZCURVE_CoV及其在分析SARS冠状病毒基因组中的应用

7.1引言

7.2材料与方法

7.2.1数据库

7.2.2基因识别算法

7.3结果与讨论

7.3.1比较ZCURVE_CoV 1.0和GeneMark.hmm

7.3.2应用ZCURVE_CoV 1.0分析SARS-CoV基因组

7.3.3多序列比对6个可能的非结构蛋白编码基因

7.3.4网上服务及补充材料

7.4结论

总结论

参考文献

攻博期间发表论文及参加科研情况说明

攻博期间发表论文首页

插图

附录

致谢

展开▼

摘要

随着DNA测序技术的进步,迄今为止已有一百多种原核生物基因组完成测序.基因识别是进行基因组分析的第一步,在生物信息学研究中占有重要的地位.该论文主要研究内容是原核生物的蛋白质编码基因识别算法和基因组进化分析.论文第一部分首先介绍了DNA序列的Z曲线理论,这是我们分析原核生物基因组的主要工具,因此建立了一个与基因识别关系密切的原核和真核生物基因组Z曲线数据库.论文第二部分是围绕细菌和古细菌基因识别问题展开的.首先,我们发现了高G+C含量细菌基因组ORFs的一个新的碱基分布模型.该模型呈花状结构,有6个花瓣状区域,其中一个区域对应于编码序列.这一有趣的发现对改进高G+C含量细菌基因组的基因识别问题有指导意义.其次,我们提出了一种基于自训练的细菌基因起始预测算法GS-Finder 1.0.它有效地整合了基因翻译起始位点附近的多个生物学特征,取得了较好的预测成绩.最后,我们提出了一个细菌和古细菌基因识别算法ZCURVE 1.0.它主要利用了Z曲线方法来描述编码序列密码子位的碱基分布偏向性,其平均预测成绩和目前国际上广泛使用的基于马尔科夫链的基因识别算法Glimmer 2.02相当.在基因起始和高G+C含量基因组基因的预测成绩等方面,ZCURVE 1.0表现略优.此外我们利用该算法参数少的优点,开发了适用于基因组较小的冠状病毒(包括SARS冠状病毒)的基因识别软件ZCURVE CoV.论文第三部分主要在细菌基因组水平上研究基因起源.我们采用z'n曲线和小波变换来预测通过物种间水平转移获得的外源基因.并建立了一个细菌基因组z'n曲线数据库,为研究基因组马赛克结构和水平转移基因分布提供了直观的分析工具.另外,我们收集了目前所能得到的微生物必需基因数据,建立了一个数据库,为研究必需基因的功能和起源,开发预测算法提供了基础.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号