声明
摘要
第一章 背景知识
§1.1 原核生物中基因的表达与调控
§1.2 调控模体的表示与预测算法
§1.3 直系同源关系与系统发生足迹法
§1.4 本论文的组织结构
第二章 模体预测与分析软件工具包BoBro2.0
§2.1 简介
§2.2 技术方法
§2.2.1 BBR:在全基因组规模上从预测出的模体集合中过滤噪声的新方法
§2.2.2 BBS:基于P-value对一个查询模体实例的搜索和排序
§2.2.3 BBC:模体比较和聚类
§2.2.4 BBA:模体共存在分析
§2.3 数据准备
§2.4 结果
§2.4.1 BoBro2.0能够在全基因组范围上准确有效的预测出调控模体
§2.4.2 BBS能够比FIMO更准确的识别出模体实例
§2.4.3 BBC能够比TOMTOM更准确的识别出模体聚类
§2.4.4 BBA能够识别出起共同调控作用的转录因子
§2.5 总结
第三章 全基因组范围原核生物调节子预测的新方法
§3.1 简介
§3.2 数据和方法
§3.2.1 数据准备
§3.2.2 通过比较基因组进行直系同源基因预测
§3.2.3 系统发生足迹法中同源操纵子和相应调控序列的确定
§3.2.4 操纵子对之间共调控分数的计算
§3.2.5 通过对操纵子的聚类预测调节子
§3.2.6 局部相关性得分和基因功能相关性得分的计算
§3.3 结果
§3.3.1 直系同源操纵子为系统发生足迹法预测模体提供有效信息
§3.3.2 共调控得分能够准确反映出操纵子对之间的共同调控关系
§3.3.3 调节子预测结果与RegulonDB中已知调节子的比较
§3.4 讨论
第四章 操纵子数据库DOOR2.0
§4.1 简介
§4.2 数据库升级
§4.3 DOOR2.0的新特性
§4.3.1 整合转录单元数据
§4.3.2 整合了转录调控元素
§4.3.3 整合了保守操纵子信息
§4.3.4 全新网页界面设计
§4.3.5 在线操纵子预测
§4.4 技术实现
§4.5 总结
第五章 梭状芽孢杆菌40个基因组的比较基因组分析
§5.1 简介
§5.2 方法与材料
§5.2.1 数据来源
§5.2.2 基因功能预测
§5.2.3 泛基因组分析
§5.2.4 调控模体预测和CAZyme基因分析
§5.3 结果
§5.3.1 梭状芽孢杆菌的系统发生分析
§5.3.2 两组细菌之间基本特征的比较
§5.3.3 核基因组与泛基因组分析
§5.3.4 CAZyme基因的识别与分析
§5.3.5 针对CAZyme基因的调控模体预测
§5.4 总结
第六章 总结与展望
§6.1 论文总结
§6.2 展望
参考文献
致谢
攻读博士学位期间完成论文情况
作者简介