首页> 中文学位 >基于最大熵隐马尔可夫模型的基因启动子识别
【6h】

基于最大熵隐马尔可夫模型的基因启动子识别

代理获取

目录

声明

摘要

第一章 绪论

1.1 国内外研究进展

1.2 本文的研究背景

1.3 本文的研究内容及研究方法

第二章 方法

2.1 基于隐马尔可夫模型的启动子识别方法

2.1.1 HMM

2.1.2 基于Profile HMM的启动子模型构建

2.1.3 识别流程

2.2 基于最大熵马尔可夫模型的启动子识别方法

2.2.1 最大熵模型

2.2.2 最大熵马尔可夫模型

2.2.3 方法流程

2.3 基于最大熵隐马尔可夫模型的启动子识别方法

2.3.1 ME-HMM

2.3.2 基于模体(Motif)的启动子模型构建

2.3.3 识别流程

第三章 实验验证

3.1 数据选用与格式

3.2 编程环境

3.3 实验过程

3.3.1 HMM

3.3.2 MEMM

3.3.3 ME-HMM

第四章 实验结果

4.1 阈值

4.2 可靠性检验

4.3 性能评价

4.3.1 评价指标

4.3.2 性能分析

第五章 讨论

参考文献

致谢

攻读学位期间完成和发表的学术论文

展开▼

摘要

随着人类基因组测序的完成,启动子识别因在基因调控中发挥的重要作用,成为当前生物信息学研究的热点之一。目前有两种启动子识别方法:基于内容的方法和基于信号的方法。基于内容的方法如隐马尔科夫模型(HMM),经常带一些信号噪声,并忽视启动子的生物特性。基于信号的方法克服上述不足,利用启动子的生物学特性作为条件,然而,它会导致较高的假阳性率(FPR)。为了克服上述不足,不断提高识别性能,本文介绍两种新方法:一是基于最大熵马尔可夫模型(MEMM),另一个是基于最大熵隐马尔科夫模型(ME-HMM)。
  新方法创新如下:首先,两种方法均是首次应用在启动子识别领域;其次,这两种方法都结合了启动子的生物特性,并建立特征模板来选择特征;最后,为了将新技术应用于启动子识别,本文改进了前向算法,并开发了MEMM-前向算法和ME-HMM-前向算法。
  此外,ME-HMM方法有自己的创新:首先,它利用基于模体的HMM模型替代剖面隐马尔可夫模型构建启动子模型。其次,它不仅克服基于内容的方法的不足,而且能够有效降低假阳性率。
  本文首次通过R语言编程建立了上述两种模型,实现了相应算法,成功的应用在启动子识别中。为验证新方法的有效性,本文引入HMM方法作为对照实验,发现两种新方法不仅能够克服HMM的缺点,而且能够利用有限的训练数据集,达到更好的识别效果。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号