首页> 中文学位 >基于泛化的隐式马尔可夫模型的基因发现系统设计与实现
【6h】

基于泛化的隐式马尔可夫模型的基因发现系统设计与实现

代理获取

目录

文摘

英文文摘

第一章生物学背景

1.1 DNA和蛋白质

1.1.1 DNA

1.1.2蛋白质

1.2基因和基因的表达

1.2.1基因的表达

1.2.2真核生物基因结构的复杂性

1.3人类基因组工程

第二章基因发现系统简介

2.1内容探测器(content sensor)

2.2信号探测器(signal sensor)

2.3各个子模块的整合

2.3.1神经网络(Neural network)

2.3.2决策树(Decisiontree)

2.3.3形式语法(Formal grammars)

2.3.4动态编程(Dynamic programming)

2.3.5隐式马尔可夫链(Hidden Markov Model)

2.3.6泛化的隐式马尔可夫链(Generalized Hidden Markov Model)

2.4本文的主要工作及文章结构

第三章基因发现系统框架模型和相关算法

3.1离散随机过程

3.1.1隐式马尔可夫链

3.1.2泛化的隐式马尔可夫链

3.2框架模型结构

3.2.1基于HMM的模型的例子

3.2.2基于GHMM的模型

3.3用模型预测基因

3.4Viterbi算法

3.4.1 Viterbi算法的算法复杂度

3.4.2序列的预处理

3.4.3 Viterbi算法

3.4.4算法的复杂性分析

3.4.5与其他基因发现系统的比较

3.5外显子的概率

3.5.1向前算法

3.5.2向后算法

3.5.3向前-向后公式

第四章信号探测器的设计和实现

4.1序列集合

4.2 pre-mRNA的拼接

4.3拼接信号

4.3.1受体/分支点信号

4.3.2供体信号

4.4拼接信号模型

4.4.1权值矩阵模型

4.4.2权值数组模型

4.4.3 WMM和WAM的比较

4.4.4模型的实现

4.5其他信号的模型

4.6状态转移概率

第五章内容探测器的设计与实现

5.1概述

5.2 C+G含量对基因结构的影响

5.3编码区域的模型

5.3.1非齐次马尔可夫模型

5.3.2五阶非齐次马尔可夫模型

5.3.3外显子的长度分布

5.4非编码区域的模型

第六章小结与展望

6.1本文工作的总结

6.2进一步的工作

参考文献

作者攻读学位期间公开发表的论文

致 谢

展开▼

摘要

该文以高等真核生物的基因发现技术为研究对象,首先,讨论了基于隐式马尔可夫模型(HMM)的基因发现系统及其不足.随后设计了我们的基因发现系统.我们在HMM的扩展形式-泛化的隐式马尔可夫模型(GHMM)的基础上,建立了一个基因发现系统的框架,用以将系统的各个子模块整合起来,以搜索潜在的基因.在该系统中,我们将基因结构的信息引入搜索算法,提出了在导出序列上使用Viterbi算法来寻找可能的基因结构的方法,并给出了具体的算法.之后,我们从系统的子模块中选择了拼接信号模块作为研究重点.实现并测试了两种被广泛使用的模型:权值矩阵模型,权值数组模型,并对测试结果进行了比较和详细的分析,为系统进一步的开发打下了坚实的基础.同时,我们也讨论了内容探测器模型和其他子模块模型的设计和实现问题.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号