文摘
英文文摘
第一章生物学背景
1.1 DNA和蛋白质
1.1.1 DNA
1.1.2蛋白质
1.2基因和基因的表达
1.2.1基因的表达
1.2.2真核生物基因结构的复杂性
1.3人类基因组工程
第二章基因发现系统简介
2.1内容探测器(content sensor)
2.2信号探测器(signal sensor)
2.3各个子模块的整合
2.3.1神经网络(Neural network)
2.3.2决策树(Decisiontree)
2.3.3形式语法(Formal grammars)
2.3.4动态编程(Dynamic programming)
2.3.5隐式马尔可夫链(Hidden Markov Model)
2.3.6泛化的隐式马尔可夫链(Generalized Hidden Markov Model)
2.4本文的主要工作及文章结构
第三章基因发现系统框架模型和相关算法
3.1离散随机过程
3.1.1隐式马尔可夫链
3.1.2泛化的隐式马尔可夫链
3.2框架模型结构
3.2.1基于HMM的模型的例子
3.2.2基于GHMM的模型
3.3用模型预测基因
3.4Viterbi算法
3.4.1 Viterbi算法的算法复杂度
3.4.2序列的预处理
3.4.3 Viterbi算法
3.4.4算法的复杂性分析
3.4.5与其他基因发现系统的比较
3.5外显子的概率
3.5.1向前算法
3.5.2向后算法
3.5.3向前-向后公式
第四章信号探测器的设计和实现
4.1序列集合
4.2 pre-mRNA的拼接
4.3拼接信号
4.3.1受体/分支点信号
4.3.2供体信号
4.4拼接信号模型
4.4.1权值矩阵模型
4.4.2权值数组模型
4.4.3 WMM和WAM的比较
4.4.4模型的实现
4.5其他信号的模型
4.6状态转移概率
第五章内容探测器的设计与实现
5.1概述
5.2 C+G含量对基因结构的影响
5.3编码区域的模型
5.3.1非齐次马尔可夫模型
5.3.2五阶非齐次马尔可夫模型
5.3.3外显子的长度分布
5.4非编码区域的模型
第六章小结与展望
6.1本文工作的总结
6.2进一步的工作
参考文献
作者攻读学位期间公开发表的论文
致 谢
上海大学;