文摘
英文文摘
独创性声明及学位论文版权使用授权书
第一章问题的引出
1.1生物测序工程与生物序列数据库
1.1.1基因组测序与DNA序列数据库
1.1.2蛋白质测序与氨基酸序列数据库
1.2分子生物学的一些基础知识
1.3粗粒化与生物序列分析
1.3.1粗粒化与字符表示
1.3.2生物序列分析
1.4现有算法概述
1.4.1海量数据期待有效算法
1.4.2现有算法的粗略分类及简介
1.4.3现有算法的特点及存在的问题
1.5从数论的角度看,生物序列分析的三个基本问题
第二章字符序列的解析数论模型
2.1字符序列的数字化表示
2.1.1字符序列的量化
2.1.2字符串的信息来源与加权统计
2.1.3在实数域上的推广
2.2对偶描述子
2.3对偶描述子用于序列特征提取
2.3.1模式偏离函数与极佳描述
2.3.2序列的重构与失真度量
2.3.3基函数的选择
2.4对偶描述子的交替式学习
2.5对偶描述子用于序列识别
2.6矢量形式、几何表示与应用扩展
2.6.1矢量形式
2.6.2几何表示——对偶曲线
2.6.3应用扩展
2.7 Z曲线理论简介
2.8基于位置权重的序列分析方法之——“位置权重矩阵”
本章小结
第三章对偶描述子方法在生物信息学中的应用举例
3.1对偶描述子用于字符序列特征提取——对偶描述子的学习演示
3.1.1冠状病毒基因组序列的特征提取——对偶描述子的一次性学习演示
3.1.2原核基因编码区公共特征的提取——对偶描述子的交替式学习演示
3.1.3二阶对偶描述子的交替式学习过程演示
3.2对偶描述子用于DNA序列蛋白质编码区的识别
3.2.1对偶描述子用于原核基因识别
3.2.2在人类基因组外显子和内含子识别中的应用
参考文献
发表论文和参加科研情况说明
附录Ⅰ:符号说明
附录Ⅱ:序列扩增的两种方法
致谢