首页> 中文学位 >生物大分子的数学描述及其应用
【6h】

生物大分子的数学描述及其应用

代理获取

目录

文摘

英文文摘

独创性说明及大连理工大学学位论文版权使用授权书

0绪论

1生物大分子的图表示

2生物序列的数值刻画

3逻辑序列与序列复杂度

4蛋白质编码基因识别

5参考文献

读博期间发表、完成论文及获奖情况

创新点摘要

致谢

附注

展开▼

摘要

随着人类和一些模式生物基因组计划的相继完成或全面实施,生物学研究的重点正从积累数据向分析解释这些数据过渡,生物信息学(也称计算分子生物学)便应运而生。它的研究内容十分丰富,例如,序列比较、计算机辅助基因识别、分子进化和比较基因组学、RNA和蛋白质结构预测、遗传密码及其起源、序列重叠群装配、基于结构的药物设计等等,都是生物信息学中重要的研究领域。其中大多数领域的研究工作都有一个共同的需求,就是常常需要给出生物学数据的数学上的描述,因此,生物大分子的数学描述便成为生物信息学中一个非常基础又十分重要的课题。 本文的主要工作包括以下几个方面: 第一章针对原有图形表示的缺陷,从不同的角度在不同的层次上给出了生物序列的三种图表示。首先,直接从DNA原始序列出发,通过赋予四种碱基四个3维空间中的向量给出了DNA序列一种3维图形表示,同时在DNA序列的特征序列的基础上提出了两种2维图形表示:“双水平线”图和“梯状”图,这两种2维表示都既考虑了序列本身的线性结构,又考虑了四种碱基的化学结构。最后,面向所有生物序列的图形表示,从整体上提出了有向图的概念。有向图表示不仅弥补了现有图形表示的许多不足,还为生物序列的数值刻画提供了新的途径。 第二章提出了一个基于矩阵范数的新的序列不变量—ALE指标,它与目前应用最为广泛的序列不变量—最大特征值等效但它的计算非常容易,这使得基于不变量的比较方法在完全基因组比较及其相关研究领域中的应用具有了可行性。同时,还就某种特殊情况下最大特征值所反映的信息是否全面进行了探讨,并提出了伪迹的概念。此外,在有向图的基础上提出了生物序列的上三角矩阵表示,并对现有序列不变量在上三角矩阵情况下的兼容性作了讨论。为了更好地反映序列中元素,尤其是它们之间的序关系所包含的信息,本章最后一节从一般数字序列出发构造出一种特殊的链(全序集),在此基础上提出了DNA序列的正规化相对熵,并简要讨论了DNA序列基于正规化相对熵的12维向量表示在酿酒酵母基因组的蛋白质编码基因识别中潜在的应用。 第三章利用代数学中的同态思想对DNA序列进行粗粒化描述,提出了DNA序列的逻辑表示,并将这一概念推广到蛋白质序列。同时,给出了(0,1)序列的广义LZ复杂度,并将其和正规化相对熵分别应用到DNA及蛋白质序列的相似性分析。此外,根据RNA二级结构的特点给出了RNA二级结构的影子序列,并结合序列复杂性,对9种病毒的RNA二级结构进行了比较。 最后一章利用DNA序列的正规化相对熵和Fisher线性判别法对酿酒酵母基因-i-组序列进行基因识别。笔者将识别的准确度提高到了96%,得到了一个酿酒酵母基因组中基因总数为5873的估计,与普遍接受的5800-6000相符。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号