首页> 中文学位 >蛋白质序列新的表示方法
【6h】

蛋白质序列新的表示方法

代理获取

摘要

虽然目前生物信息学研究的核心内容是基因组学,但对蛋白质组学的研究也是生物信息学所从事的一项非常重要的工作。一方面,基因作为重要的生命信息,它需要通过表达将信息转移到蛋白质上,蛋白质才是生命活动的主要承担者;另一方面,基因组学虽然在基因活性和疾病的相关性方面为人类提供了有力的根据,但实际上大部分疾病并不是由基因改变所引发的,而蛋白质组的研究不仅能为科学家们发现生命活动的规律提供物质基础,也能为他们发现众多疾病的发病机理以及攻克这些疾病提供理论根据和解决途径。所以,随着人类基因组计划的逐步完成,科学家们又进一步提出了后基因组计划,而对蛋白质组的研究是其中一个非常重要的内容。尽管人类基因组计划已勾画出了人体的蓝图,然而,要想全面了解复杂的人体,还需要进一步深入认识基因组所产生的全部蛋白质。
   蛋白质组学在生物信息学研究中的最主要任务是分析和预测蛋白质的结构,并将结构知识应用于生物学、医学、药学等生命科学领域。蛋白质的序列与蛋白质的结构之间存在着一种对应关系,这是目前进行蛋白质结构预测的一种前提性假设。基于这一前提,研究人员将通过分析比较蛋白质序列,计算序列之间的“进化距离”,从而判别蛋白质序列间的远近关系,最终找到同源蛋白质。又由于同源的蛋白质具有相似的空间结构,因此我们可以利用已知蛋白质的空间结构来推测未知蛋白质的空间结构。然而蛋白质序列的比较比DNA序列的比较更加复杂。其中一个原因是,DNA序列仅由4种碱基组成,而蛋白质序列则由20种氨基酸组成;另外,蛋白质序列不仅组成元素多,而且组成元素之间的关系比较复杂。因此,对蛋白质序列相似性关系的评价将会更加困难,而解决这一问题的关键是找到一种有效的方法来表示蛋白质序列,建立关于蛋白质序列的数学模型,用数学的方法来解决生物问题。
   本文的内容可以分为两个部分:在第一部分我们将提出一种新的表示蛋白质序列的方法并且验证这种方法的有效性;在第二部分我们把这种表示方法应用到对禽流感序列的分析以及对凋亡蛋白亚细胞位置的预测这两大研究课题中,并且分别将得到的结果与用以往的分析方法得到的结果进行对比,从而得出本论文中提出的蛋白质序列新的表示方法是一种非常有效的方法这一结论。我们将用四章的篇幅阐述文章的内容。本论文的主要研究工作及创新点如下:
   在第一章中我们简单介绍了生物信息学的概况及发展前景,并且说明了分析蛋白质序列作为这一学科的研究内容之一的研究意义。
   在第二章中我们首先给出了一种新的方法来表示蛋白质序列,其次对于这种新的表示方法我们做了两组实验来验证这种方法的有效性,并且得到了非常理想的结果。
   在第三章中,作为应用,我们首先用上述蛋白质序列的表示方法对123种H5N1的蛋白质序列进行相似性分析并且将得到的结果与用以前的分析方法得到的结果进行比较,得出了与之前的研究相似的结论。接下来我们又用蛋白质序列新的表示方法来预测凋亡蛋白的亚细胞位置,也得到了不错的预测结果。这充分体现了新方法的应用价值。
   在第四章中,我们提出了本论文的不足之处并且给出了总结和展望。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号