首页> 中文学位 >基于结构的蛋白质折叠类型分类建模与识别
【6h】

基于结构的蛋白质折叠类型分类建模与识别

代理获取

目录

文摘

英文文摘

声明

第1章 绪论

1.1 蛋白质简介

1.2 蛋白质的结构层次

1.2.1 蛋白质的组成

1.2.2 蛋白质的结构层次

1.2.3 蛋白质结构数据库PDB

1.3 蛋白质结构分类及其分类数据库

1.3.1 蛋白质的结构类型

1.3.2 蛋白质结构分类数据库SCOP和CATH

1.4折叠子(fold)及折叠识别(fold recognition)

1.4.1 折叠子的研究意义

1.4.2 折叠子结构特征

1.4.3 折叠识别在蛋白质结构预测中的应用

1.5课题来源和意义

第2章 蛋白质折叠类型分类及LIFCA低冗余蛋白质折叠类型分类数据库

2.1 引言——折叠类型的分类依据

2.2 蛋白质折叠核心结构(Protein Fold Core Structure)

2.2.1 蛋白质的二级结构序列

2.2.2 蛋白质的折叠核心

2.3 蛋白质折叠核心注释数据库(LIFCA)的建立

2.3.1 原料与方法

2.3.2 折叠类型图形化特征描述

2.3.3 空间方位信息及标定文件

2.4 LIFCA分类系统与命名规则

2.5 LIFCA与SCOP分类系统的比较

2.5.1 统计比较

2.5.2 拆分家族

2.6 本章小结

第3章 基于RMSD的蛋白质折叠子类的生成及标准

3.1 引言——折叠子类的来由

3.2 折叠子类形成的标准

3.2.1 RMSD——蛋白质结构差异量化指标

3.2.2 结构比对方法及RMSD矩阵

3.3 聚类方法

3.3.1 系统聚类分析概述

3.3.2 常用系统聚类方法

3.3.3 系统聚类的自动化实现

3.4 结果分析

3.5 本章小结

第4章 LIFCA-HMM库的建立和蛋白质折叠类型的Profile-HMM识别

4.1 引言

4.2 Profile-HMM与蛋白质识别

4.2.1 HMM概述

4.2.2 蛋白质序列的Profile-HMM

4.3 多重结构比对MUSTANG

4.4 Profile-HMM的训练

4.5 识别结果检验

4.5.1 单模型识别检验

4.5.2 全模型库识别检验

4.5.3 结果比较

4.6 本章小结

第5章 蛋白质折叠识别软件LIFCA-HMMER

5.1 软件功能

5.2 软件开发工具与环境

5.3 软件界面

5.4主要结果输出

5.5 本章小结

结论与展望

参考文献

攻读硕士学位期间发表的学术论文、获得科研成果及参加的科研项目

致 谢

展开▼

摘要

蛋白质的氨基酸序列如何决定空间结构是当今生命科学研究中的核心问题之一,被称为第二遗传密码。由于实验测定的费时和费力,使得从蛋白质的氨基酸序列出发理论预测它的结构成为21世纪生物学的首要任务。大量实验和理论研究表明,蛋白质的三级结构是非常复杂而不规则的,但其整体折叠类型却十分有限,一般认为只有数百到数千种,远小于蛋白质所具有的自由度数。折叠类型反映了蛋白质核心结构的拓扑模式,它是从蛋白质结构的基础层次——二级结构单元出发进行的一种描述,包括了蛋白质二级结构单元、二级结构单元的相对排布位置和整个多肽链的路由关系。随着蛋白质结构数据库趋于完备,序列-结构问题便可以转化为折叠识别问题,即找到与未知蛋白质序列在三维结构上最匹配的已知折叠类型。对自然界存在的数百到数千种折叠类型进行系统分类和识别,将有助于揭示蛋白质的折叠规律。本文通过对蛋白质折叠类型的研究,以结构核心的拓扑连接和空间排布为依据,建立了统一原理的蛋白质折叠类型数据库LIFCA,为蛋白质折叠识别奠定了基础。主要研究内容包括: ⑴从ASTRAL-1.65数据库中选取序列一致性小于25%的非冗余子集,包含α、β、α/β类蛋白共2406个,根据折叠核心二级结构片段的空间排布和拓扑连接,进行蛋白质折叠类型分类,对于序列、二级结构等信息提供了详细的注释。LIFCA包含259个折叠类型,覆盖了SCOP中244个折叠子。 ⑵为解决LIFCA数据库中36个折叠类型无法建立统一模型的问题,根据蛋白质结构差异量化指标RMSD,建立了折叠类型内部样本的两两距离关系,通过系统聚类方法生成了176个折叠子类。为LIFCA-HMM库的完善奠定了基础,也为蛋白质分类研究拓展了新的方法和思路。 ⑶对71个折叠类型与176个折叠子类中的样本分别进行MUSTANG结构比对,训练出247个Profile-HMM模型,形成完整的LIFCA-HMM库。 ⑷以序列一致性小于95%的Astral-1.65序列库为检验集,单模型及全模型库的折叠识别检验精度均很高。为了评价所用方法的识别性能,我们引入ROC分析,结果理想。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号