蛋白质超二级结构库的建立及其序列统计分析

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

蛋白质是生命活动的物质基础,生命活动几乎都是通过蛋白质实现的,而蛋白质的功能又与其结构紧密相关。所以知道一个蛋白质的结构对了解其功能是非常关键的。目前,在Swiss-prot(8.7版本)库中包含3421677个已知一级序列的蛋白质,而在PDB(2006.9.19)库中只包含38882个已知结构的蛋白质。实验测定的蛋白质结构比已知的蛋白质序列要少得多。实验测定蛋白质结构主要有X射线衍射法、核磁共振法等技术,但过程非常复杂,且代价较高。Anfinsen提出假说:蛋白质一级结构决定着蛋白质的空间结构。因此从蛋白质序列出发预测空间结构,揭示生物分子数据的内涵是生物信息学的重要研究课题。但直接从蛋白质的序列出发来预测高级结构仍很困难,尤其是三级结构的预测。已有报告表明蛋白质折叠主要由许多简单的超二级结构单元构成,由超二级结构获得的结构信息可用于三级结构的预测。如果知道了蛋白质简单超二级结构的模体构象,再预测三级结构,那么问题就会简单得多。所以蛋白质超二级结构预测是从一级序列预测三维结构的桥梁。本文主要工作是蛋白质超二级结构库的建立及其序列的统计分析:选取了SCOP数据库1.69版本中同源性小于40％的蛋白质6819,从PDB库中都找到每一个氨基酸对应的二级结构,在对蛋白质序列分析、整理基础上,给出五类超二级结构序列模式α-α、α-β、β-α、β-βhairpin和β-βlink共61824个;并根据Loop的长度进一步分类,建立了相应的蛋白质超二级结构数据库;并对五类蛋白质超二级结构序列所含20种氨基酸的概率作了统计分析,与相关工作做了比较,得到蛋白质超二级结构中的一系列有益信息;最后利用Fisher判别法对蛋白质超二级结构中Strand-Loop-Strand两类模体进行分类,得到较好效果。

著录项

作者
李彩艳;
展开▼
作者单位

内蒙古工业大学;

展开▼
授予单位内蒙古工业大学;
学科计算数学
授予学位硕士
导师姓名胡秀珍;
年度 2007
页码
总页数
原文格式 PDF
正文语种中文
中图分类生物学实验与生物学技术;
关键词
蛋白质; 超二级结构; 数据库技术; 序列统计;

相似文献

中文文献
外文文献
专利

1. 蛋白质超二级结构序列片段的统计分析 [J] . 李彩艳 ,丁海麦 ,马勇 . 医学信息 . 2010,第003期
2. 蛋白质超二级结构的分类及LOOP序列的统计分析 [J] . 李彩艳 ,胡秀珍 . 内蒙古工业大学学报（自然科学版） . 2008,第001期
3. 蛋白质中五类超二级结构模体的统计分析 [J] . 李彩艳 ,丁海麦 . 安徽农业科学 . 2012,第026期
4. 基于组合的序列特征识别蛋白质复杂超二级结构βαβ模体 [J] . 孙利霞 ,胡秀珍 ,李少波 . 内蒙古工业大学学报（自然科学版） . 2015,第003期
5. 蛋白质中较频繁发生的β发夹结构（β—Hairpins）模式──蛋白质超二级结构（MOTIF）研究（Ⅲ） [J] . 孙之荣 . 生物物理学报 . 1994,第4期
6. 利用神经网络和一致结构序列预测蛋白质二级结构 [C] . 李小妹 ,王能超 . 2005第一届中国分类技术与应用研讨会（CSCA） . 2005
7. 蛋白质复杂超二级结构βαβ模体的统计分析与识别 [A] . 孙利霞 . 2013

蛋白质超二级结构库的建立及其序列统计分析

目录

摘要

著录项

相似文献

相关主题

期刊订阅