基于不同氨基酸分布的蛋白质超家族的识别

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

蛋白质超家族是由一个或多个不同的蛋白质家族组成的，这些家族成员序列间的一致性(identity)较低，但从它们的结构和功能特征上看却有来自共同起源的可能性，因此通过序列比对寻找它们共同的序列模体成为常用的识别蛋白质超家族和家族的方法。除了序列比较的方法外，氨基酸的物理化学性质也是决定蛋白质折叠的重要因素，其中氨基酸的亲水模式和疏水模式被认为是最保守的。本文首先选取了单个氨基酸的物理化学性质及其关联分布作为参数(定义为“3p参数”)，使用最小离散增量方法对同一结构类中的不同超家族进行了识别。对全α类的4个超家族self-consistency检验为83.1％，jack-knife检验为80．7％；对全β类的4个超家族self-consistency检验和jack-knife检验均为80.9％；对α+β类的4个超家族两种检验的结果分别为88.6％，88.0％；识别α／β类的4个超家族时，两种检验的结果分别为69.3％，67.6％。脯氨酸、甘氨酸、半胱氨酸对结构的形成有巨大的影响，鉴于这三种氨基酸的特殊性，在选取单个氨基酸的物理化学性质及其关联分布作为参数的同时，把它们在各个分段中出现的个数作为另外一部分参数，称之为“6p参数”。以6p参数作为最小离散增量方法中的离散源，对同一组超家族进行识别的结果较选取3p参数有了较大的提高，对全α类的4个超家族进行识别， self-consistency检验和jack-knife检验分别为93.1％，92.9％；对全β类的4个超家族，两种检验的结果分别为91.5％和90.5％；对α+β类的4个超家族，两种检验的结果分别为92.0％，91.8％；对α／β类的4个超家族，两种检验的结果分别为78.3％，76.4％。通过一系列的参数选择和计算，并综合考虑蛋白质的整体信息，选取20个氨基酸使用频数、400个氨基酸二联体使用频数以及前面所讨论过的“6p参数”分别作为最小离散增量方法中的离散源，通过离散增量的计算分别打分并综合评比识别同一组蛋白质超家族，对全α类的4个超家族，self-consistency检验和jack-knife检验可达96.0％，94.4％；对全β类的4个超家族，两种检验分别为91.4％和91.0％；对α+β类的4个超家族，两种检验总成功率分别为95.6％，94.7％；识别α／β类的4个超家族时两种检验的结果分别为87.0％和85.7％。对超家族数据库中氨基酸的亲疏水关联分布进行了简单的分析和讨论。最后，分别在前面所用的超家族数据库和蛋白质结构类数据库的基础上讨论了氨基酸关联的不同表示方式对结果的影响。

著录项

作者
刘芬;
展开▼
作者单位

内蒙古大学;

展开▼
授予单位内蒙古大学;
学科生物物理学
授予学位硕士
导师姓名李前忠;
年度 2006
页码
总页数
原文格式 PDF
正文语种中文
中图分类蛋白质的一级结构;分子生物物理学;
关键词
蛋白质超家族; 超家族识别; 亲疏水分布; 最小离散增量; 氨基酸关联;

相似文献

中文文献
外文文献
专利

1. 基于氨基酸亲疏水分布的最小离散增量方法识别蛋白质超家族 [J] . 刘芬 ,李前忠 . 内蒙古大学学报：自然科学版 . 2006,第4期
2. 虫草不同部位氨基酸和蛋白质的分布研究 [J] . 李聪 ,梁晓原 . 氨基酸杂志 . 1993,第004期
3. 基于氨基酸组成分布的蛋白质同源寡聚体分类研究 [J] . 施建宇 ,潘泉 ,张绍武 . 生物物理学报 . 2006,第001期
4. 不同品种精白米必需氨基酸、总氨基酸和蛋白质含量的相关分析 [J] . 张顺 ,李志坚 ,张跃飞 . 湖北农业科学 . 2020,第002期
5. 不同蛋白质水平的氨基酸平衡日粮对泌乳母猪生产性能、血清指标和乳汁氨基酸含量的影响 [J] . 董志岩 ,刘亚轩 ,刘景 . 福建农林大学学报（自然科学版） . 2013,第003期
6. 中国不同城市0-12月不同泌乳阶段母乳蛋白质和氨基酸构成的纵向研究 [C] . 逄金柱 ,刘正冬 ,贾妮 . 2017中国乳制品工业协会第二十三次年会 . 2017
7. 蛋白质超家族模体特征的分析与超家族的识别 [A] . 马淑杰 . 2009

基于不同氨基酸分布的蛋白质超家族的识别

目录

摘要

著录项

相似文献

相关主题

期刊订阅