基于逐步判别分析的蛋白质序列信息提取的方法研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

人类基因组计划的实施使得蛋白质的一级结构数据与日俱增.但是,人们对蛋白质的三级结构和功能的认识却远远落后于一级结构的积累.后基因组时代迫切需要人们寻找有效的理论方法来从蛋白质一级结构预测三级结构和功能,以便于基础研究或在医学、农业及工业生产中的应用.在这样的前提下,文中提出了一种有效地从氨基酸序列来提取信息,提高预测准确率的新方法.该方法基于多元统计中的逐步判别分析,在每次循环中选取一些相对较为重要的肽,用来产生新的更长的肽.最后用选取的氨基酸和肽进行判别,结果比已有方法有很大改善.文中主要工作如下:1、对三个不同的结构类数据库进行预测,准确率比以往方法高15到20个百分点.2、用从较大的数据库(PDB40-b)中提取出的参数来预测较小的库(PDB40-j),超过80﹪的序列被准确地判别出其结构类型,准确率仍比其它方法高.3、对于其中两个数据库,随机地从中取一部分序列作为检验集,将剩余的序列作为训练集,用从原数据库中选取的变量进行预测.反复进行100次,预测结果都比较高,和1中结论没有很大差距,显示该方法的有效性.4、用从较大数据库中提取的变量进行典型判别,寻找与组有最大可能多重相关的变量的线性组合,得到三个典型变量.用它们作三维描点图,各类数据被很好的区分.5、用该方法对蛋白质亚细胞位置进行预测,也得到很好的预测结果.且所选变量的生物意义比较明显.

著录项

作者
罗瑞艳;
展开▼
作者单位

天津大学;

展开▼
授予单位天津大学;
学科应用数学
授予学位硕士
导师姓名刘嘉焜;
年度 2002
页码
总页数
原文格式 PDF
正文语种中文
中图分类基因工程（遗传工程）;
关键词
逐步判别; 典型判别; 亚细胞位置; 氨基酸组成; AAC; 分量耦合算法;

相似文献

中文文献
外文文献
专利

1. 用相似性方法研究三叶草家族蛋白质序列-结构关系 [J] . 许瑞珍 ,杨雄波 . 科技信息 . 2009,第031期
2. 用非线性预测方法研究蛋白质序列的特性(Ⅰ) [J] . 管维红 ,徐振源 ,朱平 . 食品与生物技术学报 . 2008,第001期
3. 用非线性预测方法研究蛋白质序列的特性(Ⅱ) [J] . 管维红 ,徐振源 ,朱平 . 食品与生物技术学报 . 2008,第002期
4. 用模糊聚类和逐步判别分析方法识别低电阻率油气层的方法研究 [J] . 赵继文 ,李能根 ,杨光惠 . 物探化探计算技术 . 2000,第002期
5. 基于太赫兹辐射的糖类异构体信息提取方法研究 [J] . 燕芳 ,张俊林 ,毛莉程 . 光谱学与光谱分析 . 2022,第1期
6. 基于中医四诊和脑肠肽的IBS-D中医证候逐步判别分析 [C] . Hao-meng WU ,吴皓萌 ,Zhi-wei XU . 中华中医药学会中医基础理论分会第八次学术年会 . 2014
7. 基于分子进化模型的蛋白质序列特征提取及分类方法研究 [A] . 沈倚天 . 2021

基于逐步判别分析的蛋白质序列信息提取的方法研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅