首页> 中文学位 >蛋白质相互作用预测方法的研究与蛋白质超二级结构预测系统的开发
【6h】

蛋白质相互作用预测方法的研究与蛋白质超二级结构预测系统的开发

代理获取

目录

文摘

英文文摘

论文说明:图表目录

声明

第1章绪论

1.1研究背景和意义

1.2蛋白质相互作用概述与相关预测方法介绍

1.3蛋白质结构预测概述与相关预测方法介绍

1.4本文研究工作和论文结构

第2章 基于氨基酸序列局域编码的蛋白质相互作用预测

2.1引言

2.2基于氨基酸局域编码的蛋白质特征提取

2.2.1氨基酸的分类

2.2.2区域编码

2.2.3蛋白质特征表示和蛋白质对的编码

2.3数据集

2.4相关机器学习方法

2.4.1最近邻算法

2.4.2支持向量机

2.5预测模型评价指标

2.6构建预测模型

2.6.1最近邻算法的参数优化

2.6.2蛋白质对的不同特征表示方法的优化

2.6.3最终预测模型的确定

2.7预测结果和讨论

2.8本章小结

第3章 基于径向基函数神经网络的β-发夹预测系统的开发

3.1引言

3.2数据集

3.3自协方差编码

3.4径向基函数神经网络

3.5基于径向基函数神经网络的β-发夹预测结果和讨论

3.6基于径向基函数神经网络的β-发夹预测系统介绍

3.6.1基于径向基函数神经网络的β-发夹预测系统技术特点和功能

3.6.2基于径向基函数神经网络的β-发夹预测系统的界面和功能说明

3.7本章小结

总结和展望

参考文献

致 谢

在读期间发表的学术论文与取得的研究成果

展开▼

摘要

蛋白质间相互作用以及蛋白质构象和功能等问题已是后基因组时代的重要课题。伴随着高通量的实验手段的出现,生物学数据在量上急速增长。海量的生物学数据迫切需要我们发展计算学方法来研究蛋白质间相互作用以及蛋白质构象和功能。本文正是从计算学的角度来研究蛋白质相互作用和蛋白质的超二级结构预测。本文的工作主要包括以下几个方面:
   (1)提出了一种仅基于蛋白质序列信息的蛋白质相互作用预测方法。从蛋白质序列出发,通过将一种有效的氨基酸分类方法与区域编码方法相结合构成了本文中的区域蛋白质序列编码方法。提出的这种新的蛋白质序列编码方式能够充分地捕获序列上多个重叠的连续和间断的残基结合模式,从而更精确的描述了蛋白质相互作用信息,因为蛋白质相互作用的一个重要特征是相互作用经常发生在序列上的间断区域,在这些区域中,那些序列上相距较远的残基通过蛋白质的折叠从而在空间上相距很近。我们提出的区域蛋白质序列编码方法与最近邻算法相结合的蛋白质相互作用预测模型在酿酒酵母蛋白质相互作用数据集上有着优异的表现。对于独立数据集大肠杆菌蛋白质相互作用数据集的预测结果表明我们提出的区域蛋白质序列编码方法有着优异和稳定的表现。考虑到蛋白质相互作用的复杂实质,我们提出的方法是对蛋白质相互作用预测手段的一个有效补充。
   (2)提出了一个基于神经网络的新方法来预测蛋白质中的β-发夹结构。不同于此前的方法,我们的方法采用了径向基函数神经网络并结合蛋白质序列的自相关编码方式来预测β-发夹结构。自协方差编码方式是一种基于氨基酸残基序列相关系数的编码方式,该编码方式同时考虑序列内部长程相互作用和序列之间的协同进化关系,从生物学角度来看更符合蛋白质序列是长程相关的这一事实。径向基函数神经网络是一种新颖有效的前向型神经网络,具有较高的运算速度和外推能力。在我们的方法中,机器学习方法径向基函数神经网络首次应用于β-发夹结构预测并取得不错的效果。
   (3)在提出的新方法基础上我们进一步开发出了基于径向基函数神经网络的β-发夹预测系统,该β-发夹预测系统借助现代模式识别技术,实现了对于输入的氨基酸序列进行一系列运算包括二级结构预测,ECE模式序列提取,自协方差编码方式来提取蛋白质序列片段的特征信息,利用软件内镶嵌的基于径向基函数神经网络的分类系统根据所提取的特征进行识别,预测输入的氨基酸序列是否具有β-发夹结构。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号