首页> 中文学位 >蛋白质分子溶剂化能的表面加和模型研究
【6h】

蛋白质分子溶剂化能的表面加和模型研究

代理获取

目录

文摘

英文文摘

声明

引言

1溶剂效应

1.1溶剂化能

1.2溶剂化模型

1.2.1 Poisson-Boltzmann模型

1.2.2 Born模型

1.2.3表面加和模型

2多元统计分析

2.1多元统计分析介绍

2.2多重相关性

2.2.1多重相关性的含义

2.2.2多重相关性的危害

2.3主成分回归分析

2.4典型相关分析

2.4偏最小二乘回归分析

2.4.1基本原理

2.4.2单变量偏最小二乘回归分析

2.4.3成分数的确定

3 PLSOLV模型的建立

3.1数据样本的选取和预处理

3.2样本的拟合标准值

3.3氨基酸原子

3.4模型参数的拟合

3.4.1 PLS成分数的确定

3.4.2溶剂化参数的拟合

4结果与讨论

4.1探针水分子半径对模型的影响

4.2模型选取的成分数

4.3模型的拟合质量和预测效果

4.4 PLS成分的精度分析

4.5氨基酸原子对溶剂化能的解释能力分析

结论

参考文献

附录A 氨基酸原子参数列表

攻读硕士学位期间发表学术论文情况

致谢

展开▼

摘要

溶剂效应对许多化学和生命过程都是十分重要的,比如蛋白质分子的折叠,分子对接以及生物分子之间的相互作用等。溶剂化过程可被定义为在常温下,溶质分子从真空的一个固定位置移至溶剂中的一个固定位置的过程。溶剂效应的一个关键参数就是溶剂化能,它表示将溶质分子从真空移至溶剂中自由能的变化值。在对溶剂分子采用连续介质模型的基础上,至今已有很多模型在对蛋白质分子溶剂化能进行预测,这其中包括把本文主要介绍的表面加和模型。表面加和模型的基本假设就是溶质分子在溶液中的溶剂化能可以由不同的原子类型或基团对溶剂化能贡献的加和得到,相对于其他方法,表面加和模型避免了静电模型的选择,最大的节省了计算时间。 在以往的相关模型中,在对原子类型的分类问题上基本根据原子所处的化学环境将它们划分为不同的原子类型,但是这种分类方式主要基于化学经验,分类后的原子类型变量之间会产生严重的多重相关性,对溶剂化参数的拟合产生一定的影响。为了解决上述问题,本文提出了一种新的计算蛋白质分子溶剂化能的表面加和模型PLSOLV。不同于以往模型,在处理蛋白质分子时,PLSOLV模型不完全根据化学经验划分原子类型,而只是对氨基酸中的221种原子,采用偏最小二乘回归分析方法,对它们所携带的溶剂可及表面积信息进行成分提取,再进行参数拟合,避免了变量间由于多重相关性所带来的影响。模型随机选取了1000个蛋白质分子样本组成训练集,由于蛋白质分子溶剂化能少有文献报道,样本的溶剂化能标准值采用PBSA方法计算得到。通过提取的PLS成分,模型得到每种氨基酸原子的溶剂化参数,并对测试集中的100个蛋白质分子的溶剂化能进行预测,预测值与PBSA标准值之间呈现了很好的相关性(R=0.98)。最后,PLSOLV模型通过变量投影重要性指标(VIP)分析方法,列出了每种氨基酸原子对蛋白质分子溶剂化能的解释能力值,并通过比较分析,解释了不同性质的氨基酸或基团对蛋白质分子溶剂化能的影响。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号