首页> 中文学位 >机器学习方法预测蛋白质结构域与配体的相互作用;利用色谱保留时间辅助多肽的质谱鉴定
【6h】

机器学习方法预测蛋白质结构域与配体的相互作用;利用色谱保留时间辅助多肽的质谱鉴定

代理获取

目录

序言

第一部分机器学习方法预测蛋白质结构域与配体的相互作用

摘要

缩略语

前言

材料与方法

结果与讨论

讨论

结论

参考文献

附录

第二部分利用色谱经验保留时间辅助多肽的质谱鉴定并降低假阴性

摘要

缩略语

前言

材料与方法

结果与讨论

讨论

结论

参考文献

附录

第三部分文献综述 非标记定量蛋白质组学研究进展

致谢

发表论文一

发表论文二

展开▼

摘要

很大一部分的蛋白质相互作用是通过多肽结合型的结构域来介导的,这种结构域包括SH2,SH3,PDZ和MHC等等。然而用实验的方法筛选这些结构域结合的配体费时费力,而且,由于高丰度配体的抑制作用,实验方法很难筛选到低丰度的配体。一种理想的研究蛋白质相互作用的方法就是通过计算机高通量的筛选蛋白质序列数据库,然后再用实验的手段验证计算机预测出来的最可能的相互作用。目前的预测系统通常都在有限样本的交叉验证中表现良好,但这并不能保证他们在实际的数据库筛选中仍有好的表现。本文采用了三种新型的蛋白质序列编码方式,使用机器学习的方法建立了一个整合的预测系统,筛选了Swissprot和Genbank蛋白数据库来预测10个SH3和3个PDZ结构域的配体。预测结果中的部分配体蛋白已经被其他研究者的实验证实为阳性,这说明该系统具有良好的预测能力,它的预测结果对后续的验证实验具有一定的指导意义。 在应用二级质谱图鉴定多肽时,为了降低鉴定的假阳性率,通常会提高检索软件的阈值设定,这种行为导致了多肽鉴定的假阴性率的提高,大大降低了蛋白质组研究的效率。本文构建了经验的多肽保留时间数据库(Empirical Peptide RetentionTime,EPRT),在二级质谱鉴定中引入了保留时间作为新的参数。在新的实验中,谱图质量低于一定标准的的多肽鉴定,其保留时间还要和它们在EPRT数据库中的经验保留时间相比较,来进一步决定它们是否为阳性鉴定。在18个标准蛋白混合物和尿蛋白质组的实验中,应用保留时间辅助,使鉴定的阳性谱图数增长了15%-60%,阳性多肽数增长了8%-18%。不考虑谱图的质量,仅使用保留时间新鉴定出的谱图的假阳性率为3.7%;如果加上最低的Xcorr阈值来控制谱图质量,则假阳性率降低为0.18%。这种方法可以鉴定出一些不合标准的低丰度多肽的谱图。另外,EPRT数据库也增加了多肽鉴定的可信度,这对那些仅由一张二二级质谱图鉴定出的多肽来讲尤其重要。随着更多的多肽的经验保留时间被收集到EPRT数据库中,质谱鉴定的效率会进一步提高。该方法可应用在任何标准的、可重复的分离系统中。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号