首页> 中文学位 >基于串联质谱数据进行蛋白质序列库搜索算法初探
【6h】

基于串联质谱数据进行蛋白质序列库搜索算法初探

代理获取

目录

文摘

英文文摘

声明

第一章绪论

1.1蛋白组学简介

1.1.1蛋白组学的基本概念

1.1.2蛋白组学的发展

1.2质谱基础

1.2.1质谱的概念

1.2.2质谱技术简介

1.2.3诱导碰撞解离(CID)

1.3质谱用于蛋白质组分析

1.3.1质谱用于蛋白质定性分析

1.3.2质谱用于蛋白质定量分析

1.3.3质谱用于蛋白质相互作用分析

1.4本论文研究内容

第二章基于串联质谱数据搜索蛋白质库的蛋白质定性方法

2.1蛋白质序列库

2.1.1蛋白质序列库简介

2.1.2综合数据库平台

2.1.3蛋白质数据库的缺陷

2.2蛋白质序列库搜索算法

2.2.1蛋白质库搜索算法

2.2.2蛋白质库搜索算法的缺陷

2.3搜索参数对搜索结果的影响初探

2.4蛋白质序列定性

2.5结论

第三章蛋白质库搜索结果的可靠性分析初探

3.1蛋白质库搜索结果的可靠性分析

3.1.1基于机器学习的判别分析方法

3.1.2基于统计模型的分析方法

3.1.3结合不同搜索工具的分析方法

3.2翻转蛋白质数据库(Decoy Protein Database)的应用

3.2.1基本概念

3.2.2 Decoy库的应用

3.3化学计量学方法用于蛋白质库搜索结果的可靠性分析初探

3.4结论

第四章问题及展望

参考文献

致谢

攻读学位期间主要研究成果

展开▼

摘要

蛋白质序列库搜索方法为液相-串联质谱联用仪产生的高通量质谱数据提供了快速的分析方式,使生物样品中的蛋白质可以得到快速定性定量分析。然而,该过程仍然存在很多问题。本论文初步研究了蛋白质序列库搜索算法及对搜索结果进行分析的算法,并尝试采用化学计量学方法对蛋白质库搜索结果进行判别分析。 在第二章中,论文对当前广泛采用的蛋白质序列库,库搜索算法及蛋白质定性方法进行了介绍。同时对由五种不同质谱仪产生的质谱数据的SEQUEST搜索结果,及不同参数条件下的Mascot搜索结果进行对比,发现在不同条件下得到的结果相差较大,并且在所有的结果中存在大量的错误匹配。 为了对蛋白质序列库搜索结果进行分析,并最大限度地消除错误结果的影响,大量的分析算法被开发出来,论文在第三章中对这些算法进行了介绍,并尝试采用化学计量学中的模式识别方法对搜索结果进行判别分析,认为化学计量学方法可以明显消除SEQUEST搜索结果中假阳性结果的影响。但对于Mascot搜索结果,这些方法无明显提高结果中的准确率。而采用Decoy库搜索结果估计Mascot正常蛋白质库搜索结果中的错误率亦存在错误估计的风险。 因此,如何更好地提高蛋白质库搜索结果的准确率并提供更加可靠的分析方法需要得到更多的研究,第四章对蛋白质库搜索方法进行了展望。目标蛋白组学提供的新思路及当前大量共享的数据为我们在这方面进行更加深入的研究提供了机遇。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号