首页> 中文学位 >基于正反库特征信息匹配的蛋白质二级质谱鉴定算法
【6h】

基于正反库特征信息匹配的蛋白质二级质谱鉴定算法

代理获取

目录

封面

声明

中文摘要

英文摘要

目录

第1章 引言

第2章 蛋白质二级质谱鉴定主流算法

2.1 基于关联匹配模型的Sequest算法

2.2 基于概率统计的匹配模型的ProVerB算法

2.3 随机匹配模型

2.4 FDR质量控制

第3章 基于正反库特征信息匹配的蛋白质二级质谱鉴定算法

3.1 MS/MS数据集

3.2 MS/MS数据集处理

3.3 MS/MS 数据库及仪器精度

3.4 理论图谱的产生

3.5 同位素峰合并

3.6 有效峰的选取

3.7 基于正反库特征信息的提取

3.7.1 训练集的提取

3.7.2 基于正反库匹配信息统计思想

3.7.3 统计结果的相关性

3.7.4 特征信息的数学定量

3.8 打分函数

3.8.1 碎片离子峰的匹配打分模型

3.8.2碎片峰连续匹配打分模型

3.8.3 b/y离子峰的匹配打分模型

3.8.4 肽段匹配总分值

3.9 PepFind鉴定结果

3.9.1 PepFind与主流算法软件Mascot,Sequest结果比较

3.9.2 PepFind基于FDR质量控制分析

3.9.3 PepFind算法的可靠性

3. 9. 4 多种蛋白质二级质谱鉴定算法搜索结果比较

第4章 总结与展望

参考文献

附录:PepFind软件统计主程序

在学位期间发表的学术成果

致谢

展开▼

摘要

在数据库搜索方法中,实验图谱与数据库中所有可能的候选肽段之间的匹配打分(肽段匹配打分模型)是蛋白质二级质谱鉴定算法的核心。由于串联质谱图通常带有复杂的噪声,使得目前没有任何一种数据库搜索算法可以鉴定到样品中所有的肽段序列,各种搜索算法的肽段匹配打分函数只能采用不同的方式考虑更多的串联图谱的特征和影响因素来增加肽段的鉴定量。目前,大部分数据库搜索算法的匹配打分函数主要考虑实验图谱和理论图谱匹配峰的个数,连续匹配峰的个数,理论峰个数和预设峰强度等特征。ProVerB通过考虑不同配对氨基酸(碎片离子峰前后氨基酸)的峰强度特征,其鉴定量与Mascot和Sequest相比有显著提高,可见考虑增加串联图谱新特征信息可以显著提高肽段的鉴定量。  在本文中,我们提出了一种基于全新概念下的蛋白质二级质谱鉴定算法PepFind,该算法主要通过统计不同类型实验峰与正反库理论峰在不同误差范围及强度区间下的匹配情况,进而提取出串联图谱的新特征信息并进行数学定量,最后将已被定量的新特征信息融入至蛋白质二级质谱鉴定算法打分模型。为了验证PepFind算法的可靠性,我们将利用不同质谱平台下产生的数据集对该算法进行测试,并与目前被广泛应用的商业及相关开源蛋白质二级质谱鉴定软件在FDR为1%的条件下所得鉴定结果进行对比分析,结果表明PepFind对实验图谱具有更好的鉴定量及灵敏度。最后,我们希望PepFind的思想能为相关研究者提供参考。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号