略缩词列表
1 绪 论
1.1.1 组学技术
1.1.2不同组学之间的生物学关系
1.1.3 蛋白质组学和代谢组学的优势
1.2 基于MS的蛋白质组学和代谢组学在生物医学研究中的应用
1.2.1 应用于发病机制研究
1.2.2 应用于药物的发现与开发
1.2.3 应用于精准医学
1.3.1 生物信息学简介
1.3.2 生物信息学对蛋白质组学和代谢组学研究的影响
1.3.3 生物信息学中的数据挖掘
1.4 基于MS的组学数据分析中存在的科学问题及对策
1.4.1 数据预处理
1.4.2 特征选择方法
1.4.3 生物标志物不稳定
1.5 研究内容和研究创新点
2 基于MS的代谢组学数据预处理方法研究
2.1 背景
2.2 材料与方法
2.2.1 用于信号校正和数据标准化的方法
2.2.2 预处理方法的评估标准
2.2.3 输入文件、数据格式
2.2.4 研究中采用的基准数据集
2.3 结果与讨论
2.3.1 NOREVA的构建和总览
2.3.2 NOREVA中的案例研究
2.4 本章小结
3 基于MS的蛋白组学数据预处理方法研究
3.1 背景
3.2 材料与方法
3.2.1 ANPELA中使用的蛋白质定量工具和数据预处理方法
3.2.2 评估LFQ数据处理流程性能优劣的标准
3.2.3ANPELA web框架的设计和实施
3.3.1 ANPELA流程及功能总览
3.3.2 ANPELA发现新性能最优的数据处理方法
3.3.3 在多个标准下性能同时提高的可行性分析
3.3.4 ANPELA进行多个角度性能评估
3.3.5 基于加标蛋白质和背景蛋白质验证LFQ的准确性
3.4 本章小结
4 基于MS的蛋白质组学特征选择方法的评估
4.1 背景
4.2 材料与方法
4.2.1 基于MS的微生物蛋白质组学数据集的收集
4.2.2 微生物定量蛋白质组学数据的预处理
4.2.3 本研究采用的特征选择方法
4.2.4 使用已知加标蛋白质的信息评估特征选择方法
4.2.5 评估特征选择方法的预测分类能力
4.2.6 特征选择方法性能的聚类分析
4.3.1 数据预处理
4.3.2 评估特性选择方法在预测分类性能上的表现
4.3.3 特征选择方法在预测分类性能上的一致性
4.3.4 评估特征选择方法在筛选真阳性差异蛋白质上的性能
4.3.5 特征选择方法在筛选真阳性差异蛋白质数目上的一致性
4.4 本章小结
5 基于新型稳定识别算法的垂体瘤代谢组学分析
5.1 背景
5.2.1 受试者特征
5.2.2 样品制备和非靶向代谢组学分析
5.2.3 质量控制和数据预处理
5.2.4构建基于一致性评分的稳定标志物识别算法
5.2.5 差异代谢特征离子的稳定性和可靠性评估
5.2.6 代谢物通路富集分析
5.3.1 非靶向代谢组学数据的质量评估
5.3.2 样本大小的分析
5.3.3 基于2种标准分析差异代谢特征的稳定性和预测分类能力
5.3.4 垂体瘤差异代谢物的鉴定和注释
5.3.5 富集分析揭示了脂质代谢紊乱
5.4 本章小结
6 结论与展望
6.1 主要结论
6.2 工作展望
参考文献
附录
A. 作者在攻读博士学位期间发表及拟发表论文目录
B. 作者在攻读学位期间参加的科研项目目录
C. 作者在攻读学位期间学术进修经历
D. 无标定量蛋白质组学数据分析工具中的数据预处理方法的比较
E. ANPELA单机版的详细操作步骤
F. 基于8组DDA数据集的数据处理流程的PCV值的分类图
G. 基于7组SWATH-MS数据集的PCV结果
H. 基于 PXD001064 数据集在精确度和稳定性两个标准下的评估结果
I. 不同浓度基准数据的数据处理流程在准确度评估下的结果
J. 基于PXD002099数据集中10组不同浓度比的RLA图
K.基于CPTAC Study 6数据集中10不同浓度比的RLA图
L. 基于PXD001819数据集中10不同浓度比的RLA图
M. 基于三组加标蛋白数据集中10不同浓度比的PMAD分布图
N. 由随机抽样产生的20组样本集所筛选的特征离子统计
O. 学位论文数据集
致谢
重庆大学;