首页> 中文学位 >卵巢癌蛋白质质谱数据分析模型研究
【6h】

卵巢癌蛋白质质谱数据分析模型研究

代理获取

目录

声明

摘要

缩略词

第一章 绪论

1.1 基因突变与癌症发生

1.2 卵巢癌现状与早期癌症诊断

1.3 质谱分析模型研究的目的及意义

1.4 论文的主要工作及结构

1.4.1 论文的主要工作

1.4.2 论文的结构

第二章 低分辨率卵巢癌的数据分析

2.1 实验数据集

2.2 实验方法

2.2.1 删除无效数据

2.2.2 局部最大值搜索(LMS)峰值检测和量化

2.2.3 特征选择算法

2.2.4 支持向量机学习分类算法

2.2.5 特征子集相似性分析和主成分分析

2.3 实验结果

2.3.1 LMS峰值检测和参数探究结果

2.3.2 Relief算法与其他降维算法的比较

2.3.3 特征子集相似性分析和主成分分析结果

2.4 讨论

第三章 高分辨率卵巢癌的数据分析

3.1 实验数据集

3.2 实验方法

3.2.1 删除无效数据和等间距分组

3.2.2 局部最大值搜索(LMS)峰值检测和量化

3.2.3 特征选择算法

3.2.4 F-score-Relief特征加权选择算法

3.2.5 支持向量机学习分类算法

3.2.6 特征子集相似性分析和主成分分析

3.3 实验结果

3.3.1 LMS峰值检测和参数探究结果

3.3.2 FRW算法与其他算法的分类结果比较

3.3.3 样本方差CV的限制和K-S检验算法降维结果

3.3.4 特征子集相似性分析和主成分分析结果

3.4 讨论

第四章 总结与展望

4.1 总结

4.2 展望

附录

参考文献

致谢

攻读学位期间发表的学术论文

展开▼

摘要

癌组织在病理状态表达的蛋白质和肽丰度会出现异常变化,在特定癌症的肽表达中找到一组最佳的蛋白质或多肽标记物,可临床用于特定类型的癌症诊断分析。
  本文介绍了一种基于局部最大值搜索(LMS)峰值检测算法和Relief算法的新方法,在应用于MALDI-TOF低分辨率数据,可以更准确的实现分类判别。该方法包括局部最大值搜索(LMS)峰值检测算法,Relief特征选择算法和支持向量机的学习分类法。对低分辨率的卵巢癌数据集8-7-02而言,LMS算法经参数优化可以非常有效的用于峰值检测。在本数据集上Relief算法对LMS检测的峰值进行特征选择时体现出了良好的性能。至于学习分类器,支持向量机进行预测分类的测试精度,在识别癌症组和健康组时取得了满意的性能结果。LMS的最佳参数集是通过控制变量的方法实现的,取得了99.9738%的平均精确度(标准差为0.0018),在1000个独立的10折交叉验证中得到97.7437%的平均特异性(标准差为0.0109)。
  本文提出了一种新的特征加权选择算法,该算法通过求F-score算法和Relief算法的联合权重,实现了高分辨率的MALDI-TOF质谱数据更精确分类。我们归纳了数据处理的“四步走”战略:(1)原始质谱数据对齐后按一定距离等间距分组,(2)局部最大搜索峰值检测算法(LMS)进行峰值检测,(3)新的特征加权选择算法(FRW)用来进行特征选择,(4)支持向量机进行癌症组和健康组的分类甄别。LMS的最佳参数集也是通过控制变量的方法实现的,取得了97.4167%的平均精确度(标准差为0.0146),在1000个独立的10折交叉验证中得到最佳特异性为98.6111%。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号