首页> 中文学位 >基于支持向量机的蛋白质温热性识别与亚细胞定位预测
【6h】

基于支持向量机的蛋白质温热性识别与亚细胞定位预测

代理获取

目录

文摘

英文文摘

声明

第一章 绪论

引言

1蛋白质温热性识别

1.1常温嗜热蛋白概念及特性

1.2蛋白质温热性研究背景

2蛋白质亚细胞定位预测

2.1蛋白质亚细胞定位定义和意义

2.2亚细胞定位预测研究现状

3支持向量机原理

3.1概况

3.2统计学习理论

3.3支持向量机分类

3.4支持向量机回归

3.5快速训练算法及其具体操作

第二章 蛋白质温热性识别

1.数据集选取

2.理论方法

2.1特征提取方法——多尺度组分与关联

2.2数据标准化转换

2.3程序源代码

2.4技术路线流程图

3结果和讨论

第三章 亚细胞定位预测

1数据集选取

2理论方法

2.1“留一法”(jackknife)

2.2 M次交叉测试法(M-fold Cross validation)

2.3预测结果评价标准

3结果和讨论

参考文献

附录

致谢

作者简介

展开▼

摘要

蛋白质模式识别是后基因组时代生命科学中最重大的研究课题之一,蛋白质温热性识别和蛋白质亚细胞定位则是蛋白质模式识别研究中两个新兴的富有挑战性的问题。本文基于蛋白质结构与其功能的联系,从蛋白质的氨基酸序列出发,提出了基于序列前后组分与关联的特征提取方法,并采用支持向量机方法进行预测,取得了较理想的预测精度。本研究不仅对理解蛋白质结构与功能关系具有一定的理论价值,更对生物制药业、农业生物科技等多个应用领域具有直接或者间接的指导作用。 结论如下: 首先为绪论。该章综合介绍蛋白质温热性和亚细胞定位的研究背景、发展现状等,并简述新近迅速发展起来的机器学习方法——支持向量机。 其次为蛋白质温热性识别研究。本研究中,采用基于氨基酸组分和关联特征提取的新思路与方法,利用支持向量机对76对常温蛋白和嗜热蛋白训练后建模,再利用独立测试法对供检验的20对常温蛋白和嗜热蛋白进行模式识别预测。结果显示,支持向量机对常温蛋白和嗜热蛋白预测精度分别为85%、80%,相较于张光亚等研究人员运用的主成分分析法、偏最小二乘法、神经网络法中最优预测精度稍提高。 最后为蛋白质亚细胞定位预测。同样采用基于氨基酸组分和关联特征提取方法和支持向量机,对996条共分为三类的(cytoplasmic,extracellular,periplasmic)原核生物数据集训练后建模。结果表明,运用“留一法”和“十次交叉法”测试的预测精度分别达到93.57%和93.47%,与目前已知最好的预测结果相比有了一定幅度的提升。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号