首页> 中文学位 >蛋白质结构功能预测中若干关键算法的分析比较
【6h】

蛋白质结构功能预测中若干关键算法的分析比较

代理获取

目录

声明

摘要

1、绪论

1.1 研究背景及意义

1.2 蛋白质基础知识

1.2.1 蛋白质的组成

1.2.2 中心法则

1.2.3 蛋白质结构

1.2.4 蛋白质物理化学性质

1.3 蛋白质数据库及数据集

1.3.1 蛋白质数据库

1.3.2 数据集

1.4 研究内容与结构安排

2、蛋白质结构功能预测中氨基酸约化与信息提取的分析比较

2.1 引言

2.2 数据集

2.3 氨基酸约化

2.4 蛋白质信息提取方法

2.4.1 成分提取方法

2.4.2 氨基酸物理化学性质提取方法

2.4.3 蛋白质结构信息提取方法

2.4.4 基因本体论提取方法(GO)

2.4.5 序列进化信息提取方法(PSSM)

2.5 结果与讨论

2.5.1 评估方法和指标

2.5.2 蛋白质结构类预测中氨基酸约化与信息提取的分析比较

2.5.3 蛋白质分子伴侣预测中氨基酸约化与信息提取的分析比较

2.5.4 蛋白质溶解度预测中氨基酸约化与信息提取的分析比较

2.6 本章小结

3 蛋白质结构功能预测中特征挑选的分析比较

3.1 引言

3.2 数据集

3.3 特征挑选方法

3.3.1 基于互信息的特征挑选

3.3.2 基于支持向量机的特征挑选

3.3.3 基于遗传算法的信息挑选

3.3.4 基于峰度和偏度的信息挑选方法

3.3.5 reliefF和sequentialfs信息挑选

3.4 结果与讨论

3.4.1 评估方法和指标

3.4.2 蛋白质结构类预测中特征挑选的分析比较

3.4.3 蛋白质紊乱预测中信息挑选的分析比较

3.4.4 蛋白质分子伴侣数据集预测中信息挑选的分析比较

3.4.5 蛋白质溶解度预测中信息挑选的分析比较

3.5 方法效率

3.6 本章小结

4、蛋白质结构功能预测中预测算法的分析比较

4.1 引言

4.2 数据集

4.3 预测算法

4.4 结果与讨论

4.4.1 评估方法和指标

4.4.2 蛋白质结构类预测中预测算法的分析比较

4.4.3 蛋白质分子伴侣数据集预测中预测算法的分析比较

4.4.4 蛋白质蛋白质紊乱数据集预测中预测算法的分析比较

4.4.5 蛋白质溶解度数据集预测中预测算法的分析比较

4.4.6 蛋白质RNA结合数据集预测中预测算法的分析比较

4.4 本章小结

5、总结和展望

参考文献

攻读学位期间的研究成果

致谢

展开▼

摘要

随着测序技术的快速发展,蛋白质序列数量与已测定结构与功能的蛋白质数量的差距越来越大,迫切需要通过理论计算方法实现蛋白质结构功能的预测。目前,许多有效的方法被提出来研究蛋白质序列、结构和功能之间的关系,但不同方法在解决蛋白质结构功能研究中具有偏好性。因此,本文主要围绕蛋白质结构功能研究中方法展开,系统地比较分析了不同的特征提取方法、特征挑选方法和预测算法在蛋白质结构类、蛋白质紊乱、蛋白质分子伴侣、蛋白质溶解度和RNA结合蛋白质的预测中效率。主要研究内容如下:
  1、简要介绍了蛋白质研究的研究背景及意义、蛋白质的组成、结构和物理化学性质,并简述了常用的数据库及本文采用的数据集,为本文的研究提供了理论和数据基础。
  2、分析比较了蛋白质结构功能预测中氨基酸约化和特征提取方法。根据522种氨基酸性质将20种氨基酸约化成k类,提取蛋白质6类不同信息,结合支持向量机比较分析了氨基酸约化与信息提取方法在蛋白质结构功能预测中的效率。结果表明,在蛋白质结构类和蛋白质分子伴侣预测中,最好采用氨基酸的转向倾向类性质约化20种氨基酸,再提取蛋白质的顺序特征,而蛋白质溶解度的预测则偏向于蛋白质的RCTD特征提取方法。
  3、分析比较了蛋白质结构功能预测中特征挑选方法。本章选取了基于互信息的特征挑选方法、基于支持向量机的特征挑选方法等16种,结合K近邻预测算法比较分析了特征挑选方法在蛋白质结构功能预测中的效率。结果表明,基于非线性支持向量机的特征挑选方法在蛋白质结构类预测、蛋白质溶解度预测、蛋白质分子伴侣预测和蛋白质溶解度预测中表现最好,经过挑选后特征的准确率提升了13.16%-71%,尤其是蛋白质的k-mer特征和PSSM特征。
  4、分析比较了蛋白质结构功能预测中预测算法。本章选取了线性判别分析算法、主成分分析判别算法等7种预测算法,并比较分析了不同预测算法在蛋白质结构功能中效率。结果表明,在蛋白质结构类预测中,SVM预测算法表现最好,尤其与蛋白质PRseAAC特征结合,预测准确率达到99.15%;选择PCADA、CART、PLSDA、KNN或者SVM算法可以较准确地预测蛋白质的分子伴侣;在蛋白质紊乱预测中,KNN预测算法与蛋白质RCTD特征结合表现最好,准确率达到了94.75%;蛋白质溶解度预测应选取PSSM特征,结合PLSDA和PCADA预测算法;而在预测RNA结合的蛋白质时,采用GO特征和CART算法的组合或者GO特征和PLSDA算法的组合,都能获得较好的预测准确率。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号