首页> 中文学位 >基于机器学习的蛋白质结构类预测与质量评估
【6h】

基于机器学习的蛋白质结构类预测与质量评估

代理获取

目录

摘要

第一章 绪论

1.1 研究背景和意义

1.2 国内外研究现状

1.3 论文主要内容与结构安排

1.3.1 主要内容

1.3.2 论文结构安排

第二章 机器学习及相关优化算法

2.1 算法概述

2.2 SVM及其相关算法

2.2.1 SVM原理

2.2.2 LS-SVM原理

2.2.3 多分类支持向量机

2.2.4 核函数及参数的影响

2.3 参数优化算法

2.3.1 粒子群算法

2.3.2 模拟退火算法

2.3.3 模拟退火粒子群算法

2.4 ReliefF 特征选择算法

2.4.1 Relief算法

2.4.2 ReliefF算法

2.5 本章小结

第三章 蛋白质结构及蛋白质序列特征

3.1 蛋白质结构相关知识

3.2 蛋白质数据库

3.2.1 蛋白质结构类数据库

3.2.2 蛋白质模型评估数据库

3.3 蛋白质结构类特征表达

3.3.1 氨基酸组分法

3.3.2 多肽链组分法

3.3.3 伪氨基酸组成

3.4 蛋白质模型质量的特征提取

3.4.1 BLAST简介

3.4.2 提取特征

3.4.3 蛋白结构模型质量得分

3.5 本章小结

第四章 基于ML的蛋白质结构类分类

4.1 蛋白质结构类分类过程

4.2 数据集

4.3 特征提取过程及结果

4.3.1 ReliefF算法的特征提取过程

4.3.2 特征提取结果及分析

4.4 ML建模及参数优化

4.4.1 ML建模及基于SAPSO的参数优化的具体过程

4.4.2 最优参数的结果分析

4.5 比较不同算法的分类效果

4.6 本章小结

第五章 蛋白质模型质量评估

5.1 蛋白质模型质量评估原理

5.2 数据来源

5.2.1 数据集

5.2.2 特征提取过程

5.3 ML建模及基于SAPSO参数优化的过程

5.4 结果分析

5.5 本章小结

第六章 总结与展望

6.1 总结

6.2 展望

参考文献

致谢

攻读硕士学位期间发表的学术论文和科研情况

声明

展开▼

摘要

蛋白质是构成单个细胞的基本有机物,是生命活动的执行者,其角色决定于它的功能,而蛋白质功能主要由他们的结构决定,因此研究蛋白质的结构对于认识其功能具有很大的意义。但由于在生物体内蛋白质的组成复杂多样,直接使用分子动力学技术模拟蛋白质折叠过程,不仅需要大量的计算资源,还需要对蛋白质折叠过程有深刻的认识,很难快速准确的实现结构预测和模型质量评估。随着计算机信息技术的发展,研究基于机器学习(Machine Learning,ML)的蛋白质结构类预测和质量评估是目前生物信息领域的一个研究热点。
  本研究主要内容包括:⑴构筑基于属性约减的蛋白质结构类多分类模型。在蛋白质结构类分类预测中,首先对于已知氨基酸序列的蛋白质,选择不易丢失序列信息的伪氨基酸特征,然后针对蛋白质序列特征表达存在信息冗余,考虑到结构类分类是个多分类问题,提出利用ReliefF算法对蛋白质结构特征进行约减,接着采用多个二分类的SVM模型来构造SVM多分类器模型,最后对蛋白质结构类进行分类,尽管实验结果和未进行特征约简的方法相比,耗费的时间减少近一半,但存在模型参数不好确定的问题。⑵设计SAPSO算法,优化蛋白质结构类分类模型参数。针对上述蛋白质结构类多分类模型参数不好确定的问题,综合模拟退火(Simulated Annealing,SA)算法跳出局部最优解和粒子群(Particle Swarm optimization,PSO)算法收敛速度快的特点,设计出一种适合蛋白质分类模型的模拟退火粒子群(SAPSO)算法以获取优化的模型参数,然后通过具体的蛋白质分类实验,证明设计方法的有效性。⑶针对传统蛋白质模型质量评估没有考虑同源信息问题的缺陷,建立了一种基于ML的蛋白质模型质量评估模型。将蛋白质序列输入到SWISS-MODEL中,自动构造出它的三维结构。将蛋白质序列和Model1序列输入到BLAST系统中,提取序列比对的四个主要特征。在考虑同源信息的情况下,将提取的特征值作为LS-SVM的输入数据用来训练LS-SVM,并同时利用SAPSO算法对LS-SVM的参数寻优。由最优参数值构造的LS-SVM模型来得到蛋白质GDT-TS。然后通过测试实验表明该设计模型在绝对误差和均方误差方面均有明显优势,进而证明所建模型的合理性和有效性。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号