首页> 中文学位 >基于监督流形学习算法的固有不规则蛋白质结构预测研究
【6h】

基于监督流形学习算法的固有不规则蛋白质结构预测研究

代理获取

目录

摘要

ABSTRACT

第1章 绪论

1.1 论文的背景和意义

1.1.1 研究背景

1.1.2 研究意义

1.2 固有不规则蛋白质结构预测器的研究现状

1.3 固有不规则蛋白质研究存在的难点

1.4 本文的主要工作内容

1.5 本文的章节安排

第2章 固有不规则蛋白质

2.1 引言

2.2 氨基酸

2.3 固有不规则蛋白质的结构特点

2.4 固有不规则蛋白质的功能

2.5 固有不规则蛋白质在细胞中的分布

2.6 本章小结

第3章 基于监督流形学习算法的特征提取

3.1 引言

3.2 常用的特征提取方法

3.2.1 主成分分析

3.2.2 核主成分分析

3.3 局部线性嵌入的流形学习

3.3.1 流形学习中的数学概念

3.3.2 局部线性嵌入的流形学习算法

3.4 基于局部线性嵌入算法的特征提取

3.4.1 实验过程

3.4.2 实验结果与分析

3.5 本章小结

第4章 基于支持向量机的固有不规则蛋白质结构预测

4.1 引言

4.2 常用的固有不规则蛋白质结构预测方法介绍

4.2.1 人工神经网络方法

4.2.2 最近邻方法

4.2.3 贝叶斯方法

4.2.4 支持向量机方法

4.3 支持向量机理论基础

4.3.1 最优分类面

4.3.2 核函数

4.3.3 基于支持向量机构建预测器过程

4.4 数据集的选取和建模过程及评价指标

4.4.1 数据来源

4.4.2 滑动窗口法

4.4.3 预测器建模过程与评价指标

4.5 实验结果分析

4.5.1 参数选择

4.5.2 结果与分析

4.6 本章小结

第5章 基于多预测器融合算法的固有不规则蛋白质结构预测

5.1 引言

5.2 多预测器融合

5.2.1 预测器融合的基本概念

5.2.2 多预测器融合的体系框架

5.2.3 成员预测器的设计方法

5.2.4 Adaboost算法

5.3 基于Adaboost算法预测固有不规则蛋白质结构

5.3.1 氨基酸序列的特征向量选择

5.3.2 窗口长度的选择

5.3.3 多预测器融合算法实验

5.4 本章小结

结论

参考文献

攻读硕士学位期间发表的论文和取得的科研成果

致谢

展开▼

摘要

随着人类基因组计划的顺利进展,越来越多的蛋白质序列被测定出来,而利用实验方法测量蛋白质及生物大分子的结构相当繁琐,既耗时又费力,因此利用理论计算方法来研究蛋白质的结构和功能从而指导实验是一项非常有意义的工作。
  本文从蛋白质的一级序列出发使用多分类器组合算法对固有不规则蛋白质结构进行分类研究,论文主要工作如下:1、构建规则和不规则蛋白质序列这两类序列集,依据长度不同的不规则蛋白质序列中氨基酸残基含量的不同,将不规则数据集分为长(>30个氨基酸残基)和短(≤30个氨基酸残基)两个序列集。2、基于氨基酸序列的单肽、双肽结构属性和疏水性物理属性出发,利用滑动窗口法将氨基酸序列量化,利用径向基核函数的支持向量机方法构建成员预测器模型。利用5倍交叉验证法确定长、短序列的窗口长度以及由此确定支持向量机核函数的参数值gamma值和惩罚系数coat值。3、在特征提取方面,由于滑动窗口法得到的数据矩阵容易形成维灾难,需要对矩阵进行维数规约,即将数据由高维空间投影到低维空间。主要分析了现在常用的降维方法包括线性降维方法中主成分分析法(PCA)以及一种基于PCA方法发展起来的一种非线性降维方法-核主成分分析法(KPCA)。在此基础上本文将流形学习算法中局部线性嵌入法(LLE)引入了固有不规则蛋白质结构预测中,并利用实验方法对PCA、KPCA以及LLE算法进行了验证,得出基于LLE方法的降维效果最好,从而得出蛋白质序列中氨基酸残基之间存在局部线性关系。4、为了提高固有不规则蛋白质结构预测精度,本文提出了一种基于Adaboost算法的SVM预测器融合方法预测固有不规则蛋白质结构。因此了解了预测器融合的基本概念、体系框架、成员预测器的设计方法以及Adaboost算法的基本原理和实现步骤。通过实验结果可以看出,利用多预测器融合算法后的预测精度明显优于单个成员预测器的预测精度。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号