首页> 中文学位 >基于径向基函数神经网络的蛋白质微构象预测分析研究
【6h】

基于径向基函数神经网络的蛋白质微构象预测分析研究

代理获取

目录

文摘

英文文摘

第一章绪论

1.1生物信息学相关概念

1.1.1生物信息学(Bioinformatics)的兴起

1.1.2蛋白质组学研究在生物信息学中的地位

1.1.3生物信息学常用的方法与技术

1.2神经网络技术的发展与应用

1.2.1神经网络技术

1.2.2神经网络模型

1.2.3神经网络技术与生物信息学

1.3本文的研究内容与创新点

1.3.1主要研究内容与章节安排

1.3.2主要创新点

参考文献

第二章径向基神经网络理论

2.1径向基函数神经网络

2.2 RBFNN的映射关系

2.3 RBFNN的分类本质

2.4 RBFNN网络设计的基本原则

2.5 RBFNN网络几个常用的学习方法

2.5.1误差反传算法

2.5.2递推最小二乘算法

2.5.3伪逆学习算法

2.6径向基概率神经网络(RBPNN)

2.7本章小结

参考文献

第三章基于BRFNN的蛋白质二级结构预测

3.1蛋白质的组成及其结构的一般概念

3.2蛋白质结构预测概述

3.2.1蛋白质二级结构预测

3.3氨基酸残基构象分类

3.3.1数据来源与假定

3.3.2统计算法

3.3.3氨基酸构象分类

3.4基于残基构象信息和神经网络技术的蛋白质二级结构预测

3.4.1网络结构与参数设置

3.4.2利用氨基酸构象分类信息来改进预测精度

3.4.3模拟结果与相关讨论

3.5本章小结

参考文献

第四章基于遗传算法和RBFNN的蛋白质残基空间距离预测研究

4.1残基空间距离(Spatial Distance)

4.1.1 PDB序列记录及蛋白质骨架的显示

4.1.2蛋白质残基空间距离图谱

4.2遗传算法(Genetic Algorithm)

4.2.1基于GA的特征子集选择的一般方法

4.2.2基于GA的线性特征变换的一般方法

4.2.3基于GA的非线性特征变换

4.3优化RBF神经网络结构的遗传算法及其算子构造

4.3.1遗传算法的几个相关概念

4.3.2个体(染色体)编码

4.3.3适应度函数的构造

4.3.4选择、交叉、变异算子的设计

4.4基GA优化RBFNN的蛋白质残基空间距离预测

4.4.1参数选择与数据准备

4.4.2残基空间距离预测模拟结果

4.5本章小结

参考文献

第五章基于二进制编码策略和RBFNN的残基作用图谱研究

5.1残基作用图谱(Contact Map)预测

5.1.1残基作用图谱(Contact Map)的定义

5.1.2几个常用于残基作用关系谱预测的构象特征

5.2数据准备与二进制编码策略

5.2.1数据准备

5.2.2二进制编码策略

5.2.3 RBF训练算法

5.3基RBF与二进制编码的残基作用图谱预测

5.3.1模拟输出与期望输出的比较

5.3.2实际预测值及与其它方法的比较

5.4本章小结

图表

参考文献

第六章径向基神经网络在蛋白质微构象领域的进一步应用研究

附录A重要的生物信息中心简介

A.1国外生物信息中心

A.2国内生物信息中心

附录B攻博期间发表论文及出版专著情况

B.1杂志论文

B.2会议论文

B.3出版专著

附录C科研及获奖情况

C.1参加的科研项目

C.2获奖情况

致谢

展开▼

摘要

径向基函数神经网络(RadialBasisFunctionNeuralNetworks,RBFNN)是一种模拟人脑局部调整、相互覆盖接收的典型前馈神经网络模型,与传统神经网络模型相比,具有更强的非线性映射和边界区分能力,并且以其简单的拓朴结构、快速的训练算法和较好的推广能力被广泛应用于模式识别和函数逼近等领域。特别是在近二十年来,在解决诸如蛋白质结构预测(ProteinStructurePrediction)、残基作用关系图谱(Inter-residueContactMap)研究,以及残基构象分布研究等领域发挥了重要的作用。本文主要针对径向基函数神经网络模型在蛋白质微构象(Micro-ConformationalStructure)预测与分析中的应用开展了较为系统和全面的研究,在介绍径向基神经网络的分类机理、结构优化、参数选取等基本问题的基础上,重点对径向基函数神经网络的蛋白质二级结构预测(SecondaryStructurePrediction)、残基空间距离(Inter-residueSpatialDistance)研究、残基作用关系谱研究等蛋白质微构象分析方面进行了深入的探讨。全文的要点为: 1、基于氨基酸构象信息和径向基函数神经网络的蛋白质二级结构预测:文中详细介绍了蛋白质结构预测,特别是二级结构预测的现状及各种方法的比较,然后重点研究了基于氨基酸构象偏性(ConformationProspensity)和径向基函数神经网络模型的蛋白质二级结构预测。在充分考虑各构象特征对蛋白质二级结构贡献程度的基础上,利用蛋白质数据库(ProteinDataBank,PDB)中已知结构蛋白的结构数据,对20种不同氨基酸残基对不同类型二级结构的构象偏性进行了统计分析,并将其分别归类为相应二级结构的支持子(Former)、中性子(Neutral)和断裂子(Breaker),同时还利用这些构象信息来重构氨基酸残基的主特征向量,将原有的特征向量维数由22位增加到25位,然后再把该特征向量耦合到径向基函数神经网络的输入编码中去,较好地提高了RBFNN模型在蛋白质二级结构中的预测精度。 2、蛋白质残基空间距离预测研究:残基空间距离作为蛋白质二级结构预测的一个重要模式特征,对有效提高RBFNN预测蛋白质结构的精度有着非常重要的作用。目前蛋白质结构预测的瓶颈在于:我们对蛋白质一级序列中的残基间远程(Long-Range)作用(或长程作用)的作用机理还不很清楚,对蛋白质折叠过程中的构象规律还没有完全掌握。如在蛋白质折叠过程中,序列距离(SequenceSeparation)相隔较远的残基对(ResiduePairwise)在三维空间中却有可能相距较近,这说明该基对中的两个残基在蛋白质折叠过程中,可能存在着某种相互作用,从而影响着蛋白质结构的生成。为此我们利用径向基函数神经网络模型,来对蛋白质残基空间距离进行预测,取得了较好的结果,为进一步把这些信息耦合到蛋白质结构预测的主特征向量中打下了基础。 3、基于二进制编码策略和RBFNN的残基作用图谱研究:残基作用图谱(ContactMap)实质上是残基空间距离研究的一个深化,也是蛋白质微构象研究的另一个重要内容,在蛋白质结构预测分析中具有重要的作用。如在RBFNN模型的输入编码中耦合上述构象信息,就有可能较好地提高蛋白质结构预测精度。本文重点研究了RBFNN在残基作用谱预测中的应用研究,提出一个新的二进制编码策略,分别用一个8位二进制串编码可能的残基对(PossiblePairwise)、4位二进制串来编码残基分类信息(ResidueClassication)、3位二进制串来编码残基相应的二级结构信息(SecondaryStructure)、3位二进制串来编码蛋白质序列长度(SequenceLength)、以及用一个2位二进制串来编码残基对的序列距离(SequenceSeparation),同时还把上述的编码信息耦合到径向基神经网络的输入编码中,并结合遗传算法优化RBFNN模型进行残基作用图谱预测研究。 4、深入研究了径向基函数神经网络的结构优化和参数选取问题,在传统的K-均值和最小二乘算法的结构优化基础上,采用遗传算法来对RBFNN模型的隐中心数目和激活函数的感知宽度进行全局寻优,较好的提高了径向基函数神经网络模型的推广能力,使之在蛋白质微构象分析此类的非线性模式匹配问题上的寻优能力有了较大的提高。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号