首页> 中文学位 >用于蛋白质二维HP结构分析的一种遗传算法
【6h】

用于蛋白质二维HP结构分析的一种遗传算法

代理获取

目录

声明

摘要

1 绪论

1.1 分子生物信息学技术

1.1.1 分子生物信息学技术的简单介绍

1.1.2 生物信息学的重要性

1.1.3 分子生物信息学技术的研究内容

1.2 蛋白质折叠

1.2.1 蛋白质的结构及其预测方法

1.2.2 蛋白质结构预测的两个难题

1.3 研究蛋白质折叠的相关简化数学模型

1.3.1 AB非格点模型

1.3.2 二维HP格点模型

1.4 本文的主要工作

2 Monte Carlo方法在蛋白质二维HP模型中的应用

2.1 基本Monte Carlo方法概述

2.2 HP模型(Hydrophobic-Polar)

2.2.1 二维HP格点模型及其能量表示

2.2.2 求解HP模型是NP问题

2.3 Monte Carlo在求解蛋白质HP结构中的应用

2.3.1 蛋白质折叠方向的表示方法

2.3.2 蛋白质HP模型及其能量的算法描述

2.3.3 基于Monte Carlo方法的蛋白质HP模型的预测

3 遗传算法在蛋白质二维HP模型中的应用

3.1 基本的GA概述

3.2 GA在求解蛋白质HP结构中的应用

3.2.1 GA求解蛋白质HP模型是一个NP问题

3.2.2 GA用于蛋白质HP模型的算法设计

4 改进的算法及数值实验

4.1 平行线-垂直线变异(Parallel-Vertical Variation)

4.2 数值试验及其结果

结论

参考文献

攻读硕士学位期间发表学术论文情况

致谢

展开▼

摘要

目前,蛋白质序列数据在数据库中非常庞大,所以研究蛋白质结构预测的问题是生物信息学中一个非常重要的问题,它在生物学、医学等方面的作用都非常大。在进行蛋白质结构预测时,首先需要建立数学模型,然后用比较好的算法来进行模拟实现。目前,蛋白质亲疏水(HP)格点模型是模拟蛋白质结构折叠问题时应用最广泛也是最简单的一种模型。
  现有的一种较好算法是在标准遗传算法(GA)求解HP模型中加入网格稀疏处的卷曲操作(称为Pull-Move)。我们定义一种应用于网格密集处的平行线-垂直线变异,这种变异弥补了Pull-Move必须在有空位情况下才能进行变异的缺陷,且加入这种变异的算法是一种全局优化算法。我们的做法是先用现有算法对标准的11个蛋白质序列求得最优能量,然后利用我们的平行线-垂直线变异操作对得到的结果进一步优化。实验结果表明,对蛋白质长度较大的情形,能够求得更优的蛋白质整体能量。具体来说,对长度不小于60的序列,用平行线-垂直线变异对用GA得到的结果进行了很大的改进,并且随着序列长度的增加,这种改进尤为明显,并且改变的数目呈现一个递增的趋势。此外,对于长度为100的两个序列,用平行线-垂直线变异后,甚至突破了遗传算法得到的最优值,更逼近了理论最优值。
  本文的结构安排如下:第一章为绪论,介绍分子生物信息学研究的主要内容和蛋白质的结构及如何预测它的结构。第二章介绍Monte Carlo方法及其怎样预测蛋白质二维HP模型的结构。第三章介绍GA及其怎样预测蛋白质二维HP模型的结构。第四章为我们提出的算法以及数值实验。最后是我们得出的结论。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号