首页> 中文学位 >基于智能计算的蛋白质结构预测系统的设计与实现
【6h】

基于智能计算的蛋白质结构预测系统的设计与实现

代理获取

目录

声明

摘要

第一章 绪论

1.1 课题背景、目的和意义

1.2 研究现状

1.3 论文的组织结构

1.4 课题的研究各阶段具体内容

第二章 相关理论与技术

2.1 蛋白质相关知识

2.1.1 蛋白质的组成

2.1.2 蛋白质的结构

2.1.3 蛋白质结构数据集

2.2 特征提取方法

2.3 蛋白质三级结构预测方法

2.4 应用于生物信息学领域的机器学习方法

第三章 分类模型的建立及优化

3.1 神经网络

3.1.1 神经网络结构

3.1.2 神经网络算法描述

3.1.3 神经网络的特点

3.1.4 神经网络与蛋白质结构预测

3.2 KNN算法

3.2.1 KNN算法概述

3.2.2 KNN算法的流程

3.2.3 KNN算法需要解决的问题

3.2.4 KNN算法与蛋白质三级结构预测

3.3 优化算法介绍

3.3.1 梯度下降优化算法(BP)

3.3.2 粒子群优化算法(PSO)

第四章 系统的分析与设计

4.1 需求分析

4.2 可行性分析

4.2.1 技术可行性

4.2.2 经济可行性

4.3 系统的设计

4.4 数据库设计

4.5 系统开发语言

第五章 功能模块的实现与测试

5.1 登陆模块

5.2 系统主界面

5.3 选择数据集

5.4 特征提取模块

5.5 结构预测模块

第六章 结束语

6.1 全文总结

6.2 进一步的研究设想

参考文献

致谢

附录

展开▼

摘要

随着人类基因组计划的完成,蛋白质序列数量的急剧增加,而每年新增加的已知结构的蛋白质数量却增加缓慢,因此迫切的需要开发快速、准确地计算工具来预测蛋白质的三级结构。本文介绍了蛋白质结构预测所涉及到的相关理论,内容包括氨基酸序列的的特征提取方式,分类模型的设计及智能优化算法的选择。在理论研究的基础上,构建一个在稳定性、速度和易用性方面都能胜任的蛋白分析工具,可高通量、自动化的完成大规模的蛋白数据分析的系统。
   本蛋白质结构预测系统包括特征提取、分类建模及结果评价等模块。该系统是在Microsoft Visual Studio2008平台下,用C#语言实现。本课题的主要工作如下:
   (1)氨基酸序列的特征提取。针对氨基酸序列的特点,首先必须把氨基酸序列中的信息提取出来,转化成计算机可以处理的数据,即特征提取。不同的特征提取方法对于不同的数据集和分类模型效果不同。本文采用七类组成模型、二肽组成模型、三肽频数法、分布组成模型,从不同角度对氨基酸特征进行提取,还可以将不同特征提取方法进行融合以提高预测精度。
   (2)建立分类模型。通过分析和学习从氨基酸序列提取出的有用信息,总结出规律,实现对未知结构的氨基酸序列进行结构预测。由于蛋白质三级结构预测信息维数高,计算量大,采用不同的分类模型对于时间效率和预测精度至关重要。本文采用了当前比较主流的几种分类模型:人工神经网络(ANN)、BP神经网络及K-近邻分类模型。神经网络具有自组织、自学习和自适应的特点,并且非常擅长处理非线性的生物信息学优化问题,所以本文选取了神经网络模型进行预测,同时为了避免陷入局部最优,选择了粒子群优化算法(PSO)和梯度下降优化算法(BP)优化网络参数。K-近邻算法(KNN)是一种的基于距离度量的分类方法,具有直观、无需先验统计知识、无师学习等特点,从而成为非参数分类的一种重要方法,针对于K-近邻算法的不足本文提出了一种加权的K-近邻算法,对蛋白质结构预测有很好的效果。
   (3)设计并实现蛋白质结构预测系统。在VS2008平台下,用C#语言设计并实现基于智能计算的蛋白质结构预测系统,实现上传数据、特征提取、结构预测等功能模块,测试并完善应用系统。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号