首页> 中文学位 >基于概率图模型HMM的蛋白质二级结构预测
【6h】

基于概率图模型HMM的蛋白质二级结构预测

代理获取

目录

声明

摘要

第1章 绪论

1.1 研究背景和意义

1.2 国内外研究现状

1.3 本文主要研究内容

第2章 蛋白质二级结构预测

2.1 蛋白质结构

2.1.1 蛋白质一级结构

2.1.2 蛋白质二级结构

2.1.3 蛋白质三级结构

2.1.4 蛋白质四级结构

2.2 蛋白质二级结构预测

2.3 蛋白质二级结构预测方法

2.4 蛋白质二级结构的预测准确率

2.5 本章小结

第3章 隐马尔可夫模型

3.1 马尔可夫模型

3.2 隐马尔可夫模型

3.2.1 隐马尔可夫模型的参数

3.2.2 隐马尔可夫模型的性质

3.2.3 隐马尔可夫模型的过程

3.2.4 隐马尔可夫模型的基本问题

3.2.5 隐马尔可夫模型的基本算法

3.3 隐马尔可夫模型的应用

3.4 本章小结

第4章 基于HMM的蛋白质二级结构预测

4.1 数据集

4.2 预测蛋白质二级结构的HMM

4.2.1 3-状态HMM

4.2.2 7-状态HMM

4.3 HMM技术路线

4.4 参数训练

4.4.1 初始参数的选取

4.4.2 参数训练的下溢

4.5 算法实现

4.6 测试结果

4.7 算法改进

4.7.1 结构状态的改进

4.7.2 参数训练的改进

4.8 本章小结

结论

参考文献

攻读硕士学位期间所发表的论文

致谢

展开▼

摘要

蛋白质结构与蛋白质功能密切相关,而蛋白质二级结构又是其他更高阶空间结构形成的基础,因此,蛋白质二级结构预测成为生物信息学研究的热点。蛋白质二级结构预测是根据已知二级结构的蛋白质数据建立氨基酸序列和二级结构间的关系模型,进而通过模型来预测未知氨基酸序列的二级结构。
  隐马尔可夫模型(Hidden Markov Model,HMM)是一种概率统计模型,一些国内外学者将其应用到蛋白质二级结构预测问题上,收到了一定的效果。该文首先利用3-状态HMM和7-状态HMM对蛋白质二级结构进行预测,通过比较得出7-状态HMM的预测效果要优于3-状态HMM。对于7-状态HMM预测算法,又从结构状态和参数训练两方面提出了改进方案。一方面,考虑到7-状态HMM没有包含非二级结构的状态,故引入非二级结构的状态,进而构成8-状态HMM;另一方面,对于参数重估过程的第二种下溢情况,我们打破常规,并没有通过某种手段阻止其下溢,而是用最优重估一次参数的均值作为预测二级结构的模型参数。我们通过这两种改进方案在一定程度上提高了预测准确率。
  该文的研究表明,选取合适的蛋白质结构状态以及合适的训练集对提高蛋白质二级结构的预测准确率是比较重要的。

著录项

  • 作者

    朱丽娟;

  • 作者单位

    河北科技大学;

  • 授予单位 河北科技大学;
  • 学科 数学
  • 授予学位 硕士
  • 导师姓名 张屹;
  • 年度 2017
  • 页码
  • 总页数
  • 原文格式 PDF
  • 正文语种 中文
  • 中图分类 蛋白质;
  • 关键词

    概率统计; 蛋白质; 二级结构; 参数重估;

  • 入库时间 2022-08-17 10:28:44

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号