整合模板比对和机器学习方法的蛋白质折叠分类预测

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

蛋白质是由20种标准氨基酸组成的线性序列，序列信息决定了它的结构与功能。其中蛋白质折叠分类预测是蛋白质结构预测中的一个至关重要的步骤。自然界中有一千多种蛋白质折叠，对蛋白质折叠进行研究，开发有效预测算法，不仅有助于了解蛋白质折叠的内在规律，还对蛋白质结构研究具有重要的生物学意义。
　　现有两种有效的方法对蛋白质折叠进行分类。一是基于模板比对的折叠识别。当序列相似性较高时，模板比对方法能够得到很好的预测效果。但随着相似性的降低，模板比对方法的可信度也大幅度下降。另一个是使用机器学习算法的从头预测。它是从氨基酸序列出发，提取蛋白质的特征向量，然后预测折叠类型。对这两种方法的结合是从未被探索过的，本文对此进行了探索，取得了较好的结果。
　　本研究开发了两种算法，HH-fold和SVM-fold进行蛋白质折叠分类预测。HH-fold利用HHsearch算法进行模板比对，根据比对结果预测折叠类型。SVM-fold是基于支持向量机的从头预测算法，从三个互补的序列谱中提取特征作为SVM的输入。这两种算法结合，产生了TA-fold方法。文中在六个基准数据集上对提出方法和其它从头开始方法与基于模板比对的方法进行了全面的比较与评估。TA-fold方法在 DD数据集上得到了79.9%的正确率。这比其他的从头开始的方法提高5.4-11.7%。当更新这个数据集包含更多的蛋白质折叠后，预测精度提高到97.1%。此外，TA-fold方法在包含6451个蛋白质序列的数据集F184上的预测精度大于90%。在LE数据集上进行的实验表明TA-fold在家族，超家族和折叠的水平上始终优于其它基于模板方法。TA-fold的成功归因于基于模板比对方法和包含丰富的进化信息的从头分类方法的组合。

著录项

作者
夏佳琪;
展开▼
作者单位

东北林业大学;

展开▼
授予单位东北林业大学;
学科生物物理学
授予学位硕士
导师姓名牟洪波;
年度 2017
页码
总页数
原文格式 PDF
正文语种中文
中图分类蛋白质的一级结构;自动推理、机器学习;
关键词
蛋白质折叠; 分类预测; 整合模板比对; 机器学习; 特征提取; 支持向量机;
入库时间 2022-08-17 10:32:17

相似文献

中文文献
外文文献
专利

1. 机器学习方法在蛋白质折叠结构预测中的应用研究 [J] . 林晓丽 ,周凤丽 . 计算机与数字工程 . 2011,第009期
2. 利用机器学习方法对神经肌肉罕见病DMD进行分类预测 [J] . 章鸣嬛 ,陈瑛 ,沈瑛 . 上海理工大学学报 . 2016,第002期
3. 基于机器学习方法的H1N1神经氨酸苷酶抑制剂的分类预测 [J] . 吕巍 ,薛英 ,孟庆伟 . 物理化学学报 . 2013,第001期
4. 基于AdaBoost组合学习方法的岩爆分类预测研究 [J] . 葛启发 ,冯夏庭 . 岩土力学 . 2008,第4期
5. 基于MRI和机器学习对阿尔茨海默病的分类预测 [J] . 姚丽丽 ,范炤 . 中国医学影像学杂志 . 2021,第002期
6. 整合资源,全面创新从产业链经营谈模板的创新经营模板企业营销 [C] . (Missing) . 中国模板协会第七届会员代表大会 . 2006
7. 基于机器学习的定量网络口碑分类预测 [A] . 马浩翔 . 2019

整合模板比对和机器学习方法的蛋白质折叠分类预测

目录

摘要

著录项

相似文献

相关主题

期刊订阅