首页> 中文学位 >基于多视角特征融合与随机森林的蛋白质结晶预测
【6h】

基于多视角特征融合与随机森林的蛋白质结晶预测

代理获取

目录

声明

摘要

1 绪论

1.1 引言

1.2 研究背景

1.2.1 研究意义

1.2.2 国内外研究进展

1.3 论文主要研究内容

1.4 本文的组织结构

2 蛋白质结晶预测相关知识

2.1 蛋白质概述

2.2 氨基酸概述

2.3 蛋白质结构

2.4 蛋白质表示方法

2.5 蛋白质结晶

2.6 本章小结

3 蛋白质结晶预测框架

3.1 特征提取

3.1.1 伪氨基酸组成成分特征提取

3.1.2 伪位置特异性得分矩阵特征提取

3.2 特征融合

3.2.1 基于特征选择方法

3.2.2 基于特征组合方法

3.2.3 基于特征提取方法

3.2.4 特征归一化

3.3 分类器

3.3.1 径向基函数

3.3.2 支持向量机(SVM)

3.3.3 随机森林

3.4 交叉验证

3.5 预测结果评价

3.6 和现有预测方法对比

3.7 预测框架图

3.8 本章小结

4 实验结果与分析

4.1 数据集

4.2 特征融合

4.2.1 特征选择

4.2.2 特征组合

4.2.3 特征提取

4.3 不同分类器的预测结果

4.4 不同特征组的预测结果

4.5 和现有的预测性能对比

4.6 本章小结

5 总结与展望

5.1 工作总结

5.2 未来工作和展望

致谢

参考文献

攻读硕士期间发表的论文情况

展开▼

摘要

蛋白质是构成生物体的重要基础物质,是构成细胞的基本有机物。蛋白质约占人体重量的16%~20%,生物机体中的每一个组成部分、每一个细胞的生命活动都有蛋白质的参与。因此,研究蛋白质的结构与功能,对于探索人类的生命活动的本质具有十分重要的意义。
  解析蛋白质三维结构的方法主要有三种:X射线结晶法、核磁共振、电镜三维重构。其中,应用最广泛的当属X射线结晶法。国际蛋白质数据库中已知晶体结构的蛋白质中80~90%是使用X射线结晶法得到的。
  然而,并不是所有的蛋白质都能良好结晶,使用X射线结晶法对不能结晶的蛋白质进行结构测定将浪费大量的资源。因此,研发准确高效的方法来对蛋白质能否结晶进行预测就具有重要意义。
  本文提出了一种新的蛋白质结晶预测方法。该方法从蛋白质的物理化学特性、序列组成成分以及蛋白质进化信息抽取有效的鉴别特征;在此基础上,使用随机森林建立预测模型并展开结晶预测。在标准数据集上交叉验证及独立测实验证的结果表明,本文所述方法具有良好的性能,是对已有蛋白质结晶预测方法的有益补充。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号