首页> 中文学位 >基于密度聚类和特征分类的蛋白质相互作用热区预测
【6h】

基于密度聚类和特征分类的蛋白质相互作用热区预测

代理获取

目录

声明

摘要

第1章 绪论

1.1 研究背景与意义

1.2 国内外研究现状

1.3 蛋白质相互作用热区的概念

1.3.1 蛋白质-蛋白质相互作用

1.3.2 蛋白质结合面性质

1.3.3 蛋白质相互作用中的热点残基

1.3.4 蛋白质相互作用中的热区

1.4 本文的研究内容与创新点

1.4.1 本文的内容安排

1.4.2 本文的创新点

1.5 本章小结

第2章 蛋白质相互作用的生物实验方法和智能计算方法

引言

2.1 获取蛋白质相互作用的生物实验方法

2.1.1 丙氨酸突变实验

2.1.2 Bind-Wash-Elute洗脱实验

2.1.3 高通量实验方法

2.2 预测蛋白质相互作用的智能计算方法

2.2.1 基于基因信息的方法

2.2.2 基于蛋白质结构信息的方法

2.2.3 基于氨基酸序列信息的方法

2.3 蛋白质相互作用的数据库

2.4 本章小结

第3章 基于密度聚类和特征分类的蛋白质热区预测

引言

3.1 基于密度的增量型聚类

3.1.1 聚类分析

3.1.2 聚类算法分析

3.1.3 基于蛋白质残基密度的增量型聚类

3.2 基于特征的分类

3.2.1 支持向量机

3.2.2 递归特征消除结合归一化互信息特征选择

3.3 结合密度聚类和特征分类的热区预测算法

3.4 实验结果与分析

3.4.1 数据集

3.4.2 标准热区定义

3.4.3 评价准则

3.4.4 实验结果

3.4.5 预测性能比较

3.5 本章小结

第4章 热区预测算法优化

引言

4.1 聚类参数选择优化

4.1.1 蛋白质残基密度聚类参数选择

4.1.2 聚类参数选择优化算法

4.1.3 实验结果

4.1.4 预测性能比较

4.2 邻居残基优化

4.2.1 热区预测结果邻居残基优化原则

4.2.2 邻居残基优化算法

4.2.3 实验结果

4.2.4 预测性能比较

4.3 本章小结

第5章 基于序列保守性的热区验证方法

引言

5.1 直接同源基因

5.2 保守性得分函数

5.3 实验结果与分析

5.4 本章小结

第6章 总结与展望

6.1 本文的主要研究工作

6.2 下一步工作展望

致谢

参考文献

攻读博士学位期间取得的科研成果

攻读博士学位期间参加的科研项目

展开▼

摘要

蛋白质功能由蛋白质相互作用进行表达,蛋白质与蛋白质相互作用的界面上并非所有的残基都是重要的,有时只有少数几个残基对蛋白质的结合起着关键的作用,这些起关键作用的残基称为热点残基。大量实验表明,热点残基在蛋白质与蛋白质相互作用中会形成一种特定的构象,该构象称为热区。热区具有稳定并协调蛋白质与蛋白质相互作用的功能,热区的发现和界定对于理解疾病的起源、生物制药、药物作用靶点等蛋白质活动都非常重要。
  近年来,研究人员从实验角度出发,记录了一些蛋白质相互作用的数据,但是由于蛋白质相互作用实验成本高、周期长、复杂度高,实验数据相当有限,因此利用计算机的方法预测蛋白质相互作用的热区就显得尤为重要。本文提出一种基于密度聚类和特征分类的蛋白质热区预测模型,实验结果显示,与其他方法相比,所提出的方法可以得到更好的预测结果。并且在热区研究的基础上,提出了一种基于序列保守性的验证热区的方法。研究的主要创新点概括如下:
  (1)提出了一种基于密度的增量型聚类结合特征分类的预测蛋白质相互作用热区的方法。首先利用基于密度的增量型聚类对数据集里面的数据进行聚类,得到多个初始的聚类簇,然后利用基于特征的分类剔除这些聚类簇中的非热点残基,从而得到最终的预测热区。实验结果显示所提出的方法可以预测出绝大多数的热区,同时在预测热区中热点的覆盖率也高于其他相关方法。
  (2)提出了一种有效的特征选择的方法。在进行特征分类时,为了有效的选择关键的生物特征,首先从蛋白质结构出发,提取一系列与蛋白质相互作用相关的特征,然后通过基于支持向量机的递归特征消除结合归一化互信息特征选择,利用向后特征淘汰策略得到最重要的特征和去除无关紧要的特征,从而得到一个从最重要到最无关的特征排序列表,最后通过引入F-score找到这些特征的最优化组合。
  (3)提出了一种基于序列保守性的热区验证方法。由于生物实验的复杂性和长周期性,使得由生物实验验证热区十分困难,这里提出一种基于序列保守性的热区验证方法。对于热区中的每一个热点,在蛋白质数据库中找到形成该复合物的两个蛋白质,通过其可变剪切体得到该基因的完整序列,通过完整的蛋白质序列找到其在不同物种中的直接同源基因,然后进行多序列比对,记录预测热区中每一个热点残基对应到不同物种基因序列中的位点,通过模块替换矩阵构造的蛋白质热区保守性得分函数,得到热区在不同物种中的保守性得分,最后计算每一个热区相对于相互作用界面上其他区域的保守倾向性。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号