首页> 中文学位 >基于蛋白质相互作用网络的蛋白质功能预测
【6h】

基于蛋白质相互作用网络的蛋白质功能预测

代理获取

目录

摘要

第一章 绪论

1.1 课题的背景和意义

1.2 蛋白质相互作用网络概述

1.2.1 蛋白质简介

1.2.2 蛋白质的功能

1.2.3 蛋白质相互作用网络

1.2.4 常用蛋白质相互作用数据库

1.3 蛋白质功能预测计算方法概述

1.3.1 基于蛋白质序列的方法

1.3.2 基于蛋白质结构的方法

1.3.3 基于基因组上下文的方法

1.3.4 基于基因表达数据的方法

1.3.5 基于文本挖掘的方法

1.3.6 基于蛋白质相互作用网络的方法

1.4 本文内容

1.5 论文结构

第二章 一种基于协同分类的蛋白质功能预测方法

2.1 引言

2.2 方法

2.2.1 符号和问题定义

2.2.2 利用蛋白质序列信息在网络中添加边

2.2.3 基于吉布斯抽样的协同分类算法

2.3 实验

2.3.1 数据集

2.3.2 实验设置

2.3.3 评价指标

2.3.4 对比方法

2.3.5 参数κ和λ对实验结果的影响

2.3.6 留一验证的实验结果

2.3.7 稀疏标注网络中的实验结果

2.4 本章小结

第三章 网络重构与网络加边对蛋白质功能预测的影响

3.1 引言

3.2 方法

3.2.1 相似性度量

3.2.2 网络重构和网络加边

3.2.3 蛋白质功能预测算法

3.3 实验

3.3.1 数据集

3.3.2 实验设置

3.3.3 相似性度量的选择

3.3.4 参数κ和λ对实验结果的影响

3.3.5 数据集A上的实验结果

3.3.6 数据集B上的实验结果

3.4 本章小结

第四章 一种基于主动学习的蛋白质功能预测方法

4.1 引言

4.2 方法

4.2.1 主动学习概述

4.2.2 一种基于主动学习的蛋白质功能预测方法

4.2.3 基于吉布斯抽样的协同分类算法

4.3 实验

4.3.1 数据集

4.3.2 实验设置

4.3.3 实验结果

4.4 本章小结

第五章 癌症蛋白质在蛋白质相互作用网络中的拓扑特征

5.1 引言

5.2 方法

5.2.1 生物网络的主要拓扑特征

5.2.2 两种不同的观点

5.2.3 复杂网络分析中的三种网络度量

5.3 实验

5.3.1 数据集

5.3.2 实验结果

5.4 本章小结

第六章 总结与展望

6.1 本文工作总结

6.2 未来工作展望

参考文献

发表/录用论文

已投稿论文

致谢

声明

展开▼

摘要

蛋白质是生物体内必不可少的大分子,几乎参与了细胞内所有的生物过程,蛋白质功能的研究对于理解生命活动、疾病治疗以及新药开发等都具有重要意义。然而实验方法预测蛋白质的功能费时费力,已经不能满足当代生命科学的发展需要。近年来,随着高通量生物实验技术的迅速发展,人们获得了大量的蛋白质相互作用数据,研究人员提出了很多利用蛋白质相互作用网络对蛋白质功能进行预测的方法,基于蛋白质相互作用网络的蛋白质功能预测已经成为生物信息学中最重要的研究课题之一。本文针对基于蛋白质相互作用网络的蛋白质功能预测进行研究,主要内容包括以下四个方面:
  1.提出了一种基于协同分类的蛋白质功能预测方法,该方法通过结合蛋白质序列信息和蛋白质相互作用信息来提高蛋白质功能预测的效果。我们首先通过计算蛋白质序列相似度在蛋白质相互作用网络中添加边,从而对网络进行重构,然后在这个新的网络中利用协同分类算法对蛋白质功能进行预测。实验结果表明,我们所提出的方法优于已有的基于蛋白质相互作用网络的预测方法,通过蛋白质序列信息在网络中加边的方法确实能够提高蛋白质功能预测的效果;并且我们所提出的方法对网络标注情况不十分敏感,具有很好的鲁棒性。
  2.网络重构和网络加边是两种主要的构建可靠蛋白质相互作用网络的方法,然而,这两类方法缺少一个系统的对比评价。因此,我们在两类数据集上对这两种方法做了一个全面的对比。我们首先利用蛋白质序列相似度、网络局部相似度和网络全局相似度进行网络重构和网络加边,然后对比同一种预测算法在原始网络、重构网络和加边网络上的分类效果。实验结果表明,在大多数情况下加边网络的预测效果要优于原始网络和重构网络;并且对于网络加边,蛋白质序列相似度要优于网络局部相似度和网络全局相似度。
  3.提出了一种基于主动学习的蛋白质功能预测方法,该方法通过选择信息量大的蛋白质进行标注来提高蛋白质功能预测的效果。我们首先利用谱聚类算法对蛋白质相互作用网络进行聚类操作,并在每一个簇中,利用三种常用的网络中心化指标(度指标、紧密度指标和介数指标)选择合适的候选蛋白质进行标注。然后基于这些已标注的蛋白质,利用协同分算法对蛋白质功能进行预测。实验结果表明,通过选择信息量大的蛋白质进行标注,基于主动学习的蛋白质功能预测方法取得了更好的预测效果;并且在大部分情况下,介数指标要优于度指标和紧密度指标。
  4.对癌症蛋白质在人类和酵母两种蛋白质相互作用网络中的拓扑特征进行研究。我们首先把人类蛋白质分为四类:癌症蛋白质、疾病蛋白质、必要蛋白质和控制蛋白质;然后通过同源基因把这四类蛋白质映射到酵母蛋白质相互作用网络中;最后利用三种常用的网络度量(度指标、集聚系数和介数指标)对四类蛋白质的拓扑特征进行对比。实验结果表明,相比于其它三类蛋白质,癌症蛋白质拥有较高的度指标和较低的集聚系数。也就是说,癌症蛋白质位于人类蛋白质相互作用网络的中心位置,网络中与癌症蛋白质有相互作用的蛋白质数量比较多,但是它们的集聚程度较低。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号