首页> 中文学位 >基于随机游走的蛋白质功能预测算法设计与实现
【6h】

基于随机游走的蛋白质功能预测算法设计与实现

代理获取

目录

摘要

第一章 绪论

1.1 课题背景与意义

1.2 蛋白质相互作用简介

1.2.1 蛋白质相互作用数据库

1.2.2 蛋白质相互作用网络及其构建

1.3 基于相互作用网络的蛋白质功能预测

1.3.1 直接注释方法

1.3.2 模块化方法

1.4 本文主要研究工作与创新点

1.5 本文章节安排

第二章 数据的获取与处理

2.1 引言

2.2 Gene Ontology(GO)简介

2.3 蛋白质相互作用数据的获取

2.4 蛋白质相互作用数据的整合

2.5 小结

第三章 基于蛋白质相互作用网络的随机游走算法

3.1 引言

3.2 图的预备知识

3.2.1 图的相关定义

3.2.2 图的邻接矩阵表示

3.3 随机游走算法

3.3.1 背景介绍

3.3.2 图上的随机游走

3.3.3 在蛋白质相互作用网络上的随机游走算法

3.4 小结

第四章 基于注释模式的蛋白质功能预测

4.1 引言

4.2 蛋白质的注释模式

4.2.1 注释模式的相关定义

4.2.2 提取注释模式

4.3 多标签学习的K近邻算法

4.3.1 K近邻算法

4.3.2 ML-KNN在蛋白质功能预测中的应用

4.4 小结

第五章 实验与结果分析

5.1 评价指标

5.2 结果分析

5.3 小结

结论

参考文献

致谢

声明

展开▼

摘要

蛋白质的功能的预测是后基因组时代的一个关键性的科学研究任务。随着高通量实验技术的快速发展,产生了越来越多的蛋白质相互作用数据,根据这些相互作用数据构建了各种蛋白质相互作用网络,也产生了许多融合多个蛋白质序列或构建基因表达数据的功能预测方法。本文从通路数据出发,利用通路数据整合蛋白质相互作用网络。在这个蛋白质互作网络中一部分的蛋白质的功能是已知的,另一部分的蛋白质功能是未知的。对于未知功能的蛋白质,可以利用它们与已知功能蛋白质的相互作用关系来实现其功能的预测。
  目前,已有的蛋白质功能预测方法都是假设在互作网络中相邻的蛋白质具有相似的功能。而我们的算法则假设:在蛋白质的互作网络中,不管蛋白质是否相邻,只要两个蛋白质具有相似的功能注释模式则它们的功能相似。通过和已知功能的蛋白质比较注释模式的相似度,来预测未知蛋白质的功能。基于以上的假设,可以把蛋白质功能预测看作是一个多标签分类问题,把已知功能的蛋白质的注释标签集组成训练样本集,而未知功能蛋白质的注释标签集组成待测样本集,通过比较待测样本集中的注释模式与训练样本集中的注释模式来实现未知功能蛋白质的功能预测。
  基于这样一种理念,本文提出了一种新的基于随机游走的蛋白质功能预测方法。该方法不仅考虑了网络的局部拓扑结构还考虑了全局拓扑结构。该算法以已知功能的蛋白质为随机游走的起始点,把随机游走在蛋白质互作网络中产生的邻居信息转换为注释模式信息;然后,利用传统的K近邻算法从训练样本集中找到未知功能蛋白质的k个最近邻;最后,结合多标签分类的K近邻算法,统计k个最近邻中蛋白质的功能类数目,基于最大后验概率预测未知功能蛋白质所属于的功能标签类。
  我们利用Ⅰ型糖尿病通路数据构建了蛋白质互作网络,进行了未知功能蛋白质的预测实验,结果表明本文所提出的方法能够有效的进行蛋白质的功能预测。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号