首页> 中文学位 >蛋白质交互网络中的复合物识别与应用研究
【6h】

蛋白质交互网络中的复合物识别与应用研究

代理获取

目录

声明

摘要

图目录

表目录

主要符号表

1 绪论

1.1研究背景与意义

1.2蛋白质交互网络中的复合物识别研究现状与问题

1.2.1蛋白质交互作用关系网络

1.2.2蛋白质复合物识别

1.2.3蛋白质复合物识别亟待解决的问题

1.3蛋白质复合物的应用研究现状

1.4本文主要研究思路与内容

1.5本文的结构

2蛋白质关系网络特征对复合物识别方法性能的影响

2.1蛋白质交互作用关系网络特性分析

2.1.1 蛋白质交互作用关系网络的生物特征

2.1.2蛋白质交互作用关系的拓扑特征

2.2网络特性对蛋白质复合物识别算法性能的影响分析

2.2.1 六种经典的基于网络拓扑的蛋白质复合物识别算法

2.2.2实验评价标准

2.2.3实验结果及分析

2.3本章小结

3基于蛋白质节点嵌入的复合物识别方法

3.1 PC-SENE蛋白质复合物识别算法

3.1.1蛋白质节点嵌入

3.1.2蛋白质复合物衡量方法

3.1.3 PC-SENE算法

3.2实验设计

3.2.1 实验数据及对比方法

3.2.2实验评价

3.3实验结果与分析

3.3.1蛋白质复合物识别实验结果对比

3.3.2参数灵敏度测试

3.3.3 蛋白质复合物生物显著性比较

3.4本章小结

4基于蛋白质复合物嵌入的复合物识别方法

4.1 NodeEmbed-SLPC-RF方法

4.1.1节点及蛋白质复合物向量表示

4.1.2 SLPC复合物识别模型

4.1.3随机森林模型

4.2.1实验数据

4.2.2对比方法及评价标准

4.3实验结果与讨论

4.3.1基于复合物嵌入的分类评估

4.3.2不同方法对链接预测的性能影响

4.3.3不同策略生成复合物嵌入的性能比较

4.3.4基于蛋白质向量表示相似性的网络重构

4.4本章小结

5基于多物种蛋白质关系网络嵌入的复合物识别方法

5.1 MEMO蛋白质复合物识别算法

5.1.1集成蛋白质交互作用关系网络

5.1.2蛋白质节点表示

5.1.3蛋白质复合物识别

5.1.4 MEMO方法

5.2实验设计

5.2.1实验数据及对比方法

5.2.2评价方法

5.3实验结果与分析

5.3.1不同识别方法性能对比

5.3.2参数敏感性测试

5.3.3蛋白质复合物生物显著性比较

5.4本章小结

6基于蛋白质复合物的罕见病致病基因挖掘

6.1 DIGNiFI罕见病致病基因识别方法

6.1.1 DIGNiFI方法

6.1.2融合基因标注及蛋白质复合物信息

6.2实验设计

6.2.1实验数据

6.2.2对比实验及评价方法

6.3实验结果与分析

6.3.1 k=1的实验结果分析

6.3.2实验参数敏感性分析

6.3.3使用生物医学文本数据增强蛋白质关系网络

6.3.4案例研究:挖掘遗传性眼病的致病基因

6.4本章小结

7结论

7.1结论

7.2创新点

7.3 展望

参考文献

攻读博士学位期间科研项目及科研成果

致谢

作者简介

展开▼

摘要

蛋白质是生命活动的基础,蛋白质复合物是蛋白质执行其功能的主要形式。因此,准确识别蛋白质复合物是探索各种生命活动的基础。随着蛋白质交互作用数据的不断增加,利用计算方法从蛋白质交互作用关系网络中识别复合物是当前生物信息学领域的研究热点之一。本文研究以蛋白质交互作用关系网络为基础的蛋白质复合物识别问题,针对生物学家不同的需求情况,设计了不同的蛋白质复合物识别算法,研究内容主要包括: 本文首先分析了经常用于识别蛋白质复合物的蛋白质交互作用关系网络的特征,包括生物特征和拓扑特征,同时定量分析蛋白质交互作用关系网络的特征是否会对蛋白质复合物识别算法产生影响,为设计基于蛋白质交互作用关系网络特性的蛋白质复合物识别算法提供依据。 在仅给定蛋白质交互作用关系网络的情况下,针对网络中存在假阳性数据的问题,提出基于蛋白质节点嵌入相似度的蛋白质复合物识别方法。实验结果表明,利用蛋白质节点嵌入相似度为网络加权的方式提升了网络的可靠性,与现有多个性能领先的蛋白质复合物识别算法相比,该方法能够识别出更多具有生物意义的复合物。 在已知蛋白质交互作用关系网络,同时给出该网络相应的一些标准蛋白质复合物的情况下,提出了基于蛋白质复合物嵌入的监督学习方法用于识别复合物。实验结果表明,蛋白质复合物嵌入能够充分表示已知复合物的特征,基于复合物嵌入的监督学习方法能够有效提升预测复合物的质量,与现有复合物识别方法比较,本文所提出的方法取得了更高的F值。 在已知不同物种蛋白质交互作用关系网络的情况下,为了充分利用不同物种的蛋白质交互作用关系来解决网络中存在的假阴性和假阳性噪音数据,提出了基于多物种网络嵌入的蛋白质复合物识别方法。实验结果表明,本文提出的基于多物种网络的嵌入方法不仅能够保留单个物种网络的结构信息,而且能够充分利用不同物种蛋白质间的直系同源关系。此外,本文提出的基于网络嵌入的复合物识别方法与现有性能领先的蛋白质复合物识别算法相比,取得了更高的F值,并且识别出更多具有高生物意义的复合物。 与此同时,本文提出一种基于蛋白质复合物来识别罕见病致病基因的方法,该方法融合蛋白质交互作用关系网络拓扑结构、基因标注信息和蛋白质复合物特征来预测罕见病致病基因。实验结果表明,使用蛋白质复合物能够在准确率、F值上提高罕见病致病基因预测算法的性能。 综上所述,本文针对生物学家不同需求情况,即可使用资源不同的情况下,提出针对不同需求情况的蛋白质复合物识别方法,实验结果表明本文提出的方法能够有效地解决蛋白质交互作用关系网络的噪音问题,并且能够充分利用不同蛋白质交互作用关系网络的拓扑特征和蛋白质复合物的多样性特征,从而提升基于蛋白质交互作用关系网络的蛋白质复合物的识别性能。同时,该研究也可以推广并应用于解决其他与蛋白质交互作用关系网络相关的任务。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号