基于PPI的蛋白质复合物发现算法的研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

蛋白质复合物是由多个蛋白质相互结合在一起的组织。生命活动由这些复合物来推动，因此研究蛋白质复合物的具体作用在生物领域具有非常重要的意义。然而，目前的生命科学领域在对这些复合物的识别需要相当大的时间成本和机器成本。由于现在拥有丰富的蛋白质相互作用网络，复合物可以看成是该网络上的社区。在相互作用网络上使用数据挖掘中社区发现的一些算法能够辅助识别这些复合物，以达到减少成本的目的。因此，基于蛋白质相互作用网络的复合物识别是一项有意义的研究课题。
　　现有的蛋白质复合物识别算法一般基于图的网络拓扑结构，结合子图挖掘或者特征学习等数据挖掘方法来识别这些复合物。但是这些算法往往很难完全考虑到蛋白质复合物的复杂性。有些算法只能考虑图密集区域的复合物而忽视稀疏区域的复合物，有些算法容易遗失部分复合物中的蛋白质或者产生冗余的蛋白质。因此，本文基于前人研究的这些缺陷，提出了两个更有效识别蛋白质复合物的算法:
　　第一个算法基于基本的寻找初始聚类再向外扩张的思想。为了得到有效的初始聚类，基于重启型随机游走能够得到一个网络图中所有节点之间的相关联程度，本算法将那些与某个节点联系紧密的节点组合成一个初始聚类，并对这些初始聚类进行去冗余操作形成真正的初始聚类。然后从这些初始聚类出发向外扩张成最后的复合物。在这个过程中，为了解决蛋白质复合物中的某些特殊边缘蛋白质，本文结合其他扩张公式的优缺点，提出新的容易控制聚类大小的有益密度扩张公式比较方法。同时在扩张后的复合物基础上，过于相似的会合并在一起，但是会保留某些特殊的复合物。
　　第二个算法同样基于初始聚类扩张的思想，基于重启型随机游走的结果，通过特定阈值的设计形成有一定规模的初始聚类，本算法认为某些区域内的最大的初始聚类一定程度上可视为这一部分的中心区域，将其他有相似节点的初始聚类都删去作为去冗余操作。最终得到一些互相正交的有代表性的真正初始聚类。在此过程中会产生很多剩余节点。由于重启型随机游走的结果节点之间的关联程度是一定的，因此可以根据这些剩余节点到真正初始聚类内所有节点的平均关联程度的大小来分配这些剩余节点以得到最终的复合物结果。
　　实验在几个著名的酵母细菌蛋白质相互作用网络上进行，本文提出的两个算法都表现出了较好的复合物识别能力。

著录项

作者
江家文;
展开▼
作者单位

广西大学;

展开▼
授予单位广西大学;
学科计算机应用技术
授予学位硕士
导师姓名陈庆锋;
年度 2017
页码
总页数
原文格式 PDF
正文语种中文
中图分类 TP311.13;
关键词
蛋白质相互作用网络; 复合物识别; 数据挖掘; 初始聚类扩张; 重启型随机游走;

相似文献

中文文献
外文文献
专利

1. 基于动态图的PPI网络构建和复合物挖掘算法研究 [J] . 李鹏 ,闵慧 ,罗爱静 . 电子学报 . 2021,第008期
2. 基于遗传算法的蛋白质复合物识别算法 [J] . 郑文萍 ,李晋玉 ,王杰 . 计算机科学与探索 . 2018,第005期
3. 基于动态加权PPI网络的关键蛋白质识别算法 [J] . 杨书新 ,鲁纪华 ,汤达荣 . 计算机应用研究 . 2019,第002期
4. 基于PPI网络的关键蛋白质的高效预测算法 [J] . 洪海燕 ,刘维 . 计算机科学 . 2016,第0z2期
5. PPI-DNA复合物的制备和PPI载体的细胞毒性研究 [J] . 王勤 ,吴铁 . 广东药学院学报 . 2005,第006期
6. 基于拓扑结构和随机森林算法预测蛋白质复合物功能 [C] . Zhanchao Li ,李占潮 ,Yanhua Lai . 第十二届全国计算（机）化学学术会议 . 2013
7. 基于PPI网络的蛋白质复合物和关键蛋白质识别算法研究 [A] . 刘银萍 . 2020

相关主题

基于PPI的蛋白质复合物发现算法的研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅