基于蛋白质网络中复合体的识别方法研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

近年来，伴随着蛋白质组学和系统生物学研究的逐步深入，利用蛋白质相互作用网络识别复合体逐渐成为生物信息学的一个研究热点。高通量大数据实验产生大量蛋白质数据，其中势必包含大量假阳性的数据，假阳性数据定会影响到计算方法搜索复合体的最终效果。因此，采用计算方法来搜索复合体之前需要去除假阳性的影响。本课题对蛋白质网络中相互作用的蛋白质进行研究，运用计算聚类方法从中搜索出蛋白质复合体，其中研究的主要要点包括以下两点:
　　(1)为了减少通过高通量大数据实验发现的蛋白质数据中假阳性的影响，从而提升搜索蛋白质复合体识别的精度，本章中提出了一种新的搜索蛋白质复合体的算法:MCLAd。首先，基于蛋白质相互作用网络拓扑结构的特性，选择处理网络拓扑特性方法AdjstCD对所得到的高通量蛋白质相互作用数据进行预处理，减少数据的假阳性;其次，再结合经典的MCL聚类算法进行蛋白质复合体的聚类识别;最后，将笔者的算法MCLAd和现有的7种优秀方法:MCL，ClusterONE，MCODE，RRW，RNSC，COACH以及CORE算法分别进行了实验比较。通过大量实验验证显示，本论文所提出来的MCLAd搜索算法具有非常明显的实验效果，对搜索蛋白质复合体有非常好的实验性能。
　　(2)集成ClusterONE，MCL和RRW三种方法的优势，本文提出了一种新的蛋白质复合体搜索算法MCR，并且将MCR分别同MCL，COACH，ClusterONE，MCODE，RRW，RNSC，CORE以及我们所提出的MCLAd方法进行实验比较。将上述算法分别作用在BioGRID蛋白质相互作用数据库和DIP蛋白质相互作用数据库这两个数据集上，并且将搜索所得的结果即蛋白质复合体分别同SGD以及MIPS这两种复合体标准数据集进行实验比较。实验表明，同其他搜索蛋白质复合体算法相比，MCR算法搜索出的蛋白质复合体同标准复合体数据集匹配，在搜索效率以及可靠性上面都具有非常大的优势。

著录项

作者
黄欣;
展开▼
作者单位

湖南大学;

展开▼
授予单位湖南大学;
学科软件工程
授予学位硕士
导师姓名吴蓉晖,陈敏;
年度 2016
页码
总页数
原文格式 PDF
正文语种中文
中图分类蛋白质;
关键词
蛋白质网络; 复合体; 识别算法; 聚类分析; 拓扑结构;

相似文献

中文文献
外文文献
专利

1. 基于蛋白质网络的复合体识别研究综述 [J] . 代启国 ,郭茂祖 . 智能计算机与应用 . 2015,第003期
2. 基于蛋白质网络的复合体识别研究综述 [J] . 代启国 ,郭茂祖 . 智能计算机与应用 . 2015,第003期
3. 基于蛋白质互作用网络的关键蛋白质识别研究 [J] . 赵燕萍 . 山西师范大学学报（自然科学版） . 2012,第004期
4. 蛋白质网络中复合体和功能模块预测算法研究 [J] . 鱼亮 ,高琳 ,孙鹏岗 . 计算机学报 . 2011,第007期
5. 组织特异性蛋白质复合体的识别 [J] . 丁霞 ,张晓飞 ,易鸣 . 数学杂志 . 2017,第005期
6. 道路交通网络中的关键节点识别方法研究 [C] . Yan Kai ,严开 ,Li Ling . 2018年全国理论计算机科学学术年会 . -1
7. 基于蛋白质网络的复合体识别算法研究 [A] . 代启国 . 2015

相关主题

基于蛋白质网络中复合体的识别方法研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅