首页> 中文学位 >基于最佳邻居节点的蛋白质复合体挖掘算法研究
【6h】

基于最佳邻居节点的蛋白质复合体挖掘算法研究

代理获取

目录

声明

摘要

第一章 绪论

1.1 课题研究背景

1.2 课题研究意义

1.3 相关研究工作

1.3.1 传统图聚类算法

1.3.2 结合基因表达数据的聚类算法

1.3.3 结合功能信息和其他生物信息的算法

1.4 本文的主要研究内容

1.5 本文的组织结构

第二章 蛋白质网络概述

2.1 基本概念

2.2 基本结构特征

2.2.1 节点度分布

2.2.2 小世界特性

2.2.3 高聚集系数

2.2.4 簇结构

2.3 本章小结

第三章 基于混合模块化度量标准的最佳邻居节点挖掘算法

3.1 引言

3.2 算法BN-LGQ

3.2.1 混合模块化度量标准LGQ

3.2.2 最佳邻居节点定义

3.2.3 BN-LGQ算法描述

3.3 实验结果与分析

3.3.1 参数α对算法聚类结果的影响

3.3.2 与参考蛋白质复合体进行比较

3.3.3 功能富集和共定位富集分析

3.4 本章小结

第四章 基于多阶段核扩展的最佳邻居节点挖掘算法

4.1 引言

4.2 算法BN-MNE

4.2.1 将无向网络图处理为带权的有向网络图

4.2.2 识别蛋白质复合体一级核

4.2.3 带权最佳邻居节点定义

4.2.4 识别蛋白质复合体二级核

4.2.5 通过多级核扩展生成蛋白质复合体

4.3 实验结果与分析

4.3.1 复杂社会网络

4.3.2 蛋白质网络

4.4 本章小结

第五章 总结

5.1 本文的工作总结

5.2 展望

参考文献

在校期间发表的论文和参与的项目

致谢

展开▼

摘要

在后基因组时代,系统地分析和理解生物体内蛋白质间如何通过交互来完成生命活动是一个重要的挑战。分析蛋白质网络的结构特性,从蛋白质网络中挖掘蛋白质复合体和功能模块以及标注未知蛋白质功能正成为当前蛋白质组学研究的重点。
  本文在深入分析蛋白质网络的结构特征的基础上,根据蛋白质网络的共有特性提出了有效识别蛋白质复合体的算法,主要研究工作包括:
  (1)在大多数现有算法中,模块的最佳邻居节点往往被定义为跟模块内所有节点关系最紧密的节点。文中重新定义了节点和模块的最佳邻居节点,以节点间的共同邻居数来作为衡量最佳邻居节点的重要因素,将满足特定条件节点的最佳邻居节点来作为模块的最佳邻居节点。
  (2)提出了一种混合模块化度量标准LGQ(Local-Global Quality of modularity),既克服了全局模块化度量标准Q(global Quality of modularity)不能有效识别规模较小模块的局限性,又考虑到被局部模块化度量标准LQ(Local Quality of modularity)所忽略的模块在整个网络中所具有的全局特性。接着,提出了一种基于LGQ的最佳邻居节点挖掘算法BN-LGQ(Best Neighbour with LGQ),该算法不需要其他辅助信息,简单有效。将BN-LGQ算法应用于酵母蛋白质网络,实验结果表明,该算法能够有效识别较多的已知蛋白质复合体以及较多的具有生物意义的蛋白质复合体。
  (3)通过对复杂社会网络社区形成规律的研究,提出了一种基于多阶段核扩展的最佳邻居节点挖掘算法BN-MNE(Best Neighbour-Multistage Nuclear Extension)。首先,将算法BN-MNE应用于典型的复杂社会网络社团结构识别,实验分析表明,该算法能够较其他算法更好地识别复杂网络的社团结构。然后,将算法BN-MNE应用于酵母蛋白质网络,实验结果表明,该算法能够较好地挖掘出具有生物意义的蛋白质复合体,与复杂社会网络的实验结果有很好的一致性,同时也能够为其它基于复杂网络结构的蛋白质网络中复合体的识别提供有价值的参考信息。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号