首页> 中文学位 >基于熵的聚类算法在蛋白质网络模块检测中的应用
【6h】

基于熵的聚类算法在蛋白质网络模块检测中的应用

代理获取

目录

文摘

英文文摘

第一章 绪论

1.1 研究背景及意义

1.2 蛋白质相互作用网络模块划分现状与动态

1.2.1 生物网络与模块

1.2.2 蛋白质相互作用网络模块划分算法现状与动态

1.3 本文的研究工作及论文结构

第二章 图与蛋白质相互作用网络

2.1 图的相关定义

2.1.1 图的矩阵表示

2.1.2 关于度的概念

2.1.3 几种随机网络模型

2.2 蛋白质相互作用网络简介

第三章 聚类算法的相关理论

3.1 聚类算法的基本概念

3.2 几种常见的聚类算法

3.2.1 层次聚类

3.2.2 密度聚类

3.2.3 熵聚类

3.3 聚类算法结果评价

第四章 最小带权相似熵聚类算法

4.1 算法设计

4.1.1 熵理论

4.1.2 相似度与相似熵

4.1.3 算法步骤

4.2 算法优化

4.3 实验结果与分析

4.3.1 算法有效性验证

4.3.2 蛋白质相互作用网络

4.3.3 蛋白质功能预测

第五章 总结与展望

致谢

参考文献

研究成果

展开▼

摘要

人类基因组计划和许多物种基因组测试的完成标志着一个新的生物学研究时代一后基因组时代来临了,意味着人类基因组的研究将全面进入信息提取和数据分析阶段,即生物信息学发挥重要作用的阶段,生命科学的研究重点开始从基因组学转移到了蛋白质组学。高通量的生物技术产生了大量的蛋白质网络数据,现有实验结果表明蛋白质网络是由相互作用的、可划分的功能模块所组成。检测这些功能模块对于了解蛋白质网络的拓扑结构是非常重要的。目前已有的三级分子联合体识别算法(MCODE),派系过滤算法(CPM)和基于结构的网络聚类算法(SCAN)等方法只是检测网络中“稠密”的簇而忽略了蛋白质网络自身的属性一一簇有着不同的尺寸、密度和形状。本文根据蛋白质网络中模块拓扑结构的多样性,提出了一种应用于蛋白质网络的基于熵的聚类算法。首先,利用两点之间共有邻居数得到两点之间的相似度。其次,通过对两点之间相似度的熵化来得到两点之间的相似熵。最后,再利用得到的相似熵根据最小带权相似熵准则进行聚类,从而将网络进行模块划分。通过对酵母菌网络的仿真实验研究,从匹配率和功能同源性两个方面与已知的经典算法进行比较,结果表明该方法在应用于蛋白质功能的注释上要优于其它算法。为了进一步验证算法的有效性,对人工合成网络和社会网络也进行了测试,实验结果表明本文算法是可靠的且具有良好的扩展性。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号