首页> 中文学位 >基于监督学习的人类蛋白质网络复合物识别
【6h】

基于监督学习的人类蛋白质网络复合物识别

代理获取

目录

声明

1 绪论

1.1 研究背景与意义

1.2 研究综述

1.3 研究思路

1.4 研究内容

1.5 论文结构

2 相关背景知识和评价指标

2.1 蛋白质关系网络

2.2 蛋白质复合物

2.3 基因本体

2.4 评价指标

3 基于监督学习的特定疾病复合物识别

3.1 数据集

3.2 算法

3.3 实验结果

3.4 结果分析

3.5 本章小结

4 针对不同种类网络的复合物识别

4.1 数据集

4.2 算法

4.3 实验结果

4.4 结果分析

4.5 本章小结

5 利用点向量辅助复合物识别

5.1 数据集

5.2 算法

5.3 实验结果

5.4 结果分析

5.5 本章小结

结论

参考文献

攻读硕士学位期间发表学术论文情况

致谢

展开▼

摘要

蛋白质复合物是功能相似的蛋白质分子通过聚合作用形成的大分子结构,并以复合物的形式在生物体中发挥作用,在理解生物体的生命机制和原理等方面具有重大意义。随着人类基因组学研究和高通量技术的发展,海量的蛋白质关系数据也随之产生。这些蛋白质关系构成多样的蛋白质关系网络,如酵母菌蛋白质关系网络、人类蛋白质关系网络、病菌蛋白质关系网络等。这些关系网络为复合物识别的研究提供了很好的数据支持,但同时多数据中存在的不可靠关系也给复合物识别带来了较大的挑战。
  本文首先介绍了蛋白质复合物识别算法的研究背景与意义、国内外相关学者的研究现状等,在此基础上对蛋白质复合物识别任务中存在的问题进行了总结:如何在人类蛋白质网络上进行有效的复合物识别,并揭示蛋白质复合物与疾病间所存在的关系;如何为不同的蛋白质关系网络选择合适的复合物识别算法来获得较高的性能;如何融合更多的特征到复合物识别任务中,以进一步提升算法的性能。这些问题的存在限制了复合物识别算法的发展。
  接着,为了在人类蛋白质关系网络上进行有效的复合物识别,本文改进了已有的基于监督学习的复合物识别算法。改进的算法充分利用了网络的拓扑结构性,并融合了基因本体的生物特性,从而提升复合物识别算法的性能。此外,为了更好地揭示蛋白质复合物与疾病间的关系,本文利用蛋白质关系抽取系统从生物文献中抽取与特定疾病相关的疾病蛋白质关系,并融合到原始网络中,以提高疾病复合物识别的实验效果。同时通过分析对应的疾病复合物,来加深人们对相应疾病的理解。
  随后,为了快速对不同蛋白质网络的复合物识别选择合适的算法,本文针对酵母菌蛋白质网络和人类蛋白质关系网络展开研究,并探索了已有的复合物算法在不同网络上的适应程度。此外,为了揭示不同特征在不同网络上的作用强度,本文将已有算法的回归模型和随机森林模型进行对比,从而为进行复合物识别算法的研究提供有益借鉴。
  最后,已有的复合物识别算法全都是基于人工的特征。为了衡量自动学习特征在复合物识别任务中的作用,本文将基于点向量的学习方法融合到已有的复合物识别算法中。通过多特征的融合,使得已有的复合物识别算法更加有效。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号