首页> 中文学位 >基因表型异质网带重启算子的随机游走算法研究
【6h】

基因表型异质网带重启算子的随机游走算法研究

代理获取

目录

声明

摘要

第1章绪论

1.1研究背景和意义

1.2国内外研究现状

1.2.1 异质信息网数据挖掘技术

1.2.2基于基因表型异质信息网的疾病基因预测方法

1.3论文的主要工作

1.4论文的组织结构

第2章异质网及随机游走算法简介

2.1异质信息网概述

2.1.1基本概念

2.1.2与相关概念比较

2.1.3异质信息网数据集

2.2基因表型异质网络

2.3随机游走算法简介

2.3.1随机游走模型概述

2.3.2带重启算子的随机游走

2.4异质网带重启算子随机游走模型在生物学领域的应用

2.5本章小结

第3章RWRHESER模型及其对LapRWRH算法的改进

3.1 RWRH模型简介

3.1.1数据集

3.1.2构造基因表型异质网及状态转移矩阵

3.1.3异质网上的重启随机游走算法

3.2 RWRHESER模型

3.3 LapRWRH-ESER算法

3.4本章小结

第4章实验结果分析

4.1实验环境配置

4.2数据准备

4.3 RWRHESER与RWRH实验对比分析

4.3.1 构造转移矩阵并进行随机游走

4.3.2 RWRHESER模型实验及结果

4.3.3 RWRHESER模型实验结果与RWRH模型结果对比分析

4.3.4 RWRHESER模型参数分析

4.4 LapRWRH-ESER与LapRWRH实验对比分析

4.4.1构造转移矩阵

4.4.2 LapRWRH-ESER算法实验及与LapRWRH算法对比分析

4.4.3 LapRWRH-ESER算法参数分析

4.5本章小结

结论

参考文献

攻读硕士学位期间发表的论文和取得的科研成果

致谢

展开▼

摘要

异质信息网的节点和边中包含更加丰富的语义信息,基于异质网的数据挖掘可以发现传统数据挖掘方法不易发现的关联和隐藏的关系,因而近年来受到研究者的重视。本论文利用蛋白质相互作用数据、疾病-基因关系数据、表型相似数据构造异质信息网,研究带重启算子的随机游走算法等数据分析方法,对疾病的候选致病基因进行排序,从而实现致病基因的准确定位。
  论文首先详细分析了经典的RWRH模型,包括其数据集,状态转移矩阵的构造以及利用随机游走算法得到基因排序结果的全过程。RWRH模型在探索蛋白质功能、药物靶点关系以及RNA疾病关系等领域被广泛应用。对于预测疾病的致病基因的研究,已经提出的方法大多是在构造异质网的数据源或者构造方式上进行改变或改进,但其本质都是基于RWRH模型的方法。
  基于RWRH模型,论文提出带扩展重启算子和扩展种子向量的RWRHESER模型,对初始种子向量p0按广度优先搜索(k次)形成扩展种子向量集PE,并相应地对重启算子也进行了扩展,在随机游走迭代算法中添加扩展重启算子Pe(k)。本文所提出的RWRHESER模型有效地避免了初始种子节点选择对算法性能的影响,在候选基因的排序过程中加强了异质网中致病基因节点和疾病表型节点的相邻结构数据对排序结果的影响。在预测疾病致病基因问题上,LapRWRH算法是基于RWRH模型的性能提升较大的方法之一,论文将RWRHESER模型应用于LapRWRH算法提出LapRWRH-ESER算法。
  利用HPRD数据库的开源蛋白质互作网络、MimMiner的表型相似性网络及OMIM数据库的基因表型关系网络构造异质信息网,对所提出的RWRHESER模型及LapRWRH-ESER算法与经典RWRH模型及LapRWRH算法进行了性能对比分析,使用留一交叉验证法比较,实验结果表明RWRHERSR模型和LapRWRH-ESER算法拥有更多的疾病基因成功预测数目。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号