首页> 中文学位 >癌症驱动通路的启发式识别方法研究
【6h】

癌症驱动通路的启发式识别方法研究

代理获取

目录

声明

摘要

插图索引

附表索引

第1章 绪论

1.1 研究背景和意义

1.2 癌症数据(TCGA)概述

1.2.1 癌症数据的简介

1.2.2 TCGA数据的特点

1.2.3 TCGA数据的预处理

1.3 国内外研究现状

1.3.1 国外研究现状

1.3.2 国内的研究现状

1.4 研究难点

1.5 主要研究目标和内容

1.6 论文结构安排

第2章 相关理论基础

2.1 引言

2.2 主要问题模型

2.3 主要方法介绍

2.3.1 贪婪算法

2.3.2 马尔可夫—蒙特卡洛方法

2.3.3 二元线性规划模型(BLP)

2.3.4 遗传算法

2.4 本章小结

第3章 混沌-多种群遗传算法的通路识别研究

3.1 引言

3.2 混沌理论

3.3 多种群遗传算法理论

3.4 混沌-多种群遗传算法描述

3.5 数据集描述

3.6 实验设置

3.7 实验结果分析

3.7.1 模拟数据对比

3.7.2 恶性胶质瘤结果对比

3.7.3 肺癌结果对比

3.7.4 头颈部鳞状细胞癌(HNSCC)结果对比

3.7.5 卵巢癌(OC)结果对比

3.8 本章小结

第4章 多通路的驱动基因识别方法

4.1 引言

4.2 多通路识别方法的基本理论

4.2.1 Multi-Dendrix算法描述

4.2.2 CCMGA算法原理

4.3 协同混沌-遗传识别(CCMGA)算法

4.4 数据集描述

4.5 实验结果分析

4.5.1 模拟数据结果分析

4.5.2 临床数据的结果分析

4.6 本章小结

结论

参考文献

致谢

攻读学位期间所发表的学术论文

攻读学位期间所参与的科研活动

展开▼

摘要

数据挖掘是生物学研究领域的重要技术,被广泛应用于癌症治疗中。癌症是最常见的一种由于基因的突变,导致机体失去对细胞生长的正常调控,进而异常增生、分化的恶性肿瘤。随着二代测序技术的发展,癌症数据库也得到了长足发展。现在癌症数据库(The Cancer Genome Atlas,TCGA)的数据量非常大,如何从海量数据中挖掘有效信息就成为了当下的热点问题。在癌症的研究中,一个关键的问题就是如何区分基因突变中的“乘客突变”和“驱动突变”。传统的方法就是从概率模型的角度找出基因数据集中反复出现的基因。但由于基因突变的异质性,这种方法比较理论化。早期的无先验的方法(De novo Driver Exclusivity,Dendrix)和遗传算法虽然能在一定程度上识别某些驱动通路,但随机性比较大,容易陷入局部解。针对以上问题,本文则主要围绕基因矩阵模型来分析癌症中的驱动通路,具体研究工作包括:
  (1)提出了一种基于混沌-多种群遗传算法(Chaos Multi-population GeneticAlgorithm,CMGA)的识别癌症驱动通路的方法。这种方法是一种无需先验知识的方法。本课题利用基因矩阵模型,将混沌方法和遗传算法各自优点结合起来,采取计算权重值的方式,来求得最终结果,达到优化解决该问题的效果。具体步骤是,我们首先在初始化种群的过程中,利用混沌算法的遍历性特点,遍历整个样本空间,优化抽样过程。然后在多种群遗传算法中,利用种群间的移民算子来加速算法的收敛过程。随后将该方法在1个模拟数据和4个临床数据上重复进行了大量实验,并且和以往的Dendrix、遗传算法等做了相关比较。在实验中,将各方法的平均权重值和有效运行次数进行了对比,CMGA方法的两个指标数值都是最大的。实验证明CMGA方法具有更好的稳定性能。
  (2)在Dendrix、CMGA算法中,所考虑的都是单通路识别的情况。但在现实生物个体中,基因间存在千丝万缕的联系,更应该考虑通路间的相互关系。驱动基因在基因矩阵中拥有的两个主要特征是:每条通路是同时具备高覆盖性和高互斥性的;通路间的基因有着协同突变的现象。因此,在CMGA的基础上,我们采用协同混沌-遗传算法(Co-occurring Chaos Mutli-population Genetic Algorithm,CCMGA),求解协同的多个驱动通路,使结果更加符合实际情况。同样,该方法也在1个模拟数据和4个临床数据中进行了大量实验。实验结果表明,该方法发现了癌症生理过程中的一些协作信号通路。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号