首页> 中文学位 >基于混合算法的癌症驱动通路发现方法研究
【6h】

基于混合算法的癌症驱动通路发现方法研究

代理获取

目录

声明

第1章 绪论

1.1研究背景与意义

1.2癌症数据概述

1.3国内外研究现状

1.4研究难点

1.5主要研究重点和内容

1.6论文结构和章节安排

第2章 相关理论知识

2.1引言

2.2问题建立模型

2.3常用算法介绍

2.4结果的评价

2.5本章小结

第3章 动态遗传-蚁群算法的通路识别研究

3.1引言

3.2方法

3.3实验设置及结果分析

3.4本章小结

第4章 权值基因网络中驱动通路识别

4.1引言

4.2权值基因网络

4.3实验设置及结果分析

4.4本章小结

结论

参考文献

附录A 攻读学位期间所发表的学术论文

附录B 攻读学位期间所参与的科研活动

致谢

展开▼

摘要

众所周知,癌症是一种极其复杂的疾病,而且至今难以治愈。癌症可能是由于DNA复制时基因突变累积产生的,即基因畸变。目前,基因畸变可分为两类,第一类是对癌症扩散呈中性的突变(乘客突变),第二类则是能促进癌细胞增殖和无限扩散的突变(驱动突变)。识别驱动突变、驱动基因或驱动通路是理解癌症进展分子机制的关键。
  在海量的数据和突变中,由于存在许多噪声,而这些噪声对于解释和分析数据是一个不确定的因素。关键性问题就是,如何去除噪声、提取有效的数据以及如何从随机的乘客突变中把驱动突变区分出来,并确定为驱动通路。因此驱动通路的识别成为了生物信息学和医学领域的研究热点。本文主要围绕基因矩阵模型来识别癌症中的驱动通路,具体研究工作包括:
  (1)提出一种动态蚁群算法和遗传算法相结合的算法(Dynamically Heuristic Ant Colony Optimization and Genetic Algorithm, DACGA)。基于遗传算法的大范围全局搜索能力、快速性、随机性以及可扩展性等优点,结合蚁群算法并行性、正反馈性以及求解精度高等特性,把两个算法进行融合,并对融合算法中的适应性函数、交叉和变异等操作进一步优化,避免陷入局部最优。通过模拟数据集和真实数据集进行验证,实验结果表明该算法在一定程度上可以有效的提高算法的鲁棒性,并在精度上有所提高,而且在生物意义上,相比于其他的算法可以识别更多的有意义的驱动通路。
  (2)对于DACGA算法,当样本很大的时候,求最大权值子矩阵时的过程非常耗时,针对这个问题,在权值基因网络下,提出一种人工鱼群算法和遗传算法相结合的算法以识别驱动通路。首先通过高覆盖性过滤器进行数据处理,再根据高排他性过滤器构建有权值的基因网络,最后通过算法对权值基因网络进行识别驱动通路(weighted gene network and identify pathwaysby combinations of Artificial Fish Swarm Algorithm and Genetic Algorithm, WNA)。实验结果表明,该算法和其他的模型与算法相比,在运行时间上有了很大的提高,因此也更适用于大规模的数据集,而且在生物意义上能够识别出以前没有识别出来的驱动基因和驱动通路,获得比较好的结果。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号