首页> 中文学位 >基于马尔科夫链模型的癌症分类与诊断方法研究
【6h】

基于马尔科夫链模型的癌症分类与诊断方法研究

代理获取

目录

声明

摘要

第1章 绪论

1.1 癌症分类与诊断的意义

1.2 基于基因表达数据的癌症分类与诊断方法现状

1.2.1 两种常用的癌症分类模型

1.3 基于基因通路的癌症诊断

1.4 本文的组织结构

1.5 本章小结

第2章 高通量基因表达检测技术与基因通路相关生物知识

2.1 引言

2.2 RNA-Seq

2.2.1 RNA-Seq原理介绍

2.2.2 RNA-Seq优势

2.2.3 RNA-Seq的挑战

2.3 基因通路

2.3.1 常用的基因通路数据库

2.3.2 基因通路分析

2.4 本章小结

第3章 一种基于类别分布差异性的基因表达数据离散化方法

3.1 引言

3.2 数据离散化概念

3.3 现有离散化方法介绍

3.3.1 监督型和非监督型离散方法

3.3.2 单变量和多变量离散方法

3.4 基于类别分布差异性的基因表达数据离散化方法

3.4.1 生物学知识背景

3.4.2 具体算法

3.5 离散结果分析

3.5.1 实验数据和验证准则

3.5.2 离散状态数目分布的对比

3.5.3 明星基因的离散状态数目的对比

3.6 三种离散方法的时间复杂度比较

3.7 分类性能比较

3.8 参数讨论

3.9 本章小结

第4章 基于马尔科夫链模型的癌症诊断方法

4.1 引言

4.2 马尔科夫链模型介绍

4.3 基于马尔科夫链模型建模基因通路

4.3.1 基于齐次马尔科夫链的通路模型

4.3.2 基于非齐次马尔科夫链的通路模型

4.4 基于马尔科夫链模型的癌症诊断算法

4.5 实验验证

4.5.1 实验数据和分类方法评价指标

4.5.2 实验结果

4.6 本章小结

第5章 总结与展望

5.1 论文的主要工作和创新点

5.2 下一步工作展望

参考文献

致谢

在读期间发表的学术论文与取得的其他研究成果

展开▼

摘要

现今,癌症问题日益突出。癌症分类与诊断方法的滞后一直以来都是制约癌症治疗的一个很大的瓶颈。在过去的几十年中,人们一直在寻找一种行之有效的基于基因表达水平的癌症诊断方法。高通量生物技术的产生大大方便了人们从基因层次理解和认识癌症病理。机器学习方法和统计学方法在癌症诊断中的不断的应用,使该领域又有了另一番景象。基因表达数据天生具有高噪声、高变异和高维小样本特性。如何结合先验生物知识建模基因表达数据是当前生物信息学研究的焦点问题之一。本文提出应用马尔科夫链模型理论建模基因通路,在有效表征基因通路活性的基础上发展癌症分类与诊断方法。主要工作可概括如下:
   1)提出了有约束的基因表达数据离散化方法。为了能够使数据得到更好的离散性能,依据三态基因调控假设对基因离散状态数进行约束,然后通过最大化类别分布差异性来实现基因表达数据的有效离散。在三个标准基因表达数据集(白血病数据集、前列腺癌数据集和肝癌数据集)上对该离散方法进行了实验验证。和现有方法的比较实验证实,该离散方法简单、直观,具有较低的时间复杂度,获得了较好的癌症分类性能。
   2)提出了两种基于马尔科夫链模型的基因通路建模方法。所建立的模型使用基因间的状态转移概率矩阵来刻画基因通路中的遗传信息或转导信号的传输特性,并标定基因通路的活性。基因通路图被分解为多个基因链。在一个基因链中,遗传信息由第一个基因有序的流向最后一个基因。该基因链被视为一个基因马尔科夫链。链中的每个基因视作马尔科夫链的一个时间点,可具有三种离散状态。用G={g1,g2,…,gn}代表一条长度为n的基因链,其马尔科夫链可以表示为{X(g),g∈G},其中,X(g)表示第g个基因所处的调控状态。通过假设不同的状态转移方式,两种基因通路模型被建立,即齐次马尔科夫链模型和非齐次马尔科夫链模型。
   3)提出了一种基于基因通路网络的癌症分类与诊断方法。为了探索基因通路信息与癌症分类之间的内在联系,应用马尔科夫链理论为每种类别的样例建立一个属于它们自身的马尔科夫链模型。然后,利用所构建的模型来预测未知样例的发生概率,对未知样例的类别做出预测。这种癌症诊断方法是一种有监督的方法。相对于犹如黑盒子一样的传统的癌症诊断模型,该分类模型能够将统计学方法和生物先验知识进行很好的融合,获得更高精度的同时,也能够帮助揭示癌症发病的内在机理。特别的,算法简单,直观,易于实现。结合三个来自KEGG数据库的癌症相关的基因通路,在白血病数据集和肝癌数据集这两个标准数据集上对该方法进行了实验验证。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号