首页> 中文学位 >基于基因表达谱的肿瘤亚型发现研究
【6h】

基于基因表达谱的肿瘤亚型发现研究

代理获取

目录

文摘

英文文摘

独创性声明及关于论文使用授权的说明

第1章绪论

第2章问题描述与数据来源

第3章数据预处理与信息基因的选取

第4章聚类算法的描述

第5章最佳样本分型方案的构建

结论

参考文献

攻读硕士学位期间发表的学术论文

致谢

展开▼

摘要

基于基因表达谱,在分子水平上对肿瘤进行分析和研究,是当前生物信息学研究的重要课题。本文针对肿瘤亚型发现问题,以三种肿瘤(急性白血病,结肠癌,上皮细胞卵巢癌)基因表达谱为研究对象,从系统科学和信息科学的角度,采用模式识别和计算机相关技术,就肿瘤的亚型发现问题,基于基因表达数据进行了研究,取得如下研究成果: 第一,针对肿瘤聚类信息的度量指标——信息系数的研究 本文使用了用于肿瘤信息基因选取的信息系数指标,用以衡量基因包含的分类信息多少。与以往信噪比指标不同的是,本文以基因表达谱中每一个基因的均值与其方差的比值来定义信息系数,将所有基因的信息系数组成一个信息系数矩阵,以此为基础,求出信息系数的阈值,进行基因的第一次筛选。 第二,针对推定肿瘤亚型发现方案的研究 本文建立了一种推定肿瘤亚型发现的模型,首次将信息系数与t检验相结合应用到肿瘤的亚型发现问题上。提出采用聚类算法对样本进行二聚类,在选定的显著性水平的条件下,进行t检验的分析,将没有显著性差异的基因去掉。在剩下的基因集合中,继续用聚类的算法进行二聚类,得到的结果再一次进行t检验。此过程反复迭代,直至得到一个稳定的亚型为止。 第三,针对肿瘤标准样本分型方案以及最佳样本分型方案的研究 本文提出了一种基于聚类算法的肿瘤标准样本分型方案,并且给出如何通过准样本分型方案确定最佳样本分型方案,从而完成肿瘤亚型发现的计算方法。 本文所述方案没有复杂的数学理论原理。将该模型应用到三种肿瘤(结肠癌,急性白血病,上皮细胞卵巢癌)基因表达谱数据上,实验结果如下:对于结肠癌的数据,分型的精度可以达到93.55%,之前,Xing的分型结果是91.94%,Alon的分型结果是90.32%;对于白血病的数据,分型精度可以达到94.73%,之前Golub的分型精度是89.47%;对于卵巢癌数据,得到的分型精度是100%,与实际情况完全一致。良好的分型结果表明了该模型的有效性和可行性。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号