首页> 中文学位 >基于张量分解的癌症亚型分析算法的研究
【6h】

基于张量分解的癌症亚型分析算法的研究

代理获取

目录

第1章 绪 论

1.1课题研究背景及目的意义

1.2 国内外研究现状

1.3 主要研究内容

1.4 本文组织结构

第2章 相关技术知识介绍

2.1 基因芯片与基因组数据

2.2 癌症亚型聚类分析

2.3 数据挖掘中常见的聚类算法

2.4 多源数据聚类

2.5 本章小结

第3章 基于张量分解的癌症分型算法

3.1 张量与张量分解

3.2 构建张量模型

3.3 低秩非负稀疏张量分解

3.4 基于低秩稀疏分解模型的癌症分型算法

3.5 本章小结

第4章 实验结果与分析

4.1 乳腺癌数据集与张量构建

4.2 差异表达基因识别

4.3 低秩张量分解与结果融合

4.4 聚类结果比较

4.5 生存分析

4.6 本章小结

结论

参考文献

声明

致谢

展开▼

摘要

通过形态学或所属组织器官命名的癌症并不准确,癌症的临床治疗需要更精确的亚型才能对症下药和靶向治疗。通过对基因芯片数据如mRNA、miRNA、DNA、蛋白质等数据的分析能发现和识别出更准确的癌症亚型。整合多源基因组数据不仅能够发现肿瘤与基因组数据的关系,而且可以发现各基因数据之间对肿瘤的协同共作用关系。综合考虑不同基因数据,在不丢失信息的前提下分析不同数据相互之间的共享结构是分析癌症亚型的难点。
  本研究使用多维阵列的张量结构来整合多源基因组数据,不经过中间数据转换,保留的原始单一基因数据的特有信息,同时挖掘不同基因数据之间的协同致病模式。介绍了张量模型的原理和框架,在基于乳腺癌的基因表达谱数据和 DNA甲基化数据上构建了张量模型,构建的方法是对预处理的芯片数据做差异表达分析,有明显差异的基因在张量中置位1或者保留原芯片值。表达正常或没有明显差异的基因则稀疏化为0。这样基因表达谱数据和甲基化数据就整合为一个三维张量。在现有的CP-ARP分解算法的基础上,针对基因芯片数据高维度小样本的数据特征和基因功能差异表达和表达水平正常的两极化特征,引入了非负和稀疏性限制条件,优化了CP分解模型。改进的模型使用基于随机梯度下降的ALS优化方法,在计算性能上有所提升。使用改进的分解方法在与已经验证的乳腺癌五种亚型对比结果证明了张量分解模型在癌症分型应用上的有效性。通过对癌症分型的结果分析,验证了Her2这种临床已证明存在的亚型。从平均轮廓系数和生存分析等角度证明了算法的性能和所分亚型的有效性。证实了本文提出的方法在癌症的分型以及癌症诊断治疗上能提供一定的参考和借鉴。

著录项

  • 作者

    李波;

  • 作者单位

    哈尔滨工业大学;

  • 授予单位 哈尔滨工业大学;
  • 学科 计算机技术
  • 授予学位 硕士
  • 导师姓名 王亚东;
  • 年度 2016
  • 页码
  • 总页数
  • 原文格式 PDF
  • 正文语种 中文
  • 中图分类 TP311.13;
  • 关键词

    生物分析; 数据挖掘; 信息整合; 程序语言;

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号