首页> 中文学位 >基于非负矩阵分解的肿瘤基因表达谱数据分析
【6h】

基于非负矩阵分解的肿瘤基因表达谱数据分析

代理获取

目录

声明

摘要

第一章 绪论

1.1 生物信息学

1.1.1 生物信息学概论

1.1.2 研究背景与意义

1.2 基因表达谱数据分析理论

1.2.1 DNA微阵列技术

1.2.2 基因表达谱数据的特点

1.2.3 基因表达谱数据的数学描述

1.2.4 基因表达谱数据的预处理

1.3 基因表达谱的研究现状和方向

1.3.1 肿瘤基因表达谱的研究现状

1.3.2 肿瘤基因表达谱的研究方向

1.4 本文研究内容与组织结构

第二章 非负矩阵分解及其变体算法

2.1 非负矩阵分解的基本理论

2.1.1 基础非负矩阵分解方法概述

2.1.2 收敛性证明

2.2 NMF的变体算法

2.2.1 稀疏非负矩阵分解算法

2.2.2 加权非负矩阵分解算法

2.2.3 图正规化的非负矩阵分解算法

2.2.4 概率非负矩阵分解算法

2.2.5 非平滑非负矩阵分解算法

2.3 本章小结

第三章 基于双正交非负矩阵三因式分解的肿瘤识别

3.1 引言

3.2 双正交非负矩阵分解BONMTF

3.2.1 BONMTF算法描述

3.2.2 BONMTF算法的正确性和收敛性证明

3.3 实验

3.3.1 实验方法

3.3.2 数据分析

3.3.3 结果分析

3.4 本章小结

第四章 基于对称三因式非负矩阵分解的肿瘤分类

4.1 引言

4.2 对称三因式非负矩阵分解STFNMF的算法描述

4.3 基于STFNMF的特征提取

4.4 实验

4.4.1 实验方法

4.4.2 数据分析

4.4.3 结果分析

4.5 本章小结

第五章 总结与展望

5.1 论文总结

5.2 研究展望

参考文献

致谢

攻读硕士研究生期间发表的论文和参与的科研项目

展开▼

摘要

基因数据分析已经逐渐成为疾病诊断及分类的常规步骤。原始基因数据的维数很高而样本却很小,因此如何从大量的基因数据中剔除冗余基因,提取出能够表征样本属性的特征基因成为了研究的重点和难点。在实际应用中,可以利用有效的数据表示方法来解决这一难题,即利用数据的低维表示来挖掘出原始数据的内在结构和本质信息。
  目前已经被广泛使用的基因数据处理方法如主成分分析等在进行数据分析时的效果并不十分理想,因此可以利用非负矩阵分解(Nonnegative MatrixFactorization,NMF)算法来对原始基因数据进行处理即实现数据的低秩表示。与其它矩阵分解方法相比,此方法在体现局部特征信息的同时实现了有效的肿瘤分类。
  本文主要内容如下:
  1.本文首先概述了传统NMF算法的基本理论,并在此基础上简单介绍了几种NMF的变体算法,最后介绍了这几种改进型的目标函数和迭代规则。
  2.将双正交非负矩阵三因式分解BONMTF(Bi-orthogonal NonnegativeMatrix Tri-Factorization)算法应用到了基因表达谱数据挖掘中。首先对BONMTF算法进行了系统化分析;然后利用此算法得到能够表征样本属性的矩阵,并将其应用于肿瘤分类中,提高了样本的识别率。实验采用四组具有代表性的肿瘤基因表达谱数据,其结果证明了本文方法针对不同数据集的识别率比传统方法有所提高,不仅具有可行性而且具有广阔的应用前景。
  3.将对称三因式非负矩阵分解STFNMF(Symmetric Three-factorNonnegative Matrix Factorization)算法应用到肿瘤分类中。首先使用记分准则来对基因进行排序,以降低噪声的干扰;其次利用谱图的方法将原始基因样本映射到高维空间中去,并通过所提出的权值矩阵来构造一个相似矩阵,然后利用STFNMF算法来进行特征提取;最后使用SVM实现肿瘤样本的分类。实验采取了四种广泛使用的基因表达谱数据,并通过大量实验验证了所提出的算法相比于其它传统算法有更好的性能。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号