首页> 中文学位 >基于局部强化非负矩阵分解的基因表达数据聚类
【6h】

基于局部强化非负矩阵分解的基因表达数据聚类

代理获取

目录

声明

摘要

第一章 绪论

1.1 论文研究背景及意义

1.2 目前工作进展

1.3 本文主要工作及组织结构

第二章 相关方法与基础

2.1 非负矩阵分解方法的数学描述

2.2 非负矩阵分解算法

2.2.1 基础的非负矩阵分解算法

2.2.2 改进的非负矩阵分解算法

2.3 基因表达数据分析

2.3.1 基因表达数据的表示方法

2.3.2 相似性测度

2.3.3 基因表达数据常用的聚类方法

2.4 本章小结

第三章 改进的局部强化非负矩阵分解算法

3.1 基因表达数据的聚类问题描述

3.2 局部强化非负矩阵分解算法

3.2.1 局部特征约束的含义

3.2.2 目标函数和算法步骤

3.3 LR-NMF的收敛性证明

3.4 本章小结

第四章 实验结果与分析

4.1 实验数据

4.1.1 白血病数据集

4.1.2 成神经管细胞数据集

4.1.3 数据预处理

4.2 模型选择

4.3 实验结果分析

4.3.1 白血病数据集的实验结果

4.3.2 成神经管细胞瘤数据集的实验结果

4.3.3 关于秩数k的讨论

4.4 本章小结

第五章 总结与展望

5.1 工作总结

5.2 进一步研究

致谢

参考文献

展开▼

摘要

在生物信息学的研究中,一个很重要的问题就是基于微阵列技术将肿瘤样本分到不同的类别中。和传统的聚类问题相比,它的难点在于基因空间的维数很高,而要聚类的样本数很小。原有的数据矩阵分解方法,如主成分分析(PCA)、矢量量化(VQ)、因子分析(FA)等在这类数据集上的聚类效果不佳。非负矩阵分解(NMF)已经解决了上述数据集的聚类问题,且它的非负性使聚类结果具有良好的可解释性等优势。
  本文先对NMF的相关理论进行深入的研究,论述了NMF的基本算法和各种变体算法。基于这些理论以及基因表达数据中所期望的聚类特性,给出了增加局部约束的非负矩阵分解(LR-NMF)算法。和原始的NMF相比,LR-NMF的目标函数不仅维持了原有的非负限制,更增加了对于原始数据的局部特征约束。最后通过对目标函数最小化的求解,给出LR-NMF的迭代规则,并证明了该算法的收敛性。
  在实验部分,我们先对两组经典的基因表达数据(白血病数据集和成神经管细胞瘤数据集)进行详细介绍。然后将LR-NMF算法应用到这两组数据集上,并结合模式选择机制,利用将肿瘤样本聚类来验证算法的优势。同时,通过讨论参数选择,体现了LR-NMF在疾病数据集分解上的鲁棒性。最后,我们从实验及理论上可以得知:虽然LR-NMF和NMF同样都是局部最小化的收敛算法,但LR-NMF比NMF更适合进行局部特征提取,并且聚类的效果更好。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号