首页> 中文学位 >基于谱聚类方法的基因表达数据分析研究
【6h】

基于谱聚类方法的基因表达数据分析研究

代理获取

目录

声明

摘要

插图索引

附表索引

第1章 绪论

1.1 研究背景与意义

1.2 国内外研究现状

1.2.1 基因表达数据的聚类研究现状

1.2.2 谱聚类应用于基因表达数据聚类的研究现状

1.3 主要研究内容

1.4 论文结构和章节安排

第2章 相关理论知识

2.1 引言

2.2 基因聚类基本定义

2.3 基因表达数据

2.3.1 基因表达数据的获取

2.3.2 基因表达数据的特点

2.3.3 基因表达数据的预处理

2.4 数据降维

2.4.1 非负矩阵分解

2.4.2 局部线性嵌入

2.5 相似性度量函数

2.6 常用聚类算法介绍

2.7 常见的聚类算法

2.7.1 k-means聚类算法

2.7.2 谱聚类算法

2.8 聚类结果的评价

2.9 本章小结

第3章 基于协同表示的谱聚类算法

3.1 引言

3.2 协同表示

3.2.1 稀疏表示原理

3.2.2 稀疏表示系数

3.2.3 协同表示系数

3.2.4 协同表示系数向量

3.3 构建相似度矩阵

3.4 基于协同表示的谱聚类算法

3.5 实验设置及结果分析

3.5.1 数据集及实验环境

3.5.2 实验参数影响

3.5.3 相似度矩阵对比

3.5.4 聚类结果对比

3.6 本章小结

第4章 基于主成分分析的谱聚类算法

4.1 引言

4.2 主成分分析

4.2.1 主成分分析基本思想

4.2.2 主成分分析的数学模型

4.2.3 主成分分析的推导

4.2.4 主成分分析算法基本算法和步骤

4.3 构建相似度矩阵

4.4 基于主成分分析的谱聚类算法

4.5 实验设置及结果分析

4.5.1 数据集及实验环境

4.5.2 实验参数影响

4.5.3 相似度矩阵对比

4.5.4 聚类结果对比

4.6 本章小结

结论

参考文献

附录A 攻读学位期间所发表的学术论文

附录B 攻读学位期间所参与的科研活动

致谢

展开▼

摘要

癌症的发病率高、死亡率高,患者的生存期短,给患者的本人、家人甚至整个社会都带来了严重的不良影响。因此肿瘤的预防和治疗是全世界生命科学研究者的研究焦点。通过样本的聚类,不仅可以根据已得到的肿瘤聚类样本对未知的聚类样本进行研究和预测,帮助医生进行肿瘤的诊断和治疗,还可以帮助找出相关的驱动基因或功能表达相似基因,进而可以发掘基因之间的调控关系,并找出有研究价值的基因,从中选出药靶、诊断靶。基因表达数据的聚类分析研究对肿瘤的预防和治疗研究有着很重要的医学意义。
  由于基因表达数据的高维特性,数据往往变得稀疏,样本之间的距离差距不再明显,而且冗余特征也会随之增多,导致一般的聚类算法的有效性大大降低。通过对基因表达数据进行聚类分析以提高诊断肿瘤的准确度,成为了生物信息学和医学领域的热点研究。本文主要围绕肿瘤基因表达数据的谱聚类问题进行研究,具体研究工作包括:
  (1)基于稀疏表示的谱聚类算法(Sparse Representation based SpectralClustering,SRSC)将每个高维样本映射到一个低维的系数向量子空间,并利用稀疏表示系数向量构造相似度矩阵从而进行谱聚类。由于该方法存在效率低等缺点,在高维的基因表达数据聚类中存在很大的不足,针对这个问题,提出了基于协同表示的谱聚类算法(Collaborative Representation based Spectral Clustering,CRSC):首先通过协同表示对高维的基因表达数据进行降维分析,有效的保证了信息的完整性;然后采用Cosine距离对降维后的数据构建相似度矩阵;最后采用谱聚类算法进行对相似度矩阵进行聚类分析。通过多种评价标准的对比,表明该算法在时间复杂度和聚类准确率上都有较强的鲁棒性。
  (2)当样本数量很大,SRSC算法在求解稀疏表示系数的过程非常耗时,针对这个问题,结合传统的主成分分析优势,提出了基于主成分分析的谱聚类算法(Principal Component Analysis based Spectral Clustering,PCASC):首先使用主成分分析对基因表达数据进行降维分析;然后采用Cosine距离对降维后的数据构建相似度矩阵;最后采用谱聚类算法进行对相似度矩阵进行聚类分析。通过实验对比分析,该算法在准确率和运行速率上都优于SRSC,更适用于分析大规模的基因表达谱数据。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号