首页> 中文学位 >评估几种流行学习降维分类器应用于癌症数据的性能
【6h】

评估几种流行学习降维分类器应用于癌症数据的性能

代理获取

目录

摘要

ABSTRACT

第一章 概述

1.1 数据降维的概述

1.2 数据降维的相关概念

1.3 数据降维的分类

1.4 流形学习

1.4.1 流行学习方法的发展背景

1.4.2 流行学习方法的概述

第二章 降维方法

2.1 线性降维方法

2.1.1 主成分分析

2.1.2 Fisher线性判别分析(LDA)

2.1.3 多维尺度变换(MDS)

2.2 非线性流行学习降维方法概述

2.2.1 全局特性保留方法

2.2.2 局部特性保持方法

2.2.3 非线性降维算法的总结

2.2.4 局部保持映射(LPP)

第三章 分类技术

3.1 方法介绍

3.2 常用分类分类器

3.2.1 最近邻分类器(NNC)

3.2.2 支持向量机(SVM)

第四章 结合式分类器的分类效果比较

4.1 降维技术与分类器相结合的结合式分类器的概述

4.2 结合式分类器设计与实现

4.2.1 结合式分类器的设计

4.2.2 数据预处理方法

4.2.3 结合式分类器的评估办法

4.3 实验结果分析

4.3.1 数据来源介绍

4.3.2 数据可视化分析

4.3.3 分类性能比较

4.3.4 类间类内对结合式分类器的评估

4.3.5 算法耗时评估

第五章 全文总结

5.1 研究工作总结

5.2 后续研究工作的展望

参考文献

致谢

攻读硕士期间发表的论文

展开▼

摘要

大量的高维癌症数据给我们带来了许多困扰,最显著特点之一就是维数多样本数相对较少。面对这样的高维数据,数据降维成了数据挖掘中必不可少的步骤。降维技术能够通过提取特征,保留局部结构降低维度,帮助机器学习作准确高效地分类。然而选择什么样的降维分类器才能达到最优的分类效果,是本文研究的中心内容。本文所论述的降维方法都是基于流行结构的,有线性降维方法:主成分分析(PCA)、Fisher线性判别分析(LDA)、多维尺度变换(MDS)、局部保留投影(LPP)、类别非局保留投影(CNLPP);非线性降维方法:局部线性嵌入(LLE)、拉普拉斯特征映射(LE)、等距映射(ISOMAP)。其中的局部保留投影,不仅具有保持数据集结构不变的非线性特点,而且具有线性方法计算简单、直接快捷的特点。在癌症数据的降维中表现出了优势。支持向量机(SupportVectorMachine,简称SVM)是机器学习和统计学习理论中理论完备、全局优化性能、泛化性能较好的一种方法,满足了高维癌症数据小样本的特征。最近邻分类器(NearestNeighborClassifier,简称NNC)也是一种经典,简单的分类器,是实验中最常用的一种分类器。本文主要讨论降维方法与分类器相结合的结合式分类模型对5种癌症数据进行分类的效果比较。全文的主要内容概括如下:(1)概述了高维数据处理领域的发展状况及其所蕴含的一些问题。并对典型降维方法进行了分析,包括各自的算法、优缺点及研究现状。其中着重阐述了保局投影这种线性降维方法。(2)介绍了支持向量机的基本原理,及一般的分类流程。运用Matlab2009实现了SVM对癌症数据的二分类。(3)研究和比较SVM、NNC与一些降维技术相结合的分类模型在癌症数据分类中的性能,为相关的分类研究提供参考。本文所使用的结合式分类模型有:PCA-SVM、LDA—SVM、MDS—SVM、LPP—SVM、CNLPP—SVM、ISOMAP—SVM、LLE—SVM、LE—SVM、PCA—NNC、LDA—NNC、MDS—NNC、LPP—NNC、CNLPP—NNC、ISOMAP—NNC、LLE—NNC、LE—NNC。实验结果显示LPP—SVM、CNLPP—SVM、LE—SVM有较好的分类效果。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号