首页> 中文学位 >基于支持向量机的基因表达数据降维方法的研究
【6h】

基于支持向量机的基因表达数据降维方法的研究

代理获取

目录

文摘

英文文摘

第一章 绪论

1.1 课题的提出及研究意义

1.2 课题的研究背景与现状

1.2.1 微阵列基因表达数据的研究现状

1.2.2 降维方法的研究现状

1.2.3 支持向量机的研究现状

1.3 本文的研究工作和结构安排

第二章 微阵列基因芯片与基因表达数据

2.1 生物信息学

2.2 基因芯片的基本原理和制备

2.3 微阵列基因表达数据

2.3.1 微阵列表达数据分析流程

2.3.2 微阵列基因表达数据

2.4 基因表达数据的网络资源

第三章 数据降维方法

3.1 数据降维的基本概念

3.2 数据降维方法

3.2.1 主成份分析法

3.2.2 拉普拉斯特征映射方法

3.2.3 扩散映射方法

3.3 几种降维方法降维效果的比较

第四章 支持向量机理论

4.1 统计学习理论

4.1.1 VC维

4.1.2 推广性的界

4.1.3 结构风险最小化

4.2 支持向量机理论

4.2.1 线性支持向量机

4.2.2 非线性支持向量机

第五章 基因表达数据实验结果

5.1 实验数据

5.2 实验结果

5.2.1 Leukemia实验结果及分析

5.2.2 Colon实验结果及分析

第六章 总结与展望

参考文献

攻读学位期间本人出版或公开发表的论著、论文

致谢

展开▼

摘要

随着生物信息学近年来的突破性进展,基因芯片技术也得到了快速的发展,人们可以更加快捷地获得可靠的基因表达数据,这些数据中蕴含了能够揭开生命奥秘的大量信息。但由于基因表达数据具有维数高、样本少、非线性等特点,导致了“维数灾难”,对传统的分析方法提出了挑战。支持向量机(Support Vector Machine,SVM)是一种基于统计学习理论的新型机器学习方法。它采用了结构风险最小化原则,能够在一定程度上克服小样本学习问题的困难,还采用了核函数思想,将非线性空间的问题转换到线性空间,大大降低了算法的复杂度。由于支持向量机在这类问题上表现出了良好的推广性,所以成为了当前研究的热点。
   本文针对基因表达数据维数、高样本少的特点,提出了将数据降维方法应用到基因表达数据上,分别使用线性以及非线性降维方法对原始数据进行处理,再将降维后的数据经由支持向量机进行分类,有效的提高了分类的准确性。最后,本文针对两个常用的数据集进行实验对比,结果表明,本文提出的方法相对于传统的分类方法,分类准确率有所提高。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号