首页> 中文学位 >支持向量机在基因表达数据分类中的研究
【6h】

支持向量机在基因表达数据分类中的研究

代理获取

目录

文摘

英文文摘

独创性声明及关于论文使用授权的说明

第1章绪论

第2章基因微阵列表达数据

第3章支持向量机理论

第4章基因表达数据特征选择

第5章基因表达数据分类

第6章总结及展望

参考文献

硕士在学期间发表的论文及专业书籍

致 谢

展开▼

摘要

基因芯片技术作为一种新的分子生物学技术,是影响深远的重大科技成就,它的出现对生物信息学产生一场革命,为生物信息学研究提供重要手段。通过基因芯片技术可以方便快捷的产生大量的基因表达数据,这些数据可以表现任何给定条件下的基因表达模式,从而能够在基因组水平上以系统的、全局的观念去研究生命现象及其本质。 支持向量机(SupportVectorMachine,SVM)是一类基于统计学习理论的新型机器学习方法。由于它采用了结构风险最小化原则,能较好的解决小样本学习的问题,还采用核函数思想,把非线性空间的问题转换到线性空间,降低了算法的复杂度。正因为SVM有较完备的理论基础和较好的学习性能,在解决有限样本、非线性及高维模式识别问题中表现出许多特有的优势,所以成为当前国际机器学习领域的研究热点,并在很多领域都得到了成功的应用。微阵列基因表达数据具有维数高、样本小、非线性的特点,这对一些传统的机器学习方法提出了新的挑战,对其数据的分析已成为生物信息学研究的焦点。 通过支持向量机训练算法对基因表达数据进行分类训练,为分析基因数据提供有效的手段。本文主要研究基于基因表达数据的支持向量机分类方法,并对已有的算法与模型当中存在的问题提出改进。针对基于基因表达数据的分类,本文从特征基因选择和支持向量机分类算法两个方面进行了改进。针对基因表达数据集具有“样本数目少,基因数目庞大”的特点,本文通过特征基因选择提高分类精度,采用基于相关性的递归特征消除方法。该方法通过计算基因间的相关性,在寻求数据最小冗余的同时,考虑了如何避免过度删除与目标表现型相关的基因。使用这种方法选择特征基因子集可度提高分类性能,特征选择效率也较高。在分析传统的SVM算法的基础上,本文对贯序最小优化算法作适当改进,以提高分类精度和训练速度。该算法采用径向基核函数,通过调整参数,优化支持向量机分类性能。实验结果表明新算法的分类准确率与传统的SVM算法相比有所提高。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号