支持向量机在基因表达数据分类中的研究

代理获取

页面导航

目录
摘要
著录项
引文网络
相似文献
相关主题

摘要

基因芯片技术作为一种新的分子生物学技术，是影响深远的重大科技成就，它的出现对生物信息学产生一场革命，为生物信息学研究提供重要手段。通过基因芯片技术可以方便快捷的产生大量的基因表达数据，这些数据可以表现任何给定条件下的基因表达模式，从而能够在基因组水平上以系统的、全局的观念去研究生命现象及其本质。支持向量机(SupportVectorMachine,SVM)是一类基于统计学习理论的新型机器学习方法。由于它采用了结构风险最小化原则，能较好的解决小样本学习的问题，还采用核函数思想，把非线性空间的问题转换到线性空间，降低了算法的复杂度。正因为SVM有较完备的理论基础和较好的学习性能，在解决有限样本、非线性及高维模式识别问题中表现出许多特有的优势，所以成为当前国际机器学习领域的研究热点，并在很多领域都得到了成功的应用。微阵列基因表达数据具有维数高、样本小、非线性的特点，这对一些传统的机器学习方法提出了新的挑战，对其数据的分析已成为生物信息学研究的焦点。通过支持向量机训练算法对基因表达数据进行分类训练，为分析基因数据提供有效的手段。本文主要研究基于基因表达数据的支持向量机分类方法，并对已有的算法与模型当中存在的问题提出改进。针对基于基因表达数据的分类，本文从特征基因选择和支持向量机分类算法两个方面进行了改进。针对基因表达数据集具有“样本数目少，基因数目庞大”的特点，本文通过特征基因选择提高分类精度，采用基于相关性的递归特征消除方法。该方法通过计算基因间的相关性，在寻求数据最小冗余的同时，考虑了如何避免过度删除与目标表现型相关的基因。使用这种方法选择特征基因子集可度提高分类性能，特征选择效率也较高。在分析传统的SVM算法的基础上，本文对贯序最小优化算法作适当改进，以提高分类精度和训练速度。该算法采用径向基核函数，通过调整参数，优化支持向量机分类性能。实验结果表明新算法的分类准确率与传统的SVM算法相比有所提高。

著录项

作者
詹超;
展开▼
作者单位

武汉理工大学;

展开▼
授予单位武汉理工大学;
学科计算机应用技术
授予学位硕士
导师姓名熊盛武;
年度 2006
页码
总页数
原文格式 PDF
正文语种中文
中图分类自动推理、机器学习;
关键词
生物信息学; 基因表达数据; 支持向量机; 基因芯片技术; 基因表达模式; 特征基因子;

相似文献

中文文献
外文文献
专利

1. 支持向量机在基因表达数据分类中的应用研究 [J] . 武振宇 ,李康 . 中国卫生统计 . 2007,第001期
2. 一种基于关联规则与支持向量机的基因表达数据分类模型 [J] . 王美华 ,苏雄斌 ,蔡瑞初 . 计算机应用与软件 . 2014,第005期
3. 采用非线性核支持向量机并基于基因表达数据的基因选择和分类 [J] . 张启忠 . 生命科学仪器 . 2007,第007期
4. 优化的支持向量机集成分类器在非平衡数据集分类中的应用 [J] . 章少平 ,梁雪春 . 计算机应用 . 2015,第005期
5. 浅谈模式识别中的支持向量机技术分析肿瘤基因表达数据 [J] . 赵洁茹 . 科技资讯 . 2011,第033期
6. 支持向量机在高光谱遥感图像分类中的多类分类算法的研究1 [C] . 谭琨 ,杜培军 . 第三届地理信息系统全国博士生学术论坛 . 2008
7. 支持向量机在微阵列基因表达谱数据分类中的应用 [A] . 吴骋 . 2004

支持向量机在基因表达数据分类中的研究

目录

摘要

著录项

引文网络

相似文献

相关主题

期刊订阅