基因微阵列数据的特征提取和特征优化在癌症诊断中的应用

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

由于在缺乏启发性的知识的情况下，遗传算法对于高维的数据的特征提取非常有效，所以遗传算法是基因数据研究中非常重要的算法。而支持向量机是在统计学习理论的基础上发展起来的新的模式识别方法，它不仅考虑了对推广性的要求，而且能够在现有的有限信息的条件下得到最优结果，在解决样本少、高维数、非线性等问题中有许多特有的优势。本实验正是基于这两种理论的优势而提出的。对基因微阵列数据的分析，通常包括以下的内容：对基因数据的预处理；对处理过的数据选取有用的信息或者特征基因；对基因数据进行分析并对结果进行评价。其中在对基因数据进行分析之前，基因数据的预处理非常重要，而数据分析的关键则是对特征基因的选择和提取，因而对数据分析的质量不仅取决于所用算法的有效性，而且也取决于处理过程中所产生的特征基因的数量和质量。同样，最后对基因数据的分析及结果评价也同样重要。本文中对于基因数据的分析，实验采用两种方法进行，并且为了验证方法的有效性，实验利用白血病数据集和结肠癌数据集进行验证。具体的实现方法如下：实验第一种方法是基于支持向量机分类的分析方法。为了获得较好的实验结果，按照如下步骤进行：首先对基因数据进行预处理，将白血病数据集分为训练集和测试集两部分，然后分别利用t-test检验方法和Wilconxon检验方法选取白血病训练数据集的特征基因，减少数据的维数和无关的数据信息。然后利用选取的特征基因训练支持向量机，并利用白血病的测试数据集合进行检验，通过利用样本划分法对学习的结果进行评估。为了进一步验证所提方法的有效性，实验又利用结肠癌数据集按照同样的步骤进行验证，实验结果进一步证明了所提方法的有效性。为了能够得到选取的优化特征基因，实验采用的第二种方法是基于遗传算法对特征基因进行优化的方法，在对数据进行标准化和降低维数后，利用遗传算法选取特征基因，最后利用判别分析方法对数据进行学习，通过在白血病数据集中的应用，对学习的结果进行分析和评估，判断所用方法具有良好的效果。

著录项

作者
孟范静;
展开▼
作者单位

齐鲁工业大学;

山东轻工业学院;

展开▼
授予单位齐鲁工业大学;山东轻工业学院;
学科计算机应用技术
授予学位硕士
导师姓名刘毅慧,王洪国;
年度 2008
页码
总页数
原文格式 PDF
正文语种中文
中图分类免疫疗法;
关键词
基因微阵列数据; 特征提取; 特征优化; 数据预处理; 癌症诊断; 遗传算法; 支持向量机;

相似文献

中文文献
外文文献
专利

1. 粒计算在基因微阵列数据特征选择中的应用 [J] . 王俊 ,祁云嵩 ,韩利 . 科学技术与工程 . 2009,第006期
2. 肿瘤微阵列数据的小波模极大值特征提取 [J] . 陈小梅 . 电脑与电信 . 2016,第005期
3. DNA微阵列数据特征提取的分类方法研究 [J] . 彭红毅 ,叶燕锐 ,张俊辉 . 计算机工程与应用 . 2010,第028期
4. 基于Fisher准则的特征提取在基因表达数据上的应用 [J] . 王修竹 ,罗霞 . 绵阳师范学院学报 . 2011,第008期
5. SVM在基因微阵列癌症数据分类中的应用 [J] . 孟范静 ,刘毅慧 ,王洪国 . 计算机工程与应用 . 2007,第034期
6. 核主元分析在特征提取中的优化应用 [C] . Li Jing ,李静 ,Zhang Zhimi . 第十届中国钢铁年会暨第六届宝钢学术年会 . 2015
7. 基于粒子群优化的集成学习方法在基因微阵列数据分类中的应用 [A] . 仲珊丽 . 2013

基因微阵列数据的特征提取和特征优化在癌症诊断中的应用

目录

摘要

著录项

相似文献

相关主题

期刊订阅