首页> 中文学位 >基于支持向量机和遗传算法的基因表达谱数据分类
【6h】

基于支持向量机和遗传算法的基因表达谱数据分类

代理获取

目录

声明

摘要

第一章 绪论

1.1 研究背景

1.2 研究现状

1.2.1 基因表达谱数据分类及降维方法研究现状

1.2.2 多核CPU并行计算应用

1.3 研究内容和论文组织

第二章 融合遗传算法和SVM分类基因表达潜数据

2.1 基因表达谱数据的表示

2.2 基因表达谱数据的除嗓和冗余基因的剔除

2.3 基因表达数据的特征提取

2.3.1 主成分分析

2.3.2 线性判别分析

2.4 基于遗传算法的支持向量机参数调优

2.5 基因表达谱数据分类算法

2.5.1 算法思想

2.5.2 算法描述

2.6 实验

2.6.1 实验环境与数据

2.6.2 实验结果

2.7 本章小结

第三章 多核并行加速基因表达谱数据分类

3.1 问题的提出

3.2 基因表达谱数据分类算法并行化

3.2.1 算法思想

3.2.2 算法描述

3.3 实验

3.3.1 实验环境与数据

3.3.2 实验结果

3.4 本章小结

第四章 总结

4.1 主要工作成果

4.2 未来工作

参考文献

致谢

展开▼

摘要

癌症一直困扰着人类的健康,随着基因芯片技术的发展,对癌症基因数据的分类研究在生物信息学中有着越来越重要的作用。由于基因表达谱数据具有高维度、小样本的特点,且含有大量冗余基因和噪声,使得分类计算耗时且效果不佳。针对基因表达谱数据的特性研究设计高效的特征提取与分类算法及其并行处理具有现实意义。
  利用巴氏距离公式对基因表达谱数据计算每个基因属性的B值,依据B值大小排序选出排序靠前的部分基因属性,通过特征选择达到初步降维。然后,利用本文提出的主元线性判别遗传算法PCLDGA对初步降维后的数据进行特征提取,实现二次降维。最后通过遗传算法对支持向量机(SVM)分类器进行参数优化,使用调优的训练模型对降维后的数据进行分类。实验结果表明,这种分类方法提高了基因表达谱数据分类的准确率。
  在多核CPU计算结构上,设计并行化遗传算法对SVM分类器参数调优,以实现加速基因表达谱数据分类过程。采取的方法是:将初始种群划分为多个小种群,这些小种群各自独立同时在多个worker上进化计算,把最优个体基因遗传下来,然后将各个小种群的最优基因交叉选择结合进化,即把通过遗传进化生存下来的优秀个体组成新的种群,新的种群再划分为多个小种群,以此循环,使之达到最佳适应能力,获得SVM优化参数组合,同时对留一交叉验证并行化处理。实验结果表明,基因表达谱数据分类并行化处理获得了较高的加速。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号