首页> 中文学位 >基于基因表达数据的新型特征提取算法研究
【6h】

基于基因表达数据的新型特征提取算法研究

代理获取

目录

声明

摘要

第一章 绪论

1.1 课题相关背景及知识概要

1.2 基因表达数据

1.3 国内外研究现状

1.4 文章结构安排

2.1 数据的预处理

2.2 常见的特征基因选择算法介绍

2.3 分类算法

2.4 模型评价

第三章 DKBCGS特征基因选择算法

3.1 基于KBCGS的DKBCGS算法

3.2 实验流程

3.3 实验结果与分析

3.4 本章小结

第四章 总结与展望

4.1 总结

4.2 展望

参考文献

致谢

攻读学位期间发表的学术论文

展开▼

摘要

癌症自发现以来一直是人类难以攻克的难题之一,由于它的复杂多变的特性,仍旧是当今医学界所面临的一大挑战。从本质上来看,癌症的原因是细胞内部的基因差异表达所引起的一种基因疾病。基因芯片(基因组学)技术作为本世纪生物信息学最重要的突破之一,可以在实验中同时获得实验样本的基因表达数据,因此该技术为癌症的治疗开辟了新的道路。
  组学技术可以同时测量大量的基因表达数据,这些数据既包含了各种生物过程的基本信息,也反映了细胞或组织当前的生理状态。然而,利用该技术所获得的基因芯片数据存在着大量无关的基因数据,癌症的引起往往只是其中的一小部分基因的作用,因此,从这些数据中获得相关的致病特征基因,去除无关的基因数据在该方向相关的研究中至关重要。
  鉴于此,本文主要围绕着特征基因的选择算法展开研究,目的是从基因芯片数据中挑选出相关的致病基因,主要研究内容如下:
  1.基于SCAD算法的思想和KBCGS算法,本文对其进行改进提出算法,极大的优化了KBCGS的计算时间和分类精度,在KBCGS算法中,筛选基因的核心算法用到了高斯核,而本文中用到了双高斯核函数,通过两个核函数的混合,使算法既考虑到了数据的全局特性又考虑到了其局部特性。
  2.在获取到相关特征基因后,结合了几个常用的分类器如支持向量机(SVM)和K近邻(KNN)在多个经典芯片数据集上进行分析,并将文中提出的两个基因选择方法与其他多个流行的特征基因选择方法进行了对比,结果显示文中提出的基因选择方法在这几个数据集中取得了更好的结果,从而验证了本文中所提出的方法的可行性。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号