首页> 中文学位 >基于聚类的混合基因选择方法研究
【6h】

基于聚类的混合基因选择方法研究

代理获取

摘要

基因芯片可以同时检测一个生物样本的所有转录因子活性。与传统的实验工具不同,基因表达芯片能够使对细胞在基因水平上有一个全局的认识。该技术已经被广泛应用到很多领域,如发现新的肿瘤亚型以及肿瘤分类。基因表达芯片所产生的海量数据显著特点是维度高,样本少以及大部分基因与疾病或肿瘤分类无关。基因选择不仅可以帮助找到有很好判别分类能力的基因,而且能够降低计算的时间与空间复杂度。因此基因选择显得相当重要。
   本文主要的研究工作如下:
   提出了基于特征相似性聚类的混合基因选择方法。基因表达谱数据有维度高、样本少的特点。因此数据通常有很高的冗余性。大量冗余基因的存在不仅计算开销高昂而且很难找到相关基因。在本文中首先用过滤法依据基因变量的打分值对其排序,然后采用特征相似性聚类算法对基因进行聚类并删除冗余基因。用四个公开的基因表达谱数据集来检验我们的方法。用支持向量机作为分类器来检验候选基因的分类预测准确率。实验结果证实该方法能够取得不错的分类准确率。
   基于聚类的混合基因选择方法往往都是依据某种相似度衡量标准将基因分布到多个簇中,然后从每一簇中挑选出一个打分最高的基因。由于聚类方法的差异,这种代表性基因选择方式,往往忽略了簇中某些重要信息,因此在本文中利用最大团查找算法,从每一簇中挑选一个或者多个基因作为候选代表基因。实验结果证明该方法是有效的。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号