首页> 中文学位 >基于启发式聚类的混合特征基因选择方法研究
【6h】

基于启发式聚类的混合特征基因选择方法研究

代理获取

摘要

DNA微阵列技术是基因组信息学研究的主要支撑技术,它为癌症研究提供了最基本和最必要的信息及依据。然而由于基因芯片数据样本少、高维数高的特点,在基因芯片数据处理时面临了很多的困难与挑战。如何才能通过合理的算法来识别出对疾病有鉴别意义的基因集,已经成为了目前基因表达数据处理和分析的热点研究问题。
   所以本文研究和探索了特征基因选择算法,提出了两种基于启发式聚类的混合特征基因选择方法:
   1.基于最小生成树聚类的特征基因选择方法。由于传统的聚类方法,只适合处理球状数据,而最小生成树聚类算法对图形边界较复杂的数据也能得到较好的结果。因此,本文应用不同的距离度量方法于Prim最小生成树聚类中,动态选择特征基因集,并用支持向量机进行预测。然后,提出一种精选特征基因集的方法,进一步去除冗余基因。实验表明该方法有效的降低特征基因的维数并有很好的分类准确率。
   2.基于分步聚类的特征基因选择方法。基因表达谱数据具有高维度,非线性等特点。而Gsim能够较好的表达高维数据的相似性,流形距离能够很好的展示基因之间的复杂关系。本文利用Gsim和流形距离的优点,提出一种基于分步聚类的特征基因选择算法,有效的解决在高维,非线性数据空间中分辨率能力下降的问题。同时,提高分类评估方法的泛化能力,使选择出的特征基因具有更好的鲁棒性。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号