首页> 中文学位 >基于非负矩阵分解的癌症基因表达谱数据的特征提取
【6h】

基于非负矩阵分解的癌症基因表达谱数据的特征提取

代理获取

摘要

DNA微阵列技术作为一种新兴的技术成为对肿瘤基因表达谱进行分析研究的有力工具。越来越多的肿瘤专家用它来分析正常组织和肿瘤组织之间的基因表达差异。然而基因维数大而样本小是基因表达谱数据的一个显著特点,每个样本都记录了组织细胞中所有可测基因的表达水平,但大多数基因与样本类别无关,并不包含样本分类信息,这些噪声基因会使得分类的准确率降低。因此需要从实验数据中提取有关基因的结构与功能信息,找到在功能上相互联系的基因,尽可能除去无关基因。如何有效地提取特征基因、降低数据的维数是癌症分类研究中关键的步骤。本文利用非负矩阵理论从基因表达谱数据中提取特征,进而使用分类器分类来验证本文特征提取方法的有效性和可行性,主要研究内容是:
   1.提出将非负矩阵分解算法应用在基因表达谱数据的特征提取中。非负矩阵分解算法的基本思想是将一个非负矩阵近似分解为两个非负矩阵的乘积,来反映数据潜在的结构。首先对基因表达谱数据进行筛选,然后构造非负矩阵并对其进行分解得到维数低、能充分表征样本的特征向量,最后用支持向量机对特征向量进行分类。
   2.提出将局部非负矩阵分解算法应用在基因表达谱数据的特征提取中。该算法是在非负矩阵的基础上对迭代条件进行三方面的约束,这三个限制条件更加强调了原矩阵分解过程中基本特征成分的局部化。首先对基因表达谱数据进行筛选,然后构造局部非负矩阵并对其进行分解得到表征样本的特征向量,最后通过支持向量机对特征向量进行分类。
   3.提出将稀疏非负矩阵分解算法应用在基因表达谱数据的特征提取中。该算法是对系数矩阵添加稀疏性约束条件后发展起来的一种非负矩阵算法,首先对基因表达谱数据进行筛选,然后构造稀疏非负矩阵并对其进行分解得到表征样本的特征向量,最后选用支持向量机作为分类器来验证特征向量提取的有效性。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号