首页> 中文学位 >基于独立成分分析和逻辑回归的基因表达数据肿瘤分类研究
【6h】

基于独立成分分析和逻辑回归的基因表达数据肿瘤分类研究

代理获取

目录

文摘

英文文摘

声明

致谢

第1章引言

第2章基本概念

2.1白化

2.2鞘度(Kurtosis)

2.3负熵

2.4统计独立与相关

第3章独立成分分析(ICA)

3.1 ICA概述

3.2 ICA定义

3.3 ICA与PCA

3.4 ICA一般算法

3.5 FastICA方法

3.5.1独立性判据(非高斯性最大化判据)

3.5.2 FastICA算法

3.6模拟实验

第4章逻辑回归(Logistic Regression)

4.1逻辑回归概述

4.2定义

4.3参数估计及假设检验

4.3.1极大似然函数

4.3.2显著性检验

4.3.3模型拟合检验

4.4逻辑回归算法

4.4.1概念介绍

4.4.2操作过程中遇到的问题及解决方案

第5章实验

5.1实验数据

5.2实验步骤

5.3实验结果分析

5.3.1白血病(Leukemia)数据集

5.3.2结肠癌(Colon Cancer)数据集

5.3.3髓母细胞瘤(Medulloblastoma)数据集

第6章总结与展望

参考文献

展开▼

摘要

基因芯片技术的发展使上千个基因的表达水平能够被同时检测出来成为可能。基因表达数据的一个重要应用就是样本分类。结合分类方法,该技术对个人患者提供临床管理决策支持的,比如肿瘤患者。然而,当变量个数p(基因个数)远远超过了样本个数n时,标准的分类和预测方法很难有好的表现。因此,为了对基因芯片数据进行分析,需要对现有的统计方法进行修改和发展。
   结果:本文提出了一种利用基因表达数据进行肿瘤分类的新方法。在此方法中,首先采用独立成分分析对基因表达数据建模,然后应用逻辑回归进行分类。首先,这种方法可以充分利用包含在基因表达数据中的高阶统计信息。其次,这种方法也采用了正则化回归模型来处理大量相关预测变量的情况。最后,预测模型是基于整个基因表达数据的信息进行肿瘤分类的。为了显示提出的方法的有效性,本文采用了适用于分类的三个DNA微阵列数据集,涉及各种人类正常和肿瘤组织样本。试验结果表明该方法是有效和可行的。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号