首页> 中文学位 >神经网络集成技术及其在癌症基因分类中的应用研究
【6h】

神经网络集成技术及其在癌症基因分类中的应用研究

代理获取

目录

文摘

英文文摘

论文说明:图表目录

声明

第1章 绪论

1.1研究背景与意义

1.2基因微矩阵数据在癌症分类中的应用

1.2.1概述

1.2.2基因表达数据分析方法

1.3神经网络

1.3.1人工神经网络概述

1.3.2神经网络的发展

1.4神经网络集成及应用

1.5本文的工作

第2章微阵列基因数据分类与方法

2.1概述

2.2分类的背景

2.3特征基因选择

2.3.1概述

2.3.2统计法

2.3.3主成分分析

2.3.4信噪比

2.3.5中位数

2.4人工神经网络

2.4.1前馈神经网络

2.4.2反向传播算法

2.4.3激励函数

2.5 Wrapper法

2.6小结

第3章 基于PPS抽样的神经网络集成算法

3.1样本重构方法简介

3.1.1 Bagging方法

3.1.2 Boosting方法

3.1.3两种方法的比较

3.2基于PPS抽样的样本重构

3.2.1 PPS抽样基本概念

3.2.2基于PPS抽样的样本重构

3.3神经网络集成技术

3.3.1结论结合方法

3.3.2选择个体网络集成的理论依据

3.3.3负相关学习法

3.3.4神经网络动态集成

3.4神经网络动态集成的实现方法

3.5实验数据介绍

3.6实验设计

3.7实验结果及分析

3.8 小结

第4章 基于分层抽样的神经网络集成算法

4.1特征基因选择方法简介

4.2基于分层抽样的特征基因选择

4.2.1分层

4.2.2偏度

4.3神经网络

4.3.1分量分类器结构

4.3.2分类器集成

4.4实现方法

4.4.1实验数据与评分方法

4.4.2神经网络结构

4.4.3实验结果与分析

4.5小结

结论

参考文献

致 谢

附录A 攻读学位期间所发表的学术论文目录

展开▼

摘要

微阵列技术可以在不同条件下同时检测成千上万的基因在细胞中的表达水平。已成为生物信息学研究的焦点,对生物医学研究产生了极大的影响。在癌症的研究中,微阵列技术可以从肿瘤基因表达数据的变异研究中,获得更好的癌症诊断与治疗方法。 人工神经网络已在很多领域得到了成功的应用,通过集成多个体网络提高系统泛化能力的神经网络集成技术已成为神经计算技术的一个研究热点。本文研究神经网络集成技术在癌症分类中的应用问题。 针对基因表达数据中样本数量小的情况,本文介绍了神经网络集成算法Bagging与Boosting方法,并对它们进行分析比较。Boosting算法以提高不易分类样本的训练机会,也即增加这类样本被抽中的概率来提高系统的分类效果,但不稳定;而Bagging算法以等概率的方式抽样生成训练集,虽分类效果不如Boosting,但更为稳定。为此本文建立一种不等概的抽样方法产生训练集,训练个体网络。并在基因表达数据上进行实验。结果表明,这种方法能有效地提高分类效果。研究表明,有选择性地将部分个体网络用于集成能比全部个体网络用于集成获得更好的效果,针对选择个体网络用于集成问题,本文提出一种动态集成方法,即以分类准确率为标准动态选择个体神经网络集成。在基因表达数据上进行的实验结果表明,神经网络集成的效果得到显著提高。在基因表达数据的分析中,针对特征基因选择,本文给出一种改进的信噪比方法,以中位数取代均值作为信噪比的参量。并在基因表达数据上进行实验,表明该方法能有效地剔除冗余基因。 针对特征基因的选取,本文还提出一种基于分层抽样的方法选择基因构成特征基因集,并在结肠癌数据集上进行实验。实验结果表明这种方法可更有效合理地获得特征基因集。将多个单个分类器共同构成分量分类器,以分类正确率较高的分量分类器进行集成得到最终分类效果。在基因表达数据上进行实验,结果表明,以这种方法集成可有效地提高分类预测结果。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号