首页> 中文学位 >多平台基因芯片数据整合方法改进
【6h】

多平台基因芯片数据整合方法改进

代理获取

目录

声明

摘要

插图索引

附表索引

第1章 绪论

1.1 研究背景和意义

1.2 挑战及研究现状

1.2.1 基因芯片数据分析面临的挑战

1.2.2 现状分析

1.3 本文主要工作

1.4 本文章节安排

第2章 基因芯片表达数据的基础知识及整合方法

2.1 基因芯片表达数据的基础知识

2.1.1 基因芯片数据简介及原理

2.1.2 基因表达数据处理流程

2.1.3 基因表达数据的应用

2.1.4 基因芯片的网络资源

2.2 多平台基因芯片表达数据整合流程

2.3 芯片数据整合方法介绍

2.3.1 中位值整合法(Median Rank Score,MRS)

2.3.2 分位数离散法(Quantile Discretization,QD)

2.3.3 基于排序整合方法(Rank-based,RB)

2.4 小结

第3章 基于倍数基因芯片表达数据整合方法

3.1 引言

3.2 基于倍数的整合方法

3.2.1 方法基本思想

3.2.2 方法步骤

3.2.3 方法举例

3.2.4 部分代码实现

3.3 测试与结果分析

3.3.1 实验数据集及预处理

3.3.2 数据整合

3.3.3 特征选择

3.3.4 基于支持向量机的分类

3.3.5 结果分析

3.4 小结

第4章 基于倍数归一化的两级整合方法

4.1 引言

4.2 基于倍数归一化的两级整合方法

4.2.1 方法基本思想

4.2.2 方法设计

4.3 测试与结果分析

4.3.1 实验数据集与分析方法

4.3.2 实验步骤

4.3.3 结果分析

4.4 小结

结论

参考文献

附录A 攻读硕士期间完成的学术论文

附录B 攻读硕士期间参加的科研项目

致谢

展开▼

摘要

基因芯片技术对高通量的基因表达分析产生了海量的数据,但是如何高效地对这些基因芯片数据进一步的分析和挖掘,使得这些数据从原本“产生假设”的工具逐步转变为“验证生物学假设”的信息库,是当前生物信息学研究的热点。基因芯片数据分析的一个方向是对表达数据进行去噪和归一化预处理后整合不同平台的数据来增加实验样本数目。
   本文着眼于多平台芯片数据整合方法的研究,将不同平台但具有相同研究目的的“高维数、小样本”芯片数据整合为一组对象进行更深层次的分析,从而可获得更客观、稳定、并具有普适意义的结果。
   首先,本文提出了一种基于倍数的整合方法。在研究多种已有芯片数据方法的基础上,针对它们在数据转换过程中基因之间相互关系发生变化的问题,通过计算出芯片中所有样本基因表达值中位数的平均值作为倍数指标来对整个芯片数据进行处理,从而保留样本中基因之间相互作用的程度。根据实验比较已有方法,本方法具有简单、低时间复杂度的优点,并且具有保持较高的准确率。
   进一步,通过分析基于倍数方法的实质,利用处理过程中同时能够达到归一化的特性,结合已有需要进行数据归一化预处理的中位值整合方法,设计了一个复合结构的两级整合方法。该方法同时具备两者的优势,既保持原有基因间相互关系,又可以将数据压缩到同一范围内,从而达到缓解不同平台实验环境引起的偏差问题。通过实验对比,两级整合方法比单一方法具有相似或更高的准确率,同时稳定性更好。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号