首页> 中文学位 >基于R语言的DNA微阵列数据分析与挖掘平台的构建
【6h】

基于R语言的DNA微阵列数据分析与挖掘平台的构建

代理获取

目录

封面

中文摘要

英文摘要

目录

略缩词列表

1 绪 论

1.1 基因芯片技术

1.2 Affymetrix基因表达谱芯片数据的分析

1.3 本研究的意义、主要内容和创新性

2 基因表达谱芯片数据的初步处理方法

2.1 探针水平数据的获得

2.2 数据的预处理

2.3 基因表达数据的计算

2.4 差异表达基因的筛选

2.5 数据的可视化方法

2.6 本章小结

3 基于R/Bioconductor的芯片数据分析平台的构建

3.1 引言

3.2 本地化Bioconductor平台的构建

3.3 用于分析的基因芯片数据的获取

3.4 微阵列数据的预处理与相关包的配置

3.5 差异表达基因的筛选与相关包的配置

3.6 基因富集分析与相关包的配置

3.7 通路和生物网络分析及Cytoscape软件包的安装配置

3.8 本章小结

4 实例分析:哮喘相关的基因表达谱芯片数据的分析与挖掘

4.1 引言

4.2 实验数据的获取与导入

4.3预处理前的数据质控

4.4 实验数据的预处理

4.5 归一化后数据的质控

4.6 差异表达基因的检测

4.7 差异表达基因的注释与基因本体学

4.8 聚类分析

4.9通路分析

4.10 其他生物信息学分析

4.11 本章小结

5 运用构建的平台进行哮喘相关信号通路综合分析

5.1 哮喘相关基因表达谱数据的选取

5.2 数据分析的基本过程

5.3 结果

5.4 讨论

6 结论及展望

6.1 结论

6.2 对未来工作的展望

致谢

参考文献

附录

展开▼

摘要

DNA微阵列(即基因芯片)是诞生于上世纪末的一项伟大技术,它是迄今为止最重要的基因表达调控研究技术之一。面对公共数据库中与日俱增的基因芯片表达谱数据,如何高效地从海量的数据中提取和发掘有用的生物学知识便成为当前生物学家遇到的最大挑战。虽然已有多种用于基因芯片数据分析的软件,但大多数软件的分析模块化,定制性较差,不适合二次开发,对新算法的兼容和容纳能力也很有限,不能满足深层数据挖掘的需要。
  为了深入分析和挖掘蕴藏在基因芯片数据中的重要信息,本研究基于开源的R语言编程平台,以Bioconductor为生物计算环境,利用多种软件包在本地服务器上构建了一个用于的基因芯片数据分析和挖掘系统。并采集公共数据库中已发表的Affymetrix寡核苷酸微阵列原始数据GSE470,对构建的芯片数据分析系统进行了包括基因芯片数据的获取、预处理、质量检测、差异表达基因的筛选、GO注释、聚类分析、pathway分析、基因表达调控网络和分子互作网络的分析与可视化等多项实际测试。
  GSE470芯片数据组的测试结果发现,哮喘患者与正常人体存在PIP、MMP1、PDPN等33个差异表达的基因,两者间最大的信号通路差异在于氧化磷酸化途径发生了变化;同时预测出了以该组差异表达基因为关键节点的哮喘相关基因表达调控与互作网络,发现MMP1、S100a7、DBC1与RPA2等多个关键性的调节点。以上通过该平台取得的预测结果与哮喘研究领域已经公开发表的结论一致,并不断被新的文献所证实。
  此外,应用构建好的数据分析平台对GSE470、GSE13396和GSE41649三组数据进行通路综合分析,显示有多条通路在哮喘病人体内发生了显著改变,提示这些信号通路的研究可能为哮喘的分子机理研究提供佐证。
  上述的结果表明,构建于本地windows平台下的芯片数据分析系统可快速、高效、精准地处理和分析以 Affymetrix寡核苷酸微阵列为代表的基因芯片数据,最大限度地挖掘大量基因芯片数据背后所隐藏的丰富的生物学知识,加深科研人员对疾病的分子机理等生物学问题的理解。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号