首页> 中文学位 >基于表达数据和基因组信息分析基因调控的方法学研究
【6h】

基于表达数据和基因组信息分析基因调控的方法学研究

代理获取

目录

文摘

英文文摘

论文说明:缩写词表

声明

第一章 绪论

1.1 基因调控的研究

1.2 基因表达数据分析

1.3 转录因子DNA结合位点研究

1.4 本论文的研究内容和结构

第二章 基因表达数据分析

2.1 基因表达数据分析方法综述

2.1.1 基因表达数据的获取

2.1.2 基因表达数据聚类和分类分析

2.1.3 差异表达基因的识别

2.1.4 基因表达数据分析结果的富集分析

2.2 基因表达数据模糊聚类分析

2.2.1 模糊聚类分析算法

2.2.2 酵母细胞周期表达数据模糊聚类分析

2.3 基于基因共表达的转录因子结合位点识别

2.3.1 数据和方法

2.3.2 结果与讨论

2.4 基于秩的跨平台基因表达数据分析

2.4.1 算法介绍

2.4.2 造血干细胞基因表达数据分析

2.4.3 R语言环境中的rCPGE代码

2.5 基因表达数据分析软件设计和实现

2.5.1 GEKE软件设计

2.5.2 GEKE软件的实现

2.6 小结

第三章 转录因子DNA结合位点扫描和靶基因预测

3.1 转录因子DNA结合位点识别方法综述

3.1.1 转录因子DNA结合位点的表示

3.1.2 转录因子DNA结合位点的识别方法

3.2 转录因子NF-κB的DNA结合位点扫描分析

3.2.1 数据和方法

3.2.2 结果和讨论

3.3 转录因子AP-1 的靶基因预测

3.3.1 数据和方法

3.3.2 结果和讨论

3.4 转录因子DNA结合位点扫描软件的设计和实现

3.4.1 软件设计

3.4.2 gWord软件的实现和应用

3.5 小结

第四章 基于GO术语的基因产物语义相似度分析

4.1 引言

4.2 基于GO术语的语义相似度分析

4.2.1 算法介绍

4.2.2 酵母的基因路径相关的基因语义学分析

4.2.3 AP-1 相关基因的基因语义学分析

4.3 基于GO术语的基因产物语义相似度分析程序的设计和实现

4.3.1 gFAS程序设计

4.3.2 gFAS程序实现和使用

4.4 小结

第五章 总结

参考文献

博士学习期间发表论文清单

致谢

展开▼

摘要

后基因组时代,高通量数据的产生和分析是生物医学研究中的一个重要现象和重要任务,因此面向全基因组数据的分析方法研究和工具开发应是生物信息学的重要研究内容之一。基因调控网络或者基因之间的相互关系研究是生物医学研究的重要内容,有助于揭示疾病的分子机制,为疾病的早期诊断和治疗、预防和预后提供有效的分析策略和技术支持。论文选择微阵列基因表达数据、基因组序列数据以及全基因组注释信息为分析对象,以发现基因之间的相互关系,特别是基因调控关系为目的,研究数据整合分析方法,并开发相应的工具,为基因调控的研究提供技术支持。总结本论文的主要工作和所取得结果如下: (1)分析基因表达数据,确定基因之间的共表达关系。包括3个工作。将模糊聚类分析方法引入到基因表达数据分析中,并应用于酵母细胞周期表达数据的分析,分析得到的两类基因分别参与了G1/S和G2/M期的细胞生理过程,这些共表达基因很好地描述了细胞周期中的分子过程。结果表明了模糊聚类分析算法能够提取有用的生物信息,有助于生物学知识的发现。基于共表达基因是共调控的假设,对聚类分析得到的酵母共表达基因进行了启动子区转录因子结合位点的预测工作,找到了一些转录因子结合位点,与现有的认识相一致,表明可以通过共表达基因来确定转录因子结合位点,进而找到转录因子,确定基因之间的调控关系。基于分子网络模块化和基因按需表达的假设,提出了基于秩和样本重排检验思想的跨平台分析方法,并用于小鼠造血干细胞定向分化血细胞的基因表达数据分析,分析了不同参数对结果的影响,并选择一组参数进行了条件特异基因差异表达分析,有效地提取了一组基因,它们反映出T细胞发育过程和B细胞发育过程中的共同分子过程和特异分子过程。 (2)分析基因组序列和注释信息,确定基因之间的调控关系。利用转录因子结合位点进行全基因组扫描,结合GO注释信息预测靶基因,认识基因之间的调控关系。对转录因子NF-κB和AP-1结合位点进行了基于一致序列和特定motif的扫描,分析了在人全基因组上的分布特点,NF-κB结合位点的一致序列在启动子区的转录起始位点上游300bp内出现明显的高峰,表明了TFBS在启动子区的富集,与一般认识相符。AP-1结合位点motif“TGCGTCA”也表现出类似的分布,但是AP-1结合位点的其它motif在启动子区的分布是接近均匀的。全基因组扫描分析显示转录因子结合位点的不同motif具有不同的分布特点,在基因组上的频率可以相差10倍以上,在基因各结构区也不是对称的。对扫描结果进行了基因注释,分析了已知靶基因的GO注释以及motif在启动子区的分布特点和聚集特性,利用这些信息预测了NF-κB和AP-1的靶基因,并利用文献挖掘分析工具,表明部分预测靶基因与转录因子存在密切关系,为实验验证提供了有效的线索。 (3)基于GO术语的基因产物语义相似度分析基因之间的关联关系。语义相似度计算的基本思想是基于GO图结构信息或者基于GO术语的信息量信息,选择酵母基因和AP-1相关基因,采用多种算法进行了GO语义相似度计算,结果表明应用语义相似度可以进行基因相关性分析,路径参与基因之间的语义相似度要显著高于任意基因之间的语义相似度,酵母基因分析的结果要优于AP-1路经基因的分析结果,这与酵母基因和人类基因的GO注释质量有关。分析还表明了不同算法得到的结果有较大的差异,提示了算法选择的重要性,而整合多种算法进行分析将是更好的一种选择。 (4)全基因组分析对于计算复杂度和后续信息分析都是一个挑战,在算法研究的基础上,面向具体的生物医学应用,开发了基因表达数据分析软件、转录因子结合位点扫描和注释软件、基于秩的跨平台条件特异表达分析程序和基于GO术语的基因产物语义相似度计算程序。上述软件和程序可以在http://www.lmbe.seu.edu.cn/~xjm/program.html下载。 论文在面向生物医学应用进行工具开发上进行了尝试,试图有机地把两者结合起来,以生物医学问题为主导,整合多种数据进行分析。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号