基于表达数据和基因组信息分析基因调控的方法学研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

后基因组时代，高通量数据的产生和分析是生物医学研究中的一个重要现象和重要任务，因此面向全基因组数据的分析方法研究和工具开发应是生物信息学的重要研究内容之一。基因调控网络或者基因之间的相互关系研究是生物医学研究的重要内容，有助于揭示疾病的分子机制，为疾病的早期诊断和治疗、预防和预后提供有效的分析策略和技术支持。论文选择微阵列基因表达数据、基因组序列数据以及全基因组注释信息为分析对象，以发现基因之间的相互关系，特别是基因调控关系为目的，研究数据整合分析方法，并开发相应的工具，为基因调控的研究提供技术支持。总结本论文的主要工作和所取得结果如下：（1）分析基因表达数据，确定基因之间的共表达关系。包括3个工作。将模糊聚类分析方法引入到基因表达数据分析中，并应用于酵母细胞周期表达数据的分析，分析得到的两类基因分别参与了G1/S和G2/M期的细胞生理过程，这些共表达基因很好地描述了细胞周期中的分子过程。结果表明了模糊聚类分析算法能够提取有用的生物信息，有助于生物学知识的发现。基于共表达基因是共调控的假设，对聚类分析得到的酵母共表达基因进行了启动子区转录因子结合位点的预测工作，找到了一些转录因子结合位点，与现有的认识相一致，表明可以通过共表达基因来确定转录因子结合位点，进而找到转录因子，确定基因之间的调控关系。基于分子网络模块化和基因按需表达的假设，提出了基于秩和样本重排检验思想的跨平台分析方法，并用于小鼠造血干细胞定向分化血细胞的基因表达数据分析，分析了不同参数对结果的影响，并选择一组参数进行了条件特异基因差异表达分析，有效地提取了一组基因，它们反映出T细胞发育过程和B细胞发育过程中的共同分子过程和特异分子过程。（2）分析基因组序列和注释信息，确定基因之间的调控关系。利用转录因子结合位点进行全基因组扫描，结合GO注释信息预测靶基因，认识基因之间的调控关系。对转录因子NF-κB和AP-1结合位点进行了基于一致序列和特定motif的扫描，分析了在人全基因组上的分布特点，NF-κB结合位点的一致序列在启动子区的转录起始位点上游300bp内出现明显的高峰，表明了TFBS在启动子区的富集，与一般认识相符。AP-1结合位点motif“TGCGTCA”也表现出类似的分布，但是AP-1结合位点的其它motif在启动子区的分布是接近均匀的。全基因组扫描分析显示转录因子结合位点的不同motif具有不同的分布特点，在基因组上的频率可以相差10倍以上，在基因各结构区也不是对称的。对扫描结果进行了基因注释，分析了已知靶基因的GO注释以及motif在启动子区的分布特点和聚集特性，利用这些信息预测了NF-κB和AP-1的靶基因，并利用文献挖掘分析工具，表明部分预测靶基因与转录因子存在密切关系，为实验验证提供了有效的线索。（3）基于GO术语的基因产物语义相似度分析基因之间的关联关系。语义相似度计算的基本思想是基于GO图结构信息或者基于GO术语的信息量信息，选择酵母基因和AP-1相关基因，采用多种算法进行了GO语义相似度计算，结果表明应用语义相似度可以进行基因相关性分析，路径参与基因之间的语义相似度要显著高于任意基因之间的语义相似度，酵母基因分析的结果要优于AP-1路经基因的分析结果，这与酵母基因和人类基因的GO注释质量有关。分析还表明了不同算法得到的结果有较大的差异，提示了算法选择的重要性，而整合多种算法进行分析将是更好的一种选择。（4）全基因组分析对于计算复杂度和后续信息分析都是一个挑战，在算法研究的基础上，面向具体的生物医学应用，开发了基因表达数据分析软件、转录因子结合位点扫描和注释软件、基于秩的跨平台条件特异表达分析程序和基于GO术语的基因产物语义相似度计算程序。上述软件和程序可以在http：//www．lmbe．seu．edu．cn/～xjm/program．html下载。论文在面向生物医学应用进行工具开发上进行了尝试，试图有机地把两者结合起来，以生物医学问题为主导，整合多种数据进行分析。

著录项

作者
谢建明;
展开▼
作者单位

东南大学;

展开▼
授予单位东南大学;
学科生物医学工程
授予学位博士
导师姓名陆祖宏;
年度 2009
页码
总页数
原文格式 PDF
正文语种中文
中图分类基因的表达;
关键词
基因表达; 模糊聚类分析; 转录因子结合位点; 语义相似度; 生物信息学; 基因调控;

相似文献

中文文献
外文文献
专利

1. 基于癌症基因组图谱数据库的结直肠腺癌加权基因共表达网络的构建与分析 [J] . 卞承玲 ,戴剑 ,陆亚云 . 海军医学杂志 . 2018,第005期
2. 基因组医学、染色体组和人类疾病基因(5)基因表达调控和表观遗传调控 [J] . . 中华生物医学工程杂志 . 2004,第005期
3. 基于多组全基因组表达谱的阳虚人群关键候选基因集和通路筛选及生物信息学分析 [J] . 林景峰 ,高强 ,刘甘露 . 湖南中医药大学学报 . 2021,第003期
4. 海岛棉生长调控因子GRF基因家族的全基因组及表达分析 [J] . 赵柯柯 ,范蓉 ,刘亚丽 . 新疆农业大学学报 . 2019,第003期
5. 小麦LBD基因家族的全基因组鉴定、表达特性及调控网络分析 [J] . 邢光伟 ,王梦醒 ,马小飞 . 麦类作物学报 . 2017,第7期
6. 基因组及基因调控信息分析(摘要) [C] . 孙啸 . 浙江省信号处理学会2014学术年会 . 2014
7. 结合基因组调控信息的基因芯片数据综合分析 [A] . 孙如平 . 2007

基于表达数据和基因组信息分析基因调控的方法学研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅