首页> 中文学位 >基于先验生物学知识的基因网络重构研究
【6h】

基于先验生物学知识的基因网络重构研究

代理获取

目录

摘要

第1章 绪论

1.1 课题的研究背景及意义

1.2 国内外的研究现状

1.3 本文研究的内容和结构

第2章 基于先验生物学知识生成基因网络

2.1 GRANGER因果关系建模-GC模型

2.2 二元GRANGER因果关系建模

2.3 多元GRANGER因果关系建模

2.3.1 现存策略的问题

2.4 利用先验知识指导Granger因果关系建模

2.5 算法

第3章 基因调控关系显著性

3.1 用蒙特卡洛方法计算显著性水平

3.1.1 F检验的介绍

3.1.2 不能选择F检验的原因

3.1.3 算法

3.2 皮尔逊相关系数计算

3.2.1 皮尔逊相关系数介绍

第4章 实验结果及分析

4.1 数据来源

4.2 数据处理过程及基因网络生成

4.3 真实生物数据应用与相关结果分析

4.3.1 阻塞性睡眠呼吸暂停综合证基因表达数据

4.3.2 慢性淋巴细胞白血病基因表达数据

第5章 结论

参考文献

致谢

声明

展开▼

摘要

近年来,随着人类基因组计划的完成以及分子生物学技术的进步,尤其是在下一代测序(NGS)革新生物研究的原则,这些方法的革新使科学家花费了大量的时间和成本,然而,分析这些数据成为生物信息学领域的一个新挑战[2]。在所有的数据挖掘任务中,基因调控网络推理和预测已成为当前时代一个最令人兴奋的话题[3]。在对生物有机体进行排序和识别之后,研究者对基因如何互相调节产生兴趣。最近完成的ENCODE任务通过揭示大多非编码DNA参与调节基因表达,进一步强调了基因调控网络的重要性[4]。简单来说,关于基因调控网络推论的研究在未来十年将依然很重要。虽然有许多关于基因调控网络推论的研究,却只有少数人关注新兴数据:时间序列基因表达数据。在新一代测序技术的帮助下,研究者能够很容易的从一个生物过程中获取这类数据[1],例如,细胞周期。几乎每一个个体的生物的现象都是一个涉及时间领域的动态过程,生物学家对于收集和分析时间序列基因表达数据越来越感兴趣。事实上,众所周知近几年基因表达数据库已经收集了越来越多的时间序列数据[7]。因此,发展可靠地基因调控网络推理策略和时间序列算法对于时间序列基因表达数据已经成为一项紧急任务。许多科学分析研究的基础数据资源都有赖于高速发展的基因芯片技术提供。
  本文主要针对DBN网络建模方法和互信息网络重构方法的不足提出了用于非平衡数据集(n(>>)T)的处理办法。具体做了以下几项工作;首先本文对二元因果关系模型和多元因果关系模型进行一个简单的介绍;其次,通过加入先验知识利用岭回归发现基因之间因果关系;最后,计算每条基因边的显著性水平,通过显著性水平和皮尔逊相关系数筛选基因边,对基因功能进行注释,对显著存在的基因关系通过Cytoscape软件进行展示。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号