首页> 中文学位 >基于DNase高通测序信息的DNA蛋白结合位点识别研究
【6h】

基于DNase高通测序信息的DNA蛋白结合位点识别研究

代理获取

目录

声明

摘要

第1章绪论

1.1引言

1.2选题意义与目的

1.2.1选题意义

1.2.2选题目的

1.3国内外研究现状

1.4研究内容及研究目标

1.4.1研究内容

1.4.2研究目标

1.5本文的章节安排及内容

第2章DNase-Seq高通量测序技术

2.1高通量测序技术

2.1.1模板准备

2.1.2测序

2.1.3合成测序

2.1.4杂交和连接测序

2.2 ChIP-seq技术

2.3 ATAC-seq技术

2.4 DNase-seq技术

2.5转录因子结合位点

2.6本章小结

第3章DNase-Seq数据预处理

3.1 PWM模型

3.2 DNase-seq数据及转录因子PWM数据

3.3数据提取

3.3.1 DNase-seq数据提取

3.3.2 PWM数据提取

3.4 DNase-seq数据预处理

3.5 DNase-seq数据特点

3.6本章小结

第4章转录因子结合位点识别

4.1转录因子结合位点识别模型构建过程

4.1.1自动编码器

4.1.2反向传播算法

4.1.3逻辑斯特回归

4.2转录因子结合位点识别模型构建

4.3模型实现

4.3.1神经网络结构确定

4.3.2神经网络训练

4.3.3参数调整

4.4基于自动编码器的转录因子结合位点分析

4.5本章小结

第5章转录因子结合位点识别模型评价

5.1识别结果分析

5.1.1样本数据

5.1.2样本数据划分

5.1.3分类结果说明

5.2识别模型性能评价

5.3对转录因子结合位点实现多分类的讨论

5.3.1转录因子结合位点多分类的实现

5.3.2转录因子结合位点识别结果说明

5.4本章小结

结论

参考文献

攻读硕士学位期间发表的论文和取得的科研成果

致谢

展开▼

摘要

自人类全基因组计划以来,对转录因子以及其结合位点的研究成为人类探索生命本质的重要课题。转录因子只有在与特定的结合位点结合之后才具有调控基因表达的功能。所以,准确识别出转录因子结合位点的位置成为遗传学的核心内容之一。2010年,Crawford提出的DNase-seq技术可以实现单次实验即可检测出全基因组范围内的蛋白结合位点。DNase-seq技术相比于目前广泛使用的ChIP-seq技术、ATAC-seq,表现出了诸多的优势,在提高检测效率和检测精度的同时,大幅降低了检测成本。
  在本课题研究中,首先在网站上获取到DNase-seq数据以及转录因子的有关数据。然后,利用FIMO工具得到确切的转录因子结合位点,提取整理每个结合位点的DNase-seq数据并构建数据集。随后,根据DNase-seq数据特点选择并构建了基于自动编码器神经网络的转录因子结合位点识别模型。接着,从转录因子结合位点的典型性和测序深度两个方面对所构建模型的识别结果进行分析,从而确定使用该识别模型所需的条件。最后,考虑到数据集的大小存在着不平衡的因素,我们选用指标灵敏度、特异性以及马修相关系数等指标来对所构建模型的识别能力进行评价,既衡量了分类器对正例的识别能力,又衡量了分类器对反例的识别能力,同时也验证了模型的可靠性。
  通过对识别模型结果的评估,所设计模型能够有效地实现基于DNase-seq数据的转录因子结合位点的识别,并为构建在全基因组范围内的转录因子调控网络打下了基础。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号