首页> 中文学位 >基于位置依赖性的Gibbs采样模体发现算法
【6h】

基于位置依赖性的Gibbs采样模体发现算法

代理获取

目录

文摘

英文文摘

第一章 绪论

1.1 研究背景和现状

1.1.1 生物信息学

1.1.2 生物序列分析

1.1.3 国内外的研究现状

1.2 本文的研究内容和组织结构

第二章 生物序列模体发现及典型算法分析

2.1 序列模体发现问题

2.1.1 模体的定义及表示

2.1.2 模体的得分函数

2.1.3 检验模体内部关系的方法

2.1.4 模体发现问题的数学描述

2.2 序列模体发现算法

2.2.1 模体发现算法设计

2.2.2 基于统计模型的算法

2.2.3 基于一致序列模型的算法

2.3 算法性能比较与分析

第三章 基于位置依赖性的Gibbs抽样模体发现算法PIGS

3.1 相关理论与模型

3.1.1 模体内部的位置依赖性

3.1.2 Gibbs采样算法存在的问题

3.2 算法设计

3.2.1 位置依赖关系

3.2.2 收敛条件

3.2.3 相位移动

3.2.4 PIGS算法描述

第四章 实验结果与分析

4.1 合成数据实验结果分析

4.2 真实数据实验结果分析

4.3 模体位置依赖关系结果分析

4.4 小结

第五章 总结与展望

致谢

参考文献

研究成果

展开▼

摘要

近年来,随着生物测序技术的突飞猛进,现代生物技术的研究取得了突破性的进展,生物序列数据以前所未有的速度增长。人工分析和处理生物序列数据已无法满足需要,如何分析和处理如此庞大的数据,以及理解这些生物数据所表示的生物意义,已经成为当前重要的研究任务。DNA序列中的模体发现是生物信息学中最基本的问题,它涉及到基因的发现、转录因子结合位点的发现、启动子的发现等生物学问题。生命性状由基因决定,当前基因如何决定性状的研究已从单个基因决定作用转向多个基因的协同作用研究。DNA序列调控区的模体对DNA的转录翻译起着重要作用,因此对调控区motif的分析具有重大意义和理论价值。同时,识别这些模体对基因组解码也起到了非常重要的作用。
   目前,已经有很多算法被用来解决模体发现问题,例如Gibbs采样算法,MEME算法等。本文首先对模体发现算法中常用的模型进行了分析,并且基于不同的模型对上述几种传统的模体发现算法进行了分析和研究。这些传统的算法都假设模体内部各个位置之间是相互独立的。但是最近的生物实验证实,模体内部各个位置之间并不是完全独立的,有的模体的各个位置之间存在明显的依赖性。这种依赖性应该被用于模体识别以提高模体识别的精度。本文正是基于这种考虑,将模体内部的依赖性引入得分函数中,基于Gibbs采样算法提出了PIGS算法,进行motif识别。同时改进了Gibbs采样算法的收敛条件和相移方法。在合成数据和真实数据上的实验结果表明,查找出的模体在准确度方面有较大的提高。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号