首页> 中文学位 >生物信息学中的模式发现算法研究
【6h】

生物信息学中的模式发现算法研究

代理获取

目录

文摘

英文文摘

第1章绪论

1.1研究的目的和意义

1.2国内外现状

1.3本文的贡献

1.4论文结构

第2章背景知识介绍

2.1 Motif发现算法回顾

2.1.1序列谱模型算法

2.1.2一致模型算法

第3章基于样板的贪心EM混合模型算法-SEMM

3.1混合模型算法的数学基础

3.2基于样板的EM混合模型算法-SEMM算法

3.2.1选集的生成

3.2.2算法描述

3.3.3算法性能及算法的实验结果

第4章SSNT算法-新的精确motif发现方法

4.1模式扩展

4.2候选筛

4.3算法的描述

4.4算法的性能和实验结果

第5章起动子motif关联集差异分析

5.1问题的定义

5.2 FPD-树算法-基于FP-树的关联规则算法

5.2.1算法描述

5.3 DAAR算法-起动子关联集差异分析算法

5.3.1算法描述

5.4算法性能和实验结果

总结

致谢

攻读硕士学位期间所发表的论文

参考文献

独创性声明及学位论文版权使用授权书

展开▼

摘要

生物信息数据的快速增长促使人们发展新的技术去认识它,利用它。这是认识世界,改造世界的必然途径。生物信息学研究的对象是DNA序列、蛋白质序列。motif是生命密码的一种表现形式,因此利用多序列生物数据发现motif意义重大,它可以使我们发现基因表达的方式和原理。我们将混合模型应用在motif发现过程中,提出了基于样板候选集的生成方法,改进了greedyEM算法。对于精确motif发现问题,提出了用motif家族树的方式来减小模式空间,通过候选筛的方法来减小比对次数的新算法。生命性状是由基因决定,当前基因如何决定性状的研究已从单个基因决定作用转向多个基因的协同作用研究。在分子水平上,DNA序列调控区的motif对DNA的转录翻译起着重要作用,因此对调控区motif的关联分析对研究基因表达有着重大意义和理论价值。本文针对两个不同基因表达模式的起动子motif关联集差异进行分析,提出了先建立FP-树,然后建立字典树森林进行分析比较的有效算法。我们还给出了另外一个挖掘算法,该算法适用于起动子motif数据中的关联规则的发现。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号