首页> 中文学位 >基于小鼠基因的基因预测算法研究
【6h】

基于小鼠基因的基因预测算法研究

代理获取

目录

封面

声明

摘要

英文摘要

第一章 绪论

1.1 生物信息学简介

1.2 基因预测的研究背景和意义

1.3 基因预测的国内外研究现状

1.4 论文主要工作及安排

第二章 DNA序列的数值化

2.1 真核生物的基因结构

2.2 DNA序列的常用数值化映射

2.2.1 Voss映射

2.2.2 Z-curve映射

2.2.3 正四面体映射

2.2.4 复数法映射

2.2.5 实数法映射

2.2.6 PN法映射

2.3 小结

第三章 编码区序列的统计特征

3.1 3-周期性

3.2 平均互信息

3.3 Z-curve特征

3.4 EQ(Electrie Quantity)

3.5 起始子与终止子特征

3.6 其他统计特征及小结

第四章 分类器模型

4.1 Fisher判别分类法的原理

4.2 Fisher判别分类法在基因识别中的具体应用

第五章 基于碱基3-周期性的小鼠基因预测

5.1 功率谱

5.1.1 容量法功率谱

5.1.2 优化容量法功率谱

5.1.3 碱基分布法功率谱

5.2 小鼠基因预测过程

5.2.1 小鼠基因的外显子和内含子的幅角分布

5.2.2 小鼠基因的功率谱图

5.2.3 阈值的选取

5.3 小鼠基因的信噪比分布及预测结果

5.3.1 小鼠基因的信噪比分布

5.3.2 预测结果

5.4 讨论

第六章 总结与展望

6.1 总结

6.2 展望

参考文献

致谢

攻读硕士期间发表的论文

展开▼

摘要

随着越来越多的物种的基因测序的完成,尤其是人类基因组的测序完成,接踵而至的难题就是对基因组的解释和分析。面对庞大的基因数据,挖掘和分析基因组序列的生命信息就是生物信息学要解决的主要问题。基因预测是DNA序列分析的一项重要任务,而识别基因编码区是基因预测的关键。真核生物基因外显子的识别是基因预测的重难点。由于真核生物基因编码区结构复杂、外显子序列较短、存在大量重复序列等原因,目前对真核生物的编码区预测还没能取得很好的效果。本文针对真核生物,主要研究了小鼠基因的预测方法。
  本文从三个方面对基因预测进行介绍。第一部分:生物信息学的基本知识背景简介,基因预测的国内外研究情况和意义。第二部分:基因预测的第一步是基因序列的数值化映射研究。介绍几种基因序列的统计特征及其提取,结合fisher判别法用这些统计特征对基因序列进行分类判别。第三部分:在3-周期性这一统计特征的基础上对功率谱进行研究,提出基于碱基幅角的功率谱和信噪比,并选取适当阂值判别。用小鼠基因进行试验证明,基于碱基幅角的功率谱,使小鼠外显子序列的频谱图具有更显著的3-周期性,且内含子的频谱图更加平稳,从而增大了序列中外显子与内含子的信噪比的区分度,使小鼠基因序列的预测获得更好的效果。
  总之,本文基于平均长度为150bp的小鼠基因的探究,对基因预测的算法研究取得较好的预测效果。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号