首页> 中文学位 >线粒体完全基因组混沌游戏表示的Markov模型模拟
【6h】

线粒体完全基因组混沌游戏表示的Markov模型模拟

代理获取

目录

封面

声明

中文摘要

英文摘要

目录

第一章 绪论

1.1 生物信息学的概念

1.2 生物信息学的研究目标和任务

1.3生物信息学的主要意义和展望

1.4 基因组序列分析与线粒体基因组进展

1.5 本论文的主要工作

第二章 混沌游戏表示(CGR)

2.1 混沌游戏表示(CGR) [11, 19]

2.2 混沌游戏表示的一些应用1. 利用CGR图像的点找寻核酸序列的相同片段[20]:

2.3 递归迭代函数系统的数值模拟模型[14–17]

2.4 马尔科夫链数值模拟模型[18]

第三章 马尔科夫模型下的生物线粒体完全基因组CGR的数值模拟

3.1 相关数据

3.2 数值拟合

3.3 讨论与分析

附 表

参考文献

致谢

展开▼

摘要

作为核外遗传信息系统和其具有的遗传特点,线粒体完全基因组已成为研究真核生物分子的遗传学,发育生物学和分子系统进化的一种重要的模式体系。作为基因组序列分析的一种统计方法,混沌游戏表示(CGR)图形方法表示基因组序列具有直观,不受序列长程相关性的影响,不依赖于序列尺度以及计算速度快等优点。而作为CGR的一种经典的数值模拟方法,马尔可夫链模型利用寡核苷酸频率得出转移概率矩阵进行序列的重构,具备计算快速简单,准确率高等特点。我们在NCBI收集了64种生物的线粒体完全基因组序列,并建立了一阶和二阶的马尔可夫模型并利用这两个模型对64种线粒体序列全部进行了模拟,为了判别拟合的效果,我们又引入了测度概念,把CGR图形划分为64×64和128×128的网格,进行测度比对。同时又引入测度的相对标准误差概念,对拟合的图形做了进一步的量化判别,在大量的对比中我们发现所有这些生物的序列寡核苷酸CG出现的频率都比较低,哺乳动物序列的寡核苷酸TA出现的频率较高而鸟类序列的CC现的频率较高。
  在相对误差的比较当中我们也发现在128×128的网格上,其测度的相对误差都控制在0.7左右,在64×64的相对误差都控制在0.3左右。而且二阶模型的误差要比一阶的小。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号