首页> 中文学位 >基于序列模式挖掘识别基因剪接位点的研究
【6h】

基于序列模式挖掘识别基因剪接位点的研究

代理获取

目录

声明

摘要

图目录

表目录

第一章 绪论

1.1 引言

1.2 选题目的与意义

1.3 剪接位点识别研究现状

1.4 本文的主要工作和内容安排

第二章 真核基因剪接的生物学基础

2.1 引言

2.2 生物学基础知识

2.3 基因的表达控制

2.3.1 真核基因的转录调控

2.3.2 真核基因的翻译调控

2.4 真核基因的剪接机制

2.5 生物分子数据库

2.6 本章小结

第三章 序列模式挖掘模型

3.1 引言

3.2 序列模式

3.2.1 频繁项集和关联规则挖掘

3.2.2 频繁模式挖掘经典算法——Apriori

3.3 基于序列模式挖掘建模单核苷酸短序列

3.3.1 模型数学形式化描述

3.3.2 建模流程

3.4 本章小结

第四章 基于序列模式挖掘模型的真核基因剪接位点识别

4.1 引言

4.2 识别定义剪接位点的最佳上下游序列长度

4.3 评价指标

4.4 数据提取

4.4.1 真假剪接位点提取

4.4.2 突变剪接位点提取

4.5 实验结果及讨论

4.5.1 序列模式挖掘模型区分真、假剪接位点

4.5.2 序列模式挖掘模型对比实验

4.5.3 序列模式挖掘模型的鲁棒性验证

4.5.4 序列模式挖掘模型识别剪接位点突变实验

4.6 本章小结

第五章 剪接位点组合调控研究

5.1 引言

5.2 5’端剪接位点调控3’端剪接位点的多样性

5.2.1 实验设计

5.2.2 实验结果及讨论

5.3 剪接调控元件与剪接位点间的补偿机制

5.3.1 实验数据准备

5.3.2 调控元件在剪接位点上下游密度分布实验

5.4 本章小结

第六章 总结和展望

6.1 工作总结

6.2 工作展望

参考文献

致谢

攻读硕士学位期间发表的学术论文

攻读硕士学位期间参加的科研项目

展开▼

摘要

生物信息学是融合了计算机科学和生命科学形成的一门新兴交叉学科。生物信息学不仅成为了生物医学研究的基础学科,也成为了信息科学研究最为活跃的领域之一。基因表达调控是分子生物学研究的核心问题之一。基因剪接是基因表达过程中连接转录和翻译的中枢步骤。DNA通过转录得到前体RNA,前体RNA剪接后得到成熟RNA序列,根据成熟RNA序列编码蛋白质产物。研究基因剪接和剪接机制,能够为我们更深入了解基因表达提供重要证据,目前已成为生物信息学研究的一个重要方向。分子生物学理论研究表明影响剪接的核心顺式调控元件之一是剪接位点。医学工作者研究也表明多种人类疾病致病机理均和剪接位点突变有关联。所以,正确识别基因中存在的剪接位点是研究剪接机制和剪接位点突变的前提,并能为致病机制的研究提供依据和指导。围绕这个难题,本文通过挖掘剪接位点序列中蕴含的序列特征,融合PSSM(Position-Specific ScoringMatrix,位置特异分值矩阵)算法,提出了一个基于序列模式挖掘模型,可以实现对剪接位点信号强度的定量度量,进而识别剪接位点。基因剪接机制是多种不同顺式元件和蛋白质之间相互影响而进行的组合调控。为了更深入、更全面的研究剪接机制,我们在序列模式挖掘模型的基础上,进一步对剪接位点组合调控机制进行了研究。
  本文主要研究工作和创新之处如下:
  (1)提出一个能够定量分析剪接位点序列的模型。根据基因序列本身包含的丰富分类信息和保守型特征,本文应用频繁模式挖掘理论和算法融合PSSM算法,提出序列模式挖掘模型。通过该模型,挖掘出剪接位点序列中蕴含的碱基相关性,分别计算出供体剪接位点位点、受体剪接位点和致病基因突变剪接位点信号强度值,从而进行识别和分类。实验数据均按照生物理论,从UCSC数据库中的人类全基因序列抽取。通过对该模型的实验验证,可有效区分真、假剪接位点和识别致病剪接位点突变。并且其识别结果不仅优于最大信息熵模型,且本身具有良好鲁棒性。
  (2)剪接位点组合调控研究。剪接位点序列存在保守型(剪接位点上下游单聚体、二聚体、三聚体组成具有强相关性)是能够有效识别剪接位点的最大依据,现今的识别算法和模型也都是基于抽取的序列保守特征信息来构造分类器。但是,在基因剪接过程中,剪接位点、分支位点和剪接调控元件三种顺式序列以及不同的蛋白质均可以对剪接产生调控作用。并且,每一个内含子序列两端的5'端和3'端剪接位点本身也相互存在影响。研究不同剪接信号的相互作用和补偿机制,可以为提高剪接位点识别效果和深入研究剪接机制提供思路和证据。本文基于序列模式挖掘模型设计实验,对同一内含子5'端和3'端剪接位点信号强度进行量化,得出5'端剪接位点信号强度越大,3'端剪接位点就具有更多的选择,反之则不能的结论,阐明了两种不同剪接位点信号之间存在的关系。并进一步统计强弱5'端、3'端剪接位点延长序列上的四类剪接调控元件分布密度,得出剪接调控元件与剪接位点之间也存在相互补偿机制的证据。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号