首页> 中文学位 >内含子保留型可变剪接预测及可变剪接与蛋白质结构多样性分析
【6h】

内含子保留型可变剪接预测及可变剪接与蛋白质结构多样性分析

代理获取

目录

封面

声明

中文摘要

英文摘要

目录

1 引 言

1.1可变剪接位点预测现状

1.1.1实验方法识别剪接位点

1.1.2理论预测方法介绍

1.1.3可变剪接的类型

1.2可变剪接和蛋白质结构多样性的研究现状

1.2.1可变剪接机制

1.2.2蛋白质结构

1.2.3 可变剪接和蛋白质结构多样性之间的关系

1.3数据库介绍

1.3.1可变剪接数据库

1.3.2蛋白质三维结构数据库(PDB数据库)

1.4 本文的研究内容及意义

1.5 技术路线

2 基于序列信息的内含子保留可变剪接位点预测

2.1 材料和方法

2.1.1 数据集的构建

2.1.2选取特征参数

2.1.3多样性指标(ID)

2.1.4 贝叶斯二次判别函数

2.1.5 评价指标

2.2 结果与讨论

2.2.1 内含子保留的长度统计分析结果

2.2.2序列特征的初步分析

2.2.3预测结果分析

2.3本章小结

3 可变剪接和蛋白质结构多样性的相关性分析

3.1 材料和方法

3.1.1数据库的构建

3.1.2均方根偏差(RMSD)分析

3.1.3蛋白质的结构稳定性分析

3.1.4蛋白质序列的多样性增量(ID)

3.1.5疏水非均一性分析(HI)

3.2 结果与讨论

3.2.1疾病与非疾病蛋白质结构差异的分析

3.2.2疾病与非疾病蛋白质的稳定性分析

3.2.3可变剪接偏好性分析

3.3 本章小结

结论

参考文献

在学研究成果

致谢

展开▼

摘要

真核生物多外显子基因的pre-mRNA可变剪接是一种非常普遍的基因表达调控机制。通过可变剪接一个基因可以产生多个不同的RNA转录本,并进一步表达为不同的蛋白质,增加了蛋白质的多样性。高效准确的区分可变剪接发生的类型对于研究可变剪接具有重要意义。可变剪接和蛋白质结构多样性的相关性是阐明可变剪接作用机制的重要环节,对人类相关疾病的研究也具有指导意义。
  本文主要研究以下两方面的内容:
  (1)从ASTD数据库获取人类保留型内含子和组成型内含子。首先统计分析了内含子的长度分布特征,100bp-200bp的保留型内含子在所有保留型内含子中所占的比例最大,这说明剪接效率与内含子的长度有关。然后,基于序列k-mer(k=1…5)信息,利用结合多样性指标的二次判别法,区分了保留型内含子和组成型内含子,五折交叉检验的预测总精度、敏感性和特异性均大于70%。
  (2)基于文献挖掘、Ensembl数据库、PDB数据库构建了具有确定三维结构的可变剪接蛋白质变体数据库。从蛋白质结构差异、结构稳定性等方面对导致疾病的可变剪接蛋白质变体对和正常的可变剪接蛋白质变体对进行了比较分析;通过建立真实可变剪接变体集和随机可变剪接变体集,并定义蛋白质的多样性增量和疏水非均一性,研究了可变剪接发生的非随机性。可变剪接和蛋白质结构多样性的研究显示,虽然产生蛋白质结构差异较大的可变剪接事件倾向导致疾病的发生,但现有的多数可变剪接事件与随机剪接相比却倾向于增加蛋白质结构多样性。我们提出了正负选择压力的动态平衡假说解释了这一现象:与生命活动相联系的正选择压力促使增加蛋白质结构多样性的可变剪接事件在群体中固定,但反向的负选择压力约束着可变剪接改变蛋白质结构的尺度,生命中现有的可变剪接正是这两种正负选择压力之间保持动态平衡的结果。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号