首页> 中文学位 >基于序列联配的高效可变剪接模式搜索算法和软件
【6h】

基于序列联配的高效可变剪接模式搜索算法和软件

代理获取

目录

文摘

英文文摘

上海交通大学 学位论文答辩决议书

1 绪论

1.1 PRE-MRNA可变剪接

1.2 可变剪接与人类疾病

1.3 可变剪接的研究方法

1.3.1 DNA序列联配算法研究现状

1.4 可变剪接数据库发展现状

1.5 本文的研究意义及主要研究内容

1.5.1 研究意义

1.5.2 主要研究内容

参考文献

2 基于BLAST的可变剪接搜索算法的研究

2.1 ASA(ALTERNATIVE SPLICING ASSEMBLER)算法的研究开发

2.1.1 基于RefSeq-EST联配结构选择候选EST

2.1.2 基于最长路径算法勾勒剪接模式

2.1.3 使用bl2seq完善剪接模式

2.1.4 按照剪接模式对EST进行归类

2.2 建立可变剪接数据库BASD(BIOSINO ALTERNATIVE SPLICING DATABASE)

2.3 验证BASD数据

2.4 小结

参考文献

3 高效可变剪接搜索算法-ASDT的研究开发

3.1 高效联配汁算策略分析

3.2 ASDT算法的研究开发

3.2.1 最大完全匹配片断

3.2.2 块联配延伸

3.2.3 K-最长参考路径

3.2.4 构造HSP DAG

3.2.5 K参考路径

3.2.6 精确联配与剪接位点调整

3.3 剪接模式的归并与质量控制

3.4 小结

参考文献

4 可变剪接模式的分析与应用

4.1 剪接模式的EST表达水平

4.2 FISHER精确检验

4.3 使用FISHER精确检验寻找BASD数据库中的肿瘤特异剪接模式

4.4 使用ASDT在基因组范围内分析肝癌相关可变剪接型

4.4.1 数据准备

4.4.2 使用ASDT搜索所有基因可能的剪接模式

4.4.3 使用Fisher精确检验分析剪接模式在肝脏组织中的分布

4.5 基于EST表达水平的可变剪接模式研究方法的局限性

4.5.1 EST数据缺陷对EST表达水平的影响

4.5.2 EST数据的有限性对表达水平的影响

4.6 小结

参考文献

5 ASDAT软件包的研究开发及疾病相关可变剪接模式研究的解决方案探讨

5.1 ASDT软件的开发

5.2 ASDT效率分析

5.2.1 分析PFHT参数对计算速度的影响

5.2.2 比较分析ASDT计算速度

5.3 ASDAT软件包的研究开发和疾病相关可变剪接模式研究解决方案探讨

5.3.1 ASDAT软件包的研究开发

5.3.2 基于ASDAT软件包的疾病相关可变剪接模式研究解决方案探讨

5.4 小结

参考文献

6 总结与展望

6.1 总结

6.2 前景展望

附录1

附录2

附录3

附录4

致谢

攻读博士学位期间发表论文

展开▼

摘要

可变剪接是指从一种前体mRNA(Pre-mRNA)中产生不同mRNA剪接型(异构体)的过程。它对真核生物中蛋白质组多样性具有重要贡献,并且使得蛋白质异构体的表达受到更多调控信号的调节。研究基因的可变剪接对理解真核生物基因调控具有十分重要的意义。
   文章首先归纳了可变剪接研究中常用的cDNA-基因组联配计算的基本方法,提出了设计高效可变剪接搜索算法的策略,即通过对cDNA数据库的联配搜索,并结合基因的已知剪接信息来预测可能存在的其他剪接模式。
   以这种策略为指导,本文开发了两种新的可变剪接搜索算法:以BLAST为核心的ASA(Alterntive Splicing Assembler)算法,以及一种高效可变剪接搜索算法--ASDT(Alternative Splicing Discover Tool)。
   ASA算法采用图论方法对BLAST计算结果进行计算分析来获得剪接模式。ASA在计算方法上采用了分段策略,即先在已知剪切型上定位,而后修补未匹配部分。这种计算策略不仅符合可变剪接搜索算法的目的,也极大地提高了ASA的运算速度。在计算结果可靠性方面,与ASDB数据库比较结果显示,ASA的可靠性达到了现有公开数据库的水平。
   对ASDT算法的研究则是在继承传统cDNA-基因组联配计算策略的基础上,从最底层联配计算的研究开发为切入点,通过开发多种辅助算法进行的。这些辅助算法包括截断决速散列表与增强后缀数组相结合的完全匹配片断搜索算法,全新的块联配延伸算法,全新的K最长参考路径算法,以及借鉴GMAP的“三明治”算法,结合Zhang等人提出的贪婪算法进行精确联配和调节剪接位点。这些算法使得ASDT的计算速度能够达到或超过现有的cDNA-基因组联配算法。实验显示其计算速度是BLAT的3-41倍。
   本文提出了使用Fisher精确检验分析可变剪接模式与组织类型的相关性,并将其应用于癌症相关可变剪接模式的研究。通过与实验数据以及其他公开数据的比较,该方法的可靠性得到了一定程度的证实。
   最后,本文以Fisher精确检验方法与ASDT可变剪接搜索算法为基础,研究开发了一个可用于可变剪接模式搜索和研究的软件包--ASDT,并提出了一套相应的简单解决方案,用于疾病相关可变剪接模式搜索和分析研究。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号