首页> 外文OA文献 >Algorithms for structural variation discovery and protein-protein interaction prediction
【2h】

Algorithms for structural variation discovery and protein-protein interaction prediction

机译:结构变异发现和蛋白质-蛋白质相互作用预测的算法

代理获取
本网站仅为用户提供外文OA文献查询和代理获取服务,本网站没有原文。下单后我们将采用程序或人工为您竭诚获取高质量的原文,但由于OA文献来源多样且变更频繁,仍可能出现获取不到、文献不完整或与标题不符等情况,如果获取不到我们将提供退款服务。请知悉。

摘要

This thesis has two main parts. In the first part, we will give an introduction on human genomic sequences, next-generation sequencing technologies, the structural differences among genomes of different individuals, and the 1000 Genomes Project. We will then discuss the problems of finding novel sequence insertions and mobile element insertions (e.g. Alu elements) in sequenced genomes. To identify those genomic variations with much higher accuracy than what is currently possible, we propose to move from the current model of (1) detecting genomic variations in individual nextgeneration sequenced (NGS) donor genomes independently, and (2) checking whether two or more donor genomes, indeed, agree or disagree on the variationswe will call this model the independent structural variation detection and merging (ISV&M) framework. As an alternative, we propose a new model in which genomic variation is detected among multiple genomes simultaneously. The second part of the thesis focuses on a different project which is concerned with gene tree alignment. The aim is to present the first efficient approach to the problem of determining the interaction partners among protein/domain families. This is a hard computational problem, in particular in the presence of paralogous proteins. We devise a deterministic algorithm which directly maximizes the similarity between two leaf labeled trees with edge lengths, obtaining a score optimal alignment of the two trees in question.
机译:本文主要分为两个部分。在第一部分中,我们将介绍人类基因组序列,下一代测序技术,不同个体基因组之间的结构差异以及“ 1000基因组计划”。然后,我们将讨论在测序的基因组中发现新颖的序列插入和移动元件插入(例如Alu元件)的问题。为了以比目前可能的精度更高的精度识别那些基因组变异,我们建议从当前模型中移出(1)独立检测各个下一代测序(NGS)供体基因组中的基因组变异,以及(2)检查是否存在两个或更多个实际上,供体基因组在变异上是同意还是不同意,我们将此模型称为独立的结构变异检测和合并(ISV&M)框架。作为替代方案,我们提出了一种新模型,其中同时检测多个基因组之间的基因组变异。本文的第二部分着重于与基因树比对有关的另一个项目。目的是提出第一个有效的方法来确定蛋白质/结构域家族之间的相互作用伙伴。这是一个困难的计算问题,尤其是在存在同源蛋白的情况下。我们设计了一种确定性算法,该算法可直接最大化带有边缘长度的两个叶子标记树之间的相似度,从而获得所讨论的两个树的得分最佳对齐方式。

著录项

  • 作者

    Hajirasouliha Iman;

  • 作者单位
  • 年度 2012
  • 总页数
  • 原文格式 PDF
  • 正文语种
  • 中图分类

相似文献

  • 外文文献
  • 中文文献
  • 专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号