首页> 美国卫生研究院文献>other >Identification of Predictive Cis-Regulatory Elements Using a Discriminative Objective Function and a Dynamic Search Space
【2h】

Identification of Predictive Cis-Regulatory Elements Using a Discriminative Objective Function and a Dynamic Search Space

机译:使用判别目标函数和动态搜索空间识别可预测的顺式调控元素

代理获取
本网站仅为用户提供外文OA文献查询和代理获取服务,本网站没有原文。下单后我们将采用程序或人工为您竭诚获取高质量的原文,但由于OA文献来源多样且变更频繁,仍可能出现获取不到、文献不完整或与标题不符等情况,如果获取不到我们将提供退款服务。请知悉。

摘要

The generation of genomic binding or accessibility data from massively parallel sequencing technologies such as ChIP-seq and DNase-seq continues to accelerate. Yet state-of-the-art computational approaches for the identification of DNA binding motifs often yield motifs of weak predictive power. Here we present a novel computational algorithm called MotifSpec, designed to find predictive motifs, in contrast to over-represented sequence elements. The key distinguishing feature of this algorithm is that it uses a dynamic search space and a learned threshold to find discriminative motifs in combination with the modeling of motifs using a full PWM (position weight matrix) rather than k-mer words or regular expressions. We demonstrate that our approach finds motifs corresponding to known binding specificities in several mammalian ChIP-seq datasets, and that our PWMs classify the ChIP-seq signals with accuracy comparable to, or marginally better than motifs from the best existing algorithms. In other datasets, our algorithm identifies novel motifs where other methods fail. Finally, we apply this algorithm to detect motifs from expression datasets in C. elegans using a dynamic expression similarity metric rather than fixed expression clusters, and find novel predictive motifs.
机译:大规模并行测序技术(例如ChIP-seq和DNase-seq)的基因组结合或可及性数据的生成继续加速。然而,用于鉴定DNA结合基序的最新计算方法通常会产生较弱的预测能力的基序。在这里,我们提出了一种称为MotifSpec的新颖计算算法,该算法旨在查找预测性基序,与过度代表的序列元素形成对比。该算法的主要区别特征在于,它结合了使用完整PWM(位置权重矩阵)而不是k-mer词或正则表达式的图案建模,使用了动态搜索空间和学习阈值来找到可区分的图案。我们证明了我们的方法在几个哺乳动物ChIP-seq数据集中发现了与已知结合特异性相对应的基序,并且我们的PWM对ChIP-seq信号进行了分类,其准确度与现有最佳算法的基序相当或略高。在其他数据集中,我们的算法可以识别出其他方法失败的新颖主题。最后,我们应用该算法使用动态表达相似性度量而非固定表达簇从秀丽隐杆线虫的表达数据集中检测模体,并找到新颖的预测性模体。

著录项

  • 期刊名称 other
  • 作者

    Rahul Karnik; Michael A. Beer;

  • 作者单位
  • 年(卷),期 -1(10),10
  • 年度 -1
  • 页码 e0140557
  • 总页数 19
  • 原文格式 PDF
  • 正文语种
  • 中图分类
  • 关键词

相似文献

  • 外文文献
  • 中文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号