首页> 美国卫生研究院文献>BMC Bioinformatics >Comparative analysis of long DNA sequences by per element information content using different contexts
【2h】

Comparative analysis of long DNA sequences by per element information content using different contexts

机译:使用不同上下文按元素信息内容对长DNA序列进行比较分析

代理获取
本网站仅为用户提供外文OA文献查询和代理获取服务,本网站没有原文。下单后我们将采用程序或人工为您竭诚获取高质量的原文,但由于OA文献来源多样且变更频繁,仍可能出现获取不到、文献不完整或与标题不符等情况,如果获取不到我们将提供退款服务。请知悉。

摘要

BackgroundFeatures of a DNA sequence can be found by compressing the sequence under a suitable model; good compression implies low information content. Good DNA compression models consider repetition, differences between repeats, and base distributions. From a linear DNA sequence, a compression model can produce a linear information sequence. Linear space complexity is important when exploring long DNA sequences of the order of millions of bases. Compressing a sequence in isolation will include information on self-repetition. Whereas compressing a sequence Y in the context of another X can find what new information X gives about Y. This paper presents a methodology for performing comparative analysis to find features exposed by such models.
机译:背景技术可以通过在合适的模型下压缩DNA序列来发现DNA序列的特征。良好的压缩意味着信息含量低。好的DNA压缩模型会考虑重复,重复之间的差异以及碱基分布。根据线性DNA序列,压缩模型可以产生线性信息序列。当探索数百万个碱基量级的长DNA序列时,线性空间复杂性很重要。孤立地压缩序列将包括有关自我重复的信息。而在另一个X的上下文中压缩序列Y可以找到X给出的有关Y的新信息。本文提供了一种进行比较分析的方法,以查找此类模型公开的特征。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号