【2h】

Rapid similarity searches of nucleic acid and protein data banks.

机译:快速相似搜索核酸和蛋白质数据库。

代理获取
本网站仅为用户提供外文OA文献查询和代理获取服务,本网站没有原文。下单后我们将采用程序或人工为您竭诚获取高质量的原文,但由于OA文献来源多样且变更频繁,仍可能出现获取不到、文献不完整或与标题不符等情况,如果获取不到我们将提供退款服务。请知悉。

摘要

With the development of large data banks of protein and nucleic acid sequences, the need for efficient methods of searching such banks for sequences similar to a given sequence has become evident. We present an algorithm for the global comparison of sequences based on matching k-tuples of sequence elements for a fixed k. The method results in substantial reduction in the time required to search a data bank when compared with prior techniques of similarity analysis, with minimal loss in sensitivity. The algorithm has also been adapted, in a separate implementation, to produce rigorous sequence alignments. Currently, using the DEC KL-10 system, we can compare all sequences in the entire Protein Data Bank of the National Biomedical Research Foundation with a 350-residue query sequence in less than 3 min and carry out a similar analysis with a 500-base query sequence against all eukaryotic sequences in the Los Alamos Nucleic Acid Data Base in less than 2 min.
机译:随着蛋白质和核酸序列的大型数据库的发展,对于寻找在此类数据库中寻找与给定序列相似的序列的有效方法的需求已变得显而易见。我们提出了一种基于固定k匹配序列元素的k元组的序列全局比较算法。与现有技术的相似性分析技术相比,该方法大大减少了搜索数据库所需的时间,并且灵敏度损失最小。在单独的实现中,该算法也已进行了调整,以产生严格的序列比对。目前,使用DEC KL-10系统,我们可以在不到3分钟的时间内将国家生物医学研究基金会整个蛋白质数据库中的所有序列与350个残基的查询序列进行比较,并使用500个碱基进行类似的分析在不到2分钟的时间内即可对Los Alamos核酸数据库中的所有真核序列进行查询。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号