首页> 美国卫生研究院文献>other >An Efficient Algorithm for Identifying Matches with Errors in Multiple Long Molecular Sequences
【2h】

An Efficient Algorithm for Identifying Matches with Errors in Multiple Long Molecular Sequences

机译:识别多个长分子序列中的错误匹配的有效算法

代理获取
本网站仅为用户提供外文OA文献查询和代理获取服务,本网站没有原文。下单后我们将采用程序或人工为您竭诚获取高质量的原文,但由于OA文献来源多样且变更频繁,仍可能出现获取不到、文献不完整或与标题不符等情况,如果获取不到我们将提供退款服务。请知悉。

摘要

An efficient algorithm is described for finding matches, repeats and other word relations, allowing for errors, in large data sets of long molecular sequences. The algorithm entails hashing on fixed-size words in conjunction with the use of a linked list connecting all occurrences of the same word. The average memory and run time requirement both increase almost linearly with the total sequence length. Some results of the program’s performance on a database of Escherichia coli DNA sequences are presented.
机译:描述了一种有效的算法,用于在长分子序列的大型数据集中查找匹配,重复和其他单词关系,从而允许出现错误。该算法需要结合连接相同单词的所有出现的链表,对固定大小的单词进行哈希处理。平均内存和运行时间要求几乎都随总序列长度线性增加。介绍了该程序在大肠杆菌DNA序列数据库中的执行结果。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号