【24h】

Large-Scale DNA Sequence Assembly by Using Computing Grid

机译:使用计算网格的大规模DNA序列组装

获取原文

摘要

DNA sequence assembly is a fundamental part of biological computing. However, most of the large-scale sequence assemblies require intensive computing power and huge storage. To speed up the assembly process, we here propose a method for large-scale DNA sequence assembly by using computing grid. The central idea of our method is to first cluster the input of fragment set into many non-intersected subsets using k-mers and then to distribute them to all nodes of the grid-computing system. Our method has accuracy of more than 92% on the test data sets under the simulated grid-computing system but costing shorter time and lower storage. Our method can efficiently process large-scale DNA sequence assembly by taking advantage of huge storage and computing capacity of computing gird
机译:DNA序列组装是生物计算的基础部分。但是,大多数大型序列装配都需要密集的计算能力和巨大的存储空间。为了加快组装过程,我们在此提出一种使用计算网格进行大规模DNA序列组装的方法。我们方法的中心思想是,首先使用k-mers将片段集的输入聚类为许多不相交的子集,然后将其分布到网格计算系统的所有节点。在模拟网格计算系统下,我们的方法在测试数据集上的准确度超过92%,但是花费的时间更短,存储成本更低。我们的方法可以利用巨大的存储空间和计算网格的计算能力来有效地处理大规模DNA序列组装

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号