首页> 外文OA文献 >Distributed cloud-based approaches to the genomic data analysis
【2h】

Distributed cloud-based approaches to the genomic data analysis

机译:基于分布式云的基因组数据分析方法

摘要

Výzkum v oblasti analýzy genomu spojený se sekvenováním nové generace poskytl vědcům možnost provádět experimenty pro lepší porozumění biologické struktury organismů. Nadefinujte problém výpočetně náročného sestavení genomů na základě velkého množství přečtených vzorků sekvencí. Následně prozkoumáme několik sekvenčních algoritmů pro de novo sestavování genomů. Dva fundamentální přístupy k sestavení genomů jsou známé, rekonstrukce sekvencí na základě de Bruijn grafů a na základě grafů překrytí. Zaměříme se na paralelizaci sestavování genomů pomocí grafů překrytí s využitím systému pro zpracování velkých dat Apache Spark. Demonstrujeme paralelizaci dílčích úkolů sestavování genů a jejich zpracování distribuovaným systémem. Výsledky paralelizace ověřujeme na vyvinutém konceptu provedením testů zaměřených na výkon a správnou funkcionalitu. Dosažené výsledkytestů indikují dostatečnou úroveň paralelizace a uspokojivou kvalitu sestavení ve srovnání s referenčním řešením.
机译:基因组分析与下一代测序相结合的研究为科学家提供了进行实验的机会,以更好地了解生物的生物学结构。基于读取的大量序列样本,定义计算密集型基因组组装的问题。然后,我们检查了从头基因组组装的几种序列算法。已知两种基本的基因组组装方法,即基于de Bruijn图和基于重叠图的序列重建。我们将重点介绍使用Apache Spark大数据处理系统使用重叠图进行基因组装配的并行化。我们展示了基因组装及其由分布式系统处理的部分任务的并行化。通过执行针对性能和正确功能的测试,我们验证了已开发概念的并行化结果。与参考解决方案相比,获得的测试结果表明足够的并行化水平和令人满意的组装质量。

著录项

  • 作者

    Mihalovič Filip;

  • 作者单位
  • 年度 2016
  • 总页数
  • 原文格式 PDF
  • 正文语种
  • 中图分类

相似文献

  • 外文文献
  • 中文文献
  • 专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号