首页> 外文期刊>Pomiary Automatyka Kontrola >A system for simulation of DNA coverage in shotgun sequencing processes
【24h】

A system for simulation of DNA coverage in shotgun sequencing processes

机译:一种在shot弹枪测序过程中模拟DNA覆盖率的系统

获取原文
获取原文并翻译 | 示例

摘要

W artykule zawarte są informacje dotyczące statystycznej analizy metody sekwencjonowania typu "Shotgun". Projekt zakładał stworzenie środowiska obliczeniowego oraz modelu matematycznego, który jak najdokładniej odzwierciedla proces sekwencjonowania metodą „Shotgun", wykorzystując przy tym losowe powstawanie krótkich sekwencji nukleotydowych, tak zwanych read'ów, a co za tym idzie również losowe formowanie się contig'ow - w pełni odtworzonych odcinków sekwencji. Stworzony model dzielił sekwencję zasad na zadaną ilość read 'ów o stałej długości którą następnie odtwarzał poprzez porównanie końca poprzedniego i początku kolejnego read'a, sprawdzając tym samym ile fragmentów zostaje w pełni złożonych w contig'i. Jako własności statystyczne metody można rozumieć wzory Landera-Watermana przewidujące ilość powstawania contig'ów, które biorą pod uwagę całkowitą ilość read'ów, długość read'ów oraz całą długość sekwencji wejściowej. Wartości uzyskane metodą Landera-Watermana oraz uzyskane za pomocą modelu przedstawiono w postaci wykresu zależności ilości powstających contig'ów do parametru ścieżki pokrycia. Dodatkowo pod względem statystycznym wykreślono histogramy przedstawiające częstość występowania zasad w danym miejscu stworzone w oparciu o model oraz wykreślono na wykresie zakres wyników dla ilości powstających contig'ów wyliczony jako maksima i minima dla wielu losowych prób i przedstawione jako zależność od ścieżki pokrycia.%A design of a computational environment for simulation and statistical analysis of shotgun DNA sequencing process is presented. The approach involves developing simulation procedures on the basis of the Lander-Waterman theory. The explored aspects concern numbers of gaps and contigs. Simulations allow drawing certain conclusions: the created model is very similar to the Lander-Waterman theory, simulations of k-mers maps by the Poisson process allows estimating statistics of contigs number.
机译:本文包含有关“ Shotgun”测序方法的统计分析的信息。该项目假设创建了一个计算环境和一个数学模型,该模型使用短核苷酸序列的随机形成(即所谓的读段)和重叠群的随机形成,可以最准确地反映“ Shotgun”测序过程。创建的模型将基本序列划分为给定数量的固定长度的读段,然后通过比较上一个读段的末尾和下一个读段的开始进行播放,从而检查重叠群中有多少片段完全组装在一起。您可以了解预测重叠群形成量的Lander-Waterman公式,其中考虑了读取总数,读取长度和输入序列的整个长度.Lander-Waterman方法获得并使用模型获得的值以数量依存关系图的形式呈现路径参数p的重叠群覆盖。此外,在统计方面,绘制了显示基于模型的给定位置规则发生频率的直方图,并在该图上计算了生成重叠群数的结果范围,该图被计算为许多随机测试的最大值和最小值,并表示为覆盖范围的依赖性。%A设计介绍了用于shot弹枪DNA测序过程仿真和统计分析的计算环境。该方法涉及根据Lander-Waterman理论开发仿真程序。探索的方面涉及缺口和重叠群的数量。通过仿真可以得出某些结论:创建的模型与Lander-Waterman理论非常相似,通过泊松过程对k-mers映射进行仿真可以估算重叠群数的统计信息。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号