【24h】

de Bruijnグラフの圧縮

机译:de Bruijn图压缩

获取原文
获取原文并翻译 | 示例
       

摘要

We propose a new succinct de Bruijn graph representation. If the de Bruijn graph of k-mers in a DNA sequence of length N has m edges, it can be represented in 4m + o(m) bits. This is much smaller than existing ones. The numbers of outgoing and incoming edges of a node are computed in constant time, and the outgoing and incoming edge with given label are found in constant time and O(k) time, respectively. The data structure is constructed in O(N k log m/log log m) time using no additional space.%本稿はde Bruijn グラフの新しい簡潔表現を提案する.長さ N の DNA配列の k-mer に対する de Bruijn グラフが m 本の枝を持つとき,このグラフは 4m + o(m) ビットで表現できる.節点の出次数と入次数は定数時間,ある節点から出る,またはある節点に入る枝で指定されたラベルを持つものはそれぞれ定数時間,O(k)時間で求まる.データ構造は余分な作業領域を使わずに O(Nk log m/log log m) 時間で構築できる.
机译:我们提出了一种新的简洁的de Bruijn图表示形式,如果长度为N的DNA序列中k-mers的de Bruijn图具有m条边,则可以用4m + o(m)位表示,这比现有的小得多。节点的传出和传入边缘数是在恒定时间内计算的,带有给定标签的传出和传入边缘分别是在恒定时间和O(k)时间内找到的。数据结构以O(N k本文提出了一种新的简洁的de Bruijn图表示形式,当一个长度为N的DNA序列的k-mer的de Bruijn图具有m个分支时,该图可以用4m + o(m)位表示,一个节点的输出度和输入度是恒定时间,离开一个节点或进入一个节点的度和输入度分别带有恒定时间O标记。可以在O(Nk log m / log log m)时间内构造数据结构,而无需额外的工作区域。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号