首页> 外国专利> Compression representation method and apparatus of bioinformatics data using multiple genome descriptors

Compression representation method and apparatus of bioinformatics data using multiple genome descriptors

机译:使用多个基因组描述符的生物信息学数据的压缩表示方法和装置

摘要

A method and apparatus for compressing genomic sequence data generated by a genomic sequencing instrument. Sequence reads are coded by aligning them with respect to reference sequences that already exist or have been produced. The coding process consists of classifying reads into data classes and then coding each class in terms of a plurality of descriptor blocks. A particular source model and entropy coder is used for each data class and each associated descriptor block for which data is partitioned.
机译:一种用于压缩由基因组测序仪器产生的基因组序列数据的方法和装置。通过相对于已经存在或已经产生的参考序列比对序列读取来编码序列读取。编码过程包括将读取数据分类为数据类,然后根据多个描述符块对每个类进行编码。特定的源模型和熵编码器用于每个数据类以及为其划分数据的每个关联描述符块。

著录项

相似文献

  • 专利
  • 外文文献
  • 中文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号