首页> 中国专利> 一种FASTQ文件压缩中的碱基序列编码方法和系统

一种FASTQ文件压缩中的碱基序列编码方法和系统

摘要

本发明属于生物信息数据处理技术领域,涉及一种FASTQ文件压缩中的碱基序列编码方法和系统,S1对待编码碱基序列的简并碱基信息进行编码;S2判断待编码碱基序列是否存在接头序列,若存在所述接头序列则对所述接头序列进行编码;S3将待编码碱基序列与参考序列进行比对,若所述待编码碱基序列与参考序列比对成功,则将所述待编码碱基序列的比对信息进行编码;S4若所述待编码碱基序列与参考序列比对失败,则对所述待编码碱基序列进行熵编码。其通过尽量降低接头序列、简并碱基、低质量碱基给序列比对和熵编码带来的负面影响,从而提高了比对率和熵编码的压缩率。

著录项

  • 公开/公告号CN112102883A

    专利类型发明专利

  • 公开/公告日2020-12-18

    原文格式PDF

  • 申请/专利权人 深圳华大生命科学研究院;

    申请/专利号CN202011016128.9

  • 申请日2020-09-24

  • 分类号G16B30/10(20190101);

  • 代理机构11245 北京纪凯知识产权代理有限公司;

  • 代理人赵悦

  • 地址 518083 广东省深圳市盐田区北山路146号北山工业综合楼11层

  • 入库时间 2023-06-19 09:15:15

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号