首页> 中国专利> 一种针对大数据基因组比对文件排序的并行加速方法

一种针对大数据基因组比对文件排序的并行加速方法

页面导航

摘要
著录项
法律信息
相似文献

摘要

本发明公开了一种针对大数据基因组比对文件排序的并行加速方法，包括以下步骤：对目标BAM文件进行读取和解压，并存入连续的第一缓冲区B；每当第一缓冲区B存满后，进行多线程排序并通过堆排序进行归并形成一个中间文件；依次对所述中间文件进行读取，放入关联的第二缓冲区MB，对每个第二缓冲区MB的数据通过堆排序进行归并；将归并的数据通过多个线程进行压缩处理，写入结果文件。本发明通过为读取和解压单独分配线程，分别为解压和压缩构建线程池，减少开辟的线程数量，充分利用多线程资源，提高文件读写效率，减少中间文件的数量，减小内存拷贝操作次数，实现处理时间的缩短。

著录项

公开/公告号CN110767265A

专利类型发明专利
公开/公告日2020-02-07

原文格式PDF
申请/专利权人中国科学院计算技术研究所;
展开▼

申请/专利号CN201911008972.4
发明设计人张中海;谭光明;张春明;姚二林;
展开▼

申请日2019-10-23
分类号
代理机构北京泛华伟业知识产权代理有限公司;
代理人王勇
地址 100190 北京市海淀区中关村科学院南路6号
入库时间 2023-12-17 07:00:13

法律信息

法律状态公告日

法律状态信息

法律状态
2020-03-03

实质审查的生效 IPC(主分类):G16B30/10 申请日:20191023

实质审查的生效
2020-02-07

公开

公开

相似文献

专利
中文文献
外文文献

1. 一种针对大数据基因组比对文件排序的并行加速方法 [P] . 中国专利： CN110767265A . 2020-02-07
2. 一种针对大数据任务处理的基于CPU多线程与GPU多粒度并行及协同优化的方法 [P] . 中国专利： CN106991011A . 2017-07-28
3. Alignment of clone identification and acceleration of the polymorphism of a single nucleotide in the genome sequencing [P] . 日本专利： JP2002534098A . 2002-10-15

机译：克隆鉴定的比对和基因组测序中单个核苷酸多态性的加速
4. AN APPARATUS AND METHOD FOR PARALLEL SORTING FOR BIG-DATA [P] . 韩国专利： KR20140092135A . 2014-07-23

机译：用于大数据并行排序的装置和方法
5. A method for determining an alignment of segments of a genome [P] . AU2016355090A1 . 2018-06-07

机译：一种确定基因组区段比对的方法