首页> 中国专利> 基于图像构建测序模板的方法、碱基识别方法和装置

基于图像构建测序模板的方法、碱基识别方法和装置

摘要

本发明公开了一种基于图像构建测序模板的方法、装置和系统。所称的图像包括分别对应A/U、T、G和C四种碱基延伸反应时的一个相同视野的第一、第二、第三和第四图像,第一、第二、第三和第四图像分别包括图像M1和M2、图像N1和N2、图像P1和P2、图像Q1和Q2,该构建测序模板的方法包括:组合图像M1、M2、N1、N2、P1、P2、Q1和Q2中的任两图像以进行亮斑匹配,并且使图像M1、N1、N2、P1、P2、Q1和Q2均至少一次参与该组合,获得包含第一重合亮斑的多个组合图像,在组合图像上距离小于第一预定像素的两个或多个亮斑为一个第一重合亮斑;合并多个组合图像上的第一重合亮斑,以获得一个对应测序模板的亮斑集合。该方法能够有效地获取对应核酸模板的亮斑集合。

著录项

  • 公开/公告号CN112288783A

    专利类型发明专利

  • 公开/公告日2021-01-29

    原文格式PDF

  • 申请/专利权人 深圳市真迈生物科技有限公司;

    申请/专利号CN201810961277.9

  • 申请日2018-08-22

  • 分类号G06T7/32(20170101);

  • 代理机构

  • 代理人

  • 地址 518000 广东省深圳市罗湖区清水河街道清水河一路116号深业进元大厦2座5楼、6楼

  • 入库时间 2023-06-19 09:41:38

说明书

技术领域

本发明涉及图像处理和信息识别领域,特别地,涉及一种基于图像构建测序模板的方法、一种碱基识别方法、一种基于图像构建测序模板的装置、一种碱基识别装置和一种计算机程序产品。

背景技术

在相关技术中,包括在基于成像系统多次对生化反应中的核酸分子(模板)进行图像采集以测定该核酸分子的核苷酸顺序的测序平台中,如何处理以及关联多次不同时间点所采集的图像包括图像上的信息,以有效且准确地获得核酸模板的至少一部分的核苷酸组成和顺序,是值得关注的问题。

发明内容

本发明实施方式旨在至少解决相关技术中存在的技术问题之一或者至少提供一种可选择的实用方案。

依据本发明的一个实施方式,提供一种基于图像构建测序模板的方法,所称的图像包括分别对应A/U、T、G和C四种碱基延伸反应时的一个相同视野的第一图像、第二图像、第三图像和第四图像,碱基延伸反应时的该视野存在多个带有光学可检测标记的核酸分子,至少一部分核酸分子在图像上表现为亮斑,定义顺序和/或同时实现一次四种类型碱基延伸反应为一轮测序反应,第一图像包括图像M1和图像M2,第二图像包括图像N1和图像N2,第三图像包括图像P1和图像P2,第四图像包括图像Q1和图像Q2,图像M1和图像M2分别来自两轮测序反应,图像N1和图像N2分别来自两轮测序反应,图像P1和图像P2分别来自两轮测序反应,图像Q1和图像Q2分别来自两轮测序反应,该方法包括:组合图像M1、图像M2、图像N1、图像N2、图像P1、图像P2、图像Q1和图像Q2中的任两图像以进行亮斑匹配,并且使图像M1、图像N1、图像N2、图像P1、图像P2、图像Q1和图像Q2均至少一次参与组合,获得包含第一重合亮斑的多个组合图像,在组合图像上距离小于第一预定像素的两个或多个亮斑为一个第一重合亮斑;以及合并多个组合图像上的第一重合亮斑,以获得一个对应测序模板的亮斑集合。

依据本发明的一个实施方式,提供一种基于图像构建测序模板的装置,该装置用以实施上述本发明实施方式中的基于图像构建测序模板的方法的全部或部分步骤。所称的图像包括分别对应A/U、T、G和C四种碱基延伸反应时的一个相同视野的第一图像、第二图像、第三图像和第四图像,碱基延伸反应时的该视野存在多个带有光学可检测标记的核酸分子,至少一部分核酸分子在图像上表现为亮斑,定义顺序和/或同时实现一次四种类型碱基延伸反应为一轮测序反应,第一图像包括图像M1和图像M2,第二图像包括图像N1和图像N2,第三图像包括图像P1和图像P2,第四图像包括图像Q1和图像Q2,图像M1和图像M2分别来自两轮测序反应,图像N1和图像N2分别来自两轮测序反应,图像P1和图像P2分别来自两轮测序反应,图像Q1和图像Q2分别来自两轮测序反应,该装置包括:组合单元,用于组合图像M1、图像M2、图像N1、图像N2、图像P1、图像P2、图像Q1和图像Q2中的任两图像以进行亮斑匹配,并且使图像M1、图像N1、图像N2、图像P1、图像P2、图像Q1和图像Q2均至少一次参与该组合,获得包含第一重合亮斑的多个组合图像,在组合图像上距离小于第一预定像素的两个或多个亮斑为一个第一重合亮斑;以及合并单元,用于合并来自所述组合单元的多个组合图像上的第一重合亮斑,以获得一个对应测序模板的亮斑集合。

依据本发明的一个实施方式,提供一种计算机可读存储介质,用于存储供计算机执行的程序,执行所述程序包括完成上述任一实施方式中的基于图像构建测序模板的方法。计算机可读存储介质包括但不限于只读存储器、随机存储器、磁盘或光盘等。

依据本发明的一个实施方式,还提供一种终端,一种计算机程序产品,该产品包括指令,该指令在计算机执行所称的程序时,使该计算机执行上述本发明实施方式中的基于图像的构建测序模板的方法。

利用上述基于图像构建测序模板的方法、装置、计算机可读存储介质和/或计算机程序产品构建获得的测序模板,是一个对应测序模板的亮斑集合,该亮斑集合能有效、准确且全面的反映测序模板的信息,利于进一步的碱基的准确识别(base call),即准确识别获取模板核酸的至少一部分的核苷酸序列。

依据本发明的另一个实施方式,提供一种碱基识别方法,该方法包括将获自碱基延伸反应的图像上的亮斑匹配到对应测序模板的亮斑集合,依据匹配上的亮斑进行碱基识别,获自碱基延伸反应的图像对应的视野中存在多个带有光学可检测标记的核酸分子,至少一部分核酸分子在获自碱基延伸反应的图像上表现为亮斑,对应测序模板的亮斑集合通过上述本发明实施方式中的基于图像构建测序模板的方法、装置、计算机可读存储介质和/或计算机程序产品来构建获取。

依据本发明的一个实施方式,提供一种碱基识别装置,该装置用于实施上述本发明实施方式中的碱基识别方法,该装置用于将获自碱基延伸反应的图像上的亮斑匹配到对应测序模板的亮斑集合,依据匹配上的亮斑进行碱基识别,获自碱基延伸反应的图像对应的视野中存在多个带有光学可检测标记的核酸分子,至少一部分核酸分子在获自碱基延伸反应的图像上表现为亮斑,对应测序模板的亮斑集合通过上述本发明实施方式中的基于图像构建测序模板的方法和/或装置构建获得。

依据本发明的一个实施方式,提供一种计算机可读存储介质,用于存储供计算机执行的程序,执行所述程序包括完成上述任一实施方式中的碱基识别方法。计算机可读存储介质包括但不限于只读存储器、随机存储器、磁盘或光盘等。

依据本发明的一个实施方式,还提供一种计算机程序产品,该产品包括实现碱基识别的指令,该指令在计算机执行所称的程序时,使该计算机执行上述本发明实施方式中的碱基识别的方法。

利用该碱基识别方法、装置、计算机可读存储介质和/或计算机程序产品,基于构建得的对应测序模板的亮斑集合,能够识别碱基延伸反应时与模板核酸结合的碱基的类型,能够用于实现模板核酸序列的准确测定。

本发明实施方式的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明实施方式的实践了解到。

附图说明

图1是本发明具体实施方式中的基于图像构建测序模板的方法的流程示意图。

图2是本发明具体实施方式中的基于亮斑对图像Repeat1、Repeat5、Repeat6和Repeat7进行组合和合并以构建测序模板的示意图。

图3是本发明的具体实施方式中的纠偏过程和纠偏结果的示意图。

图4是本发明具体实施方式中的候选亮斑的对应的矩阵以及连同像素示意图。

图5是本发明具体实施方式中的以像素点矩阵的中心像素点为中心的m1*m2范围的像素值示意图。

图6是本发明具体实施方式中的依据第二亮斑检测阈值进行判定之前和之后的亮斑检测结果对比示意图。

图7是本发明具体实施方式中的基于图像构建测序模板的装置的结构示意图。

具体实施方式

下面详细描述本发明的实施方式,实施方式的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施方式是示例性的,仅用于解释本发明,而不能理解为对本发明的限制。

在本发明的描述中,术语“第一”、“第二”、“第三”、“第四”等仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量或者顺序。在本发明的描述中,“多个”的含义是两个或两个以上,除非另有明确具体的限定。

请参阅图1,本发明实施方式提供一种基于图像构建测序模板的方法,所称的图像采集自一个相同视野,包括分别采集于A/U、T、G和C四种碱基延伸反应时的第一图像、第二图像、第三图像和第四图像,碱基延伸反应时的该视野存在多个带有光学可检测标记的核酸分子,至少一部分核酸分子在图像上表现为亮斑,定义顺序和/或同时实现一次四种类型碱基延伸反应为一轮测序反应,第一图像包括图像M1和图像M2,第二图像包括图像N1和图像N2,第三图像包括图像P1和图像P2,第四图像包括图像Q1和图像Q2,图像M1和图像M2分别来自两轮测序反应,图像N1和图像N2分别来自两轮测序反应,图像P1和图像P2分别来自两轮测序反应,图像Q1和图像Q2分别来自两轮测序反应,该方法包括:S10组合图像M1、图像M2、图像N1、图像N2、图像P1、图像P2、图像Q1和图像Q2中的任两图像以进行亮斑匹配,并且使图像M1、图像N1、图像N2、图像P1、图像P2、图像Q1和图像Q2均至少一次参与组合,获得包含第一重合亮斑的多个组合图像,在组合图像上距离小于第一预定像素的两个或多个亮斑为一个第一重合亮斑;以及S20合并多个组合图像上的第一重合亮斑,以获得一个对应测序模板的亮斑集合。所称的“亮斑”也称为“亮点”(spots或peaks),指图像上的发光点,一个发光点占有至少一个像素点。所称“像素点”同“像素”。

该方法通过对多个图像上的亮斑先取交集再取并集,能够获得与模板核酸分子对应的亮斑集合。利用该方法获得的测序模板,是一个对应测序模板的亮斑集合,该亮斑集合能有效、准确且全面的反映测序模板的信息,获得的亮斑集合能够进一步用于碱基的准确识别(base call),即用于准确获取模板核酸的至少一部分的核苷酸序列。

所称的一轮测序反应,顺序和/或同时实现一次四种类型碱基延伸反应,可以是四种类型碱基反应底物(例如核苷酸类似物/碱基类似物)同时于一个碱基延伸反应体系中实现一轮测序反应,可以是两种类型碱基类似物于一个碱基延伸反应体系中、另外两种类型反应底物于下一个碱基延伸反应体系以实现一轮测序反应,也可以是一种类型碱基类似物于一个碱基延伸反应体系中、依次在四个连续的碱基延伸反应体系中加入该四种类型碱基类似物以实现一轮测序反应。可知,第一图像、第二图像、第三图像和第四图像可以采集自两次碱基延伸反应或者更多次的碱基延伸反应。另外,一个碱基延伸反应可能包含一次图像采集,也可能包含多次图像采集。

在一个示例中,一轮测序反应包括多次碱基延伸反应,例如单色测序,利用的四种类型碱基对应的反应底物(核苷酸类似物)均带有同一种荧光染料,一轮测序反应包括四次碱基延伸反应(4repeats),对于一个视野来说,一次碱基延伸反应包含一次图像采集,图像M1、图像N1、图像P1和图像Q1分别为来自一轮测序反应的四次碱基延伸反应的同一视野。

在另一个示例中,例如单分子双色测序反应,利用的四种类型碱基对应的反应底物(核苷酸类似物)中的两种带有一种荧光染料、另两种带有另一种不同激发波长的荧光染料,一轮测序反应包括两次碱基延伸反应,带有不同染料的两种类型碱基反应底物于一次碱基延伸反应中进行结合反应,对于一个视野,一次碱基延伸反应包括两次于不同激发波长下的图像采集,图像M1、图像N1、图像P1和图像Q1分别来自一轮测序反应的两次碱基延伸反应的两种激发波长下的同一视野。

在又一个示例中,一轮测序反应包括一次碱基延伸反应,例如二代测序平台的双色测序反应,四种类型碱基反应底物(例如核苷酸类似物)分别带有染料a、带有染料b、带有染料a和染料b以及不带任何染料,染料a和染料b的激发波长不一样;四种类型反应底物于同一次碱基延伸反应中实现一轮测序反应,一次碱基延伸反应包括两次于不同激发波长下的图像采集,第一图像同第三图像、第二图像同第四图像,图像M1和图像N1分别来自不同轮测序反应或者同一轮测序反应中的不同激发波长下的同一视野。

在某些具体实施方式中,S20合并多个组合图像上的第一重合亮斑,包括对不同组合图像中的第一重合亮斑进行一次或多次匹配,以获得对应测序模板的亮斑集合。如此,利于获得准确的、与模板核酸分子一一对应的亮斑的集合,利于基于图像信息构建准确的模板。

在某些具体实施方式中,图像M1、图像N1、图像P1和图像Q1为顺序获得,图像M2、图像N2、图像P2和图像Q2为顺序获得,即图像M1、图像N1、图像P1和图像Q1于一轮测序反应中获得,图像M2、图像N2、图像P2和图像Q2于另一轮测序反应中获得,S10包括:间隔S个图像对图像M1、图像M2、图像N1、图像N2、图像P1、图像P2、图像Q1和图像Q2进行两两组合,获得K个组合图像以及对组合图像上的亮斑进行匹配,弃组合图像上的非重合亮斑,S为整数,0≤S≤S

对于一轮测序反应包含四次碱基延伸反应,即每次碱基延伸反应只含一种类型核苷酸类似物,较佳地,S大于1,更佳地,S大于2,有利于避免或减少生化试验因素带来的噪声对基于图像构建测序模板带来的干扰,利于有效且准确地确定模板。

在一个实施例中,参与组合的图像的总数为12,S=2,如此,能够获得较完整的测序模板,减少下机数据(读段)的损失。

在另一个实施例中,参与组合的图像的总数为8,S=2。当Repeat=5的时候,将图像Repeat1-5(Repeat1和Repeat5的图像),Repeat2-5分别进行重合亮斑匹配,然后将匹配结果合并至模板容器(Template;初始为空)中;在一个示例中,因Repeat4图像用于参考图像的构建,为减少计算量,模板构建从图像Repeat5开始;Repeat=6时,分别对图像Repeat1-6、Repeat2-6、Repeat3-6进行重合亮斑匹配,再合并匹配结果至Template中;Repeat=7时,分别对图像Repeat1-7、Repeat2-7、Repeat3-7、Repeat4-7进行重合亮斑匹配,再合并匹配结果至Template中;Repeat=8时,分别对图像Repeat1-8、Repeat2-8、Repeat3-8、Repeat4-8、Repeat5-8进行重合亮斑匹配,再合并匹配结果至Template中;最后统计所有Template容器中的亮斑,输出,每个亮斑坐标表示一条链,即一条reads。模板构建成功后,能知道reads总数TotalRead。图2为该过程的示意图,图2的上面四个图像依次为Repeat1、Repeat5、Repeat6和Repeat7,中间的图像变化示意Repeat1和Repeat5重合亮斑匹配的过程和结果,下图示意图像Repeat1、Repeat5、Repeat6和Repeat7重合亮斑匹配的结果。

在一个示例中,成像系统中,电子传感器的尺寸为6.5μm,显微镜放大倍率60倍,能看到的最小尺寸就是0.1μm。对应核酸分子的亮斑的大小一般为小于10*10像素。

所称的第一预定像素,在一个示例中,为1.05像素。

在一个示例中,设置距离大于1.85像素的两个第一重合亮斑为两个第一重合亮斑。

在一个示例中,舍弃距离一个重合亮斑大于1.05像素但小于另一个重合亮斑1.85像素的重合亮斑。如此,有利于构建准确的测序模板。

在某些具体实施方式中,图像为经过配准的图像。如此,利于准确地获取对应与测序模板的亮斑集合。

本发明实施方式对实现图像配准即纠偏的方式不作限制。在一些示例中,利用如下方法进行图像配准,包括:基于参考图像对待配准图像进行第一配准,参考图像和待配准图像对应相同对象,参考图像和待配准图像均包含多个亮斑,包括确定待配准图像上的预定区域和参考图像上的相应预定区域的第一偏移量,基于第一偏移量移动待配准图像上的所有亮斑,获得第一配准后的待配准图像;基于参考图像对第一配准后的待配准图像进行第二配准,包括合并第一配准后的待配准图像和参考图像,获得合并图像,计算合并图像上的预定区域的所有重合亮斑的偏移量,以确定第二偏移量,距离小于预定像素的两个或多个亮斑为一个重合亮斑,基于该第二偏移量移动第一配准后的待配准图像上的所有亮斑,以实现对待配准图像的配准。该图像配准方法通过两次关联配准,可相对称为粗配准和细配准,包括利用图像上的亮斑进行细配准,能够基于少量数据信息快速地实现图像的高精度纠偏,特别适于高精度图像纠偏要求的场景。例如,单分子级别的图像检测,比如来自第三代测序平台的测序反应的图像。所称单分子级别指分辨率为单个或少数几个分子的大小,例如10个、8个、5个、4个或3个以下分子。

在某些具体实施方式中,待配准图像即构建测序模板的图像来自利用光学成像原理进行序列测定的测序平台。所称的测序,也称为序列测定,指核酸序列测定,包括DNA测序和/或RNA测序,包括长片段测序和/或短片段测序,测序生化反应包括碱基的延伸。测序可以通过测序平台进行,测序平台可选择但不限于Illumina公司的Hisq/Miseq/Nextseq测序平台、Thermo Fisher/Life Technologies公司的Ion Torrent平台、华大基因的BGISEQ平台和单分子测序平台;测序方式可以选择单端测序,也可以选择双末端测序;获得的测序结果/数据即测读出来的片段,称为读段(reads),读段的长度称为读长。所称的“亮斑”对应延伸碱基或碱基簇的光学信号。

所称的图像上的预定区域,可以是整个图像,也可以是图像的一部分。在一个示例中,图像上的预定区域为图像的一部分,例如为图像中心的512*512区域。所称的图像中心,为该视野的中心,成像系统的光轴与成像平面的交点可称为图像中心点,以该中心点为中心的区域可视为图像中心区域。

在某些具体实施方式中,待配准图像来自核酸测序平台,该平台包括成像系统和核酸样本承载系统,带有光学检测标记的待测核酸分子固定于反应器中,该反应器也称为芯片,芯片装载在一个可移动台子上,通过该移动台子带动芯片运动来实现对位于芯片不同位置(不同视野)的待测核酸分子进行图像采集。一般地,光学系统和/或移动台子的运动存在精度限制,例如,指令指定运动至某个位置和该机械结构实际运动达到的位置存在偏差,特别是在对精度高要求的应用情景,由此,在依据指令移动硬件以对不同时间点的同一位置(视野)进行多次图像采集的过程中,不同时间点采集的同一视野的多个图像难以完全对齐,对该些图像进行纠偏对齐,有利于基于该多个时间点采集的多个图像中的信息的变化来准确确定核酸分子核苷酸顺序。

在某些具体实施方式中,所称的参考图像是通过构建获得的,参考图像可以在对待配准图像进行配准时构建,也可以预先构建保存需要时调用。

在一些示例中,构建参考图像包括:获取第五图像和第六图像,第五图像和第六图像与待配准图像对应相同对象;基于第五图像对第六图像进行粗配准,包括确定第六图像和第五图像的偏移量,基于该偏移量移动第六图像,获得粗配准后的第六图像;合并第五图像和粗配准后的第六图像,以获得参考图像,第五图像和第六图像均包含多个亮斑。如此,利用构建获得包含更多或相对更完整的信息的图像,利用该图像作为纠偏的基准,利于实现更准确的图像配准。对于核酸序列测定得到的图像,利用多个图像进行参考图像构建,利于使得该参考图像获得完整的对应核酸分子的亮斑信息,利于基于亮斑的图像纠偏。

在一些实施例中,第五图像、第六图像分别来自核酸序列测定反应(测序反应)的不同时刻的同一个视野。在一个示例中,一轮测序反应包括多次碱基延伸反应,例如单色测序,利用的四种类型碱基对应的反应底物(核苷酸类似物)均带有同一种荧光染料,一轮测序反应包括四次碱基延伸反应(4repeats),对于一个视野来说,一次碱基延伸反应包含一次图像采集,第五图像和第六图像分别来自不同次的碱基延伸反应的同一视野。如此,通过处理以及集合第五图像和第六图像的信息获得的参考图像作为纠偏的基准,利于进行更准确的图像纠偏。

在另一个示例中,单分子双色测序反应,利用的四种类型碱基对应的反应底物(核苷酸类似物)中的两种带有一种荧光染料、另两种带有另一种不同激发波长的荧光染料,一轮测序反应包括两次碱基延伸反应,带有不同染料的两种类型碱基反应底物于一次碱基延伸反应中进行结合反应,对于一个视野,一次碱基延伸反应包括两次于不同激发波长下的图像采集,第五图像和第六图像分别来自不同次的碱基延伸反应或者同一次碱基延伸反应中的不同激发波长下的同一视野。如此,通过处理以及集合第五图像和第六图像的信息获得的参考图像作为纠偏的基准,利于进行更准确的图像纠偏。

在又一个示例中,一轮测序反应包括一次碱基延伸反应,例如二代测序平台的双色测序反应,四种类型碱基反应底物(例如核苷酸类似物)分别带有染料a、带有染料b、带有染料a和染料b以及不带任何染料,染料a和染料b的激发波长不一样;四种类型反应底物于同一次碱基延伸反应中实现一轮测序反应,第五图像和第六图像分别来自不同轮测序反应或者同一轮测序反应中的不同激发波长下的同一视野。如此,通过处理以及集合第五图像和第六图像的信息获得的参考图像作为纠偏的基准,利于进行更准确的图像纠偏。

第五图像和/或第六图像,可以是一个图像也可以是多个图像。在一个示例中,第五图像为第一图像,第六图像为第二图像。进一步地,在一些具体实施方式中,还包括利用第七图像和第八图像构建所称的参考图像,待配准图像、第五图像、第六图像、第七图像和第八图像来自测序反应的相同视野,第五图像、第六图像、第七图像和第八图像分别对应A/U、T、G和C四种类型碱基延伸反应时的视野,碱基延伸反应时的该视野存在多个带有光学可检测标记的核酸分子,至少一部分核酸分子在图像上表现为亮斑,构建参考图像还包括:基于第五图像对第七图像进行粗配准,包括确定第七图像和第五图像的偏移量,基于该偏移量移动第七图像,获得粗配准后的第七图像;基于第五图像对第八图像进行粗配准,包括确定第八图像和第五图像的偏移量,基于该偏移量移动第八图像,获得粗配准后的第八图像;合并第五图像和粗配准后的第六图像、粗配准后的第七图像以及粗配准后的第八图像,以获得参考图像。

本发明实施方式对第一配准的实现方式不作限制,例如可利用傅里叶变换,使用频域配准,确定第一偏移量。具体地,例如可参考Kenji TAKITA et al,IEICETRANS.FUNDAMENTALS,VOL.E86-A,NO.8AUGUST 2003.中的纯相位相关函数(Phase-OnlyCorrelation Function)中的二维离散傅里叶变换确定第一偏移量、第六图像和第五图像的偏移量、第七图像和第五图像的偏移量和/或第八图像和第五图像的偏移量。第一配准/粗配准可达到1像素(1pixel)的精度。如此,可快速准确地确定第一偏移量和/或构建利于精确纠偏的参考图像。

在某些具体实施方式中,参考图像和待配准图像为二值化图像。如此,利于减少运算量快速纠偏。

在一个示例中,待纠偏图像和参考图像均为二值化图像,即图像中的各个像素非a即b,例如a为1,b为0,像素标记为1的较像素标记为0的亮,或者说强度大;参考图像是利用一轮测序反应的四次碱基延伸反应的图像repeat1、repeat2、repeat3和repeat4构建的,第五图像、第六图像选自图像repeat1-4中的任一个、两个或三个。

在一个示例中,第五图像为图像repeat1,图像repeat2、repeat3和repeat4为第六图像,基于图像图像repeat1依次对图像repeat2-4进行粗配准,分别获得粗配准后的图像repeat2-4;合并图像repeat1和粗配准后的图像repeat2-4,获得参考图像。所称的合并图像为合并图像中的重合亮斑。主要基于对应核酸分子的亮斑的大小和成像系统分辨率,在一个示例中,设定两个图像上距离不大于1.5个像素的两个亮斑为重合亮斑。这里,采用4个repeat的合成的图像中心区域作为参考图像,一来利于使得参考图像具有足够量的亮斑,利于后续配准,二来检测及定位出的图像中心区域中的亮斑,亮斑信息是相对更准确的,利于准确配准。

在一个示例中,进行如下步骤对图像进行纠偏:1)对采集自另一轮测序反应的一次碱基延伸反应的某个视野的图像repeat5进行粗纠偏,repeat5为二值化后的图像,取该图像中心例如512*512区域,与repeat1-4合成的中心图像(相应参考图像的中心512*512区域),进行二维离散傅里叶变换,使用频域配准,得到偏移量offset(x0,y0),即实现图像粗配准,x0、y0能达到1pixel的精度;2)将上述粗配准后的图像和参考图像基于图像上的亮斑进行合并(merge),包括计算repeat5图像的中心区域内与参考图像相应区域内的重合亮斑的偏移量offset(x1,y1)=待纠偏图像的该亮斑的坐标位置-参考图像上的相应亮斑的坐标位置,可表示为offset(x1,y1)=curRepeatPoints-basePoints;求取所有重合亮斑的平均偏移量,从而得到[0,0]到[1,1]范围内的细偏移量。在一个示例中,设定两个图像上距离不大于1.5个像素的两个亮斑为重合亮斑;3)综上,得到一个视野图像(fov)不同cycle的偏移量(x0,y0)-(x1,y1),对于一个亮斑(peak)可表示为:curRepeatPoints+(x0,y0)-(x1,y1),curRepeatPoints表示该亮斑原始坐标,即在纠偏前的图像中的坐标。上述图像纠偏获得的纠偏结果具有较高的准确性,且纠偏精度小于或等于0.1像素。图3示意纠偏过程及结果,图3中,基于图像A对图像C进行纠偏,图像A和图像C中的圆圈表示亮斑、相同数字标记的亮斑为重合亮斑,图像C->A表示纠偏结果,即图像C对齐至图像A的结果。

本发明的实施方式对图像上亮斑的识别检测方式不作限定。在某些具体实施方式中,进行图像配准还包括识别亮斑,包括利用k1*k2矩阵对图像进行亮斑检测,判定矩阵的中心像素值不小于矩阵非中心任一像素值的矩阵对应一个候选亮斑,以及确定候选亮斑是否为亮斑,k1和k2均为大于1的奇数,k1*k2矩阵包含k1*k2个像素点。所称的图像选自待配准图像、构建参考图像的图像中的至少一个。利用该方式检测图像上的亮斑,能够快速有效地实现图像上的亮斑(spots或peaks)的检测,特别是对采集自核酸序列测定反应的图像。该方法对待检测图像即原始输入数据没有特别的限制,适用于任何利用光学检测原理进行核酸序列测定的平台所产生的图像的处理分析,包括但不限于二代和三代测序,具有高准确性和高效的特点,能从图像中获取更多的代表序列的信息。特别是对于随机图像及高准确度要求的信号识别,尤其具有优势。

在一些实施例中,图像来自核酸序列测定反应,核酸分子上带有光学可检测标记,利如荧光标记,荧光分子在特定波长激光照射下能够被激发发出荧光,通过成像系统采集图像。采集到的图像包括可能与荧光分子所在位置相对应的光斑/亮斑。可以理解地,当处于焦面位置时,所采集到的图像中的与荧光分子所在位置相对应的亮斑的尺寸较小且亮度较高;当位于非焦面位置时,所采集到的图像中的与荧光分子所在位置相对应的亮斑的尺寸较大且亮度较低。另外,视野中的可能存在其它非目标或者后续难以利用的物质/信息,比如杂质等;进一步地,在对单分子视野进行拍照中,大量分子聚集(簇)等也会干扰目标单分子信息采集。所称的单分子为一个少数几个分子,例如分子数目不大于10,例如为一个、两个、三个、四个、五个、六个、八个或者十个。

在一些示例中,矩阵的中心像素值大于第一预设值,矩阵非中心任一像素值大于第二预设值,第一预设值和第二预设值与图像的平均像素值相关。

在一些实施例中,可以利用k1*k2矩阵对图像进行遍历检测,所称的第一预设值和/或第二预设值的设置与该图像的平均像素值相关。对于灰度图像,像素值同灰度值。k1*k2矩阵,k1、k2可以相等也可以不相等。在一个示例中,成像系统相关参数为:物镜60倍,电子传感器的尺寸为6.5μm,经过显微镜成的像再经过电子传感器,能看到的最小尺寸为0.1μm,获得的图像或者输入的图像可为512*512、1024*1024或2048*2048的16位的灰度或彩色图像,k1和k2的取值范围均为大于1且小于10。在一个示例中,k1=k2=3;在另一个示例中,k1=k2=5。若图像是彩色图像,彩色图像的一个像素点具有三个像素值,可以将彩色图像转化为灰度图像,再进行亮斑检测,以降低图像检测过程的计算量和复杂度。可选择但不限于利用浮点算法、整数方法、移位方法或平均值法等将非灰度图像转换成灰度图像。

在一个示例中,发明人经过大量图像处理统计,取第一预设值为该图像的平均像素的1.4倍,取第二预设值为该图像的平均像素值的1.1倍,能够排除干扰、获得来自于光学检测标记的亮斑检测结果。

可利用大小、与理想亮斑的相似程度和/或强度来对候选亮斑进一步进行筛选判断。在某些具体实施方式中,利用候选亮斑对应的连通域的大小来定量反映比较图像上候选亮斑的大小,以此来筛选判断候选亮斑是否为要的亮斑。

在一个示例中,确定候选亮斑是否为亮斑包括:计算一个候选亮斑对应的连通域的大小Area=A*B,判定对应的连通域的大小大于第三预设值的候选亮斑为一个亮斑,A表示以该候选亮斑对应的矩阵的中心的所在行的相连像素/连通像素的大小,B表示以该候选亮斑对应的矩阵的中心的所在列的相连像素/连通像素的大小,定义一个k1*k2矩阵中大于平均像素值的相连像素为一个所称的候选亮斑对应的连通域。如此,能够能够有效获得对应标记分子且符合后续序列识别的亮斑,获得核酸序列信息。

在一个例子中,以该图像的平均像素值作为基准,相邻的不小于平均像素值的两个或多个像素为所称的相连像素/连通像素(pixel connectivity),如图4所示,加粗加大的表示候选亮斑对应的矩阵的中心,粗线框表示候选亮斑对应的3*3矩阵,标记为1的像素为不小于该图像的平均像素值的像素点,标记为0的像素为小于平均像素值的像素点,可看出A=3,B=6,该候选亮斑对应的连通域的大小为A*B=3*6。

所称的第三预设值可依据该图像上所有候选亮斑对应的连通域的大小这一信息来确定。例如通过计算该图上各候选亮斑对应的连通域的大小,取亮斑的连通域大小的平均值代表该图像一个特性,作为第三预设值;又例如,可将该图像上各个候选亮斑对应的连通域大小按从小到大排序,取第50、第60、第70、第80或第90百分位数连通域大小作为该第三预设值。如此,可有效获得亮斑信息,利于后续识别核酸序列。

在某些示例中,通过统计设置参数来定量反映比较候选亮斑的强度特征,以此来筛选候选亮斑。在一个示例中,确定候选亮斑是否为亮斑包括:计算一个候选亮斑的分值Score=((k1*k2-1)CV-EV)/((CV+EV)/(k1*k2)),判定分值大于第四预设值的候选亮斑为一个亮斑,CV表示候选亮斑对应的矩阵的中心像素值,EV表示亮斑对应的矩阵的非中心像素值的总和。如此,能够能够有效获得对应标记分子且符合后续序列识别的亮斑,获得核酸序列信息。

所称的第四预设值可依据该图像上所有候选亮斑的分值的大小这一信息来确定。例如,当该图像上的候选亮斑的数量大于一定数目符合统计上对量的要求,例如该图像上候选亮斑的数目大于30,可计算且将该图像的所有候选亮斑的Score值按升序排序,第四预设值可设置为第50、第60、第70、第80或90分位数Score值,如此,可排除掉小于第50、第60、第70、第80或第90分位数Score值的候选亮斑,利于有效获得目标亮斑,利于后续碱基序列准确识别。进行该处理或者说该筛选设置的依据是,一般地,认为中心与边缘强度/像素值差异大且汇聚的亮斑为与待检分子所在位置相对应的亮斑。一般情况下,图像上的候选亮斑的数量大于50、大于100或大于1000。

在某些示例中,结合形态和强度/亮度对候选亮斑进行筛选。在一个示例中,确定候选亮斑是否为亮斑包括:计算一个候选亮斑对应的连通域的大小Area=A*B,以及计算一个候选亮斑的分值Score=((k1*k2-1)CV-EV)/((CV+EV)/(k1*k2)),A表示以该候选亮斑对应的矩阵的中心的所在行的相连像素/连通像素的大小,B表示以该候选亮斑对应的矩阵的中心的所在列的相连像素/连通像素的大小,定义一个k1*k2矩阵中大于平均像素值的相连像素为一个所称的候选亮斑对应的连通域,CV表示候选亮斑对应的矩阵的中心像素值,EV表示亮斑对应的矩阵的非中心像素值的总和;判定对应的连通域的大小大于第三预设值且分值大于第四预设值的候选亮斑为一个亮斑。如此,能够有效地获得对应核酸分子且利于后续序列识别的亮斑信息。对于所称的第三预设值和/或第四预设值,可以参照前面具体实施方式进行考虑和设置。

在某些具体实施方式中,图像配准方法还包括亮斑识别检测,包括:预处理图像,获得预处理后的图像,所称的图像选自第一图像、第二图像、第三图像、第四图像、第五图像、第六图像、第七图像和第八图像中的至少一个;确定临界值以简化预处理后的图像,包括对小于临界值的预处理后的图像上的像素点的像素值赋值为第一预设值,对不小于临界值的预处理后的图像上的像素点的像素值赋值为第二预设值,以获得简化图像;基于预处理后的图像确定第一亮斑检测阈值c1;基于预处理后的图像和简化图像识别图像上的候选亮斑,包括判定满足以下a)-c)中至少两个条件的像素点矩阵为一个候选亮斑,a)在预处理后的图像中,像素点矩阵的中心像素点的像素值为最大,像素点矩阵可表示为r1*r2,r1和r2均为大于1的奇数,r1*r2像素点矩阵包含r1*r2个像素点,b)在简化图像中,像素点矩阵的中心像素点的像素值为第二预设值并且像素点矩阵的连通像素大于

对于灰度图像,像素值同灰度值。若图像是彩色图像,彩色图像的一个像素点具有三个像素值,可以将彩色图像转化为灰度图像,再进行亮斑检测,以降低图像检测过程的计算量和复杂度。可选择但不限于利用浮点算法、整数方法、移位方法或平均值法等将非灰度图像转换成灰度图像。

在一些实施例中,预处理图像包括:利用开运算确定图像的背景;基于背景,利用顶帽运算将图像转化为第一图像;对第一图像进行高斯模糊处理,获得第二图像;对第二图像进行锐化,以获得所称的预处理后的图像。如此,能对图像进行有效的降噪或者说提高图像的信噪比,利于亮斑的准确检测。

开运算是一种形态学处理,即先膨胀后腐蚀的过程,腐蚀操作会使得前景(感兴趣的部分)变小,而膨胀会使得前景变大;开运算可以用来消除小物体,在纤细点处分离物体,并且在平滑较大物体的边界的同时不明显改变其面积。该实施方式对图像做开运算的结构元p1*p2(用来处理图像的基本模板)的大小不作特别限制,p1和p2为奇数。在一个示例中,结构元p1*p2可以为15*15、31*31等,最终都能够获得利于后续处理分析的预处理后的图像。

顶帽运算往往用来分离比临近点(亮点/亮斑)亮一些的斑块,在一幅图像具有大幅的背景,而微小物品比较有规律的情况下,可以使用顶帽运算进行背景提取。在一个示例中,对图像进行顶帽变换包括先对图像做开运算,进而利用原图像减去开运算结果,获得第一图像即顶帽变换后的图像。顶帽变换的数学表达式为dst=tophat(src,element)=src-open(src,element)。发明人认为,开运算的结果放大了裂缝或者局部低亮度的区域,因此从原图中减去开运算后的图,得到的图像突出了比原图轮廓周围的区域更明亮的区域,这一操作与选择的核的大小相关,可以认为与亮点/亮斑的预期大小相关,若亮点不是预期大小,处理后的效果会使得整张图产生许多小凸起,具体可以参考虚焦图片,即亮点/亮斑晕染成一团。在一个示例中,亮点的预期大小即选择的核的大小为3*3,得到的顶帽变换后的图像利于后续进一步去噪处理。

高斯模糊(Gaussian Blur)也称为高斯滤波,是一种线性平滑滤波,适用于消除高斯噪声,广泛应用于图像处理的减噪过程。通俗的讲,高斯滤波就是对整幅图像进行加权平均的过程,每一个像素点的值,都由其本身和邻域内的其他像素值经过加权平均后得到。高斯滤波的具体操作是:用一个模板(或称卷积、掩模)扫描图像中的每一个像素,用模板确定的邻域内像素的加权平均灰度值去替代模板中心像素点的值。在一个示例中,对第一图像进行高斯模糊处理,在OpenCV中使用高斯滤波GaussianBlur函数进行,高斯分布参数Sigma取0.9,所使用的二维滤波器矩阵(卷积核)是3*3,从图像角度看经过该高斯模糊处理后,第一图像上的小突起被抹平,图像边缘光滑。进一步地,对第二图像即高斯过滤后的图像进行锐化,例如进行二维拉普拉斯锐化,从图像角度看经过处理后,边缘被锐化,高斯模糊后的图像得以恢复。

在一些实施例中,简化预处理后的图像包括:基于背景和预处理后的图像,确定临界值;比较预处理后的图像上的像素点的像素值与临界值,对小于临界值的预处理后的图像上的像素点的像素值赋值为第一预设值,对不小于临界值的预处理后的图像上的像素点的像素值赋值为第二预设值,获得简化图像。如此,根据发明人大量测试数据总结的确定临界值的方式以及确定的临界值,据此将预处理后的图像简化,例如二值化,利于后续亮斑准确检测,利于后续碱基准确识别、获得高质量数据等。

具体地,在一些示例中,获得简化图像包括:将预处理后获得的锐化后的结果除以开运算结果,获得和图像像素点对应的一组数值;通过该组数值,确定二值化预处理后的图像的临界值。例如,可将该组数值按大小升序排列,取该组数值中第20、30或40百分位数对应的数值作为二值化临界值/阈值。如此,获得的二值化图像利于后续亮斑的准确检测识别。

在一个示例中,图像预处理时的开运算的结构元为p1*p2,所称的将预处理后的图像(锐化后的结果)除以开运算结果,获得一组和结构元一样大小的数组/矩阵p1*p2,在每个数组中,将该数组包含的p1*p2个数值按大小升序排列,取该数组中第三十百分位数对应的数值作为该区域(数值矩阵)的二值化临界值/阈值,如此,分别确定阈值对图像上的各个区域进行二值化,最终获得的二值化结果在去噪的同时更加突出所需信息,利于后续亮斑的准确检测。

在一些示例中,利用大津法进行第一亮斑检测阈值的确定。大津法(OTSU算法)也可称为最大类间方差法,大津法利用类间方差最大来分割图像,意味着错分概率小,准确性高。假设预处理后的图像的前景和背景的分割阈值为T(c1),属于前景的像素点数占整幅图像的比例为w

μ=ω

在一些实施例中,基于预处理后的图像和简化图像识别图像上的候选亮斑,包括判断同时满足a)-c)三个条件的像素点矩阵为一个候选亮斑。如此,能有效地提高后续基于亮斑信息确定核酸序列的准确性和下机数据的质量。

具体地,在一个示例中,候选亮斑的判定需要满足的条件包括a),k1、k2可以相等也可以不相等。在一个示例中,成像系统相关参数为:物镜60倍,电子传感器的尺寸为6.5μm,经过显微镜成的像再经过电子传感器,能看到的最小尺寸为0.1μm,获得的图像或者输入的图像可为512*512、1024*1024或2048*2048的16位的灰度或彩色图像,k1和k2的取值范围均为大于1且小于10。在一个示例中,在一个预处理后的图像中,依据亮斑的预期大小设置k1=k2=3;在另一个示例中,设置k1=k2=5。

在一个示例中,候选亮斑的判定需要满足的条件包括b),在简化图像中,像素点矩阵的中心像素点的像素值为第二预设值,并且该像素点矩阵的连通像素大于

在一个示例中,候选亮斑的判定需要满足的条件包括c),在预处理图像中,g2为修正后的m1*m2范围的像素,即为修正后的m1*m2范围像素总和。在一个例子中,依据简化图像相应m1*m2范围中像素值为第二预设值的像素点所占的比例进行修正,例如,如图5所示,m1=m2=5,所称的简化图像相应m1*m2范围中像素值为第二预设值的像素点所占的比例为13/25(13个“1”),修正后的g2为原来的13/25。如此,利于更准确的检测识别亮斑,利于后续亮斑信息的分析读取。

在一些示例中,所称的判定候选亮斑是否为亮斑还包括:基于预处理后的图像确定第二亮斑检测阈值,以及判定像素值不小于第二亮斑检测阈值的候选亮斑为亮斑。在具体示例中,以候选亮斑的坐标所在的像素点的像素值作为该候选亮斑的像素值。通过利用基于预处理后的图像确定的第二亮斑检测阈值对候选亮斑的进一步筛选,能够排除掉至少一部分更可能是图像背景但亮度(强度)和/或形状表现为“亮斑”的亮斑,利于后续基于亮斑的序列的准确识别,提高下机数据的质量。

在一个示例中,可利用重心法获取候选亮斑的坐标,包括亚像素级坐标。利用双线性插值法计算候选亮斑的坐标位置的灰度值。

在某些具体示例中,判定候选亮斑是否为亮斑包括:将预处理后的图像划分为预定大小的一组区域(block),对该区域中的像素点的像素值进行排序,以确定该区域对应的第二亮斑检测阈值;对于位于区域的候选亮斑,判定像素值不小于该区域对应的第二亮斑检测阈值的候选亮斑为亮斑。如此,区分图像的不同区域的差异比如光强的整体落差,分开进行亮斑的进一步检测识别,利于准确识别亮斑并且获得更多的亮斑。

所称的将预处理后的图像划分为预定大小的一组区域(block),block之间可以有重叠也可以没有重叠。在一个示例中,block之间没有重叠。在一些实施例中,预处理后的图像的大小不小于512*512,例如为512*512、1024*1024、1800*1800或者2056*2056等,所称预定大小的区域可以设为为200*200。如此,利于快速计算判断识别亮斑。

在一些实施例中,确定该区域对应的第二亮斑检测阈值时,对每个block中的像素点的像素值按大小进行升序排列,取p10+(p10-p1)*4.1作为该block对应的第二亮斑检测阈值,即该block的背景,p1表示第百分之一分位的像素值,p10表示第百分之十分位的像素值。该阈值是发明人通过大量数据训练测试得出的较为稳定的阈值,能够消除大量背景上的亮斑。可以理解地,当光学系统调整,图像整体像素分布发生改变时,此阈值可能需要适当调整。图6为进行该处理之前和之后的亮斑检测结果对比示意图,即排除掉区域背景前后的亮斑检测结果示意图,图6的上半部分为作该处理后的亮斑检测结果、下半部分为不作该处理的亮斑检测结果,十字标记的为候选亮斑或亮斑。

本发明的实施方式还提供一种碱基识别方法,包括将获自碱基延伸反应的图像上的亮斑匹配到对应测序模板的亮斑集合,依据匹配上的亮斑进行碱基识别,获自碱基延伸反应的图像对应的视野中存在多个带有光学可检测标记的核酸分子,至少一部分核酸分子在获自碱基延伸反应的图像上表现为亮斑,对应测序模板的亮斑集合通过上述任一实施例中的基于图像构建测序模板的方法获得。

上述对任一实施方式中的基于图像构建测序模板的方法的技术特征和优点的描述,同样适用本发明这一实施方式中的碱基识别方法,在此不再赘述。

具体地,可以利用遍历的方式将获自碱基延伸反应的图像上的亮斑与构建的亮斑集合进行匹配。在某些具体实施方式中,对应测序模板的亮斑集合中存在与获自碱基延伸反应的图像上的任一亮斑的距离小于第三预定像素,则判定获自碱基延伸反应的图像上的该亮斑匹配上对应测序模板的亮斑集合。在一个示例中,所称的第三预定像素为2。如此,能够实现碱基的准确识别,获得模板的部分碱基序列(读段)。

上述在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的序列表,可以具体实现在任何计算机可读存储介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,"计算机可读存储介质"可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读存储介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM)。另外,计算机可读存储介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。

本发明的实施方式还提供一种基于图像构建测序模板的装置100,如图7所示,用于实施上述本发明任一实施例中的基于图像构建测序模板的方法,所称的图像包括分别对应A/U、T、G和C四种碱基延伸反应时的一个相同视野的第一图像、第二图像、第三图像和第四图像,碱基延伸反应时的该视野存在多个带有光学可检测标记的核酸分子,至少一部分核酸分子在图像上表现为亮斑,定义顺序和/或同时实现一次四种类型碱基延伸反应为一轮测序反应,第一图像包括图像M1和图像M2,第二图像包括图像N1和图像N2,第三图像包括图像P1和图像P2,第四图像包括图像Q1和图像Q2,图像M1和图像M2分别来自两轮测序反应,图像N1和图像N2分别来自两轮测序反应,图像P1和图像P2分别来自两轮测序反应,图像Q1和图像Q2分别来自两轮测序反应,该装置包括:组合单元110,用于组合图像M1、图像M2、图像N1、图像N2、图像P1、图像P2、图像Q1和图像Q2中的任两图像以进行亮斑匹配,并且使图像M1、图像N1、图像N2、图像P1、图像P2、图像Q1和图像Q2均至少一次参与该组合,获得包含第一重合亮斑的多个组合图像,在组合图像上距离小于第一预定像素的两个或多个亮斑为一个第一重合亮斑;合并单元130,用于合并来自所述组合单元的多个组合图像上的第一重合亮斑,以获得一个对应测序模板的亮斑集合。

上述对本发明任一实施例中的基于图像构建测序模板的方法的技术特征和优点的描述,同样适用本发明这一实施方式中的装置100,在此不再赘述。

例如,在合并单元130中,合并多个组合图像上的第一重合亮斑,包括对不同组合图像中的第一重合亮斑进行一次或多次匹配,以获得对应测序模板的亮斑集合。

在一些示例中,图像M1、图像N1、图像P1和图像Q1为顺序获得,图像M2、图像N2、图像P2和图像Q2为顺序获得,组合单元130用于:间隔S个图像对图像M1、图像M2、图像N1、图像N2、图像P1、图像P2、图像Q1和图像Q2进行两两组合,获得K个组合图像以及对组合图像上的亮斑进行匹配,弃组合图像上的非重合亮斑,S为整数,0≤S≤Smax,Smax=参与组合的图像总数-4,K=[(参与组合的图像总数-S-1)+1]*(参与组合的图像总数-S-1)/2。

在一些示例中,图像为经过配准的图像。

具体地,装置100还包括配准单元108,配准单元用于图像配准,配准单元包括第一配准模块和第二配准模块,第一配准模块用于基于参考图像对待配准图像进行第一配准,参考图像和待配准图像对应相同视野,包括确定待配准图像上的预定区域和参考图像上的相应预定区域的第一偏移量,基于第一偏移量移动待配准图像上的所有亮斑,获得第一配准后的待配准图像;第二配准模块用于基于参考图像对第一配准后的待配准图像进行第二配准,包括合并第一配准后的待配准图像和参考图像,获得合并图像,计算合并图像上的预定区域的所有第二重合亮斑的偏移量,以确定第二偏移量,在合并图像上的距离小于第二预定像素的两个或多个亮斑为一个第二重合亮斑,以及基于该第二偏移量移动第一配准后的待配准图像上的所有亮斑,以实现对待配准图像的配准。

在一些示例中,参考图像通过构建获得,配准单元108还包括参考图像构建模块,参考图像构建模块用于:获取第五图像和第六图像,第五图像和第六图像与待配准图像对应相同视野;基于第五图像对第六图像进行粗配准,包括确定第六图像和第五图像的偏移量,基于该偏移量移动第六图像,获得粗配准后的第六图像;合并第五图像和粗配准后的第六图像,以获得参考图像。

在一些示例中,在利用参考图像构建模块构建参考图像时,还包括利用第七图像和第八图像,第七图像和第八图像与待配准图像来自测序反应的相同视野,第五图像、第六图像、第七图像和第八图像分别对应A/U、T、G和C四种类型碱基延伸反应时的视野,构建参考图像还包括:基于第五图像对第七图像进行粗配准,包括确定第七图像和第五图像的偏移量,基于该偏移量移动第七图像,获得粗配准后的第七图像;基于第五图像对第八图像进行粗配准,包括确定第八图像和第五图像的偏移量,基于该偏移量移动第八图像,获得粗配准后的第八图像;合并第五图像和粗配准后的第六图像、粗配准后的第七图像以及粗配准后的第八图像,以获得参考图像。

在一些示例中,参考图像和待配准图像为二值化图像。

在一些示例中,利用二维离散傅里叶变换确定第一偏移量、第六图像和第五图像的偏移量、第七图像和第五图像的偏移量和/或第八图像和第五图像的偏移量。

在一些示例中,装置100还包括亮斑检测单元106,亮斑检测单元106用于:预处理图像,获得预处理后的图像;确定临界值以简化预处理后的图像,包括对小于临界值的预处理后的图像上的像素点的像素值赋值为第一预设值,对不小于临界值的预处理后的图像上的像素点的像素值赋值为第二预设值,以获得简化图像;基于预处理后的图像确定第一亮斑检测阈值c1;基于预处理后的图像和简化图像识别图像上的候选亮斑,包括判定满足以下a)-c)中至少两个条件的像素点矩阵为一个候选亮斑,a)在预处理后的图像中,像素点矩阵的中心像素点的像素值为最大,像素点矩阵可表示为k1*k2,k1和k2均为大于1的奇数,k1*k2像素点矩阵包含k1*k2个像素点,b)在简化图像中,像素点矩阵的中心像素点的像素值为第二预设值并且像素点矩阵的连通像素大于

在一些示例中,亮斑检测单元106还包括用于判定候选亮斑是否为亮斑,包括:基于基于预处理后的图像确定第二亮斑检测阈值,以及判定像素值不小于第二亮斑检测阈值的候选亮斑为亮斑。

在一些示例中,候选亮斑的像素值为该候选亮斑的坐标所在的像素点的像素值。

在一些示例中,在亮斑检测单元106中判定候选亮斑是否为亮斑包括:将预处理后的图像划分为预定大小的一组区域,对该区域中的像素点的像素值进行排序,以确定该区域对应的第二亮斑检测阈值,对于位于区域的候选亮斑,判定像素值不小于该区域对应的第二亮斑检测阈值的候选亮斑为亮斑。

在一些示例中,在亮斑检测单元106中预处理图像,包括:利用开运算确定图像的背景,基于背景,利用顶帽运算将图像转化为第一图像,对第一图像进行高斯模糊处理,获得第二图像,对第二图像进行锐化,获得预处理后的图像。

在一些示例中,在亮斑检测单元106中确定临界值以简化预处理后的图像,获得简化图像,包括:基于背景和预处理后的图像,确定临界值,比较预处理后的图像上的像素点的像素值与临界值,以获得简化图像。

在一些示例中,g2为修正后的m1*m2范围的像素,依据简化图像相应m1*m2范围中像素值为第二预设值的像素点所占的比例进行修正。

本发明的实施方式还提供一种碱基识别装置1000,该装置用以实现上述本发明任一具体实施方式中的碱基识别方法,该装置1000用于将获自碱基延伸反应的图像上的亮斑匹配到对应测序模板的亮斑集合,依据匹配上的亮斑进行碱基识别,获自碱基延伸反应的图像对应的视野中存在多个带有光学可检测标记的核酸分子,至少一部分核酸分子在获自碱基延伸反应的图像上表现为亮斑,对应测序模板的亮斑集合通过上述任一实施例中的基于图像构建测序模板的方法和/或基于图像构建测序模板的装置构建。

具体地,在碱基识别装置1000中,对应测序模板的亮斑集合中存在与获自碱基延伸反应的图像上的任一亮斑的距离小于第三预定像素,则判定获自碱基延伸反应的图像上的该亮斑匹配上对应测序模板的亮斑集合。

依据本发明的实施方式,还提供一种计算机程序产品,该产品包括实现基于图像构建测序模板的指令,指令在计算机执行程序时,使计算机执行上述本发明任一具体实施方式中的基于图像构建测序模板的方法。

依据本发明的实施方式,还提供另一种计算机程序产品,该产品包括实现碱基识别的指令,指令在计算机执行程序时,使计算机执行上述本发明任一具体实施方式中的碱基识别方法。

本领域技术人员知晓,除了以纯计算机可读程序代码方式实现控制器/处理器外,完全可以通过将方法步骤进行逻辑变成来使得控制器以逻辑门、开关、专用集成电路、可编辑逻辑控制器和嵌入微控制器等的形式来实现相同的功能。因此,这种控制器/处理器可以被认为是一种硬件部件,而对其内包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至,可以将用于实现各种功能的装置视为既可以是实现方法的的软件模块又可以是硬件部件内的结构。

在本说明书的描述中,一个实施方式、一些实施方式、一个或一些具体实施方式、一个或一些实施例、示例等的描述意指结合该实施方式或示例描述的具体特征、结构或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构等特点可以在任何的一个或多个实施例或示例中以合适的方式结合。

尽管已经示出和描述了本发明的实施例,本领域的普通技术人员可以理解:在不脱离本发明的原理和宗旨的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由权利要求及其等同限定。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号