首页> 中国专利> 使用未标记的核苷酸进行大规模平行测序

使用未标记的核苷酸进行大规模平行测序

摘要

本发明提供了用于对核酸进行测序的组合物和方法以及其他应用。在合成测序中,在每个循环中通过聚合酶掺入未标记的可逆终止子,然后在掺入后通过将直接或间接标记的抗体或其他亲和试剂结合至所述可逆终止子来进行标记。

著录项

说明书

技术领域

本发明涉及核酸测序及其在医学和生物科学中的用途。

序列表

本申请包含序列表,该序列表已经以ASCII格式电子提交,并且以引用方式将其全部内容并入本文。

相关申请的交叉引用

本申请要求2018年11月9日递交的美国临时专利申请62/758,317,2019年10月14日提交的美国临时专利申请62/914,877,2019年10月14日提交的美国临时专利申请62/914,940,以及2019年10月14日提交的美国临时专利申请62/914,915的优先权,所述申请中的每一个均以引用方式并入本文。

本申请涉及美国专利公布US 2018/0223358和作为WO 2018/129214公布的国际专利申请PCT/US2018/012425,所述专利两者以引用方式并入本文。

背景技术

对用于核酸测序和重新测序的低成本、高通量的方法的需求已导致开发出“大规模平行测序”(MPS)技术。一种常用的用于DNA测序的方法称为“合成测序”(SBS),如Ronaghi等人,Science,281:363-365,1998;Li等人,Proc.Natl.Acad.Sci.USA,100:414-419,2003;Metzker,Nat Rev Genet.11:31-46,2010;Ju等人,Proc.Natl.Acad.Sci.USA 103:19635–19640,2006;Bentley等人,Nature 456:53–59,2008;以及在美国专利6,210,891、6,828,100、6,833,246和6,911,345以及美国专利公布2016/0130647中所公开的。

SBS需要与被测序的寡核苷酸相对的正确互补核苷酸的受控(即,一次一个)掺入。这允许通过在多个循环中添加核苷酸进行精确测序,因为一次一个地测序每个核苷酸残基,从而防止发生一系列不受控的掺入。在一种方法中,可逆终止子核苷酸(RT)用于确定DNA模板的序列。在最常用的SBS方法中,每个RT包含修饰的核苷酸,其包括:(1)封端基团,所述封端基团确保通过DNA聚合酶仅将单个碱基添加到生长DNA拷贝链的3'端,以及(2)荧光标签,所述荧光标签能够由相机检测到。在最常见的SBS方法中,将模板和测序引物固定在固体支撑物上,并将该支撑物暴露于四种DNA核苷酸类似物中的每一种,每一种类似物包含通过可裂解接头附着(attach)到含氮碱基的不同荧光团,以及脱氧核糖3'-OH位的3'-O-叠氮基甲基基团,以及DNA聚合酶。只有正确的互补碱基退火到靶,随后在引物的3'末端处掺入。洗掉未掺入的核苷酸,并将固体支撑物成像。引入TCEP(三(2-羧乙基)膦)以裂解接头并释放荧光团并去除3'-O-叠氮基甲基基团,从而使3'-OH再生。然后可以重复该循环((Bentley等人,Nature 456,53–59,2008)。对于四种碱基中的每一种使用不同的荧光颜色标记,使得在每个测序循环中,可以通过其颜色鉴定掺入的RT的身份(identity)。

尽管SBS被广泛使用,仍然需要改进。例如,目前的SBS方法需要昂贵的可逆终止的dNTP(RT),其中碱基上的标记(例如染料)与可裂解接头连接,从而导致a)在标记裂解后在掺入的碱基上留下化学疤痕,b)掺入效率较低,c)淬灭,d)激发的染料诱导延伸的终止,以及减少每个测序循环中的信号。

发明内容

本发明涉及用于核酸分析和测序的方法和组合物。本文公开了一种SBS测序方法,其中通过结合识别最后掺入的核苷酸中的碱基、糖、可裂解的封端基团或这些组分的组合的亲和试剂(例如,抗体、适体、亲和物(Affimer)、结蛋白(Knottin)等)来鉴定最后掺入的核苷酸碱基。结合与可检测信号的产生直接或间接相关联。

根据一个实施方案,本发明提供了采用非标记的可逆终止子(NLRT)核苷酸来测序的方法。可逆终止子(RT)核苷酸是修饰的脱氧核苷酸三磷酸(dNTP)或dNTP类似物,其含有可去除的封端基团,所述封端基团确保通过DNA聚合酶仅能将单个碱基添加到生长DNA拷贝链的3'端。众所周知,在DNA合成过程中将dNTP(2'-脱氧核苷三磷酸)掺入生长链的3'端涉及焦磷酸酯的释放,以及当dNTP掺入DNA链时,所掺入的部分是单磷酸核苷酸(或更确切地说,通过磷酸二酯键与一个或两个相邻核苷酸单体连接的核苷酸单体)。可逆终止子(RT)核苷酸是修饰的脱氧核苷酸三磷酸(dNTP)或dNTP类似物,其含有可去除的封端基团,所述封端基团确保通过DNA聚合酶仅能将单个碱基添加到生长DNA拷贝链的3'端。非标记的RT核苷酸不含可检测标记。在每个测序循环中,核苷酸或核苷酸类似物通过聚合酶掺入,从而使DNA拷贝链的3'端延伸一个碱基,以及洗掉未掺入的核苷酸或核苷酸类似物。引入亲和试剂,其特异性识别并结合新掺入的核苷酸或核苷酸类似物的表位。在拍摄图像后,从DNA中去除封端基团和标记的亲和试剂,从而允许开始下一个测序循环。在一些实施方案中,通过亲和试剂识别的表位由掺入的核苷本身(即碱基加糖)或核苷酸和3'封端基团形成。在一些实施方案中,通过亲和试剂识别的表位由可逆终止子本身、可逆终止子与脱氧核糖组合,或可逆终止子与核碱基或核碱基和脱氧核糖组合形成。

根据一个这样的实施方案,本发明提供了用于对核酸测序的方法,该方法包括:(a)在引物延伸以将未标记的RT掺入与核酸模板互补的序列的条件下,使包含所述核酸的核酸模板、与所述模板的一部分互补的核酸引物、聚合酶和式I的未标记的RT接触,从而产生包含掺入的RT的未标记的延伸产物:

其中:R

在通常用于通过合成测序的dNTP类似物中,核碱基与可裂解接头缀合,所述接头将碱基连接至可检测标记物,例如荧光团。参见,例如,美国专利公布2002/0227131。与之相比,在本发明的dNTP类似物中,通常R

根据另一个实施方案,这种方法还包括(d)从所述RT中去除所述可逆封端基团以产生3'-OH;以及(e)从所述RT中去除所述亲和试剂。

根据另一个实施方案,这种方法进一步包括重复该方法的步骤一次或多次,即进行多个测序循环,其中确定所述核酸模板的序列的至少一部分。

根据另一个实施方案,这种方法包括在相同反应中去除所述可逆封端基团和所述亲和试剂。

根据另一个实施方案,这种方法包括去除所述亲和试剂而不去除所述可逆封端基团以及用不同的亲和试剂重新探测。

在这种方法中,亲和试剂可包括抗体(包括抗体的结合片段、单链抗体、双特异性抗体等)、适体、亲和物、结蛋白或任何其他已知的以合适的特异性和亲和力结合掺入的NLRT的试剂。在一个实施方案中,亲和试剂是抗体。在另一个实施方案中,亲和试剂是包含可检测标记的抗体,所述可检测标记是荧光标记。

根据一个实施方案,R

根据另一个实施方案,R

根据另一个实施方案,R

术语非标记的可逆终止子(NLRT)可以指核苷酸类似物的三磷酸酯形式,或者可以指掺入的NLRT。

根据本发明的另一个实施方案,提供了用于对核酸测序的方法,包括:(a)提供DNA阵列,所述DNA阵列包含(i)多个模板DNA分子,每个模板DNA分子包含所述核酸的片段,其中所述多个模板DNA分子中的每一个附着在所述阵列的一个位置处,(b)在引物延伸以将未标记的RT掺入与所述多个模板DNA分子中的至少一些互补的序列的条件下,使所述DNA阵列与核酸引物、聚合酶和式I的未标记的RT接触,从而产生包含所述RT的未标记的延伸产物,所述核酸引物与所述模板DNA分子的每一个的一部分互补:

其中:R

根据本发明的一个实施方案,这种方法包括:(b)在引物延伸以将未标记的RT掺入与多个模板DNA分子中的至少一些互补的序列的条件下,使所述DNA阵列与核酸引物、聚合酶和式I的未标记的RT组接触,从而产生包含所述RT的未标记的延伸产物,所述核酸引物与所述模板DNA分子的每一个的一部分互补,以及所述式I的未标记的RT组包括其中R

根据本发明的另一个实施方案,提供了DNA阵列。这种阵列包括:多个模板DNA分子,每个DNA分子附着在所述阵列的一个位置处;互补DNA序列,其与多个所述位置处的所述模板DNA分子的一部分成碱基配对,其中所述互补DNA序列包含在其3'端的掺入的RT;以及亲和试剂,其特异性地附着于所述RT中的至少一些,所述亲和试剂包含鉴定附着有所述亲和试剂的RT的可检测标记。

根据本发明的另一个实施方案,提供了试剂盒,其包含:(a)式I的未标记的RT:

其中:R

在前述实施方案中的任一个中,亲和试剂可以为选自下列的单克隆抗体:2C5、3B12、17H7、18B7、1B8、2B9、4C8、1A10、3B7、3G6、5F6、4B8、7C8、2D4、2D10、1F9、3B7和4G8以及它们的变体和衍生物。

附图说明

图1A-H示出了针对下列具有特异性的单克隆抗体的重链氨基酸序列和轻链氨基酸序列的比对:3’-叠氮甲基-dA(N3A):mAbs 2C5、3B12、17H7和18B7;3’-叠氮甲基-dC(N3C):mAbs 1B8、2B9、4C8、1A10、和3B7;3’-叠氮甲基-dG(N3G):mAbs 3G6、5F6、4B8和7C8;以及3’-叠氮甲基-dT(N3T):mAbs 2D4、2D10、1F9和3B7。具体地讲,图1A示出N3A轻链序列;图1B示出N3A重链序列;图1C示出N3C轻链序列;图1D示出N3C重链序列;图1E示出N3G轻链序列;图1F示出N3G重链序列;图1G示出N3T轻链序列;以及图1H示出N3T重链序列。

图2A是散点图,其示出与标记抗体结合后单个成像区内两个通道中的DNB群体的荧光强度。

图2B是检测到的荧光图,其示出抗体结合既取决于碱基,也取决于具有3'叠氮基甲基嵌段的糖。

图2C是数据图,其示出抗体结合的快速动力学,以检测DNA纳米球(DNB)测序中的引物延伸。示出标记的抗体在30秒、60秒和90秒内与未标记RT核苷酸的结合。

图2D比较了强度数据,其示出了在几种反应条件下结合至RT后去除荧光抗体的效果。

图2E比较了在返回到碱基标记的RT之前,在前10个循环位置内,之后是抗体标记的检测的另外80个循环位置内,碱基标记的核苷酸的相对强度。

图2F为散点图,其比较了在两个连续循环中的一组DNB的信号,从而示出不同碱基的独立标记。

图3A示出了阵列的所选区域中DNB的平均调用碱基强度,从而示出在200个单端读取循环中标记强度的变化。

图3B为200个测序循环的位置不一致的图。数据展示出高精确性和94%测序收率。

图4A为示出人DNA文库的PE150强度的图,其中减去了背景并校正了光谱串扰。

图4B和4C示出了相同DNA文库的PE150 Lag和具有优化的Ph29去除的大肠杆菌文库的PE100 Lag。

图5示出了NLRT结构的示例:图5A:3’-O-叠氮甲基-2’-脱氧鸟嘌呤;图5B:3’-O-氨基-2’-脱氧鸟嘌呤;图5C:3’-O-氰基乙烯-2’-脱氧鸟嘌呤;图5D:3’-O-磷酸;图5E:3’-乙基二硫化物-亚甲基-2’-脱氧胸腺嘧啶。

图6示出了可在本发明的实践中使用的各种保护基。“~”指示分子与结构其余部分的连接点。

具体实施方式

在某些方面,本发明提供了用于采用未标记的可逆终止子核苷酸而进行核酸的合成测序(SBS)的方法和组合物。在一种方法中,通过在阵列上的位置处产生固定的单链模板DNA来进行SBS。在大多数方法中,每个固定的单链模板DNA位于具有类似序列的大量拷贝(例如扩增子)的位置处。例如,桥式PCR(例如,如WO1998044151中所述)可用于在阵列上的位置(Illumina)生成模板序列簇,或者滚环复制可用于生成单链多联体,或DNA纳米球(DNB)(参见,例如,美国专利8,445,194),其具有许多模板序列拷贝(Complete Genomics,Inc.,San Jose,CA)。在一种方法中,通过将一种或多种引物与模板DNA杂交并延伸所述引物以产生“延伸引物”或“生长DNA链”(GDS)来进行SBS。延伸引物是指在引物DNA链的3'端添加(“掺入”)核苷酸,同时使其与模板杂交。在3'末端掺入的核苷酸与引物的相应核苷酸互补,使得通过在每个测序循环确定掺入的核苷酸的身份就可以确定模板的核苷酸序列。如本文所用“延伸引物”和“生长DNA链”(GDS)以及“生长DNA复制链”具有相同含义并且可互换使用。

在一种现有技术途径中,将标记的核苷酸类似物掺入GDS中。通常,标记的核苷酸类似物包含封端基团,其确保每个步骤仅可掺入单个核苷酸,以及染料(通常为荧光染料)经由可裂解接头附着于核苷酸。每个测序循环涵盖在GDS的一端掺入标记的核苷酸类似物,检测掺入的标记的核苷酸类似物标记,从掺入的核苷酸类似物中去除标记,以及从掺入的核苷酸类似物中去除封端基团以允许掺入新标记的核苷酸类似物。与之相比,本发明不需要包括经由可裂解接头附着于碱基或糖的染料的标记的核苷酸类似物。

在美国专利公布US2017/0240961(其通过引用并入本文)中描述的替代途径中,当掺入时,核苷酸类似物包含经由接头附着于核苷酸的亲和标签。亲和标签是特定结合对(SBP)的一个成员。在一种方法中,亲和标签是生物素。掺入后,将掺入的核苷酸暴露于包含SBP的第二成员(例如链酶亲和素)和可检测标记的亲和试剂。检测可检测标记以鉴定掺入的核苷酸。检测后,处理掺入的核苷酸类似物-亲和试剂复合物以裂解接头并释放可检测标记。在一种方法中,亲和标签是抗原以及亲和试剂是特异性结合抗原的荧光标记的抗体。与之相比,本发明不需要亲和标签,以及在一些方面,采用亲和试剂,而不是亲和标签,所述亲和试剂结合核碱基、糖单元(moiety)、可裂解的封端基团或其组合或子组合。

根据本文公开的方法的一个方面,在GDS的3'末端处掺入非标记的可逆终止子,即包含可逆终止子或封端基团的核苷酸类似物(Non-Labeled Reversible Terminator或NLRT),然后暴露于特异性结合掺入的NLRT(“结合事件”)的亲和试剂(例如,抗体)。在检测到结合事件后,去除亲和试剂。在一种方法中,在GDS的3'末端处掺入包含可逆封端基团的核苷酸类似物,以及在检测到结合事件后,任选地在相同步骤中,去除可逆封端基团和亲和试剂。在该方法中,每个测序循环包括:(i)通过DNA聚合酶掺入包含封端基团的NLRT,然后洗掉未掺入的NLRT;(ii)使掺入的核苷酸类似物与识别并特异性结合掺入的NLRT的标记的亲和试剂接触;(iii)检测亲和试剂的结合;(iv)以允许掺入另外的核苷酸类似物的方式(例如,在脱氧核糖单元的3'位置处产生羟基)去除封端基团,以及(v)去除亲和试剂。该步骤之后可以是新的一个或多个循环,其中掺入并检测新的核苷酸类似物。亲和试剂(例如,抗体)可以直接标记(例如,荧光标记的抗体)或可以间接检测(例如,通过结合标记的抗亲和试剂二级亲和试剂)。因此,应当理解,“标记的亲和试剂”可以通过例如缀合荧光团来直接标记,或可间接标记。

在另一种方法中,在GDS的3'末端掺入包含可逆封端基团的核苷酸类似物,以及在检测到结合事件后,去除可逆封端基团和亲和试剂。在该方法中,每个测序循环包括:(i)通过DNA聚合酶掺入包含封端基团的NLRT,任选地随后移除(洗掉)未掺入的NLRT;(ii)使掺入的核苷酸类似物与识别并特异性结合到掺入的NLRT的标记的亲和试剂接触;(iii)检测亲和试剂的结合;(iv)以在脱氧核糖核苷酸的3'位置处再生羟基(OH)的方式去除封端基团;(iv)以在脱氧核糖单元的3'位置处再生羟基(OH)的方式去除封端基团,这允许掺入另外的核苷酸类似物(例如,在脱氧核糖部分的3'位置处产生羟基),以及(v)移除亲和试剂。亲和试剂(例如,抗体)可以直接标记(例如,荧光标记的抗体)或可间接检测(例如,通过结合标记的抗亲和试剂二级亲和试剂)。因此,应当理解,“标记的亲和试剂”可以通过例如缀合荧光团来直接标记,或间接标记。

SBS涉及两个或更多个引物延伸循环,其中在延伸引物的3'末端处掺入核苷酸。本发明利用亲和试剂,例如抗体,以(i)检测在延伸引物的3'末端处掺入的核苷酸(“3'末端核苷酸”)以及(ii)鉴定该3'末端核苷酸的核碱基并区分一种与另一种核碱基(例如,区分A与G)。不希望受特定机制的束缚,这是可能的,因为每种亲和试剂被设计用于区分3'末端核苷酸与延伸引物的其他“内部”核苷酸,即使在3'末端核苷酸和内部核苷酸包含相同的核碱基时也如此。每种亲和试剂(或在一些情况下,亲和试剂的组合)也被设计用于检测鉴定与3'末端核苷酸相关联的核碱基的3'末端核苷酸的性质。提供了许多策略、方法和材料来执行这些和其他步骤。本节提供了概述,其中省略了许多变型,以及不应以任何方式视为限制。

在一些方法中,使用具有3'可逆终止子部分的核苷酸进行本发明的SBS反应。在这些方法中,基于可逆终止子部分的位置和存在,掺入的3'末端核苷酸与内部核苷酸不同。因此,与延伸引物中的可逆终止子部分结合的亲和试剂结合(并因此检测)3'末端核苷酸,从而将其与内部核苷酸区分开。在不同的方法中,基于内部核苷酸上不存在的游离3'-OH(羟基)基团的存在,掺入的3'末端核苷酸与内部核苷酸不同。因此,与延伸引物中的游离3'-OH基团结合的亲和试剂与3'末端核苷酸结合,结合(并因此检测)3'末端核苷酸,从而将其与内部核苷酸区分开。在一些方法中,游离的3'-OH基团通过裂解掺入的核苷酸类似物中的可逆终止子而生成。在另一种方法中,游离3'-OH基团由掺入不包含可逆终止子单元的核苷酸(诸如天然存在的核苷酸)而产生。在可与上述两种方法中的任一种组合的另外方法中,基于3'末端核苷酸的其他结构差异特征,掺入的3'末端核苷酸与内部核苷酸不同,包括但不限于:相对于内部核苷酸的脱氧核糖,亲和试剂更可接近3'末端核苷酸的脱氧核糖;相对于亲和试剂对内部核苷酸的脱氧核糖的接近性,亲和试剂更可接近3'末端核苷酸的核碱基,以及3'末端核苷酸和内部核苷酸之间的其他分子和构象差异。

因此,在本发明的一个方面,亲和试剂用于检测延伸引物的3'末端核苷酸与其他核苷酸之间的这些结构差异。

还提供了许多用于检测鉴定3'末端核苷酸的核碱基的3'末端核苷酸的性质的策略、方法和材料。在一种方法中,天然存在的核苷酸或包含天然存在的核碱基(例如A、T、C和G)的核苷酸类似物用于测序反应并掺入引物延伸产物中。特异性结合一种核碱基(例如A)并将该核碱基与其不结合的其他核碱基(例如T、C和G)区分开的亲和试剂用于鉴定3'末端核苷酸的核碱基。在另一种方法中,包含修饰的(即,非天然存在的)核碱基的核苷酸类似物用于测序反应并掺入引物延伸产物中。亲和试剂特异性结合一种修饰的核碱基(例如,修饰的A)并将该修饰的核碱基与其他修饰的或天然的核碱基区分开。特异性结合修饰的核碱基的亲和试剂通常识别修饰,使得与修饰的核碱基的结合不同于在没有修饰的情况下与天然存在的核碱基的结合。例如,结合腺苷类似物的亲和试剂,其中7位(N

在又一种途径中,将具有3'可逆封端基团的核苷酸(可逆终止子核苷酸)掺入引物延伸产物中。在每个测序循环中去除封端基团,使得引物延伸产物的仅最后掺入的核苷酸包含封端基团。在该方法中,使用结合封端基团的亲和试剂。在该方法的一个方面中,测序反应中使用的至少两种核苷酸类似物(即,其具有不同的核碱基)包含不同的封端基团。为了说明,通过将第一封端基团(例如,3'-O-叠氮基甲基)用于包含腺嘌呤或腺嘌呤类似物的核苷酸,将不同的第二封端基团(例如,3'-O-氰基乙烯)用于包含鸟嘌呤或鸟嘌呤类似物的核苷酸,等等,亲和试剂的特异性将鉴定相关联的核碱基。例如,在如上所述延伸时,如果3'末端核苷酸被3'-O-氰基乙烯特异性亲和试剂识别出,则这表明相关联的核碱基是鸟嘌呤或鸟嘌呤类似物,以及该位置的模板碱基是胞嘧啶。在该方法的变型中,可以使用仅在小特征方面不同的封端基团,以及亲和试剂结合包括小的区别特征的表位。

如下文所述,在本发明的一个方面,使用基于结构特征的组合识别并特异性结合核苷酸或核苷酸类似物的亲和试剂(例如,识别具有特定修饰的特定封端基团和特定核碱基的亲和试剂)。在这方面,针对被特异性亲和试剂识别的性质,对核苷酸或核苷酸类似物进行设计和/或选择。在一些情况下,结合多种结构特征的亲和试剂具有更强和更特异的亲和试剂结合的优点。下表是结构差异的示例的非穷举性集合,所述结构差异可以通过亲和试剂识别以区分具有不同核碱基的核苷酸(第2列)和可以被亲和试剂结合以提供足够的结合效率的最后掺入的核苷酸中的部分;和/或基于那些特征区分最后掺入的核苷酸与内部核苷酸区(第3列)。

表1

如下文详细讨论的,标记的亲和试剂结合的掺入的核苷酸类似物的部分可包括,例如但不限于,核碱基和封端基团,或核碱基和/或封端基团与核苷酸类似物的糖部分的组合。参见表1。标记的亲和试剂的结合可取决于靶核苷酸的位置,例如,从而区分在GDS的3'末端具有封端基团的核苷酸类似物,以及位于GDS中或内部的类似核苷酸类似物(缺乏封端基团)。标记的亲和试剂的结合还取决于核碱基本身,使得亲和试剂在阵列上的一个位置处结合在GDS的末端处掺入的一个靶NLRT(例如,NLRT-A)但不在阵列的不同位置处结合在GDS的末端处掺入的其他NLRT(例如,NLRT-C、-T或-G)。

本发明具有优于其他SBS方法的优点。标记的亲和试剂的去除不会留下化学“疤痕”,所述化学“疤痕”由在接头裂解后仍附着于dNTP的基团所致。这是有利的,因为这种“疤痕”可能降低通过聚合酶掺入dNTP的效率。此外,在该方法中,亲和试剂可以包括多个荧光单元,以及根据常用方法提供比附着于dNTP的单一荧光染料更强的信号。该方法还可以引起较少的光损伤,因为可以使用较低的激发功率或较短的曝光时间。本文公开的方法允许更长的高准确读数(例如,长于500个碱基或长于1000个碱基的读数)和/或长于50、100或200个碱基的更准确的读数(例如,具有在2000个碱基中少于一个的错误或在5000个碱基中少于一个的错误)。本发明的组合物和方法也可以比通常用于SBS的标记的可逆终止子(RT)方法更经济。未标记的RT成本低于标记的RT。在使用标记的RT的标准SBS中,使用高浓度的标记的RT来驱动完成RT的掺入,以及大多数标记的RT(70-99%或更多)不通过聚合酶掺入而被洗掉。使用较低成本的未标记RT因而降低此成本。此外,在本发明的标记步骤(其中使用标记的亲和试剂)中,不必要的是,阵列位点处的靶序列的每个拷贝通过亲和试剂结合,尤其是当亲和试剂用多个染料分子标记时(例如,每分子亲和试剂,平均2、3、4、5、至少2、至少3、至少4、至少5、2-5或3-5个染料分子)。例如,在阵列的一个位点处可存在模板序列的50个拷贝(例如,阵列上一个位点处的多联体可含有模板序列的50个拷贝)。在一种方法中,亲和试剂的一个分子用多个染料分子标记并且少于约50%的模板序列的拷贝由亲和试剂结合。在一些实施方案中,少于约30%、少于约25%、少于约20%或少于约15%的靶序列的拷贝由亲和试剂结合。如果亲和试剂仅带有单个标记分子(例如,50%或更多或70%),则可以优选更高水平的结合。

如本文所用,在核苷酸类似物的上下文中,术语“未标记的”和“非标记的”可互换使用。

如本文所用,除非从上下文另外显而易见,否则“非标记的可逆终止子[核苷酸]”、“NLRT”、“可逆终止子核苷酸”、“可逆终止子”、“RT”等均用于指代包括核碱基或类似物、脱氧核糖或类似物和可裂解的封端基团的测序试剂。非标记的可逆终止子核苷酸可以指dNTP(即,聚合酶的底物)或可逆终止子核苷酸,其最初在3'末端掺入引物延伸产物中,以及在附加的掺入循环(若有)后掺入引物延伸产物的“内部”部分。

如本文所用,“dNTP”包括天然存在的脱氧核糖核苷酸三磷酸及其类似物,包括具有3'-O可裂解的封端基团的类似物。

如本文所用,在核苷酸类似物的可裂解封端基团的上下文中,名称3'-O-“有时是隐含的而不是明确的。例如,术语“叠氮甲基”,“3'-O-叠氮甲基”是可互换的,这将从上下文中显而易见。

“扩增子”意指多核苷酸扩增反应的产物,即从一个或多个起始序列复制的多核苷酸群。扩增子可以通过多种扩增反应产生,包括但不限于聚合酶链反应(PCR)、线性聚合酶反应、基于核酸序列的扩增、滚环扩增和类似反应(参见,例如,美国专利4,683,195;4,965,188;4,683,202;4,800,159;5,210,015;6,174,670;5,399,491;6,287,824和5,854,033;以及美国专利公布2006/0024711)。

如本文所用的“抗原”意指可被抗体特异性结合的化合物。一些抗原是免疫原(参见,Janeway等人,Immunobiology,5th Edition,2001,Garland Publishing)。一些抗原是半抗原,其被抗体识别,但除非与蛋白质缀合,否则不引发免疫应答。示例性抗原包括NLRT、可逆终止子封端基团、dNTP、多肽、小分子、脂质或核酸。

“阵列”或“微阵列”意指具有表面(优选但不限于平坦或基本上平坦的表面)的固体支撑物(或固体支撑物的集合,诸如小珠),其携带包含核酸的位点的集合,使得集合的每个位点都是在空间上限定的,而不与阵列的其他位点重叠;也就是说,这些位点在空间上是离散的。阵列或微阵列还可以包括具有诸如珠或孔之类的表面的非平面可询问结构。阵列的寡核苷酸或多核苷酸可以与固体支撑物共价结合,或者它可以是非共价结合的。在例如Schena,Ed.(2000),Microarrays:A Practical Approach(IRL Press,Oxford)中回顾了传统的微阵列技术。如众所周知的,阵列通常容纳在流动池内。

如本文所用,“随机阵列”或“随机微阵列”是指其中寡核苷酸或多核苷酸的身份不可,或至少最初不可由其位置识别,但可通过对阵列进行的特定生物化学检测技术来确定的微阵列。

提及封端基团时的术语“可逆的”、“可去除的”和“可裂解的”具有相同的含义。

可逆终止子核苷酸的术语“可逆封端基团”也可称为“可去除的封端基团”、“可裂解接头”、“阻断部分”、“封端基团”、“可逆终止子封端基团”等。可逆封端基团是通常在糖部分的3'-O位置处附着于核苷酸糖(例如,脱氧核糖)的化学单元,其防止在该位置处通过聚合酶添加核苷酸。可逆封端基团可以通过酶(例如,磷酸酶或酯酶)、化学反应、热、光等裂解,以在核苷或核苷酸的3'-位置处提供羟基基团,使得可能发生通过聚合酶对核苷酸的添加。

“衍生物”或“类似物”意指这样的化合物或分子,其核心结构与母体化合物的核心结构相同或非常类似,但其具有化学或物理修饰,例如不同的或另外的侧基,或2'和/或3'封端基团,这允许衍生核苷酸或核苷与另一分子连接。例如,碱基可以是脱氮嘌呤。衍生物应该能够进行Watson-Crick配对。“衍生物”和“类似物”还指具有修饰的碱基单元和/或修饰的糖单元的合成核苷酸或核苷衍生物。这种衍生物和类似物在例如Scheit,NucleotideAnalogs(John Wiley&Son,1980)和Uhlman等人,Chemical Reviews 90:543-584,1990中讨论。核苷酸类似物还可包含修饰的磷酸二酯键合(linkage),包括硫代磷酸酯、二硫代磷酸酯、烷基-磷酸酯、亚磷酰胺和氨基磷酸酯键合。类似物应该能够进行Watson-Crick碱基配对。例如,脱氧腺苷类似物包括去羟肌苷(ddI)和阿糖腺苷,以及腺苷类似物包括BCX4430;脱氧胞苷类似物包括阿糖胞苷、吉西他滨、恩曲他滨(FTC)、拉米夫定(3TC)和扎西他滨(ddC);鸟苷和脱氧鸟苷类似物包括阿巴卡韦、阿昔洛韦和恩替卡韦;胸苷和脱氧胸苷类似物包括司他夫定(d4T)、替比夫定和齐多夫定(叠氮胸苷,或AZT);以及脱氧尿苷类似物包括碘苷和曲氟尿苷。如本文所用的“衍生物”、“类似物”和“修饰的”可互换使用,以及被本文定义的术语“核苷酸”和“核苷”涵盖。

“掺入”意指成为核酸分子的一部分。在SBS中,当聚合酶通过在一个核苷酸的戊糖的3'位置(即,DNA链上的3'核苷酸)和相邻核苷酸上戊糖的5'位置之间形成磷酸二酯或修饰的磷酸二酯键而向生长DNA链添加RT时,发生RT的掺入,即RT被添加到DNA链。

在标记的亲和试剂的上下文中,“标记”意指可用于提供可检测和/或可定量信号的任何原子或分子。合适的标记包括放射性同位素、荧光团、发色团、质量标记、电子致密颗粒、磁性颗粒、自旋标记、发射化学发光的分子、电化学活性分子、酶、辅因子和酶底物。在一些实施方案中,检测标记是含有带电基团的分子(例如,含有阳离子基团的分子或含有阴离子基团的分子)、荧光分子(例如,荧光染料)、发荧光分子或金属。任选地,检测标记是发荧光标记。发荧光标记可以是在未淬灭形式时(例如,当未被另一剂淬灭时)能够发光的任何标记。当被适当的激发波长激发时,荧光单元以特定的发射波长发射光能(即发荧光)。当荧光单元和淬灭剂单元紧密靠近时,荧光单元发射的光能被淬灭剂单元吸收。在一些实施方案中,发荧光染料是荧光素、罗丹明、吩噁嗪、吖啶、香豆素或其衍生物。在一些实施方案中,发荧光染料是羧基荧光素。合适的发荧光染料的其他示例包括Alexa[image]产品系列下(Life Technologies,Carlsbad,CA)可商购的发荧光染料。替代地,可以使用非发荧光标记,包括但不限于,氧化还原标记、还原标签、含硫代或硫醇的分子、取代或未取代的烷基、荧光蛋白、非荧光染料和发光蛋白。

“核碱基”是指可以与模板核酸的互补含氮碱基进行碱基配对的含氮碱基。示例性的核碱基包括腺嘌呤(A)、胞嘧啶(C)、鸟嘌呤(G)、胸腺嘧啶(T)、尿嘧啶(U)、肌苷(I)及其衍生物。本文中对胸腺嘧啶的提及应理解为同样提及尿嘧啶,除非从上下文中另外显而易见。如本文所用,术语“核碱基”、“含氮碱基”和“碱”可互换使用。

如本文所用,“天然存在的核碱基”意指腺嘌呤(A)、胞嘧啶(C)、鸟嘌呤(G)、胸腺嘧啶(T)或尿嘧啶(U)。在一些情况下,天然存在的核碱基是指A、C、G和T(在DNA中发现的天然存在的碱基)。

“核苷酸”由核碱基、糖和一个或多个磷酸基团组成。它们是核酸序列的单体单元(monomeric unit)。在RNA中,糖是核糖,而在DNA中,糖是脱氧核糖,即缺乏存在于核糖中的羟基基团的糖。含氮碱基是嘌呤或嘧啶的衍生物。嘌呤是腺嘌呤(A)和鸟嘌呤(G),以及嘧啶是胞嘧啶(C)和胸腺嘧啶(T)[或在RNA的情况下,是尿嘧啶(U)]。脱氧核糖的C-1原子与嘧啶的N-1或嘌呤的N-9结合。核苷酸也是磷酸酯或核苷,其中酯化发生在附着于糖的C-5的羟基基团上。核苷酸通常是单磷酸、二磷酸或三磷酸。“核苷”在结构上与核苷酸相似,但不包括磷酸酯单元。常用缩写包括针对脱氧核苷酸三磷酸的“dNTP”。

“核酸”意指核苷酸单体的聚合物。如本文所用,该术语可以指单链或双链形式。构成核酸和寡核苷酸的单体能够借助于单体-与-单体相互作用的规则模式(例如Watson-Crick类型的碱基配对、碱基堆积、Hoogsteen或反向Hoogsteen类型的碱基配对等)特异性结合天然多核苷酸,以形成双链体(duplex)或三链体形式。这种单体及其核苷间键合可以是天然存在的或可以是其类似物,例如天然存在的或非天然存在的类似物。非天然存在的类似物可包括肽核酸、锁核酸、硫代磷酸酯核苷间键合、含有允许标记附着的连接基团的碱基,例如荧光团或半抗原等。核酸的大小通常为几个单体单元(例如5-40个,这时它们通常称为“寡核苷酸”)乃至数十万或更多个单体单元。每当核酸或寡核苷酸由字母(大写或小写)序列表示时,例如“AGCT”,应理解的是,核苷酸从左到右为5'到3'顺序,以及“A”表示脱氧腺苷,“C”表示脱氧胞苷,“G”表示脱氧鸟苷,以及“T”表示胸苷,“I”表示脱氧肌苷,“U”表示尿苷,除非另有说明或从上下文中显而易见。除非另有指示,否则术语和原子编号惯例将遵循Strachan和Read,Human Molecular Genetics 2(Wiley-Liss,New York,1999)中公开的那些。通常,核酸包含通过磷酸二酯键连接的天然核苷(例如,针对DNA的脱氧腺苷、脱氧胞苷、脱氧鸟苷、脱氧胸苷或针对RNA的其核糖对应物);然而,它们也可包含非天然核苷酸类似物,例如修饰的碱基、糖或核苷间键合。对于本领域技术人员而言,当酶具有特定的寡核苷酸或核酸底物对活性的要求(例如单链DNA、RNA/DNA双链体等)时,则对适合寡核苷酸或核酸底物的组合物的选择在普通技术人员的知识范围内,在论文[例如Sambrook等人,Molecular Cloning,Second Edition(Cold Spring Harbor Laboratory,New York,1989)]和相似的参考文献的指导下尤其如此。

“引物”意指天然或合成的寡核苷酸,其在与多核苷酸模板形成双链体后能够充当核酸合成的起始点以及从其3'端沿着该模板延伸,以便形成扩展的双链体。在延伸过程中添加的核苷酸的序列通过模板多核苷酸的序列确定。通常引物通过DNA聚合酶延伸。引物通常具有9至40个核苷酸的长度,或在一些实施方案中,具有14至36个核苷酸。

“多核苷酸”与术语“核酸”可互换使用,以意指DNA、RNA以及杂合和合成的核酸,以及可以是单链或双链的。“寡核苷酸”是长度介于约6个和约300个核苷酸的短多核苷酸。“互补多核苷酸”是指与靶核酸互补的多核苷酸。

“固体支撑物”和“支撑物”可互换使用,并且是指具有一种或多种刚性或半刚性表面的材料或材料组。微阵列通常包含至少一种平面固相支撑物,例如显微镜载玻片。固体支撑物可包括具有固定位点或孔的有序或无序阵列。

多肽序列与参考序列之间的“同一性”百分比定义为如果需要,在比对序列并引入缺口以获得最大的序列同一性百分比后,多肽序列中与参考序列中氨基酸残基相同的氨基酸残基的百分比。对于短(例如,少于150个氨基酸)序列,可以对一对opf序列进行手工比对和目视检查以确定氨基酸序列同一性百分比。另选地,公开可用的计算机软件,诸如BLAST、BLAST-2、ALIGN、MEGALIGN(DNASTAR)、CLUSTALW或CLUSTAL OMEGA软件。在一些实施方案中,使用CLUSTAL OMEGA软件执行比对。本领域技术人员可确定用于比对序列的合适参数,包括在所比较的序列的全长上实现最大比对所需的任何算法。可例如通过以下方法进行序列的最佳比对以进行比较:Smith和Waterman的局部同源性算法(Adv.Appl.Math.2:482,1970),Needleman和Wunsch的同源性比对算法(J.Mol.Biol.48:443,1970),Pearson和Lipman的搜索相似性方法(Proc.Natl.Acad.Sci.USA85:2444,1988),这些算法的计算机化实施方式(例如,Wisconsin Genetics软件包中的GAP、BESTFIT、FASTA和TFASTA,Genetics ComputerGroup,575Science Dr.,Madison,Wis.),或手动比对和视觉检测(参见,例如,Ausubel etal.,Current Protocols in Molecular Biology(1995supplement))。

“保守取代”或“保守氨基酸取代”是指一个或多个氨基酸被一种或多种化学或功能上相似的氨基酸取代。提供相似氨基酸的保守取代表是本领域众所周知的。具有此类取代的多肽序列被称为“保守修饰的变体”。除了但不排除多肽变体,此类保守修饰的变体还为种间同系物和等位基因。在某些实施方案中,所选氨基酸组被认为是彼此的保守取代的。例如,在以下残基组内的取代是保守取代:1)丙氨酸(A),甘氨酸(G);2)天冬氨酸(D),谷氨酸(E);3)天冬酰胺(N),谷氨酰胺(Q);4)精氨酸(R),赖氨酸(K);5)异亮氨酸(I),亮氨酸(L),蛋氨酸(M),缬氨酸(V);6)苯丙氨酸(F),酪氨酸(Y),色氨酸(W);7)丝氨酸(S),苏氨酸(T);8)半胱氨酸(C),蛋氨酸(M)。附加的保守取代可见于例如,Creighton,Proteins:Structures and Molecular Properties 2nd ed.(1993)W.H.Freeman&Co.,New York,N.Y。相对于参考蛋白质具有保守取代的蛋白质可以被称为保守取代的变体。

如本文和所附权利要求中所使用的,单数形式“一”、“一种”和“该”包括复数指示物,除非上下文另有明确说明。因此,例如,提及“一种聚合酶”是指一种试剂或这些试剂的混合物,以及提及“该方法”包括提及本领域技术人员已知的等同步骤和/或方法。

除非另外定义,否则本文使用的所有技术和科学术语具有与本发明所属领域的普通技术人员通常理解的含义相同的含义。本文提到的所有出版物通过引用并入本文,以用于描述和公开在出版物中描述并且可以与本发明所述的结合使用的装置、组合物、制剂和方法。

在提供数值的范围的情况下,应理解的是,除非上下文另有明确规定,否则在该范围的上限和下限之间的每个中间值至下限单位的十分之一以及在所述范围内的任何其他所述或中间值被涵盖在本发明内。这些较小范围的上限和下限可以独立地被包括在较小范围内,也被涵盖在本发明内,受所述范围内任何特别排除限值的限制。在所述范围包括一个或两个限值的情况下,排除这些所含限值的一者或两者的范围也包括在本发明中。

在以下描述中,阐述了许多具体细节以提供对本发明的更透彻的理解。然而,对于本领域技术人员显而易见的是,可以在没有这些具体细节中的一个或多个的情况下实践本发明。在其他情况下,为了避免模糊本发明,没有描述本领域技术人员众所周知的公知特征和程序。

尽管主要参考特定实施方案描述了本发明,但是还可以设想,在阅读本公开时,其他实施方案对于本领域技术人员将变得显而易见,以及此类实施方案旨在包含在本发明方法内。

除非另有说明,否则本发明的实践可采用有机化学、聚合物技术、分子生物学(包括重组技术)、细胞生物学、生物化学和免疫学的常规技术和描述,这些技术和描述在本领域的技术范围内。这些常规技术包括聚合物阵列合成、杂交、连接(ligation)和使用标记的杂交检测。通过参考下文的示例可以得到对合适技术的具体说明。然而,当然也可以使用其他等同的传统程序。这些常规技术和描述可以在标准实验室手册中找到,例如GenomeAnalysis:A Laboratory Manual Series(Vols.I-IV),Using Antibodies:ALaboratoryManual,Cells:A Laboratory Manual,PCR Primer:A Laboratory Manual,以及MolecularCloning:A Laboratory Manual(全部来自Cold Spring Harbor Laboratory Press),Stryer,L.(1995)Biochemistry(4th Ed.)Freeman,N.Y.,Gait,"OligonucleotideSynthesis:A Practical Approach"1984,IRL Press,London,Nelson and Cox(2000),Lehninger,Principles of Biochemistry 3rd Ed.,W.H.Freeman Pub.,New York,N.Y.,以及Berg等人,(2002)Biochemistry,5th Ed.,W.H.Freeman Pub.,New York,N.Y.,所有这些文献通过引用整体并入本文以用于所有目的。

在各种实施方案中,根据本发明的SBS可使用非标记的可逆终止子(“NLRT”)(例如,具有封端基团的核苷酸类似物)、非标记的天然存在的核苷酸(例如,dATP、dTTP、dCTP和dGTP)或不包含封端基团的非标记的核苷酸类似物。

本发明的未标记的可逆终止子(“NLRT”)是在脱氧核糖的3’-OH位置处包含可去除的封端基团的核苷酸类似物。尽管已经描述了许多可逆终止子,以及可逆终止子广泛用于SBS,但是根据本发明使用的未标记的可逆终止子与商业用途的那些不同,因为它们是未标记的并且因为它们与下文描述的亲和试剂联合使用。在一个方面,本发明的NLRT是未标记的。在一个实施方案中,非标记意指NLRT不包含荧光染料。在一个实施方案中,非标记意指NLRT不包含化学发光染料。在一个实施方案中,非标记意指NLRT不包含发光单元。

在一些实施方案中,在将NLRT掺入DNA链之前,示例性NLRT具有以下结构I。

其中R

在将NLRT掺入DNA链之后,可以去除可逆封端基团R

核碱基R

核碱基R

R

在某些实施方案中,式I的R

应当理解,未掺入的NLRT核苷酸类似物适合作为具有DNA聚合酶活性的酶的底物,以及可以在3'末端处掺入DNA链中。例如,可逆封端基团具有的大小和结构应使得NLRT是至少一些DNA聚合酶的底物。NLRT的掺入可以通过末端转移酶、聚合酶或逆转录酶完成。可以采用用于测序的任何DNA聚合酶,包括例如来自嗜热球菌属的DNA聚合酶,例如9°N或其突变体,包括A485L,包括双突变体Y409V和A485L。如本领域已知,聚合酶在3'封端基团的性质方面具有高度判别性。因此,通常需要对聚合酶蛋白进行突变以促进有效掺入。可用于本发明的示例性DNA聚合酶和方法包括以下文献中所描述的那些:Chen,C.,2014,“DNAPolymerases Drive DNA Sequencing-By-Synthesis Technologies:Both Past andPresent”Frontiers in Microbiology,Vol.5,Article 305,Pinheiro,V.等人,2012“Polymerase Engineering:From PCR and Sequencing to Synthetic Biology”ProteinEngineering Handbook:Volume 3:279–302;国际专利公布WO2005/024010和WO2006/120433,每个文献通过引用并入以用于所有目的。在一些情况下,聚合酶是来自嗜热球菌属的DNA聚合酶,例如9°N或其突变体,包括A485L,包括双突变体Y409V和A485L。其他示例包括KOD聚合酶(Kitabayashi等人,2002.Biosci.Biotechnol.Biochem.66:10,2194;Fujii等人,1999.J.Mol.Biol.289:835)、Taq聚合酶、大肠杆菌DNA聚合酶I、DNA聚合酶I的Klenow片段、T7或T5噬菌体DNA聚合酶、HIV逆转录酶;Phi29聚合酶,以及Bst DNA聚合酶。

应理解,对封端基团的修饰不应干扰可逆终止子功能。也就是说,它们应该是可裂解的以产生3'-OH脱氧核糖核苷酸。

在一实施方案中,在将RT掺入DNA链之前,RT具有下面的结构II。

结构II

其中R

在一实施方案中,在将RT掺入DNA链之后,RT具有下面的结构III。

结构III

其中R

在另一个实施方案中,在掺入和去除可逆封端基团之后,RT具有结构IV。

结构IV

R

在结构I、III和IV的某些实施方案中,R

在给定端(例如3'端)存在多于一个末端核苷酸的应用中,可以使用各种方法来阻断非目的末端,例如通过不同的封端基团或使“污染”端附着于支撑物来阻断。例如,对于DNB测序,除了用于测序的3'端之外,可能还有其他3'端。在通过桥式PCR产生的PCR簇中,测序模板通过5'端附着,因此模板的3'端不能用RT延伸或修饰以防止与本文所述的分子结合剂结合。

用于本发明的NLRT可包括任何合适的封端基团。在一些实施方案中,合适的封端基团是可以通过化学或酶促处理去除以产生3'-OH基团的基团。化学处理不应显著降解模板或引物延伸链。已经描述了可逆终止子的3'封端基团的各种分子单元,所述3'封端基团例如3'-O-烯丙基基团(Ju等人,Proc.Natl.Acad.Sci.USA 103:19635–19640,2006)、3'-O-叠氮基甲基-dNTP(Guo等人,Proc.Natl Acad.Sci.USA 105,9145–9150,2008)、氨基烷氧基基团(Hutter等人,Nucleosides,Nucleotides and Nucleic Acids,29:879–895,2010)和3'-O-(2-氰基乙基)基团(Knapp等人,Chem.Eur.J.,17,2903–2915,2011)。示例性的RT封端基团包括-O-叠氮基甲基和-O-氰基乙烯基。其他示例性RT封端基团在图5和6中示出以用于说明而非限制。

在其他实施方案中,式I(上文)的R

多种3'-O可逆封端基团(式I中的R

如本文所用,术语“烷基”、“烯基”和“炔基”包括直链和支链一价取代基。示例包括甲基、乙基、异丁基、3-丁炔基等。可用于本文所述的化合物和方法的这些基团的范围包括C

“杂烷基”、“杂烯基”和“杂炔基”类似地定义为烷基、烯基和炔基,但可在骨架内含有O、S或N杂原子或其组合。可用于本文所述的化合物和方法的这些基团的范围包括C

本文使用的烷基、烯基、炔基、杂烷基、杂烯基或杂炔基分子可以是取代的或未取代的。如本文所用,术语取代的包括在附着于烷氧基、芳氧基、氨基、烷基、烯基、炔基、芳基、杂烷基、杂烯基、杂炔基、杂芳基、环烷基或杂环烷基的主链的位置上添加烷氧基、芳氧基、氨基、烷基、烯基、炔基、芳基、杂烷基、杂烯基、杂炔基、杂芳基、环烷基或杂环烷基基团,例如,用这些分子之一取代氢。取代基的示例包括但不限于羟基、卤素(例如F、Br、Cl或I)和羧基。相反,如本文所用,术语未取代的表示烷基、烯基、炔基、杂烷基、杂烯基或杂炔基具有完整的氢,即与其饱和水平相当,没有取代,例如,线性丁烷(-(CH

在其他实施方案中,可逆封端基团是含氨基的封端基团(例如,NH

在一些实施方案中,可逆封端基团是硝基苄基(C6H4(NO2)–CH2–)。在一些实施方案中,可逆封端基团是香豆素基(即,含有香豆素单元或其衍生物),其中,例如,香豆素基可逆封端基团的CH碳中的任何一个共价附着于核苷酸类似物的3'-O。

在一些实施方案中,可逆封端基团是硝基萘基(即,含有硝基萘单元或其衍生物),其中,例如,硝基萘基可逆封端基团的CH碳中的任何一个共价附着于核苷类似物的3'-O。

在一些实施方案中,可逆封端基团选自:

其中R

适用于本发明的其他可逆封端基团在文献中描述为标记的可逆终止子的封端基团。通常,用于合成测序的任何合适的可逆封端基团可用于本发明的实践中。

优选地,对于测序应用,RT的封端基团在不干扰被测序的DNA的完整性的反应条件下是可去除的。理想的封端基团将表现出长期稳定性,通过聚合酶有效掺入,导致对二级或进一步掺入的完全阻断,以及能够在不会对多核苷酸结构造成损害的温和条件下,优选在水性条件下去除。

在本发明的某些实施方案中,封端基团(包括脱氧核糖3'氧原子)具有的分子量(MW)小于200,通常小于190,通常小于180,通常小于170,通常小于160,通常小于150,通常小于140,通常小于130,通常小于120,通常小于110,有时小于100。换言之,在某些实施方案中,式I的R

脱氧核糖单磷酸核苷酸酯的分子量在约307至322的范围内(dAMP 331.2、dCMP307.2、dGMP 347.2和dTMP 322.2)。在某些实施方案中,NLRT单元在掺入GDS中时(即,不包括dNTP的焦磷酸酯)具有的分子量小于550,通常小于540,通常小于530,通常小于520,通常小于510,通常小于500,通常小于490,通常小于480,通常小于470,有时小于460。

在一些实施方案中,R

在一些方法中,根据本发明的SBS测序包括使测序阵列与多种NLRT(例如,NLRT-A、NLRT-T、NLRT-C和NLRT-G)接触。接触可以按顺序进行,每次一种NLRT。替代地,可以同时使四种NLRT与测序阵列接触,最常见的是作为四种NLRT的混合物。四种NLRT一起组成“NLRT组”。NRRT组的NLRT可以包装成混合物或者可以包装成试剂盒,所述试剂盒在单独的容器中包括每个不同NLRT。在四种NLRT的混合物中可以包括相等比例的或者可以包括不等量的每个碱基。NLRT组的一个实施方案成员(NLRT-A、NLRT-T、NLRT-C和NLRT-G)包含天然存在的核碱基和3’叠氮基甲基封端基团。

在一个实施方案中,NLRT组中的每种NLRT包含相同的封端基团(例如叠氮基甲基)。在一个实施方案中,NLRT组中的NLRT包含不同的封端基团(例如,NLRT-A包含叠氮基甲基,以及NLRT-T包含氰基乙烯;或NLRT-A和NLRT-G包含叠氮基甲基,以及NLRT-C和NLRT-T包含氰基乙烯基)。如果使用不同的封端基团,则任选地选择这种封端基团,使得可以通过相同的处理去除不同的封端基团。替代地,可以选择通过不同的处理,任选地在不同的时间去除封端基团。在一个实施方案中,一组中的一种或多种NLRT包含修饰的(非天然存在的)核碱基。

本文描述的NLRT可以以混合物的形式提供或使用。例如,混合物可含有两种、三种或四种(或更多种)结构不同的NLRT。结构不同的NLRT可以在它们各自的核碱基方面不同。例如,混合物可含有四种结构不同的NLRT,每种NLRT包含四种天然DNA核碱基(即腺嘌呤、胞嘧啶、鸟嘌呤和胸腺嘧啶)中的一种或其衍生物。

为了测序目的,NLRT组中的不同NLRT可以单独包装,然后在测序仪本身上混合(例如,在递送至流动池之前)或可以包装在一起(即预混合)。可以提供包含NLRT组(其中不同的NLRT被包装在单独容器中或作为混合物被包装在同一容器中)的试剂盒。

在一个实施方案中,核碱基包括不可去除的化学基团,当存在于生长DNA链的3'末端(即,作为最后掺入的碱基)时,所述化学基团增加亲和试剂对核碱基的特异性或亲和力,但是,引物延伸产物内部的核苷酸中的亲和试剂不能识别或不能接近所述化学基团。在一种方法中,修饰被亲和试剂识别或结合,但相对于3'末端核苷酸中的相同修饰,其亲和力较低或效率较低。

为了说明而非限制,这种修饰的核碱基的示例包括:

R

天然存在的核碱基的分子量是:腺嘌呤135;鸟嘌呤151、胸腺嘧啶126和胞嘧啶111。在一些实施方案中,核碱基类似物具有的分子量不超过天然碱基的分子量10、20、30、40、50、60、70、80、90或100Da。

在一个实施方案中,将天然dNTP(例如,dATP、dGTP、dCTP或dTTP)或不具有3'-O-封端基团的dNTP类似物用于测序。在一些实施方案中,核苷酸在测序过程(如在焦磷酸测序中)中一次一个地掺入,或通过聚合酶掺入,其在一个碱基掺入后暂停。在文献(见,例如,Ju等人,2006,Proc.Natl.Acad.Sci.USA 103:19635–40,2006;Guo,Proc.Natl Acad.Sci.USA105,9145–50,2008,以及Ronaghi等人,Science,281:363-365,1998)中描述了示例性方法,其可以通过去除将标记连接到RT的标记和/或接头进行修饰以用于本发明。在一些方法中,将具有不同核碱基的dNTP添加并按顺序掺入(例如,A,然后G等)。通常在添加下一个dNTP之前对核碱基进行单独成像。

在本发明的一些实施方案中,糖(脱氧核糖)单元被修饰。例如,使用识别封端基团和糖单元的亲和试剂,可以将具有核碱基腺嘌呤、封端基团叠氮基甲基和糖脱氧核糖的NLRT与具有核碱基胞嘧啶、封端基团叠氮基甲基和糖修饰的脱氧核糖的NLRT区分开。

在可用于若干应用的不同方面,使用具有不可去除(即不可裂解)的3'封端基团的核苷酸代替NLRT。在一种方法中,在用亲和试剂检测后,去除最后掺入的碱基,并将其位置填充相似但具有可裂解的封端基团的核苷酸(Koziolkiewicz等人,FEBS Lett.434:77-82,1998)。

上面给出的示例包括经由脱氧核糖糖单元的3'-O附着于核苷酸的可逆性封端基团。本发明还包括具有附着于脱氧核糖糖的2'-O-的可逆和不可逆封端基团的NLRT。这些实施方案可用于单碱基检测(单个或几个碱基引物延伸)、监测DNA中的空隙和缺口以及其他检测方法。因此,本领域普通技术人员将能够将本文的方法和信息应用于具有2'而不是3'的封端基团的NLRT。

本发明使用亲和试剂,所述亲和试剂例如,在SBS期间通过聚合酶掺入生长的DNA链的末端之后在GDS的3'端处特异性结合NLRT。在一个实施方案中,亲和试剂结合结构III的NLRT。在一个实施方案中,亲和试剂结合结构IV的NLRT。

在一个方面,本发明涉及用于检测在核酸的3'端处掺入的NLRT的存在或不存在的亲和试剂。亲和试剂是基于掺入的NLRT的结构特征特异性结合NLRT的分子或大分子。例如,亲和试剂可以特异性结合具有例如特定碱基和/或特定可逆封端基团的NLRT。

为了说明,亲和试剂的一个示例是单克隆抗体(mAb),当NLRT包含核碱基腺苷和叠氮基甲基可逆封端基团时,所述单克隆抗体以高度亲和力结合DNA链的3'端处掺入的NLRT。示例性亲和试剂包括抗体(包括抗体,单链抗体等的结合片段)、核酸适体、亲和物和结蛋白,如美国专利公布2018/0223358中所述。为了说明,亲和试剂的一个示例是单克隆抗体(mAb),当NLRT包含核碱基腺苷和叠氮基甲基可逆封端基团时,所述单克隆抗体以高度亲和力结合DNA链的3'端处掺入的NLRT,但当NLRT包含核碱基腺苷但具有3'羟基基团而不是叠氮基甲基可逆阻断剂时,不以高度亲和力结合在DNA链的3'端处掺入的NLRT,以及不以高度亲和力结合在DNA链的3'末端处掺入的NLRT,所述NLRT包含核碱基胞嘧啶、鸟嘌呤或胸腺嘧啶(各自具有或不具有叠氮基甲基可逆封端基团)。亲和试剂可以直接或间接标记。

“特异性”是亲和试剂判别不同分子(例如,NLRT)的程度,所述程度例如通过亲和试剂对分子的相对结合亲和力测得。关于本发明的亲和试剂,亲和试剂应当对一种NLRT(其靶RT)具有比对其他NLRT显著更高的亲和力(例如,亲和试剂结合C核苷类似物但不结合A、T或G)。此外,当通过聚合酶在生长DNA链的3'端处掺入时,亲和试剂结合多核苷酸末端的靶核苷类似物,但不结合DNA链上的其他位置处的核苷酸碱基。如果存在多个模板多核苷酸(例如模板多核苷酸阵列),其中GDS的3'-末端包括NLRT-A、NLRT-T、NLRT-C、NLRT-G(例如,以阵列),则亲和试剂对特定的NLRT(例如NLRT-A)具有特异性,亲和试剂在SBS测序中使用的反应条件下优先结合NLRT-A。如本文所用,与第二结构相比,亲和试剂与第一结构的“优先结合”意指亲和试剂结合第一结构但不结合第二结构或较弱地(即,以较低亲和力)或效率较低地结合第二结构。

在亲和试剂与掺入的NLRT结合的上下文中,术语“特异性结合”、“特异性地结合”等是指与具有不同核碱基(NLRT-T、NLRT-C或NLRT-G)、不同的封端基团或无封端基团(例如,具有3'-OH的脱氧腺苷)的NLRT相比,亲和试剂与特定NLRT的优先关联(例如,具有3'-O叠氮基基团的NLRT-A)。亲和试剂和NLRT之间的特异性结合有时意指至少10

亲和试剂(例如抗体)和掺入的可逆终止子脱氧核糖核苷酸之间的特异性结合相互作用可以以各种方式进行描述,包括参照负责特异性的掺入的可逆终止子脱氧核糖核苷酸的一部分或部分进行描述。在此比对是有用的:想象一下具有两个结构域(结构域1和结构域2)的蛋白质。两种不同的抗体可以特异性地结合该蛋白质。然而,它们可能识别不同的表位。例如,一个抗体可能结合结构域1中的表位,而第二抗体可能结合结构域2中的表位。在该假设中,如果在结构域1中进行修饰,这可能影响第一抗体对蛋白质的结合,而不改变第二抗体的结合。在这种情况下,第一抗体对蛋白质的结合可以说是“依赖于”结构域1,这意味着结构域1的变化(例如,氨基酸序列的变化)将改变抗体1的结合特性(例如,消除结合、增加结合亲和力、降低结合亲和力等)。等同地,结构域1可以说是“负责”抗体1的结合。在掺入的可逆终止子脱氧核糖核苷酸的情况下,结合的特异性可能是由于一个部分(例如,封端基团)的结构特征以及不受其他部分(例如核碱基)或者不受其他部分的结构的影响。替代地,结合的特异性可能是由于多个部分(例如,核碱基和封端基团)的结构特征等。当亲和试剂与掺入的可逆终止子脱氧核糖核苷酸的结合需要存在单元的特定结构特征时,亲和试剂的结合可以“特异于”或“基于”具有那些结构特征的单元的存在或不存在。等同地,具有那些结构特征的可以“负责”通过亲和试剂进行的结合,或者亲和试剂的结合可以“依赖于”具有那些结构特征的部分的存在。

还应注意,“特异性”可取决于环境。例如,想象一种结合A和A'但不结合B、C或D的亲和试剂。在含有A、A'、B和C的反应或样品中,亲和试剂可以结合A和A'两者,因此可能不被认为是“特异性地结合”A。但是,在含有A、B、C和D的反应或样品中,亲和试剂仅结合A,以及在该环境中将被称为特异性地结合A。在另一个示例中,在含有A、A'、B和C的样品中,亲和试剂可以以不同的亲和力或效率结合A和A',从而可以基于此区分对A的结合和对A'的结合。

另一个相关术语是“判别”(或有时是“区分”)。有一种亲和试剂,只有当存在特定的封端基团(例如叠氮基甲基)时所述亲和试剂才结合掺入的可逆终止子脱氧核糖核苷酸,但与具有叠氮基甲基封端基团的掺入的可逆终止子脱氧核糖核苷酸结合而不考虑存在什么核碱基,这种亲和试剂可以说是“判别”具有和不具有叠氮基甲基封端基团的掺入的可逆终止子脱氧核糖核苷酸,或者更广泛地,可以说是“基于封端基团判别”。

亲和试剂的特异性是用于制备亲和试剂的过程的结果。例如,可以用阳性和阴性结合测定来凭经验测试识别叠氮基甲基阻断部分的试剂。为了说明,在一种方法中,试剂是基于O-叠氮基甲基阻断部分的存在而结合NLRT的抗体。在一种方法中,使用与钥孔血蓝蛋白缀合的叠氮基甲基来培养对抗半抗原O-叠氮基甲基的抗体。可以选择所需的抗体用于与3'-O-叠氮基甲基-2'-脱氧鸟嘌呤结合,但对抗与其他脱氧鸟嘌呤核苷酸[诸如3'-O-2-(氰基乙氧基)甲基-2'-脱氧鸟嘌呤;3'-O-(2-硝基苄基)-2'-脱氧鸟嘌呤;和3'-O-烯丙基-2'-脱氧鸟嘌呤]的结合;以及对抗与其他叠氮基甲基NLRT(如3'-O-叠氮基甲基-2'-脱氧腺苷;3'-O-叠氮基甲基-2'-脱氧胞嘧啶;和3'-O-叠氮基甲基-2'-脱氧胸腺嘧啶)的结合。

抗体-半抗原相互作用的性质也可以使用本领域已知的方法确定,例如以下文献中所描述的那些方法:Al Qaraghuli,2015,“Defining the complementaritiesbetweenantibodies and haptens to refine our understanding and aid theprediction ofa successful binding interaction”BMC Biotechnology,15(1)p.1;Britta等人,2005,“Generation of hapten-specific recombinant antibodies:Antibody phage displaytechnology:A review”Vet Med.50:231–52;Charlton等人,2002.“Isolation of anti-hapten specific antibody fragments from combinatoriallibraries”Methods MolBiol.178:159–71;以及Hongtao等人,2014,“Molecular ModelingApplication onHapten Epitope Prediction:An Enantioselective Immunoassay forOfloxacinOptical Isomers”J.Agric.Food Chem.62(31)pp 7804–7812。应当理解,将亲和试剂描述为结合某些单元(例如,核碱基和糖单元)不排除与掺入的核苷酸的其他部分的结合。例如,结合核碱基和糖单元的亲和试剂也可以结合封端基团。

亲和试剂可以特异性识别靶NLRT中的核碱基、糖(例如脱氧核糖)、封端基团或任何其他部分或其组合。在一种方法中,亲和试剂识别包含封端基团的表位。在另一种方法中,亲和试剂识别包含核碱基的表位。在另一种方法中,亲和试剂识别包含核碱基和封端基团的表位。应当理解,即使亲和试剂不与部分接触,该部分也可以决定其他部分的位置。例如,对于基于核碱基和3'封端基团判别NLRT的亲和试剂,需要脱氧核糖部分定位核碱基和3'封端基团以进行识别。

在作为抗体的亲和试剂的情况下,可以使用本领域已知的任何抗体结合测定来确定特异性结合,所述测定包括蛋白质印迹、酶联免疫吸附测定(ELISA)、流式细胞术或柱层析法。在一种方法中,使用ELISA类型测定证明特异性结合。例如,针对3'-O-叠氮基甲基-dC(阳性特异性测定)和诸如3'-O-叠氮基甲基-dG或-dA或3'-OH-dC之类的核苷酸(阴性特异性测定),连续地滴定培养的对抗3'-叠氮基甲基-dC的血清抗体。

在一些实施方案中,亲和试剂对其靶核苷的碱特异性结合是与其他核苷或类似物的结合的2-100倍。在一些实施方案中,亲和试剂对其靶核苷的碱特异性结合是与其他核苷的结合的至少10倍,或至少30倍,或至少100倍。

优选的抗体与特定碱基的结合效率是低于100pM,或低于1nM,或低于10nM,或低于1μM的浓度。

可使用阳性选择(即,与靶分子结合)和阴性选择(即,不与不是靶分子的分子结合)选择具有所需特异性的亲和试剂。在亲和试剂为单克隆抗体的情况下,下文在“单克隆抗体的筛选和选择”部分介绍了一种选择方案。

亲和试剂既可结合溶液中的dNTP又可结合在引物延伸产物的3'末端处掺入的相应核苷酸。在一些实施方案中,亲和试剂不结合未掺入的NLRT(例如,溶液中的NLRT)或以显著更低的特异性结合。然而,一般而言,在测序过程中不会发生亲和试剂对未掺入的NLRT的结合,因为在引入亲和试剂之前去除(洗掉)了未掺入的NLRT。替代地,在成像之前去除(洗掉)由与NLRT结合的亲和试剂形成的复合物。

在一种方法中,亲和试剂特异性地结合核碱基,以及部分地基于3'-OH基团的存在或不存在来区分不同的碱基(例如,A、T、G、C)。在该方法中,亲和试剂将GDS的3'端的核苷酸与来自GDS内部(不是3'端)的掺入的核苷酸的3'-OH区分开。在一些情况下,识别特定核碱基的亲和试剂还区分3'-OH基团的存在或不存在,从而将掺入的NLRT识别为具有特定核碱基的3'末端核苷酸。

在一种方法中,亲和试剂识别包含封端基团的表位但不区分碱基。例如,给定四种RT封端基团[A.叠氮基甲基,B.2-(氰基乙氧基)甲基,C.3'-O-(2-硝基苄基),以及D.3'-O-烯丙基],可以制备区分这四种封端基团的亲和试剂。为了说明,给定下面标记为A至D的脱氧鸟嘌呤类似物,可以选择仅识别一种NLRT而不识别其他三种NLRT的亲和试剂。

A.3'-O-叠氮基甲基-2'-脱氧鸟嘌呤

B.3'-O-2-(氰基乙氧基)甲基-2'-脱氧鸟嘌呤

C.3'-O-(2-硝基苄基)-2'-脱氧鸟嘌呤

D.3'-O-烯丙基-2'-脱氧鸟嘌呤

在一些实施方案中,所选择的亲和试剂不区分具有不同核碱基的核苷酸,只要这些核苷酸具有相同的封端基团。例如,识别上述B(3'-O-2-(氰基乙氧基)甲基-2'-脱氧鸟嘌呤)的亲和试剂也可识别3'-O-2-(氰基乙氧基)甲基-2'-脱氧腺嘌呤;3'-O-2-(氰基乙氧基)甲基-2'-脱氧胸腺嘧啶;以及3'-O-2-(氰基乙氧基)甲基-2'-脱氧胞嘧啶。

尽管上述示例描述了其中四种核苷酸具有结构差异非常大的不同封端基团(例如,叠氮基甲基对比2-(氰基乙氧基)甲基)的实施方案,但在本发明的一些实施方案中,由不同的亲和试剂结合的封端基团之间仅存在小的差异。例如,在封端基团中,氢原子可以被氟原子或甲基基团取代,以生成可以通过亲和试剂组区分的三种相关的封端基团[封端基团、F取代基封端基团、甲基取代的封端基团]。

在本发明的一些实施方案中,使用四种NLRT进行测序,每种NLRT都具有3'-O-封端基团,其中2个或更多个,替代地3个或更多个,替代地全部4个的封端基团在以下意义上是结构上类似的:(1)它们具有相同数量的原子或原子数相差不超过一个小数目(例如,1、2、3、4、5、6、7、8、9或10);(2)封端基团单元的分子式相差1至10个原子(例如,有3处差异:单个H被CH

在一些实施方案中,亲和试剂结合NLRT(例如,3'-O-叠氮基甲基-2'-脱氧鸟嘌呤)但不结合相应的未阻断的核苷酸(例如,3'-OH-2'-脱氧鸟嘌呤)。

在一个实施方案中,亲和试剂结合NLRT(例如,3'-O-叠氮基甲基-2'-脱氧鸟嘌呤),但在处理后(例如,在用TCEP(三(2-羧乙基)膦)处理后)与核苷酸类似物解离以去除封端基团。

将特异性识别NLRT-A的亲和试剂称为抗A。特异性识别NLRT-T的亲和试剂称为抗T。特异性识别NLRT-G的亲和试剂称为抗G。特异性识别NLRT-C的亲和试剂称为抗C。特异性识别NLRT-U的亲和试剂称为抗U。尽管该命名法类似于用于描述免疫球蛋白特异性的命名法,但是本发明中该术语的使用并不意在指示亲和试剂必须是抗体。

可以直接标记亲和试剂。替代地,亲和试剂可以是使用标记的二级亲和试剂可检测的未标记的初级亲和试剂。例如,可以用结合初级亲和试剂的标记的二级亲和试剂(例如,结合初级亲和试剂的标记抗体)检测特异性结合NLRT的未标记的初级亲和试剂。

在一些实施方案中,亲和试剂是抗体。可以采用本领域已知的任何用于产生抗体的方法。

如本文所用,“抗体”意指免疫球蛋白分子或组合物(例如,单克隆和多克隆抗体),以及基因工程形式,例如嵌合抗体和本文所述的其他抗体。

免疫球蛋白G分子是具有两个重链和两个轻链的四聚体。重链和轻链包含恒定区和可变区(VH和VL)。VH和VL区可进一步细分为高变区(高变区(HVR),也称为互补决定区(CDR)),其间散布着更为保守的区域。保守性更高的区域称为框架区域(FR)。每个VH和VL通常包含三个CDR和四个FR,它们按以下顺序排列(从N端到C端):FR1-CDR1-FR2-CDR2-FR3-CDR3-FR4。CDR参与抗原结合,并赋予抗原特异性和对抗体的结合亲和力。参见,Kabat等人,(1991)Sequences of Proteins of Immunological Interest 5th ed.,Public HealthService,National Institutes of Health,Bethesda,MD.)重链(VH)上的CDR序列可被指定为CDRH1、2、3,然而轻链(Vv)上的CDR序列可被指定为CDRL1、2、3。

抗体可以来自重组来源和/或在动物(包括但不限于转基因动物)体内产生。如本文所用,术语“抗体”包括“抗体片段”,包括但不限于Fab、Fab'、F(ab')2、scFv、dsFv、ds-scFv、二聚体、微抗体、纳米抗体、双抗体,以及其多聚体,以及双特异性抗体片段。可以使用常规技术将抗体片段化。例如,通过用胃蛋白酶处理抗体可以生成F(ab')

抗体可以是嵌合抗体,其中重链和/或轻链的一部分衍生自特定来源或物种,然而重链和/或轻链的其余部分衍生自不同来源或物种。CDR接枝的抗体包含来自一个来源(例如兔子)的CDR序列和来自不同来源(例如山羊)的框架残基。例如,来自兔IgG的CDR可被剪接至小鼠抗体框架或支架中。为了说明,抗体可以是非人抗体的“人源化”形式。人源化抗体是嵌合抗体,其包含源自非人抗体的最小序列。人源化抗体通常是人免疫球蛋白(受体抗体),其中来自一个或多个CDR的残基被来自非人类抗体(供体抗体)的一个或多个CDR的残基替代。供体抗体可以是任何合适的非人抗体,例如具有所需特异性、亲和力或生物学效应的小鼠、大鼠、兔、鸡或非人灵长类抗体。在一些情况下,受体抗体的所选框架区残基被来自供体抗体的相应框架区残基代替。人源化抗体还可包含在受体抗体或供体抗体中均未发现的残基。可以进行此类修饰以进一步改善抗体功能。对于更多细节,参见Jones等人,Nature,1986,321:522-525;Riechmann等人,Nature,1988,332:323-329;以及Presta,Curr.Op.Struct.Biol.,1992,2:593-596,其各自以引用方式全文并入。人源化抗体主要用于治疗用途,在测序方面没有独特价值。这里讨论它们以说明它们可以对抗体进行的修饰类型。可制备相似的嵌合抗体,其中供体抗体和受体抗体都是非人类的。

在一些实施方案中,亲和试剂是微抗体。其他抗体结合部分包括在单个多肽链中包含VH结构域和VL结构域的“单链Fv”或“sFv”或“scFv”片段。VH和VL通常通过肽接头连接。参见,Pluckthun A.(1994).Antibodies from Escherichia coli in Rosenberg M.&Moore G.P.(Eds.),The Pharmacology of Monoclonal Antibodies vol.113(pp.269-315),Springer-Verlag,New York,其以引用方式全文并入。在一些实施方案中,接头可以为单个氨基酸。在一些实施方案中,接头可以为化学键。

微抗体是工程化单链抗体构建体,其由与免疫球蛋白分子的铰链区和CH3结构域融合的天然抗体的可变重链(VH)和可变轻链(VL)结构域组成。因此,微抗体是在单个蛋白质链中编码的完整抗体的小版本,其保留了抗原结合区、CH3结构域以允许组装成二价分子并允许抗体铰链适应通过二硫键合的二聚化。也可以使用单结构域抗体(sdAb)。单结构域抗体或NANOBODY(Ablynx)是具有单个单体可变抗体结构域的抗体片段。参见,Holt等人,Trends in Biotechnol.,2003,21:484-490,其以引用方式全文并入。单结构域抗体选择性结合特异性抗原,以及比常规抗体更小(MW为12-15kDa)。其他抗体结合部分包括重链抗体。“重链抗体”是指包含至少两条重链并且缺乏轻链的抗体。参见,Harmesen等人,AppliedMicrobiology and Biotechnology,77:13-22,2007;以及Hamers-Casterman等人,Nature,1993,363:446-448;其各自以引用方式全文并入。其他抗体结合部分包括天然不含轻链的抗体,衍生自常规4-链抗体的单结构域抗体、工程化抗体以及不同于衍生自抗体的那些的单结构域支架。单结构域抗体可以为任何本领域的抗体,或任何未来的单结构域抗体。单域抗体可以衍生自任何物种,包括但不限于小鼠、大鼠、豚鼠、猪、人、骆驼、美洲驼、鱼、鲨鱼、山羊、兔和牛。单结构域抗体描述于例如国际申请公布WO 94/04678中。其他的抗体结合部分包括Masat等人,Proc.Natl.Acad.Sci.USA,1994,91:893-896中提供的单轻链抗体。

其他亲和试剂包括“替代支架”,诸如衍生自纤连蛋白(例如,Adnectins

另外,可使用直接将重组抗体片段(例如,单链Fv片段(scFv))与报道蛋白连接的融合体(Skerrah和Plückthun,Science 240:1038-1041,1988;Bird等人,Science 242:423-426,1988;Huston等人,Methods Enzymol 203:46-88,1991;Ahmad等人,Clin.Dev.Immunol.2012:1,2012)。例如,具有生物发光特性的光蛋白,例如荧光素酶和水母发光蛋白,可以用作具有例如抗体片段、表位肽和抗生蛋白链菌素的融合蛋白中的报告蛋白(Oyama等人,Anal Chem 87:12387-12395,2015;Wang等人,Anal Chim Acta 435:255-263,2001;Desai等人,Anal Biochem 294:132-140,2001;Inouye等人,Biosci BiotechnolBiochem 75:568-571,2011)。例如,Morino等人(J.Immunol.Methods 257:175-184,2001)描述了与绿色荧光蛋白(GFP)或红色荧光蛋白(RFP)融合的单链Fv-CL片段的融合体,并且Luria等人(mAbs 4:3,373-384,2012)描述了与Superfolder GFP(SFGFP)和mCherry融合的全长IgG抗体在抗原结合中发挥功能,并保持荧光强度,并另外将多个SFGFP与每个IgG串联连接,其中荧光强度相应增加。

用于培养多克隆抗体的方法是已知的,以及可以用于产生NLRT特异性抗体。一种方法参见WO 2018/129214的实施例2。根据一种培养对特定NLRT(例如NLRT-A)特异性的多克隆抗体的方法,给兔注射NLRT-A(与免疫原缀合)以培养抗体,以及将抗体选择成不结合:缺少封端基团(例如,具有3'-OH)和其他NLRT(NLRT-T、NLRT-G和NLRT-C)的相同结构。因此,所产生的多克隆抗体在测序阵列上的特定位置处识别出在生长DNA链的3'端处掺入的特异性NLRT,而不是在生长链的其他内部位置处的相同的核苷或可以在阵列的其他位置处掺入的其他NLRT。(多克隆抗体也可以识别未掺入的NLRT-A,但是未掺入的NLRT在使用标记的亲和试剂探测掺入的NLRT之前已被洗掉)。

应当认识到,根据研究者的需要,并不总是需要培养对抗整个NLRT的抗体。例如,如果需要对封端基团有特异性的抗体,则半抗原可以是具有3'-O-封端基团(即,无核碱基)或仅具有3'-O-封端基团的脱氧核糖。在一些实施方案中,培养对抗在3'端处的感兴趣的NLRT的多核苷酸的抗体。在一些实施方案中,培养对抗退火到模板分子的多核苷酸的抗体。

例如,为了产生单克隆抗体,可以从用包含NLRT的免疫原免疫的动物收获抗体产生细胞(淋巴细胞),以及通过标准体细胞融合方法与骨髓瘤细胞融合,从而使这些细胞永生化并收获杂交瘤细胞。这些技术是本领域熟知的(例如,最初由Kohler和Milstein开发的杂交瘤技术(Kohler和Milstein Nature 256:495-497,1975),以及其他技术,例如人B-细胞杂交瘤技术(Kozbor等人,1983,Immunol.Today 4:72)、用以产生人单克隆抗体的EBV-杂交瘤技术(Cole等人,1986,Methods Enzymol,121:140-67),以及组合抗体文库的筛选(Huse等人,1989,Science 246:1275))。杂交瘤细胞可以经免疫化学筛选以产生与特定RT特异性反应的抗体,以及可以分离单克隆抗体。单克隆抗体的体外生产可以使用本领域已知的方法进行。参见,例如,Li,N.等人,MAbs.2,466–477(2010);Shukla,A.&J.

对特定抗原或分子具有反应性的特异性抗体或抗体片段还可以通过筛选编码免疫球蛋白基因或其部分的表达文库来生成,所述免疫球蛋白基因或其部分在具有细胞表面组分的细菌中表达。例如,可以使用噬菌体表达文库在细菌中表达完整的Fab片段、VH区和FV区(参见,例如Ward等人,Nature 341:544-546,1989;Huse等人,Science 246:1275,1989;以及McCafferty等人,Nature 348:552-554,1990)。

另外,通过筛选抗体噬菌体展示文库容易地分离对靶NLRT特异的抗体。例如,任选地通过使用以鉴定对靶NLRT特异的抗体片段来筛选抗体噬菌体文库。用于筛选抗体噬菌体文库的方法是本领域熟知的。

抗NLRT抗体也可以在无细胞系统中产生。例如,在Sitaraman等人,MethodsMol.Biol.498:229-44,2009;Spirin,Trends Biotechnol.22:538-45,2004;以及Endo等人,Biotechnol.Adv.21:695-713,2003中描述了非限制示例性无细胞系统。

可以通过任何合适的方法纯化抗NLRT抗体。这种方法包括但不限于使用亲和基质和/或柱层析(例如,亲和色谱、疏水相互作用色谱、尺寸排阻色谱和离子交换色谱)。在一种方法中,使用Ig结合蛋白(例如蛋白A、蛋白G、蛋白A/G和蛋白L)进行的亲和纯化可固定在树脂上,并用于纯化感兴趣的抗体。

由本公开内容指导的普通技术人员将能够针对在脱氧核糖的3'-OH处具有封闭部分的任何所需的NLRT(例如,NLRT-A、NLRT-T、NLRT-C、NLRT-G)产生多克隆抗血清。在一种方法中,如实施例1和US 2018/0223358中所述,每两周用KLH抗原免疫测试动物(例如兔)并持续3个月。免疫后一周收集血清,并通过针对靶(例如,NLRT-A)和非靶(例如,NLRT-T、NLRT-C、NLRT-G)抗原的ELISA进行测试以确定抗体应答。脾细胞得自产生良好特异性反应的动物。测试脾细胞与靶标NLRT-A的结合。例如,可以使用生物素化的NLRT-A通过荧光链霉亲和素检测,通过FACS对脾细胞进行分选,从而从单个细胞中创建培养菌落板。具有零或一种磷酸盐的核苷酸类似物可以用于免疫和/或FACS分选步骤。

通过ELISA针对这些靶和非靶抗原测试来自这些单细胞培养物的上清液。在一种方法中,针对结合至ELISA板的孔的靶和非靶BSA-NLRT测试上清液(参见,WO 2018/129214的图9)。在第二种方法中,进行阳性和阴性ELISA筛选,其中ELISA靶抗原是一种复合物,该复合物包含固定的模板DNA,该模板DNA与延伸引物杂交,并在延伸引物的3’末端处掺入了靶(用于阳性筛选)或非靶(用于阴性筛选)NLRT。该复合物是部分双链体,因此模板链延伸超出了3'引物末端,从而模拟了测序中产生的DNA结构。在一种方法中,通过将3'生物素化的DNA模板固定在链霉亲和素包被的表面(例如ELISA板的孔)上,杂交引物,并掺入NLRT,来形成用于筛选的复合物。通过在掺入步骤中使用不同的引物,可使用相同的模板筛选不同的核苷酸特异性。在一种相关的方法中,发夹寡核苷酸(在环状部分进行了生物素化,用于荧光链霉亲和素检测)在3'末端将可逆终止子掺入发夹的双链体中,并用于结合测定。在另一种方法中,与模板杂交的生物素化引物可用于添加3'-NLRT。可除去模板(例如,通过变性),并在链霉亲和素上捕获引物。该所得结构可用于筛选以模拟部分变性的DNA末端。

选择高性能的脾细胞克隆,并使用IgG编码序列克隆和表达抗体。一种方法是将序列克隆到线性表达模块(LEM)中,以转染到HEK细胞系(HEK细胞)中,然后将有生产能力的LEM克隆到质粒中,以转染和产生纯化的抗体。可进一步改变选择的抗体,例如以例如通过亲和力成熟来改善对靶标的亲和力。参见,Marks等人(Bio/Technology,1992,10:779-783),其描述了通过VH和VL结构域混编的亲和力成熟。还参见,Barbas等人,(Proc.Nat.Acad.Sci.USA.,1994,91:3809-3813(描述了CDR和/或框架残基的随机诱变)。

如实施例中所述产生示例性兔抗NLRT抗体。本文讨论了多个特异性结合到靶NLRT的单克隆抗体,其包括但不限于对3'-叠氮基甲基dA(N3A)具有特异性的单克隆抗体:mAb2C5、3B12、17H7和18B7;和对3'-叠氮基甲基dC(N3C)具特异性的单克隆抗体:mAbs 1B8、2B9、4C8、1A10和3B7;对3’-叠氮基甲基dG(N3G)具有特异性的单克隆抗体:mAbs3G6、5F6、4B8、4G8和7C8;以及对3’-叠氮基甲基dT(N3T)具有特异性的单克隆抗体:mAbs 2D4、2D10、1F9和3B7。重链和轻链(包括信号肽)的氨基酸序列在图1A-H和下表2中提供。

表2

显然,抗体链名称可以读作N3X_ABC_Y,其中X是核碱基特异性(例如,A、T、G或C),ABC是抗体名称,Y表示重(H)或轻(L)链序列。还应认识到,可以产生具有共同名称(ABC)的重链和轻链,作为杂二聚体(H-L)或任选与抗体恒定区结合的H-V二聚体。抗体链序列1-36包括信号肽。将认识到,成熟的抗体将不包括信号肽序列。

亲和试剂可选自以上公开的抗体或此类抗体的衍生物。在某些情况下,使用mAb18B7(A)、4G8(C)、7C8(G)和2D10(T)。可以使用具有适当的特异性组合的所有其他组合或子组合。通常,将对A、T、G和C具有特异的mAb一起使用。但是,可以使用其他组合;例如,在某些方法中,仅使用三种亲和试剂或仅使用三种标记的亲和试剂,而省略一种亲和试剂(因此,没有信号识别3'末端碱基)。

其他有用的亲和试剂包括与选自mAb 2C5、3B12、17H7、18B7、1B8、2B9、4C8、1A10、3B7、3G6、5F6、4B8、7C8、2D4、2D10、1F9、3B7和4G8的亲和试剂竞争对靶结构的结合的抗体(或其他亲和试剂)。在上下文中,“靶结构”是指在链霉亲和素包被的表面(例如,ELISA板的孔)上的3'生物素化DNA模板,其与在末端掺入NLRT核苷酸的引物杂交,如上文抗体筛选的情况下所讨论的。竞争测定法可用于鉴定结合相同表位的抗体对(或结合重叠或靠在一起的表位)。因此,当在本文中在两种或更多种亲和试剂的上下文中使用时,术语“与……竞争”表示两种或更多种亲和试剂竞争与靶抗原的结合。竞争性结合测定法是众所周知的(参见,例如,Junghans等人,Cancer Res.50:1495,1990)。在一种示例性测定中,“参考mAb”中的一种(mAb 2C5、3B12、17H7、18B7、1B8、2B9、4C8、1A10、3B7、3G6、5F6、4B8、7C8、2D4、2D10、1F9、3B7或4G8)允许其与靶抗原结合(例如,以ELISA形式或测序阵列),并将候选亲和试剂添加至靶抗原。如果候选物的存在降低了参考mAb的结合,则候选亲和试剂将与参考mAb竞争。在一些实施方案中,候选物的存在将结合降低等摩尔量的参考mAb至不超过不存在候选物的情况下的结合的50%(即,候选物将参考结合降低一半)。在某些情况下,候选物抑制与参考mAb的结合至少50%,有时至少75%或至少90%。在另一种竞争测定中,将参考mAb固定在基质上,并添加各种浓度的候选物和可溶性靶抗原,以检测和测量竞争。在这种情况下,可溶性抗原可以是发夹寡核苷酸(在环状部分中进行了生物素化,用于荧光链霉亲和素的检测),如上所述,在3'末端将可逆终止子掺入发夹的双链体中。因此,在本发明的一方面,如本文所述确定测序,其中至少一种亲和试剂是与mAbs 2C5、3B12、17H7、18B7、1B8、2B9、4C8、1A10、3B7、3G6、5F6、4B8、7C8、2D4、2D10、1F9、3B7或4G8中的一者竞争的亲和试剂(例如抗体)。在一些实施方案中,至少三种或至少四种亲和试剂与这些mAb中的一者竞争。

在一些实施方案中,亲和试剂是抗体或其抗原结合部分,其包含重链可变区和/或轻链可变区,该重链可变区包含与SEQ ID NO:1、3、5、7、9、11、13、15、17、19、21,23、25、27、29、31、33中的任一者(任选地不包括信号肽,例如氨基末端约19个氨基酸)至少90%相同(例如,至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同)的氨基酸序列,该轻链可变区包含包含与SEQ ID NO:2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34或36中的任一者(任选地不包括信号肽,例如氨基末端约22个氨基酸)至少90%相同(例如,至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同)的氨基酸序列。

如上所述,可使用来自已知特异性的供体抗体的CDR序列来制备抗体变体。例如,单克隆抗体序列可用于产生嵌合或CDR移植的抗体,例如,通过将一种抗体的可变区与另一种抗体的恒定区结合,或通过重组DNA技术将供体抗体的互补决定区(CDR)片段插入受体抗体支架中(在Almagro和Fransson,Frontiers in Bioscience 13,1619-1633,2008中进行综述),同时保留了原始单克隆抗体的特异性。

CDR的氨基酸序列边界可由本领域技术人员使用许多已知的编号方案中的任一种来确定,包括由下列所述的那些:Kabat等人,supra(“Kabat”numbering scheme);Al-Lazikani等人,1997,J.Mol.Biol.,273:927-948(“Chothia”numbering scheme);MacCallum等人,1996,J.Mol.Biol.262:732-745(“Contact”numbering scheme);Lefranc等人,Dev.Comp.Immunol.,2003,27:55-77(“IMGT”numbering scheme);以及Honegge和Plückthun,J.Mol.Biol.,2001,309:657-70(“AHo”numbering scheme),其各自以引用方式全文并入。

下表3提供了表2中列出的抗体重链和轻链的CDR序列。如上所述,CDR赋予了抗原特异性和对抗体的结合亲和力,这些CDR序列可以掺入嵌合的人源化抗体、单链抗体、纳米抗体和上述其他抗体。

技术人员将认识到,表3为18个轻链和18个重链中的每一个鉴定了三个CDR序列,其对应于包含2个轻可变区和2个重可变区(VH-VL二聚体)的组合的18个四链抗体。来自同一mAb的重链和轻链的每种组合都可以称为“同源集”。本发明涵盖包含表3中一个或多个CDR序列的相关亲和试剂(例如,单链抗体)。特别地,本发明涵盖包含来自表3中重链或轻链的三个相应CDR的亲和试剂。来自同一IgG链的三个CDR的每组称为“对应集”。另外,本发明涵盖包含来自18种所列抗体的六个CDR序列的亲和试剂。此外,本发明包括在本文所述的测序方法中使用此类亲和试剂。在一个方面,本发明包括使用3或4种亲和试剂的组合,每种亲和试剂包含赋予不同核苷酸类似物(即A、T、G或C)特异性的CDR序列。

在一方面,本发明包括亲和试剂(例如,抗体或其抗原结合部分),其包括:重链可变区,其包括相应的CDR组,包括(i)VH CDR1,(ii)VH CDR2,(iii)VH CDR3。例如,具有包含SEQ ID No:37、74和80的CDR的重链可变区。

在一方面,本发明包括亲和试剂(例如,抗体或其抗原结合部分),其包括:轻链可变区,其包括相应的CDR组,包括(i)VL CDL1;(ii)VL CDL2;(iii)VL CDL3。例如,具有包含SEQ ID No:85、90和95的CDR的轻链可变区。

在一个方面,本发明包括亲和试剂,该亲和试剂包含重链可变区,该重链可变区包括相应的CDR组,其包括(例如,抗体或其抗原结合部分),包括:轻链可变区,该轻链可变区包括相应的CDR组,包括(i)VL CDL1;(ii)VL CDL2;(iii)VL CDL3。例如,具有包含SEQ IDNo:85、90和95的CDR的轻链可变区。

可以可检测地标记用于本发明实践的亲和试剂,包括抗体、适体、亲和物(Affimer)、结蛋白(Knottin)和本文所述的其他亲和试剂。例如,本文所述的亲和试剂可用荧光染料或荧光团可检测地标记。“荧光染料”意指荧光团(吸收特定波长的光能并重新发射更长波长的光的化合物)。荧光染料通常在约300nm至约1,000nm或至少约5,000,更优选至少约10,000,以及最优选至少约50,000cm-1M-1的波长下具有最大摩尔消光系数,以及具有至少约0.05,优选至少约0.1,更优选至少约0.5,以及最优选约0.1至约1的量子产率。下面描述用于标记适应多个染料分子的亲和试剂的标记策略。

在文献中有大量实用指导可用于选择适当的可检测标记以附着于亲和试剂,如下列参考资料所例示的:Grimm等人,Prog.Mol.Biol.Transl.Sci.113:1-34,2013;Oushiki等人,Anal.Chem.84:4404-4410,2012;Medintz&Hildebrandt编辑,2013,“FRET–

示例性荧光染料包括但不限于吖啶染料、花青染料、荧光染料、噁嗪染料、菲啶染料和罗丹明染料。示例性荧光染料包括但不限于荧光素、FITC、德克萨斯红、ROX、Cy3、AlexaFluor染料(例如Alexa Fluor 647或488)、ATTO染料(例如ATTO 532或655)和Cy5。示例性荧光染料还可包括在两通道或四通道SBS化学品和工作流程中使用或与之相容的染料。示例性标记分子可选自氧杂蒽染料(包括荧光素)和罗丹明染料。这些化合物的许多合适形式普遍是可商购的,它们的苯基部分上具有取代基,其可用作连接到亲和试剂的位点。另一组荧光化合物是萘胺,其在α或β位置中具有氨基基团。这些萘氨基化合物中包括1-二甲基氨基萘基-5-磺酸盐、1-苯胺基-8-萘磺酸盐和2-对-甲苯胺基-6-萘磺酸盐。其他标记包括3-苯基-7-异氰酸酯香豆素;吖啶,如9-异硫氰酸酯吖啶和吖啶橙;N-(对-(2-苯并噁唑基)苯基)马来酰亚胺;苯并噁二唑基;芪类;芘类;等等。在一些实施方案中,标记选自荧光素和罗丹明染料。这些染料和适当的连接方法描述于许多参考文献中,例如Khanna等人(如上所述);Marshall,Histochemical J.,7:299-303(1975);Menchen等人,美国专利5,188,934;Menchen等人,欧洲专利申请87310256.0;以及Bergot等人,国际申请PCT/US90/05565。可用作亲和试剂或核苷类似物的可检测标记的荧光团包括但不限于罗丹明、花青3(Cy 3)、花青5(Cy 5)、荧光素、Vic

通过明智地选择标记,可以进行分析,其中在单个反应中以不同波长激发和/或检测不同标记。参见,例如,荧光光谱学(Pesce等人,Eds.)Marcel Dekker,New York,(1971);White等人,Fluorescence Analysis:APractical Approach,Marcel Dekker,New York,(1970);Berlman,Handbook of Fluorescence Spectra of Aromatic Molecules,2nded.,Academic Press,New York,(1971);Griffiths,Colour and Constitution ofOrganicMolecules,Academic Press,New York,(1976);Indicators(Bishop,Ed.).PergamonPress,Oxford,1972;以及Haugland,Handbook of Fluorescent Probes andResearchChemicals,Molecular Probes,Eugene(2005)。

在一种方法中,对亲和试剂(例如,抗体或亲和物)进行酶标记,以及在底物的存在下,与结合引物延伸产物的亲和试剂相关联的酶产生可检测信号。例如,酶包括但不限于过氧化物酶、磷酸酶、荧光素酶等。在一种途径中,酶是过氧化物酶。在一种方法中,对亲和试剂(例如,抗体或亲和物)直接进行酶标记。在一种方法中,例如,使用过氧化物酶[例如辣根过氧化物酶(HRP)]或磷酸酶(例如碱性磷酸酶)标记抗体或其他亲和试剂(Beyzavi等人,Annals Clin Biochem 24:145–152,1987)。在一种方法中,亲和试剂与荧光素酶或可用于产生化学发光信号的其他蛋白质偶联(或是其融合蛋白的一部分)。在另一种方法中,亲和试剂可以与被选择成产生非光学信号的酶系统偶联/融合,例如可以检测到(例如通过离子半导体测序(例如Ion Torrent测序仪;Life Technologies Corporation,GrandIsland,NY)检测到)质子的pH变化。酶标记的亲和试剂的使用具有某些优点,包括由信号放大产生的高灵敏度和针对各种仪器定制测序方法的能力。在Rashidian等人,BioconjugateChem.24:1277–1294,2013中回顾了酶报告系统(Enzyme reporter system)。

亲和试剂可以直接标记(例如,通过与标记缀合,例如,经由共价键,与荧光团缀合)或间接标记,例如通过结合标记的二级亲和试剂而间接标记,所述标记的二级亲和试剂结合直接与具有3'NLRT的延伸引物结合的初级亲和试剂。未标记的初级亲和试剂结合靶核苷酸,以及标记的二级亲和试剂(例如,抗体、适体、亲和物(Affimer)、结蛋白(Knottin))结合初级亲和试剂。在一些方法中,初级和/或二级亲和试剂是抗体。例如,在一种方法中,亲和试剂是“初级”抗体(例如,兔抗NLRT-C抗体),以及二级结合剂是标记的抗初级抗体(例如,染料标记的山羊抗兔抗体)。在一些方法中,使用二级亲和试剂提供有利的信号放大。

在间接检测的情况下,测定包括两个不同的部分:首先,在抗体与抗原结合期间(当然假设存在抗原),未标记的初级抗体存在一段时间(通常一小时)的孵育。然后洗掉过量的未结合的初级抗体并加入标记的二级试剂。孵育一段时间(又一小时)后,洗掉过量的二级试剂,以及量化与初级抗体相关联(即间接经由二级试剂)的标记的量。如果存在抗原,标记通常导致有色物质产生或导致在特定波长下发射的光量增加。在不存在抗原的情况下,没有初级抗体的结合,而且没有二级试剂的结合,因此没有信号。通过直接检测,标记与初级抗体的先前共价附着意味着仅需要对抗原的单一孵育步骤以及仅需要一轮洗涤步骤,相反,间接检测需要两轮孵育和洗涤步骤。

可以选择初级抗体和二级抗体以区分多种抗原(例如,将RT-A、RT-C、RT-G和RT-T彼此区分开)。未标记的初级抗体(通常是单克隆抗体或工程化抗体)可具有不同的同种型和/或具有不同物种特征的序列(例如,在不同动物体内培养的多克隆抗体或相应的单克隆抗体或其他亲和试剂)。在这种情况下,每种抗原的标记的二级(即抗初级)抗体对于适当的同种型或物种序列是特异性的。例如,同种型IgG1、IgG2a、IgG2b和IgG3的初级抗体可以与同种型-特异性二级抗体一起使用。

初级抗体和二级抗体或其他剂可以按顺序加入到测序阵列中,同时,可以在二级抗体与初级抗体结合并作为复合物添加到阵列的条件下预先组合。

标记抗体和其他亲和试剂的方法

标记的亲和试剂可用于通过多种方法对模板核酸测序。可以使用本发明的标记抗体和其他亲和试剂的任何方法。用于将抗体和其他亲和试剂与报道分子(例如,包括酶和荧光/发光蛋白在内的信号产生蛋白)连接的方法在本领域中是众所周知的(Wild,TheImmunoassay Handbook,4

大多数抗体标记策略使用以下三种靶之一:(1)伯胺(-NH2):它们存在于赖氨酸残基和每条多肽链的N-末端上。它们数量很多并且分布在整个抗体上;(2)巯基基团(-SH):它们存在于半胱氨酸残基上以及以稳定整个分子结构的二硫键存在。可以选择性地还原铰链区二硫化物以使游离巯基可用于靶向标记。(3)碳水化合物(糖):糖基化主要发生在抗体(IgG)的Fc区。这些含有顺式二醇的多糖单元中的组分糖可被氧化以产生用于偶联的活性醛(-CHO)。抗体标记的四种主要化学方法总结如下:

1.NHS酯.在荧光染料标记的情况下,通常购买具有内置的NHS酯(也称为“琥珀酰亚胺酯”)的活化形式的标记。活化的染料可以在合适的条件下与抗体(其全部都具有多个赖氨酸基团)反应。通过几种可能的方法之一(通常是柱层析法)去除过量的活性染料,之后可将标记的抗体用于免疫测定。

2.异双功能试剂.如果标记是蛋白质分子[例如辣根过氧化物酶(HRP)、碱性磷酸酶或藻红蛋白],则抗体标记程序由于抗体和标记具有多个胺这一事实而变得复杂。在这种情况下,通常修饰一个分子(例如抗体)上的一些赖氨酸以在标记上产生新的反应基团(X)和赖氨酸以产生另一个反应基团(Y)。“异双功能试剂”用于引入Y基团,当抗体和标记混合时,Y基团随后与X基团反应,从而产生异二聚体缀合物。该主题有很多变型,而且人们会在文献中找到数百个关于使用异双功能试剂来产生标记抗体和其他标记生物分子的示例。

3.碳二亚胺.这些试剂(EDC是一个非常常见的示例)用于在含胺分子和含羧基分子之间产生共价连接。碳二亚胺活化羧基基团,然后活化的中间体被胺攻击(例如由抗体上的赖氨酸残基提供)。碳二亚胺通常用于将抗体与羧化颗粒(例如胶乳颗粒、磁珠)和其他羧化表面(例如微孔板或芯片表面)缀合。碳二亚胺很少用于使染料或蛋白质标记附着于抗体上,尽管它们在NHS活化染料的生产中很重要(见上文)。

4.高碘酸钠.这种化学物质不能与绝大多数标记一起使用,但它是一种非常重要的试剂,因为它适用于最常用的诊断酶HRP。高碘酸盐激活HRP分子上的碳水化合物链以产生能够与抗体分子上的赖氨酸反应的醛基。由于HRP本身具有非常少的赖氨酸,因此相对容易地产生抗体-HRP缀合物而没有显著的HRP聚合。

对于任何特定的抗体克隆,赖氨酸(伯胺)可能突出地存在于抗原结合位点内。因此,该标记策略的唯一缺点是它偶尔会导致抗体的抗原结合活性显著降低。当使用单克隆抗体工作或当试图为每个抗体分子添加高密度标记时,所述降低可能特别明显。

在一种方法中,用限定数量的染料分子(例如,每个抗体1、2、3、4或5个染料分子)特异性标记抗体(例如,在抗体上的特定位点处)。在另一种方法中,例如通过使蛋白质上可用的游离胺与NHS酯活化的荧光染料反应来对抗体进行随机标记(Mattson等人,Apractical approach to crosslinking.Mol.Biol.Rep.17,167–183(1993),其以引用方式并入本文)。随机标记过程可用于产生每个抗体用多个染料分子标记的抗体。同样,可以使用特定的标记方法来产生每个抗体用多个染料分子标记的抗体。如果每个抗体有多个染料分子,则给定抗体蛋白上(例如,四聚体)的染料可以相同或不同(例如,两种不同的染料)。因此,在一种方法中,将抗体组中的抗体(其中抗体组包含具有相同核碱基特异性的抗体,例如核碱基特异性单克隆抗体)用相同染料的2个或更多个染料分子(例如,两个荧光素分子)标记。在一种方法中,用2个或更多个不相同的染料分子(例如,一个荧光素分子和一个若丹明分子)标记抗体组中的抗体。

在一种方法中,通过抗体蛋白上可用的游离胺与NHS酯活化的荧光染料的反应来标记抗体。例如,将NHS酯活化的荧光团在无水DMSO中稀释,并以浓度(10-100uM)反应。将相对较低浓度的抗体在碳酸氢盐缓冲液中调节至pH 8,并与NHS酯染料反应。在该阶段的抗体浓度可以为约(1mg/ml),或者在各种实施方案中,可以为例如0.1至0.5mg/ml,0.5至5mg/ml,0.3-1mg/ml或0.3至2mg/ml。在室温下继续孵育45分钟。任选地,在tris-缓冲盐水(pH7.4)中淬灭未反应的染料。这种标记方法可提供强信号,而不会不利地影响抗体结合或特异性。

为了在最终测序反应中结合抗体,将标记的抗体组合物稀释(通常30-300倍,例如大于50倍,经常大于100倍,有时大于500倍)。在核酸阵列上温育的最终测序反应混合物中,可以使用过量的抗体,例如浓度为约1至约10ug/ml,这导致与高度纯化的碱基标记的标记核苷酸的大于1uM的常用浓度相比,抗体结合反应中的最终染料浓度大约为0.2uM。

令人惊讶地,我们发现这些标记的抗体可以在-20℃下保存并且无需从抗体中纯化游离的未反应的染料而使用,并且令人惊讶地,我们发现在测序反应中使用之前,没有必要从标记的抗体制剂中去除游离的未反应染料。

在一个方面,本发明提供了一种组合物,其包含荧光染料标记的抗NLRT抗体和游离的(即,未与蛋白质缀合的)染料,其中该组合物每1mg抗体包含大于10纳摩尔的游离染料,通常大于20纳摩尔的游离染料,通常每1mg抗体大于50纳摩尔的游离染料,其中通常平均用一个以上的染料分子标记抗体。在一实施方案中,染料是NHS酯活化的荧光团。在对未使用的染料分子进行可选的“淬灭”后,即使没有甘油,标记的抗体也可以在-4℃或-20℃或-80℃下保存。可以将四种标记的抗体混合并存储,也可以以1ug/ml至10ug/ul的浓度存储库。

因此,本发明的一个方面包括:(1)用染料(例如荧光染料,例如NHS酯活化的荧光染料)标记亲和试剂(例如蛋白质,例如抗体)以产生包含标记的亲和试剂的组合物和未反应的染料;(2)将组合物用于本文所述的基于亲和试剂的测序中,而不除去未反应的染料分子(无需纯化)。使用NLRT进行基于亲和试剂(抗体)的合成测序,其中在非掺入染料的存在下,在结合反应中使用碱基特异性标记的抗体,其浓度大于10纳摩尔/mg标记抗体蛋白,有时大于20纳摩尔,并且有时大于50纳摩尔。

各种SBS方法可与NLRT和本申请的抗体一起使用,例如公开于PCT专利公布WO1999/019341;WO2005/082098;WO 2006/073504;WO 2018/129214;以及Shendure等人,2005,Science,309:1728-1739中。SBS方法可以采用有序的DNA纳米球阵列,其描述于,例如美国专利公布2010/0105052、2007/099208和US 2009/0264299以及PCT专利公布WO 2007/120208、WO 2006/073504和WO 2007/133831中,其以引用方式全文并入以用于所有目的。

在一些实施方案中,核酸模板固定在固体表面上(例如,硅、玻璃、金、聚合物、PDMS、珠),通常在壁内。在一些实施方案中,核酸模板固定或包含在液滴内(任选地固定在液滴内的珠或其他底物上)。通常,阵列(有时称为阵列chi)包含在流动池中,流动池是一种将试剂溶液输送到阵列模板的流体装置。通常,试剂溶液被输送到在阵列表面和盖玻片之间形成的反应室。参见美国专利公布2013/0281305,其以引用方式并入。

在一些实施方案中,模板核酸是包含靶序列的多个拷贝的固定化DNA多联体。在一些实施方案中,模板核酸表示为其包含靶序列的多个拷贝和“衔接子序列”的DNA多联体,诸如DNA纳米球(DNB)。在一些实施方案中,DNA模板是DNA多联体,并且在每个位置存在单个多联体。参见,PCT专利公布WO 2007/133831,其内容通过引用整体并入本文以用于所有目的。

在一些实施方案中,在阵列的每个位置的核酸模板是DNA片段的克隆群。在一些实施方案中,DNA片段的克隆群体是通过桥式PCR产生的。在一些实施方案中,模板是单个多核苷酸分子。在一些实施方案中,模板以模板分子的克隆群存在(例如,通过桥扩增或Wildfire扩增产生的克隆群)。

包括DNB、簇、聚合酶群落(polony)及其阵列或基团的合适的模板核酸进一步描述于美国专利8,440,397;8,445,194;8,133,719;8,445,196;8,445,197;7,709,197;12/335,168、7,901,891;7,960,104;7,910,354;7,910,302;8,105,771;7,910,304;7,906,285;8,278,039;7,901,890;7,897,344;8,298,768;8,415,099;8,671,811;7,115,400;8,236,499,以及美国专利公布2015/0353926;2010/0311602;2014/0228223;以及2013/0338008,其全部都以引用方式全文并入本文。

在一个方面,本发明提供了一种DNA阵列,其包含:多个模板DNA分子,每个模板DNA分子附着在阵列的一个位置处;互补DNA序列,其与多个位置上的模板DNA分子的一部分碱基配对,其中互补DNA序列在其3'端包含掺入的第一可逆终止子脱氧核糖核苷酸;以及第一亲和试剂,其特异性结合第一可逆终止子脱氧核糖核苷酸中的至少一些。在一种方法中,DNA阵列包含具有3'末端核苷酸的引物延伸产物,所述3'末端核苷酸包含A、T、G或C核碱基或其类似物;以及与引物延伸产物结合的亲和试剂。

用于检测抗体与掺入的RT的结合的方法将随所使用的可检测标记的性质而变化。许多方法是本领域已知的并可商购获得。对于荧光标记,一种方法是使激光穿过阵列以激活荧光标记。使用照相机(例如,基于CCD或CMOS的照相机)检测荧光并将其记录在计算机上,例如,作为在每个迭代测序步骤之后所记录的平铺的荧光或发光图像的集合。(或如下所述,在每个完整周期中收集不止一次。不同的染料以不同的波长(或不同的颜色)和强度发射光)。在一种方法中,每种颜色都生成单独的图像(获取不同波长的信号),然后将图像进行比较。使用可以在一个或多个计算机系统上执行的各种技术和算法。可使用多种本领域已知的方法来区分不同颜色的染料。一种常见的方法是使用多个激光来激活具有不同激发波长的染料和/或滤光器以捕获不同波长的光。此类滤光器和方法通常捕获可被称为“颜色”(例如,红色或绿色),“带”或“检测通道”的波长光谱上的光。在一种方法中,每个通道产生不同的图像,使得可以比较图像以确定每个阵列位置处的信号的性质。基于过滤器、照明源和软件的存在或不存在,可将市售测序器调整为1色、2色或4色。

一种颜色测序特别适合于其中使用化学发光(而不是荧光)标记或使用非发光标记的方法,并且在本文公开的方法中可使用标记有化学发光染料和替代标记的亲和试剂。

可以同时去除封端基团和亲和试剂或可在不同时间解耦或发生。在一个方法中,阵列暴露于同时去除封端基团和亲和试剂的条件。在一个方法中,使阵列与具有试剂的组合的溶液接触,其中导致去除亲和试剂的一些试剂(例如,高盐、小分子竞争剂、蛋白酶等)与裂解封端基团的试剂进行组合。

在一些情况下,3'封端基团的去除导致亲和试剂的去除。不希望受特定机制的束缚,据信,在这些情况下,阻断单元的去除破坏了抗体或其他亲和试剂结合所需的表位。

在不同的方法中,将亲和试剂和封端基团的去除解偶联,从而去除亲和试剂,但是不从核苷酸糖上裂解封端基团。在本发明的一方面,使用NLRT在DNA阵列上进行SBS,其中在成像后在去除封端基团之前去除碱基特异性标记的抗体。通常在高温(大于50℃,有时大于60℃)下除去抗体,并且在引入除去条件后40秒内基本上完成除去(下面讨论其中一些)。

应当理解,将选择去除条件,即用于去除亲和试剂和/或封端基团的去除条件,以保持被测序的DNA的完整性。

核苷类似物或NLRT包括3'-O可逆阻断的那些。在一些方面,封端基团提供了单个3'-O可逆阻断的NLRT在引物(例如在先前测序循环中延伸的GDS)的3'端处的受控掺入。

通常,在使用NLRT的每个测序循环中,去除封端基团并将亲和试剂与NLRT解离。这些步骤可以同时进行。例如,可以通过用膦处理(广泛使用的工艺)来去除叠氮基甲基封端基团,以及可以通过用低pH(例如,100mM甘氨酸pH 2.8)或高pH(例如,100mM甘氨酸pH10)、高盐或离液剥离缓冲液处理来去除抗体亲和试剂。在一实施方案中,可以使用单一处理或条件来去除NLRT和亲和试剂(例如,含于高盐缓冲液的膦)。在一些实施方案中,如果例如封端基团是亲和试剂结合所需的,则封端基团的去除导致亲和试剂的解离。

可以通过酶促裂解或化学裂解(例如水解)去除3'-O可逆封端基团。去除条件可以由本领域普通技术人员基于本文提供的描述、待裂解的封端基团的化学身份和本领域已知的核酸化学原理进行选择。在一些实施方案中,通过使可逆阻断的核苷与还原剂接触来去除封端基团,所述还原剂例如二硫苏糖醇(DTT)或膦试剂[如三(2-羧乙基)膦(TCEP)、三(羟甲基)膦(THP)或三(羟丙基)膦]。在一些情况下,通过使用还原剂(如膦试剂)从掺入的核苷酸类似物中洗掉封端基团来去除封端基团。在一些情况下,封端基团是光不稳定的,以及可以通过施加例如UV光来去除封端基团。在一些情况下,可以通过使用例如钯(Pd)水溶液使核苷类似物与过渡金属催化反应接触来去除封端基团。在一些情况下,可以通过使核苷类似物与亚硝酸盐水溶液接触来去除封端基团。附加地,或者替代地,可以通过改变含有掺入的核苷酸类似物的溶液或混合物的pH来去除封端基团。例如,在一些情况下,可通过使核苷类似物与酸或低pH(例如,小于4)缓冲水溶液接触来去除封端基团。作为另一个示例,在一些情况下,可以通过使核苷类似物与碱基或高pH(例如,大于10)缓冲水溶液接触来去除封端基团。

可通过还原剂(例如膦)裂解的3'-O可逆封端基团包括但不限于叠氮基甲基。可通过UV光裂解的3'-O可逆封端基团包括但不限于硝基苄基。可通过与Pd水溶液接触而裂解的3'-O可逆封端基团包括但不限于烯丙基。可用酸裂解的3'-O可逆封端基团包括但不限于甲氧基甲基。可通过与亚硝酸钠缓冲(pH5.5)水溶液接触而裂解的3'-O可逆封端基团包括但不限于氨基烷氧基。

基于抗体的亲和试剂可通过低pH、高pH、高盐或低盐或变性剂(例如高离液剥离缓冲液)去除。其他种类的亲和试剂(例如适体)可通过本领域已知的任何方法去除。另外,亲和试剂,例如抗体可以通过引入与所结合的表位竞争亲和试剂结合的一种剂来去除,例如,如下文实施例10中所示。

在一种方法中,高温(例如,50-60℃或55C-65℃或60-70℃)或高温(例如,60-65℃)与高pH(8.5-9.5)的组合也可用于在小于30s或小于20s或小于10s内定量去除抗体。快速完全或接近完全去除抗体而不裂解3'封端基团允许i)最佳裂解条件或ii)一次快速顺序结合/检测/去除每种抗体或两种抗体。

如上所述,亲和试剂也可通过破坏试剂结合掺入的NLRT的能力来除去。通常在3'封端基团从掺入的核苷酸类似物裂解时会发生这种情况。在亲和试剂结合依赖于封端基团的存在的情况下(例如,在被1抗体识别的表位包括封端基团或其部分的情况下),封端基团的除去也导致亲和试剂释放。

亲和试剂和封端基团的同时去除也可以通过加入包含封端基团裂解组分(例如膦试剂)和亲和试剂释放剂(例如高盐)的溶液来实现。

在本发明的一个方面,SBS用于将NLRT掺入生长的引物链中(“第一掺入”),并且亲和试剂(例如单克隆抗体)用于检测掺入。在一种方法中,在检测之后,去除亲和试剂,并且去除可逆封端基团(“去阻断”)。在一种方法中,在检测之后并且在去阻断之前,在去除亲和试剂的同时或之后进行第二NLRT掺入步骤。第二掺入解决了不同时性(异相掺入)问题。SBS通常使用阵列上某个位置的模板的大克隆群进行。模板的示例性大克隆群包括DNB和模板簇(其可以通过桥PCR或类似方法产生)。在一些情况下,对于阵列上某个位置的某些DNA模板拷贝,DNA聚合酶可能无法将互补的RT掺入到GDS中,因此,DNA阵列上大量DNA模板上的测序反应可能是不完全的或不同时的(异相)。也就是说,并非所有与所有模板杂交的引物都以相同的效率延伸,并且这种差异随着循环数的增加而增加,从而导致质量较低的测序数据。当RT和DNA模板上的碱基之间存在互补性时,第二掺入步骤在每个测序循环中为DNA聚合酶掺入RT提供了第二次机会,从而增加了在每个测序循环中延长的模板的比例。抗体去除和第二掺入可在相同条件下同时进行。这消除了采取步骤来改变条件以适应两种不同类型的反应的需要,并且显着减少了成本和循环时间。

在一种方法中,在检测来自标记的延伸产物的信号之后并且在去阻断之前,使DNA阵列(和固定在其上的标记的延伸产物)经历解离条件,在该条件下:(1)将标记的亲和试剂从延伸产物中解离和(2)第一掺入步骤中未掺入阻断的核苷酸的任何模板位置处进行NLRT的进一步掺入(“第二掺入”)。第二掺入包括在抗体解离条件下添加附加聚合酶和,任选地,附加NLRT。聚合酶和NLRT的添加以及亲和试剂的去除可以同时发生(即,在解离条件下均如此)。另选地,亲和试剂可在解离条件下去除或部分去除,并且随后在相同或相似的解离条件下添加聚合酶//NLRT,通常不具有中间洗涤步骤(去除解离的亲和试剂)。细心的读者将认识到,第二掺入步骤在解离条件下进行。

在第二掺入后,通过第一掺入而掺入的NLRT和通过第二掺入而掺入的NLRT的封端基团均被除去,这允许生长的DNA拷贝链的下一延伸循环并鉴定随后掺入的NLRT。

本文公开的测序方法使用允许在与抗体解离步骤相同的条件下进行第二掺入的试剂。该条件导致标记的抗体与阵列上它们的靶RT分离,但仍适用于正确进行聚合反应的聚合酶(例如第二掺入)。

如本文所用,“第一掺入”或“第二掺入”是指在核酸引物或生长的DNA链的3′末端掺入RT。通过第一掺入而掺入的RT将通过抗体结合来鉴定,然而通过第二次掺入而掺入的RT将不进行抗体结合。第二掺入发生在第一掺入、抗体结合和检测之后。

在第一掺入步骤和第二掺入步骤中使用的NLRT通常具有相同的封端基团。但是,可使用不同的封端基团。当使用多个不同的封端基团时,优选所有基团都可在相同条件下,例如在共同的温度、pH和盐浓度下,用相容的裂解剂进行裂解。

在一种方法中,测序反应的一个循环包括以下步骤:i)通过在核酸引物或与阵列上多个DNA模板杂交的生长DNA拷贝链的3'末端处掺入RT,形成未标记的延伸产物(“第一掺入”),ii)通过将标记的亲和试剂(例如抗体)与延伸产物结合形成标记的延伸产物,iii)检测标记的延伸产物,iv)在允许两个过程同时发生的条件下(同时或在相同条件下)去除结合的标记抗体并掺入附加量的RT(“第二掺入”)。在除去封端基团之后,可重复这些步骤以进行测序反应的附加循环。

如上所述,第一掺入步骤涉及与DNA阵列上的模板核酸杂交的核酸引物的延伸或在较早的测序循环中产生的引物延伸产物的延伸。反应包括适用于引物延伸的DNA聚合酶、NLRT和缓冲液。在一种方法中,本文公开的方法中使用的NLRT是A、G、C和T的混合物(即,NLRT-A、NLRT-G、NLRT-C和NLRT-T)。备选地,可将各NLRT或NLRT的组合单独地掺入单独的步骤中(例如,在本文所述的某些双色方案中)。在每个循环中,将NLRT掺入模板DNA分子中的一个的生长DNA链中以形成未标记的延伸产物。在一些情况下,在一次掺入后,未掺入的NLRT被洗掉并从测序反应中去除。

通过第一掺入形成的未标记的延伸产物然后与标记的抗体结合。该方法中使用的每种抗体都可特异性结合一个核碱基(例如A),并将该核碱基与根本不结合或无效结合的其他核碱基(例如T、C和G)区分开。例如,如果3'末端核苷酸被鸟苷核苷碱基的特异性抗体识别(例如,将3'-OH阻断的鸟苷核苷酸掺入模板引物双链体的生长链中),则指示相关的核苷碱基是鸟嘌呤并且此位置的模板碱基为胞嘧啶。标记的抗体与未标记的延伸产物的结合以形成标记的延伸产物,然后使用本领域已知的方法检测标记的延伸产物。任选地,在检测步骤之前将未结合的标记抗体洗掉。

抗体与掺入生长DNA链中的RT的结合通常在适用于抗体-抗原相互作用的条件(“结合条件”)下进行。例如,在一些实施方案中,结合在30至45℃或35-50℃的范围内的温度下发生。在一些实施方案中,结合在pH值为7至8.5,通常为7至7.5的环境中发生。在一些实施方案中,进行结合,结合条件包括30-45℃范围内的温度和/或pH范围为7至7.5的环境。在DNB阵列上的某些条件下,发现具有EDTA且不具Mg++的低盐(例如30-70mM)的Tris缓冲液(

结合后,可在去除条件下去除过量的(未结合的)抗体,通常在150mM至1000mM(例如150mM至400mM,150mM至350mM)的较高盐浓度以及接近中性pH的条件下去除(例如,pH范围从6到8,从6.5到7.5,例如约7)。洗涤可在20至50℃,例如25至40℃或约30℃的温度下进行。在另一种方法中,另一种可能性是接近中性的缓冲液中(例如,pH 6.8至7.2)的低盐(30-100mM或50-150mM)。

检测后,使DNA阵列经受解离条件下(例如,通过升高温度和/或pH),在该条件下,结合的标记抗体从DNA模板上解离。在第二掺入步骤中使用的DNA聚合酶应在这些解离条件下保持其聚合酶活性,以便在抗体解离的条件下可以发生附加RT的掺入。通常在检测后将附加NLRT和附加聚合酶添加到测序反应中。

用于第一掺入的相同掺入反应成分(通常为pH 9,具有酶和NLRT)可在适当的温度下使用并持续10-60s,以同时进行第二掺入和抗体去除。可将多个掺入反应等分试样推入流动池,例如将2-3个等分试样各温育10-20秒。溶液中NLRT的存在有利于在较低的温度(例如小于60℃)或较短的时间(例如缩短20-50%))完全或接近完全去除标记的抗体,这可能是由于对抗体结合的竞争。

在一些实施方案中,取决于在第二掺入之前洗涤步骤的选择,可仅添加附加NLRT(依赖于来自第一掺入步骤的残留聚合酶)或附加聚合酶(依赖于来自第一掺入的残留NLRTS)。所述附加聚合酶可以与在第一掺入中使用的聚合酶相同或不同,并且附加NLRT可与在第一掺入中使用的相同或不同(例如,不同的阻断部分)。

示例性解离条件包括高温,例如50℃至75℃,并且有时55℃至75℃,例如60℃至70℃的温度。在一些实施方案中,高pH大于7,大于8,例如约9。示例性解离条件包括高pH环境(pH在pH 8至10的范围内)。在优选的实施方案中,解离条件包括高温和高pH。另外,在一些实施方案中,抗体的去除和第二掺入在含有盐的反应混合物中进行,该盐的浓度小于100mM,例如小于90mM或小于80mM。在优选的解离条件下,抗体的去除或解离通常可在少于60秒,例如少于40秒或少于30秒内进行。在一些实施方案中,解离条件是这样的条件,在该条件下至少约90%,有时至少约95%,有时至少约99%的结合的标记抗体在小于5分钟,小于60秒,例如小于40秒,或小于30秒,小于20s,或小于10s内从模板DNA分子解离。

对于第二掺入,优选使用DNA聚合酶,与所述DNA聚合酶在已知的最佳条件下的活性相比,所述聚合酶在解离条件下保留至少90%的聚合酶活性。每种DNA聚合酶的最佳条件通常可在制造商的说明中找到。

可用于本文公开的方法中的合适的DNA聚合酶的非限制性示例包括来自Thermococcus sp.的DNA聚合酶,例如9°N或其突变体,包括A485L,包括双重突变体Y409V和A485L,如在例如WO2018/129214中所述的。DNA聚合酶的其他非限制性示例包括Taq聚合酶、Bst DNA聚合酶和KOD聚合酶。

期望的解离条件通常至少部分是由于与阵列接触的缓冲液的变化(例如,通过用添加试剂(例如,NLRT)补充先前的缓冲剂(例如,结合缓冲液或通过缓冲液交换)。也就是说,解离条件通常是由于引入解离缓冲液而产生的,该解离缓冲液被引入DNA阵列(例如,注入到流通池中),任选地直接加热或冷却流通池。

在一些实施方案中,抗体解离和第二掺入基本上同时发生(例如,在相同条件下在相同反应缓冲液中)。在一些实施方案中,将没有聚合酶和/或没有可逆终止子核苷酸的解离缓冲液引入初始组,并通过向该缓冲液中添加聚合酶和/或可逆终止子核苷酸或者进行其中第二缓冲液包含聚合酶和/可逆终止子核苷酸的缓冲液交换而快速补充。然而,抗体解离和第二掺入可以以任何顺序发生,例如,抗体解离可以在第二掺入之前、之后或基本同时发生。

DNA阵列经受高温和高pH条件的持续时间很短(通常小于60秒或小于30秒)。这些相对温和的解离条件有利地最小化了对掺入的RT和随后的延伸反应的不利影响。根据本文公开的方法,可在相同条件下发生抗体去除和第二掺入,这意指无不要任何动作即可改变条件以适应两种不同的反应。因此,这些方法显著改善了效率并减少了测序成本和循环时间。

在第二掺入步骤之后去除抗体之后,可洗涤阵列以去除抗体和未掺入的RT。然后去除RT的可去除封端基团,以允许下一个引物延伸、抗体结合和检测循环。

在一些方法中,DNA阵列上的测序反应的每个循环包括:(i)将包含可去除封端基团的RT掺入阵列上多个模板DNA分子中的至少一些中,以形成未标记的延伸产物;(ii)使未标记的延伸产物上的掺入的RT与特异性结合掺入RT的标记抗体接触,并且结合事件形成标记的延伸产物;(iii)检测抗体的结合,任选地随后洗去未结合的抗体;(iv)使与DNA阵列杂交的标记的延伸产物经受既能使结合的抗体解离又掺入附加RT的条件,(v)以允许掺入附加核苷酸类似物的方式去除封端基团(例如,在脱氧核糖部分的3'位置产生羟基)。该步骤之后可进行一个多多个新的循环,其中掺入并检测新的RT。抗体可被直接标记(例如,荧光标记的抗体)或可以被间接检测(例如,通过结合标记的第二抗体)。

在同时去除封端基团和亲和试剂的情况下,用于掺入NLRT的DNA聚合酶能够在也适用于将标记抗体从其靶上解离的条件下介导聚合,即掺入的RT在引物延伸产物的3'末端。如上文所公开,称为解离条件的这些条件,通常涉及较高的温度(例如,在50-75℃之间,在55-75℃之间或在60-70℃之间),高pH(pH为8至10,例如pH 9)和低盐条件(盐以小于100mM的浓度存在于反应中)。在一些实施方案中,用于本发明的聚合酶能够保留其聚合酶活性的至少80%、至少85%或至少90%。使用具有这些特性的DNA聚合酶允许抗体去除和RT的第二掺入在同一条件下进行,从而改善了测序效率并降低了成本。

表4

具有两个或一个检测通道(检测一个或两个波长带)的成像仪比4通道成像仪更有效(例如,检测到更多的光,没有染料串扰)且价格便宜。这些成像仪中的一些可以提供等效于一个通道检测的电子检测或其他检测。通过在每个周期(每个DNA位置)生成1、2、3、4个或更多图像,将这些成像仪用于DNA阵列上的SBS是有利的。然而,每个位置需要少于4张图像的测序更快,并且导致处理更少数据。使用NLRT和标记的碱基特异性抗体在这些类型的测序方法中提供了很多有益效果,尤其是i)使用少于4个图像进行更精确的测序,或ii)使用两个或更多单独的抗体结合和成像有效生成4个或更多图像(包括重新探测)的步骤,以达到优异的精度。在一些方法中,这些方法可仅使用三种标记的抗体,其中一种未标记或不存在)或全部四种标记的抗体,并且仅使用一种或两种或更多种不同的染料或在每个成像仪可用的一个或两个通道中可检测到的其他标记。例如,通过每个抗体附着不同数量的染料分子,尤其是结合使用不同亮度的染料,四种抗体可以产生4种不同的强度(例如,相对数量为0.5、1、2、4),以在一个图像中区分4种掺入的核苷酸。这种单通道成像仪的替代方案是生成两个图像,每个图像使用两个连续的抗体结合、成像和去除步骤来检测具有两种不同强度(例如1和4)的两种抗体。

与标记的dNTP相比,在经济上和化学上可行的是将多个染料分子附着至本发明的抗体。每个抗体附着多个染料分子比一个染料分子附着至碱基上提供更强的信号,从而以更少的照明光实现更高效的高质量成像。此外,我们已经认识到这可以开发新的检测策略。例如,每个抗体附着多个染料分子允许我们能够平衡前述2色MPS测序中的信号强度,其中必须在两个不同的波长通道中检测一个核苷酸。参见美国专利8,617,81。更多的染料分子可附着到抗体,其中50%的抗体分子必须用一种染料标记,而50%的抗体用另一种染料标记。

提供了将直接或间接标记的抗体或其他亲和试剂用于单色、双色、三色或四色检测的抗体/NLRT测序和检测方法。在一些实施方案中,一种亲和试剂是未标记的。

如本文所用,如果在自动测序系统的同一通道中检测到具有相似发射波长的染料,则它们被认为“相同颜色”,在自动测序系统的同一通道中检测在200nm波段(优选地100nm波段,有时50nm或更窄)中的发射。本领域技术人员将理解,可选择不同颜色的染料以避免或最小化串扰或重叠发射光谱。使用本发明的方法的测序可以是双色、三色或四色测序。在一种方法(四色测序)中,用不同的可检测标记(例如荧光染料)或产生独特信号的标记的组合直接或间接标记每种亲和试剂。应当理解,当用两种或更多种染料(或其他标记)识别单一抗原时,可能(但不是必须)用两种(或所有)染料或其他标记来标记单一亲和试剂分子。相反,可以用一种染料标记对单一抗原特异的亲和试剂分子的一部分(例如,50%),以及可以用另一种染料标记对单一抗原特异的亲和试剂分子的另一部分(例如,50%)。

根据一种这样的方法,提供了一种阵列,其包括设置在表面上的位置处的单链核酸模板。通过延伸或SBS进行测序,以便在多个测序循环中通过以下方式确定核酸模板中的检测位置处的核苷酸的身份:(i)在检测位置处将未标记的互补核苷酸(NLRT)结合到(或掺入)核苷酸,(ii)通过将其与特异性结合这种NLRT的直接或间接标记的亲和试剂结合来标记NLRT;(iii)检测在检测位置处与互补NLRT相关联的信号的存在或不存在,所述信号(例如,荧光信号)由标记产生;其中,(1)在检测位置处检测到第一信号而不是第二信号鉴定互补NLRT选自NLRT-A、NLRT-T、NLRT-G和NLRT-C;(2)在检测位置处检测到第二信号而非第一信号将互补NLRT鉴定为选自NLRT-A、NLRT-T、NLRT-G或NLRT-C的与(1)中选择的NLRT不同的NLRT;(3)在检测位置处检测到第一信号和第二信号两者将互补NLRT鉴定为选自NLRT-A、NLRT-T、NLRT-G和NLRT-C的与(1)和(2)中选择的核苷酸不同的NLRT;以及(4)在所述位置均未检测到第一信号和第二信号将互补NLRT鉴定为选自NLRT-A、NLRT-T、NLRT-G和NLRT-C的与(1)、(2)和(3)中选择的核苷酸不同的NLRT;以及(iii)基于互补NLRT的身份推断在核酸模板中的检测位置处的核苷酸的身份。

另一种这样的方法包括:提供多个核酸模板,每个核酸模板包含引物结合位点,以及与引物结合位点相邻的靶核酸序列;通过在一个或多个合成测序循环中,使用NLRT组和相应的亲和试剂组,将引物与引物结合位点杂交以及每个循环将单个引物延伸一个核苷酸,对多个不同的核酸模板进行测序反应,所述NLRT组和相应的亲和试剂组例如:(i)第一NLRT和特异性结合第一NLRT并包含第一标记的第一亲和试剂;(ii)第二NLRT和特异性结合第二NLRT并包含第二标记的第二亲和试剂;(iii)第三NLRT和特异性结合第三NLRT并包含第一标记和第二标记的第三亲和试剂;以及(iv)第四NLRT和特异性结合第四NLRT以及既不包含第一标记也不包含第二标记的第四亲和试剂,其中第一标记和第二标记可彼此区分;以及在合成测序的每个循环中,通过检测第一标记的存在或不存在以及第二标记的存在或不存在来确定检测位置处的NLRT的身份,以确定靶核酸序列。上述方法的替代方案是使用特异性结合第三NLRT的第三亲和试剂的混合物,其中一些包含第一标记以及其中一些包含第二标记(例如,相等的混合物)。

在单色测序方法中,亲和试剂包括以可区分的强度存在的可检测标记。例如,根据一个这样的实施方案,这种方法包括:提供多个核酸模板,每个核酸模板包含引物结合位点,以及与引物结合位点相邻的靶核酸序列;通过在一个或多个合成测序循环中,使用NLRT组和相应的亲和试剂组,将引物与引物结合位点杂交以及每个循环将单个引物延伸一个核苷酸,对多个不同的核酸模板进行测序反应,所述NLRT组和相应的亲和试剂组例如:(i)第一NLRT和特异性结合第一NLRT并包含第一强度标记的第一亲和试剂;(ii)第二NLRT和特异性结合第二NLRT并包含第二强度标记的第二亲和试剂;(iii)第三NLRT和特异性结合第三NLRT并包含第三强度标记的第三亲和试剂;以及(iv)第四NLRT和特异性结合第四NLRT以及未标记的第四亲和试剂(或者,替代地,所述亲和试剂组仅包括第一亲和试剂、第二亲和试剂和第三亲和试剂而不包括结合第四NLRT的第四亲和试剂);以及在合成测序的每个循环中,通过检测标记的存在和强度(或不存在)来确定检测位置处的NLRT的身份,以确定靶核酸序列。

在另一种方法中,使用亲和试剂,所述亲和试剂用单个染料的一个或相同数目的分子标记,但由于不同的结合效率(即,结合阵列上的单个斑点的亲和试剂的平均数量,例如NLRT-A的靶DNA分子的所有拷贝的10%,NLRT-T的30%,以及NLRT-C的60%,以及NLRT-G的0%或几乎没有可检测的结合)而判别四种NLRT。在一种方法中,靶具有相同的封端基团,以及选择对其靶具有不同亲和力的亲和试剂。在另一种方法中,可以用小的化学变化修饰封端基团以调谐相同亲和试剂的结合效率,从而生成碱基特异性信号水平。例如,未修饰的封端基团可以产生最高信号(100%信号),具有修饰1的封端基团可以产生较低水平的信号(例如50%),具有修饰2的封端基团可以产生更低甚至更少的信号(25%),等等。

在另一种方法中,仅使用一种亲和试剂。具有亲和试剂识别的不同比例的封端基团的核苷酸混合物用于生成可区分的信号水平。该混合物中余量的核苷酸具有一种封端基团,但没有相应的亲和试剂。以下用于说明:

dA 0%封端基团1,100%封端基团2

dG 25%封端基团1,75%封端基团2

dC 50%封端基团1,50%封端基团2

dT 100%封端基团1,0%封端基团2

在另一个实施方案中,抗体可以识别两种碱基(核苷酸二聚体),其中通过添加可裂解或不可裂解的基团修饰下游碱基。

在另一个实施方案中,通过结合以下组合的两个亲和试剂鉴定最后掺入的碱基:一个亲和试剂特异性识别并结合核碱基,而第二亲和试剂特异性识别并结合封端基团。只有当这两个亲和试剂结合和/或空间接近时,才能确定末端碱基的身份,例如当这两个亲和试剂包括FRET供体-受体对作为它们各自的“标记”时。替代地,所述亲和试剂中的一个的结合可导致允许或增强第二亲和试剂结合的构象变化。

本文所述的核苷类似物可用于多种测序方法。例如,类似物可用于单标记(有时称为“无标记”)、双标记、三标记或四标记测序方法,其中未标记的类似物与根据单标记、双标记、三标记或四标记方案直接或间接标记的亲和试剂配对。

示例性的单标记测序方法包括但不限于这样的方法,其中连续递送具有不同核碱基(例如,A、C、G、T)的核苷类似物以及通过检测针对每种不同的核碱基的相同的信号或标记的存在或不存在来检测掺入。因此,单标记方法有时被称为单色方法,因为对于所有核碱基,检测信号和/或标记是相同的,即使它在对于每种核苷类似物的强度(或存在)方面可能不同。例如,通过检测从核苷焦磷酸酯裂解的焦磷酸酯,可以检测通过DNA聚合酶介导的模板导向聚合将核苷掺入引物。焦磷酸可以使用偶联测定法检测,其中ATP硫酸化酶在5'硫磷酸腺苷(adenosine 5′phosphosulfate)的存在下将焦磷酸酯转化为ATP,其又充当荧光素酶介导的荧光素转化为氧化荧光素的底物,从而以与ATP生成成正比的量生成可见光。

根据另一个实施方案,可以使用本文所述的RT和亲和试剂进行双标记或双色测序,使用组合方式的两个可区分信号来检测四种不同RT的掺入。示例性的双标记系统、方法和组合物包括但不限于美国专利号8,617,811中所描述的那些,该专利的内容,特别是与双标记测序相关的公开内容,通过引用整体并入本文以用于所有目的。简言之,在双标记测序中,第一RT(例如,RT-A)的掺入通过标记新掺入的RT来检测,而所述新掺入的RT的标记通过特异性结合包含第一标记的第一亲和试剂,然后检测第一标记的存在来进行。第二RT(例如,RT-C)的掺入通过标记第二RT来检测,而所述第二RT的标记通过特异性结合包含第二标记的第二亲和试剂,然后检测第二标记的存在来进行。第三RT(例如,RT-T)的掺入通过标记第三RT来检测,而所述第三RT的标记通过特异性结合包含第一标记和第二标记的第三亲和试剂,然后检测第一标记和第二标记的存在来进行;以及,通过检测由于结合了未标记的第四亲和试剂或者由于所使用的亲和试剂组中没有包含第四亲和试剂而导致的第一标记和第二标记两者的不存在来检测第四RT(例如,RT-G)的掺入。在双色测序中,第一标记可与第二标记区分开,以及第一标记和第二标记的组合可与单独采用的第一标记和第二标记区分开。

根据另一个实施方案,可以使用通过特异性结合包含第一标记的第一亲和试剂而标记的第一RT、通过特异性结合包含第二标记的第二亲和试剂而标记的第二RT、通过特异性结合包含第三标记的第三亲和试剂而标记的第三RT进行三标记测序。对于第四RT,将相应的亲和试剂从亲和试剂组中省略,或者未标记,或者包括第一标记、第二标记和第三标记中的两种或更多种的组合(或用所述标记中的一种不同标记来标记且特异性结合第四RT的亲和试剂的混合物)。第一标记、第二标记和第三标记可彼此区分。

类似地,可以采用通过特异性结合包含第一标记的第一亲和试剂而标记的第一NLRT、通过特异性结合包含第二标记的第二亲和试剂而标记的第二NLRT、通过特异性结合包含第三种标记的第三种亲和试剂而标记的第三NLRT以及通过特异性结合包含第四标记的第四亲和试剂而标记的第四NLRT进行四标记测序。同样,第一标记、第二标记、第三标记和第四标记可彼此区分。

在一种方法中,通过使阵列与一组至少三种不同的亲和试剂(为清楚起见而不是出于限制的目的,在下文中称为抗体)接触,来标记阵列上的延伸引物,所述试剂包括以下各项:

(a)包含对四种核苷酸类似物中的一者具有特异性的第一抗体的组合物,该第一抗体带有在第一波长发荧光或产生在第一波长发荧光的产物的第一标记;

(b)包含对四种核苷酸类似物中的另一者具有特异性的第二抗体的组合物,该第二抗体带有在第二波长发荧光或产生在第二波长发荧光的产物的第二标记;

(c)包含对两种剩余核苷酸类似物中的一者具有特异性的第三抗体的组合物,其带有第一和第二标记。第四抗体可以不存在或未标记。

在一种方法中,(c)中的组合物包含抗体的混合物,其中一些(例如50%)包含第一标记,而其中一些(例如50%)包含第二标记。在该实施方案中,组合物(c)中的第一标记的密度(每个被第一标记标记的抗体的染料分子)大于组合物(a)中的第一标记的密度,并且组合物(c)中的第二标记的密度(每个被第二标记标记的抗体的染料分子)大于组合物(b)中的第二标记的密度。例如,组合物(a)中的抗体可包含2个第一标记分子或平均包含2个第一标记分子,并且组合物(c)中用第一标记标记的抗体可包含3或4个或更多个第一标记分子,或平均包含3或4个或更多个第一标记分子,同样,组合物(b)中的抗体可包含2个第二标记分子,或平均包含2个第二标记分子,并且组合物(c)中用第二标记标记的抗体的分子可包含3或4个或更多第二标记分子,或平均包含3或4个或更多第二标记分子。对基于两个波长的发射鉴定的核苷酸具有特异性的抗体可被更密集地标记。更多染料分子可附着到抗体,其中50%的抗体分子必须用一种染料标记,而50%的抗体必须用不同染料标记。

表5

上面的表4示出当用两种不同的染料标记的亲和试剂被分成两个相等的部分并且4个核苷酸中的每一个具有相等的掺入时的平衡。对于读者而言显而易见的是,所示的一般原理可适用于亲和试剂被分成不相等比例的情况。

在另一种方法中,(c)中的组合物包含抗体,其中单个抗体(例如,四聚体)具有其上附着的第一标记和第二标记,其中组合物(c)中的第一标记的密度大于组合物(a)抗体中第一标记的密度,并且组合物(c)抗体中的第一标记的密度大于组合物(b)抗体中第一标记的密度。例如,组合物(a)中的抗体可包含1个第一标记分子,或平均包含1个第一标记分子,并且组合物(c)中的抗体可包含2个第一标记分子,和/或平均包含2个第一标记分子和2个第二标记分子,或平均包含2个第二标记分子。

(a),(b)和(c)中的组合物可以组合为单个组合物,例如,允许同时添加亲和试剂。另选地,组合物可以不同,并且可以大约同时(同时)在阵列上组合。或者,可将组合物一次一种地依次添加到阵列中。

任选地,该亲和试剂组还包括第四亲和试剂,该第四亲和试剂与第四核苷酸类似物特异性结合,但是在第一或第二波长上均不发射可检测的荧光或不产生发荧光的产物。在本文中,术语“可检测的”是指当调节检测装置以准确地区分来自第一亲和试剂和第二亲和试剂的正信号和负信号时,得分为负,低于得分为正的阈值的荧光。

在亲和试剂与延伸引物结合之后,将未反应的亲和试剂洗掉,并通过检测或测量阵列上各个位点的标记来确定已掺入延伸引物中的核苷酸类似物。仅在第一波长的荧光表明已掺入了第一核苷酸类似物,仅在第二波长的荧光表明已加入了第二核苷酸类似物,在第一波长和第二波长两者下的荧光表明已掺入了第三核苷酸类似物;两种波长下均无荧光表明已经掺入了第四种核苷酸类似物。这如下表所示:

表6

表6仅作为示例提供。可使用第3列中亲和剂特异性与第4列和第5列中标记的任何组合,以使对第1列中的靶核酸中的核苷酸的解释可以任何顺序进行。

如上所述,为了完成双色方法,对第三亲和试剂进行标记,以便与第一亲和试剂和第二亲和试剂同时被检测或成像。如上所述,第三亲和试剂在每个波长处的信号强度可以与第一和第二亲和试剂在强度上匹配。匹配强度的可能技术包括下列:

(1)第三亲和试剂包括带有两种不同标记的组合的一种特异性抗体或其等同物,所述两种不同标记分别在第一和第二波长下发出荧光或产生发出荧光的产物。第三亲和试剂中抗体上的两个不同标记可分别与第一和第二亲和试剂中的抗体所使用的标记相同。为了匹配相同的强度,第三亲和试剂中的抗体带有与第一试剂和第二试剂中的每种抗体的每个标记相同的密度,密度总计为两倍。

(2)作为替代方案,可用与第一亲和试剂和第二亲和试剂上的标记不同的一个或多个标记来标记第三亲和试剂。通过为第三亲和试剂选择标记,可以使第三亲和试剂在两个波长中的每个波长上的荧光强度与第一亲和试剂和第二亲和试剂匹配,当以相同波长激发时,所述第三亲和试剂在用于检测第一亲和试剂和第二亲和试剂上每个标记的波长下以更高的强度(也许是所述强度的两倍)发荧光。

(3)在另一替代方案中,第三亲和试剂包括至少两种特异性抗体或其等同物的混合物,其中第一种抗体带有在第一波长发荧光或产生荧光的产物的的标记,其中第二种抗体带有在第二波长发荧光或产生荧光的产物的标记。例如,第一抗体以大约两倍的密度带有与第一亲和试剂中的抗体相同的标记,并且第二抗体以大约两倍的密度带有与第二亲和试剂中的抗体相同的标记。

为了便于检测,当分别进行测量时,将第三亲和试剂上的两个标记的强度与第一试剂和第二试剂各自的标记相匹配是很有帮助的。当在第三试剂带有的标记中分别存在分别在第一波长和第二波长发荧光的两种不同抗体时,可以通过将每种抗体上标记的密度加倍、试剂中抗体总量加倍来匹配强度。以这种方式,用第三试剂标记的延伸引物在第一波长下以与被第一试剂标记的第一类似物的强度相当的强度发荧光;并在第二波长下以与第二试剂标记的第二类似物的强度相匹配或相当的强度发荧光。在本文中,“匹配”或“相当”的强度是指双标记试剂中每种标记的强度至少是单标记试剂中的任一者中的标记强度的至少约75%,通常不超过约135%或150%。

在用于检测哪个核苷酸已掺入单通道或双通道仪器上的延伸引物中的一些方法中,进行了多个单独的标记反应。

在方法中,共采集了四个图像(每个碱基一个图像),如下所示:

在第一个反应中,将在3'末端包含四个掺入核苷酸(例如A、T、G和C)的延伸引物与亲和试剂接触,以在以下条件下形成第一反应产物,其中第一亲和试剂特异性结合至第一核苷酸类似物,第二亲和试剂特异性结合至第二核苷酸类似物,所述第一亲和试剂带有在第一波长下发荧光或产生发荧光的产物的标记,所述第二亲和试剂带有在第二波长下发荧光或产生发荧光的产物的标记。在任选地去除未结合的试剂之后,通过检测和/或测量在第一波长和第二波长下的荧光来确定在两个第一反应产物的每一个中新添加的掺入核苷酸。然后将第一亲和试剂和第二亲和试剂(或其上的标记)去除(或修饰,使其不再发出信号),然后可进行第二标记反应并进行解释。在一种方法中,标记通过可裂解的接头与亲和试剂附接,并且亲和试剂被修饰,因此它们不再由于标记的裂解而发射相关的信号。

在第二反应中,在以下条件下使延伸引物与亲和试剂接触以形成第二反应产物,其中第三亲和试剂特异性结合至第三核苷酸类似物,第四亲和试剂特异性结合至第四核苷酸类似物,所述第三亲和试剂包含在第一波长下发荧光或产生发荧光的产物的标记,所述第四亲和试剂包含在第二波长下发荧光或产生发荧光的产物的标记。在任选地除去未反应的试剂之后,通过测量第一波长和第二波长下的荧光来确定已经添加到第二反应产物的每一个中的核苷酸类似物。

因此,四种亲和试剂如下:

(a)对核苷酸类似物中的一者具有特异性的第一亲和试剂,其带有在第一波长发荧光或产生发荧光的荧光产物的标记;

(b)对核苷酸类似物中的另一者具有特异性的第二种亲和试剂,其带有在第二波长下发荧光或产生发荧光的荧光产物的标记;

(c)对两种剩余核苷酸类似物中的一者具有特异性的第三亲和试剂,其带有在与第一亲和试剂相同的波长下发荧光或产生发荧光的产物的标记,和

(d)对第四核苷酸类似物具有特异性的第四亲和试剂,其带有在与第二亲和试剂相同的波长下发荧光或产生发荧光的产物的标记。

在某些实施方案中,第一亲和试剂和第三亲和试剂包含相同的标记(例如,相同的染料),第二亲和试剂和第四亲和试剂包含相同的标记(例如,相同的染料),该标记与第一亲和试剂和第三亲和试剂上的标记不同。在其他实施方案中,在相同通道中检测到的染料/标记物不同,其具有相似或不同的亮度。

标记和检测的结果解释如下:第一反应产物在第一波长的荧光表明已掺入了第一核苷酸类似物,第一反应产物在第二波长的荧光表明已掺入了第二核苷酸类似物,第二反应产物在第一波长下的荧光表明已掺入了第三核苷酸类似物,而第二反应产物在第二波长处的荧光表明了已掺入了第四核苷酸类似物。如下表所示:

表7

表7仅作为示例提供。如前所述,可使用第3列中亲和剂特异性与第4列和第5列中标记的任何组合,以使对列1中的靶核酸中的核苷酸的解释可以以任何顺序进行。

如上所述,在应用上述提出的标记和检测方案时,示例性亲和试剂是具有所需特异性的单克隆抗体(或由其衍生的抗原结合片段)。如本文其他地方所讨论的,亲和试剂可直接或间接标记。例如,当亲和试剂是未标记的抗体时,它可直接与相应的核苷酸类似物结合,然后使用与初级抗体特异性结合的第二抗体进行标记。

示例性标记是可在不同条件下(发射波长)进行区分的荧光部分,其直接附着于相应的抗体或亲和试剂。本公开还包括使用本身不发荧光但产生发荧光的产物的标记的双色检测。此类标记包括将在检测波长下基本不发荧光的小分子底物转化为在检测波长下发荧光的产物的酶。此类底物包括L-丙氨酸4-甲氧基-β-萘酰胺盐酸盐、3-氨基-9-乙基咔唑、丹磺胺、二氢罗丹明、荧光素二(β-D-吡喃半乳糖苷)、L-甲硫氨酸7-酰氨基-4-甲基香豆素三氟乙酸盐、4-甲基伞形酮α-D-吡喃半乳糖苷、间苯二酚乙醚、酪胺,可从Sigma Aldrich和Thermofisher Scientific购得。读者可参考“The Molecular Probes”手册(invitrogen)的最新版本。

为了实施双色方法,可使用两种酶标记检测系统中的第一、第二和第三亲和剂。两种酶分别将底物转化为两种不同的产物,它们以两种不同的波长发荧光。在一些反应条件下,每个酶部分将产生多个荧光分子。这可增强信号,于是用户通常将对反应进行计时以获得所需的强度。本发明的二元检测方案也可通过用标记来标记抗体或亲和试剂来实现,该标记可通过其他方式,经过必要的修正,作为其缀合物、生物发光测量或其他合适的技术来检测到。

在以上描述中对标记的讨论并不一定要求每种抗体或其他亲和试剂都用单个标记部分(例如荧光染料或酶)标记。更典型地,亲和试剂被标记以便在每个亲和试剂分子上放置多个标记部分(例如,以泊松分布),由此标记强度由每个亲和试剂的实体的平均数目确定(即,等份试样中的部分总数除以等分试样中的亲和试剂总数)。等分试样的亲和试剂可具有未标记的一些分子。通常,这不会干扰检测的效率,因为要在阵列上测序的核酸分子通常是DNA片段的扩增子,呈现多个结合位点。

除非明确说明或要求,否则在相同波长下发荧光的标记不一定是相同的标记。可以通过调节每种亲和试剂的标记数量,和/或通过选择以相同检测波长以每个标记部分不同的强度发荧光的不同标记,来调节特定波长下的荧光标记的发射强度。

在以上提出的标记和检测方法中,反应可以以任何有效顺序进行。例如,靶核酸通常同时与所有核苷酸类似物接触,然后同时与亲和试剂接触。然而,允许靶核酸与类似物接触,然后以顺序方式与亲和试剂接触。也可以以有效的方式来确定协议中的不同步骤:例如,使杂合体与一些但不是全部类似物反应,检测掺入的类似物,然后使杂合体与其他类似物反应并随后检测类似物。

上述方法可适于如下对DNA分子进行测序的双色方法:将测序引物与DNA分子杂交。随后,用户执行以下多个循环:

A.使测序引物与核苷酸类似物接触以形成延伸引物,和

B.确定掺入延伸引物中的核苷酸类似物;然后

C.去除标记的亲和试剂和荧光标记,以及

D.将每个延伸引物上的终止子核苷酸转化为非终止子核苷酸,从而允许在随后的测序循环中进一步引物延伸。

如上所述,任选使用两对具有不同特异性的抗体重复(两个半周期)步骤B和C。

可以执行任何所需的循环数,例如5或10个循环,更典型的是超过25、50、100或200个循环。

本公开还提供了用于对DNA分子进行测序的试剂盒或试剂组。例如,为了提供使用上述第一检测方案进行测序的试剂,该组试剂可以包含:(1)四个不同的核苷酸类似物,它们将根据与DNA上互补的核苷酸是腺嘌呤、胸腺嘧啶、胞嘧啶还是鸟嘌呤来使与DNA分子杂交的测序引物延伸;(2)至少三种亲和试剂,其中

(a)对四种核苷酸类似物中的一种具有特异性的第一亲和试剂,其带有在第一波长下发荧光或产生发荧光的产物的标记;

(b)对四种核苷酸类似物中的另一种具有特异性的第二亲和试剂,其带有在第二波长下发荧光或产生发荧光的产物的标记;

(c)对两种剩余核苷酸类似物中的一种具有特异性的第三亲和试剂,其带有一个或多个在第一和第二波长下均发荧光的标记;以及任选地

(d)对第四核苷酸类似物具有特异性的第四试剂,其不带有在第一或第二波长下发荧光或产生发荧光的产物的标记。

为了提供使用上述第二检测方案进行测序的试剂,该试剂组可包含:(1)四种不同的核苷酸类似物,它们将根据DNA上的互补核苷酸是腺嘌呤、胸腺嘧啶、胞嘧啶还是鸟嘌呤,使与DNA分子杂交的测序引物延伸;以及(2)四种亲和试剂,其中:

(a)对核苷酸类似物中的一种具有特异性的第一亲和试剂,其带有在第一波长下发荧光或产生发荧光的荧光产物的标记;

(b)对核苷酸类似物中的另一种具有特异性的第二亲和试剂,其带有在第二波长下发荧光或产生发荧光的荧光产物的标记;

(c)对两种剩余核苷酸类似物中的一种具有特异性的第三亲和试剂,其带有在与第一亲和试剂相同的波长下发荧光或产生发荧光的产物的标记(任选地与第一亲和试剂所用的相同的标记);以及

(d)对第四核苷酸类似物具有特异性的第四试剂,其带有在与第二亲和试剂相同的波长下发荧光或产生发荧光的产物的标记(任选地与第二亲和试剂所用的相同的标记)。

在另一种方法中,使用两个结合反应。不去除第一个结合抗体。第二对图像分别检测两个核苷酸。

在另一种方法中,执行四个结合反应以在单通道成像仪上获得4个图像。在第一反应中,结合一种亲和剂。在第二反应中,结合第二亲和剂但不除去第一亲和剂。第三和第四亲和剂被类似地结合,结果如下表所示地进行解释。该方法可在单通道(单色)测序仪上使用。

通过获取两个连续的图像,可在单通道成像仪上使用利用三种标记抗体的相似方案。例如:图像1:染料1标记的抗体A、C。图像2:染料2标记的抗体T、C:

在另一种方法中,通过使用底物来改变信号,进行四个结合反应以在单通道成像仪上获得四个图像。如果在结合这两种抗体后,首先从一种抗体产生可检测信号,然后从第二种结合的抗体产生可检测信号,则可以在单通道成像仪上使用两个结合反应以获得四个图像(每个碱基一个)。例如,如果每种抗体结合至不同的荧光素酶,其中每种荧光素酶作用于不同的底物以发出生物发光,则通过添加第一底物,将检测到第一抗体。然后可以去除底物并用第二底物替换以检测第二抗体。

如上面第8节所述,根据本发明,有可能使亲和试剂(例如抗体)和3'保护基团的去除解耦。因为可以在不去除阻断单元的情况下去除亲和试剂,所以有可能有利地重新探测一些或所有碱基位置以提高碱基调用的准确性,测试芯片的完整性,或者用于其他目的。任何给定的碱基位置可以探测一次并重新探测0次、1次、2次或多于2次。通常,单轮重新探测被认为是足够的。仅仅为了方便起见,在两次探测碱基位置的情况下,第一轮探测可以称为第一半循环,而第二轮探测可以称为第二半循环。

当重新探测时,可能用相同的亲和试剂(例如,相同的初级抗体)探测每个位置两次。更常见的是,使用不同的亲和试剂,例如不同的抗体制剂(例如,不同的单克隆抗体)、不同类别的亲和试剂(例如,在第一半循环中使用抗体探测而在第二半循环中使用适体探测),或具有不同特异性的亲和试剂。例如,在第一半循环中,可以用抗A、抗T、抗C和抗G探测阵列,以及在第二半循环中可以使用抗嘌呤和抗嘧啶探测阵列。

在一种方法中,使用两个封端基团阻断四种NLRT,例如叠氮基甲基-T、叠氮基甲基-G、氰基乙烯基-C和氰基乙烯基-A,以及用两种亲和试剂(一种特异于3'-O-叠氮基甲基-2'-脱氧核糖而另一种特异于3'-O-氰基乙烯基-2'-脱氧核糖)探测阵列一次,以及用不同的一对亲和试剂(一种特异于嘌呤而另一种特异于嘧啶)探测阵列第二次。阵列上显示3'-O-叠氮基甲基-2'-脱氧核糖和嘌呤的信号特征的地址将被鉴定为具有鸟嘌呤碱基,等等。

“亲和试剂组”用于标记SBS中使用的RT。例如,在一个实施方案中,对于包含四种RT(RT-A、RT-T、RT-C和RT-G)的RT组,可以存在四种亲和试剂的相应亲和试剂组,每种亲和试剂特异性识别并结合所述RT中的一种(抗A、抗T、抗C和抗G)。亲和试剂组描述了亲和试剂的组合,其可以(i)以试剂盒形式,作为混合物或在单独的容器中提供和/或(ii)与测序阵列接触或在测序阵列上(例如,在测序流动池内)进行组合。设想本发明的亲和试剂包括至少一种上述亲和试剂,其包括表3中所示一个或多个(例如6个中的3个)CDR。应当理解,该设想的组将包括亲和试剂,所述亲和试剂包括表2中所述的至少一个(例如2个)抗体链。

根据一个实施方案,亲和试剂组的每个成员具有不同的、可区分的可检测标记,如在四色SBS中。根据另一个实施方案,亲和试剂组的一个成员是未标记的,而其他成员是标记的。替代地,亲和试剂组可以简单地排除未标记的亲和试剂以及仅包括标记的亲和试剂。

例如,根据一个实施方案,一种亲和试剂用第一标记(例如,抗A)来标记;第二亲和试剂用第二标记(例如抗T)来标记;第三亲和试剂用第三标记(例如抗C)来标记;以及第四亲和试剂未标记或简单地从亲和试剂组中排除(例如,抗G)。这种亲和试剂组可用于三色测序。

根据另一个实施方案,一种亲和试剂(例如,抗A)用第一标记来标记;第二亲和试剂(例如抗T)用第二标记来标记;第三亲和试剂(例如,抗C)用第一标记和第二标记来标记;以及第四亲和试剂(例如,抗G)未标记(或从亲和试剂组中排除)。替代地,第三亲和试剂可包括亲和试剂分子的混合物,所有亲和试剂分子特异性结合特定碱基(例如,全部是抗C),但一些包括第一标记,另一些包括第二标记。这种亲和试剂组可用于双色测序。

根据另一个实施方案,仅使用单个可检测标记(或两个或更多个标记的单一组合),但该组成员之间的强度不同,例如当亲和试剂包含不同量的标记(或两个或更多个标记的组合中的不同量的至少一个标记)。例如,在一个实施方案中,第一亲和试剂(例如,抗A)用第一强度标记来标记;第二亲和试剂(例如,抗T)用相同的但是第二强度的标记来标记;第三亲和试剂(例如,抗C)用相同的但是第三强度的标记来标记;以及第四亲和试剂(例如,抗G)未标记(或第四亲和试剂从亲和试剂组中排除)。在另一个实施方案中,第一亲和试剂(例如,抗A)用第一强度的第一标记,以及第二标记来标记;第二亲和试剂(例如,抗T)用相同的但是第二强度的第一标记,以及相同的第二标记来标记;第三亲和试剂(例如,抗C)用相同的但是第三强度的第一标记,以及相同的第二标记来标记;以及第四亲和试剂(例如,抗G)未标记,仅用第二标记来标记,或从亲和试剂组中排除。

核苷类似物(例如,NLRT)和含有这种核苷类似物或其反应产物的寡核苷酸或多核苷酸可用作反应混合物的组分。例如,这种组分可用于反应混合物中以进行核酸测序(例如,SBS)。示例性反应混合物包括但不限于含有以下的那些反应混合物:(a)模板核酸;(b)聚合酶;(c)寡核苷酸引物;(d)3'-O可逆阻断的核苷类似物,或具有结构上不同的核碱基的3'-O可逆阻断的核苷类似物的混合物;以及(e)标记的亲和试剂。本发明的示例性测序反应混合物包括但不限于:包含多个不同模板核酸的阵列,所述多个不同模板核酸固定在阵列上的不同位置处;(b)聚合酶;(c)寡核苷酸引物;以及(d)一种NLRT或多种NLRT的混合物。本发明的示例性测序反应混合物包括但不限于包含多个不同模板核酸的阵列,所述多个不同模板核酸固定在阵列上的不同位置处;(b)生长DNA链(GDS)(其可包含3'NLRT);以及(c)一种或多种亲和试剂(例如,如上所述的亲和试剂组)。

识别单个NLRT的不同表位的亲和试剂可以组合使用。例如,识别掺入的NLRT的核碱基部分的第一亲和试剂可以与识别封端基团的第二亲和试剂一起使用。染色可以同时地或按顺序进行。在按顺序的染色中,可以在第一亲和试剂保持与NLRT结合的同时或者在重新探测的情况下去除第一亲和试剂(如下面讨论)之后,施加第二亲和试剂。

本申请中所述的组分可用于核酸测序的反应混合物中。示例性的反应混合物包括但不限于以下那些:(a)在阵列底物上的位置处包含多个核酸模板分子的克隆群的核酸阵列;和(b)聚合酶;(c)引物延伸产物;d)具有结构不同核碱基的3'-O可逆阻断核苷类似物(例如3'-O-可逆终止子脱氧核糖核苷酸)的混合物;以及(e)一种或多种标记的抗体,其可特异性结合至具有结构不同核碱基的3'-O可逆阻断核苷类似物中的一种或多者,其中至少95%的抗体分子在溶液中游离(即从核酸模板解离)),并且其中反应混合物处于升高的温度和pH(即,如上所述的离解条件),并且盐浓度通常小于100mM。

在一些实施方案中,反应混合物包含(a)DNA聚合酶,其中所述聚合酶能够在60℃的温度,pH 9和50mM盐下介导聚合;(c)寡核苷酸引物;(d)3'-O-可逆终止子脱氧核糖核苷酸,或具有结构不同核碱基的3'-O可逆阻断核苷类似物的混合物;(e)可与具有结构不同核碱基的3'-O可逆阻断核苷类似物中一种或多种特异性结合的一种或多种标记抗体,并且反应混合物中至少95%的标记抗体分子不与其靶3'-O可逆阻断核苷类似物解离。

本发明的示例性测序反应混合物还可包括洗涤缓冲液和/或包含固定在阵列上不同位置的多个模板核酸的阵列。阵列上的模板核酸可具有不同的序列。

可以提供试剂盒用于实施本发明。如上所述,NLRT和NLRT组可以以试剂盒形式提供。同样如上所述,亲和试剂和亲和试剂组可以以试剂盒形式提供。还设想到了包含NLRT和NLRT组以及亲和试剂或亲和试剂组的试剂盒。例如,本发明提供了试剂盒,其包括但不限于(a)可逆终止子核苷酸(RT)或包括一种、两种、三种、四种或更多种不同的个体RT的RT组;(b)相应的亲和试剂或包括一种、两种、三种、四种或更多种亲和试剂的亲和试剂组,每种亲和试剂对于RT中的一种是特异性的;以及(c)包装材料和/或使用说明。设想本发明的试剂盒包括至少一种上述亲和试剂,其包括表3中所述一个或多个(例如6个中的3个)CDR。应当理解,该设想的试剂盒将包括亲和试剂,所述亲和试剂包括如表2中所述的至少一个(例如2个)抗体链。

根据另一个实施方案,这种试剂盒包含多个RT,其中每个RT包含不同的核碱基;以及多种亲和试剂,其中每种亲和试剂特异性结合RT中的一种。将认识到,本发明的试剂盒包括至少一种上述亲和试剂,其包括表3中所述的一个或多个(例如6个中的3个)CDR。应当理解,该设想的试剂盒将包括亲和试剂,所述亲和试剂包括如表2中所述的至少一个(例如2个)抗体链。

在一个示例中,本发明提供了一种试剂盒,其包含(a)如本文所述的可逆终止子核苷酸,其可以掺入引物延伸产物中;(b)第一亲和试剂,其当在引物延伸产物的3'末端处掺入时与可逆终止子核苷酸特异性结合;以及(c)(a)和(b)的包装。在一种方法中,试剂盒含有多个可逆终止子脱氧核糖核苷酸,其中每个可逆终止子脱氧核糖核苷酸包含不同的核碱基;以及多个第一亲和试剂,其中每个第一亲和试剂特异性结合可逆终止子脱氧核糖核苷酸中的不同的一个。在一些实施方案中,第一亲和试剂是可检测标记的并且可彼此区分。在一些实施方案中,试剂盒包含第二亲和试剂。在一些实施方案中,第一亲和试剂和/或第二亲和试剂是抗体。

试剂盒可包括如上所述的一种或多种NLRT、DNA聚合酶和抗体。例如,本发明提供了试剂盒,其包括但不限于(a)NLRT或包括一个、两个、三个、四个或更多个具有不同结构核碱基的NLRT组;(b)相应的亲和剂,每种亲和剂都可以以核碱基特异性的方式结合到一个NLRT上;(c)能够在50-75℃(例如60℃),pH 8-10(例如pH 9)下介导聚合的DNA聚合酶;(c)(a)-(c)的包装材料和/或使用说明。在一些实施方案中,亲和试剂或亲和试剂组被可检测地标记并且可彼此区分。在一些实施方案中,试剂盒包含第二亲和试剂。在一些实施方案中,第一和/或第二亲和试剂是抗体。在一些实施方案中,试剂盒还包含第一洗涤缓冲液,其中第一洗涤缓冲液的pH在6-8的范围内(例如,pH 6.5-7.5),并且可用于洗去未结合的NLRT。在一些实施方案中,试剂盒还包含第二洗涤缓冲液,其中第二缓冲液包含150mM-1000mM或150mM-400mM的盐。

在各种实施方案中,根据本发明的测序方法包括使DNA阵列与多个未标记的RT(例如,RT-A、RT-T、RT-C和RT-G)接触。接触可以顺序进行,一次一个RT。另选地,四个RT可同时与测序阵列接触,最常见的是作为四个RT的混合物。在一些实施方案中,四个RT一起被提供为“RT组”。在一个实施方案中,RT组包括RT-A、RT-T、RT-C和RT-G。在一个实施方案中,RT组包括RT-A、RT-U、RT-C和RT-G。在一个实施方案中,一组中的一个或多个RT包含与可去除封端基团缀合的修饰的(非天然存在的)核碱基。

RT组的RT可被包装为混合物,也可被包装为试剂盒,包含每个不同RT的试剂盒是单独的容器。在这四种RT的混合物中,每个碱基可以相等的比例被包含或可包含不相等的量。

在一些实施方案中,本发明中使用的RT的3'-O可去除封端基团可被还原剂裂解,所述还原剂如膦,其包括但不限于叠氮甲基和三(羟丙基)膦(THPP)。在一些实施方案中,本发明中使用的RT的3’-O可逆封端基团可被UV光裂解,其包括但不限于硝基苄基。在一些实施方案中,可通过与Pd水溶液接触来裂解本发明中使用的RT的3’-O可逆封端基团。Pd水溶液包括但不限于烯丙基。在一些实施方案中,可用酸裂解3′-O可逆封端基团。合适的酸包括但不限于甲氧基甲基。可通过与亚硝酸钠的缓冲水溶液(pH 5.5)接触而裂解的3'-O可逆封端基团包括但不限于氨基烷氧基。

在一个实施方案中,RT组中的每个RT包含相同的封端基团(例如叠氮基甲基)。在一个实施方案中,RT组中的RT包含不同的封端基团(例如,RT-A包含叠氮基甲基,并且RT-T包含氰基乙烯基;或者RT-A和RT-G包含叠氮基甲基,并且RT-C和RT-T包含氰基乙烯基)。如果使用不同的保护基团,则任选选择此类封端基团,使得可通过相同的处理除去不同的封端基团。另选地,可选择封端基团以通过不同的处理,任选地在不同的时间下去除。

WO 2018/129214提供了对于理解本发明有用的实施例,并且是以下实施例的前提。在WO 2018/129214的实施例1中描述了缀合的3′-O-叠氮甲基-2′-dG、-dC、-dA和-dT抗原的制备。如WO 2018/129214的实施例2中所述制备针对非标记的可逆终止子(NLRT)抗原的多克隆抗体。大肠杆菌基因组DNA文库的DNA纳米球(DNB)阵列用于测序实验。这些阵列在WO 2018/129214的实施例3中进行描述。简而言之,由大肠杆菌基因组DNA的片段制备环状文库构建体,并通过滚环扩增(RCA)扩增文库构建体,以产生包含具有相邻引物结合位点的基因组DNA插入片段的DNB。将DNB排列在DNA测序流动池(例如BGISEQ-500流动池或BGISEQ-1000流动池)中。参见,Drmanac等人,2010,Science 327:78–81和Huang等人,2017,Gigascience 6:1-9。WO 2018/129214的实施例4描述了使用dN-叠氮甲基特异性兔多克隆抗体和标记的山羊抗兔第二抗体来检测DNB阵列中掺入的NLRT。WO 2018/129214的实施例5描述了使用荧光标记的RT-A、-C和-T以及未标记的RT-G进行DNA测序。WO 2018/129214的实施例6描述了使用四种未标记的RT和未标记的抗-NLRT多克隆抗体进行DNA测序。WO 2018/129214的实施例7描述了50个测序循环,其中使用抗RT-G兔一抗和标记的山羊抗兔二抗检测未标记的rt-g。WO 2018/129214的实施例8描述了以足够的特异性结合NLRT以产生适用于碱基检出分析的信噪比(snr)值的抗体WO 2018/129214的实施例9描述了使用标记的抗NLRT多克隆抗体进行25个循环的测序。WO 2018/129214的实施例11描述了在不去除3’封端基团的情况下去除抗NLRT抗体。如本文其他地方所述,抗体的去除(与引物延伸产物的解离)可与3'封端基团的裂解和去除解耦。在一种方法中,通过特异性竞争除去抗体。使用包含四个未标记的3'-叠氮甲基碱基的核苷酸,在包含大肠杆菌文库的DNB阵列上进行引物延伸。染色是同时温育所有四个直接用Color Set 1荧光团标记的抗-3'-叠氮甲基碱基抗体。特定的竞争用于通过在20μM游离抗原(3'-O-叠氮甲基-2'-脱氧鸟嘌呤、脱氧腺嘌呤、脱氧胞嘧啶、脱氧胸腺嘧啶,各自以三磷酸酯形式)存在下在50%WB1、50%Ab缓冲液中于57℃温育2分钟去除检测亲和试剂。去除Ab的程序为(1)WB1,55℃;(2)去除溶液;(3)WB1,20℃;(4)WB2;(5)SRE. WB1:NaCl 0.75M,柠檬酸钠0.075M,吐温20 0.05%,pH 7.0;WB2 NaCl 50mM,Tris-HCl pH9 50mM,吐温20 0.05%,EDTA 1mM。pH值9.0;SRE NaCl 400mM,Tris HCl pH71000mM,抗坏血酸钠L 100mM,吐温200.05%,pH 7.0。

产生针对KLH缀合的3'-叠氮甲基-dA(N3A)、3'-叠氮甲基-dC(N3C)、3'-叠氮甲基-dG(N3G)或3'-叠氮甲基-dT(N3T)的兔单克隆抗体(Yurogen Biosystems,Worcester,MA)。简而言之,用四种不同的KLH-缀合的NLRT免疫8只兔,对于四种分子中的每一种免疫两只兔。使用每个NLRT进行ELISA的出血分析。免疫后第63天,处死兔子并分离外周血单个核细胞(PBMC)或脾细胞。选择兔子进行细胞分选和培养分泌抗体的B细胞。使用NLRT筛选共培养上清液。为四个NLRT中的每一个制备了五个或十个不同的抗-NLRT抗体克隆体(取决于靶),从而产生>30mAb制剂。

由通过抗原筛选鉴定的特定B细胞克隆兔IgG基因。获得与每种靶抗原结合的选定单克隆抗体的重链和轻链IgG抗体序列。图1A-H示出了对四个NLRT中的每一个具有特异性的单克隆抗体的比对重链和轻链序列。

构建了线性表达模块。重组兔mAb通过微型瞬时表达在人胚胎肾(HEK)293T细胞中表达。通过ELISA筛选转染的293T细胞的上清液。

重链和轻链序列被亚克隆到单独的表达载体中,并在HEK293细胞中表达。通过由间接ELISA结合到抗原来验证表达的重组兔mAb。

在该实验中使用兔单克隆抗体N3A、N3T、N3G和N3C。对含有大肠杆菌基因组DNA插入片段的DNB阵列进行致敏,并使用BG9 DNA聚合酶(BGI,Shenzhen,China)使引物延伸。按指示将三十种抗体制剂以3μg/mL或25%培养上清液单独施用于DNB阵列上的分离泳道,并在35℃下温育5分钟(30次独立温育)。温育结束时,通过在35℃下用抗体缓冲液(AbB)(Tris缓冲盐水pH 7.4+0.1%BSA和0.05%Tween-20)洗涤阵列,除去未结合的初级抗体。然后将该阵列与得自Jackson Immune Research(West Grove,PA,USA)的Cy3标记的山羊抗兔第二抗体(Fab片段)在35℃下温育5分钟。该阵列用AbB洗涤以除去未结合的第二抗体,并使用BGISEQ-1000测序系统成像。如上所述,预期用单个初级抗体染色的30种抗体制剂中的每一种都在大约25%的DNA位点处结合掺入的NLRT。

进行初步筛选以确定ELISA阳性克隆体在功能测定,即测序中是否也为阳性。测序阵列中的对照泳道(泳道1、8)通过致敏DNB并使用所有四个3'-叠氮甲基dNTP(通过经由可裂解的接头连接到碱基的荧光团标记使引物延伸)而生成。显示的ACG对照值为Cy3。T抗体数据使用ROXtra标记的第二抗体,对照值对于ROX而言。结果示于表7中。

表8

即使使用给定的抗体浓度,信号在克隆体之间也会有所不同。通过ELISA呈阳性的一些抗体在DNB阵列上表现不佳。

如前所述制备大肠杆菌基因组DNA文库,并将其排列在BGISEQ-500流动池上。加入引物,并通过引物延伸使用一个靶未标记的核苷酸3'-叠氮甲基可逆终止子(dATP、dCTP、dGTP、dTTP)和三个常规标记的可逆终止子进行合成测序,其比例为:A-AF532 25%标记的,C-IF700 40%标记的、G-Cy5 35%标记的和T-ROX 35%标记的(在一个实验中,RT中的两个(RT-A和RT-C)被常规标记,并且RT中的两个(RT-G和RT-T)通过标记的单克隆抗体检测)。对于每个核苷酸,3'阻断的dNTP的总浓度为1μM,并在55℃下使用BG9 DNA掺入并且每个循环持续1分钟。掺入并洗涤以除去未掺入的核苷酸后,通过将阵列与四种直接标记的抗-3'-叠氮甲基碱基抗体(范围为1-3μg/mL)的混合物一起温育,来检测靶3'-叠氮甲基碱基核苷酸。在35℃将抗体在阵列上以每循环2X2分钟温育,其中“2x2”是指与抗体一起温育2分钟,然后在添加附加抗体后再温育2分钟。将该阵列洗涤两次以去除任何未结合的抗体,然后在35℃与适当荧光染料标记的抗体一起温育,每个循环中2X2min。将阵列洗涤两次以除去任何未结合的抗体。表9示出了直接缀合至每种第二抗体的荧光团的身份。

表9

通过在荧光团的激光激发过程中扫描并持续40ms来确定DNB阵列上每个位置的荧光信号。在确定DNB碱基的身份后,通过在57℃下用THPP(26mM)还原2分钟除去3'封端基团,从而使3'-OH基团再生并允许新生DNA链进一步延伸。去除3′封端基团也导致抗体与引物延伸产物解离。

重复该系列步骤(延伸、抗体温育、检测和去阻断),共进行25次DNA测序循环。

表10示出了使用标记的抗-NLRT单克隆抗体(使用大肠杆菌基因组作为参考基因组)的25-30个测序循环的结果。

表10

这些数据展示出,可使用未标记的可逆终止子以及结合至封端基团和碱基的单克隆抗体来进行多个DNA测序循环。

如上所述,为了证明抗体-MPS,使用了天然的未标记的腺苷、胞嘧啶、鸟苷和胸苷、叠氮甲基-3'-修饰的单磷酸核苷酸。

核苷酸通过单磷酸盐连接到NHS,然后将其连接到KLH蛋白,每两周对兔进行一次免疫。在三个月的时间段内从经免疫的兔中收集血清,并通过ELISA进行筛选以确定免疫应答。用于ELISA筛选的抗原是与涂覆在微量滴定板孔中的BSA连接的叠氮甲基-3'-阻断核苷酸。

脾细胞筛选:使用经由生物素结合到荧光标记链霉亲和素上的抗原,对从血清阳性兔收集的脾细胞进行FACS分选,以进行阳性抗体表达。FACS选择了具有阳性表达的免疫原反应性表面结合IgG的单细胞,以便在384孔板中进一步生长。这允许对表达的抗体进行确认性筛选。

抗体筛选:脾细胞扩增后,针对所有4种核苷酸变体(A、C、G和T)筛选每个单细胞来源的克隆培养物的上清液,以鉴定对特定核碱基抗原具有高反应性,并且对3个非靶向碱基具有低可检测反应性或非可检测反应性的克隆体。对于此ELISA筛选,使用了模拟测序中产生的DNA结构的抗原。四个带有杂交引物的生物素化DNA模板用于掺入未标记的叠氮甲基RT,并与链霉亲和素板结合以进行阳性和阴性ELISA筛选。如由非靶向碱基的高ELISA阳性信号所示,那些具有高非特异性结合(>20%)的抗体不在考虑之列。

抗体的克隆和表达:选定的脾细胞培养物具有将抗体重链和轻链克隆到质粒表达系统中的编码区。这些质粒用于瞬时转染293细胞系以产生单克隆抗体。表达的抗体通过蛋白A捕获柱纯化,并在将缓冲液更换为磷酸盐缓冲盐水之前,在低pH缓冲液中洗脱。

通过蛋白质上可用的游离胺与NHS酯活化的荧光染料的反应来标记抗体(14)。将NHS酯活化的荧光团在无水DMSO中稀释,并在提供强信号而不会对抗体结合或特异性产生不利影响的浓度(10-100uM)下反应。在碳酸氢盐缓冲液中将相对较低且易于获得的抗体浓度(1mg/ml)调节至pH 8,并与NHS酯染料反应。在室温下继续温育45分钟,然后在tris缓冲盐水(pH 7.4)中淬灭未反应的染料。不经任何纯化,将这些标记的抗体等分并储存在-20℃。在这些条件下的随机标记过程可平衡每个抗体的荧光团数和抗体失活。抗体-MPS抗体可以用每个抗体分子多个染料分子进行标记,从而可提供更强的测序信号。

DNBSEQ-G400用于测试和实施抗体-MPS过程。DNBSEQ平台利用了DNA纳米球(DNB)的无PCR纳米阵列;通过滚环复制产生的DNA拷贝的线性多联体,其结合在图案化纳米阵列的定义位置上(4)。对于流行的双端(PE)或第二端测序,在US20160237488中所述的DNB阵列上使用受控多位移扩增(MDA)工艺,该专利文献以应用方式并入以用于所有目的。在DNB上产生第一读数后,可通过链置换聚合酶(例如Phi29)以受控且充分同步的方式,使用天然的未阻断核苷酸使延伸产物进一步延伸(任选地使用附加引物)。该过程产生与原始DNB互补的单链(ss)DNA支链,并且仍通过未置换的区域与DNB结合(图3)。所得的“支链DNB”通常包含每个支链1-3个模板拷贝,从而提供在第二末端读数中比在第一末端读数中更多的引发位点和更强的信号。

参见美国专利10,227,647,其描述了用于双端测序的方法。在用于实施例的方法中,将包含衔接子序列和插入的基因组DNA的拷贝DNA纳米球(DNB)作为多联体与引物杂交以进行第一末端测序。在产生第一末端读数之后,通过链置换DNA聚合酶来进行受控的持续延伸,以产生多条互补链。当新合成链的3'末端到达下游链的5'末端时,5'末端被DNA聚合酶置换,产生ssDNA突出端,形成“支链DNB”。将第二末端测序引物与新成形的支链中的衔接子拷贝杂交以产生第二末端读数。

对于测序,使用经修改的标准MPS试剂盒以实现抗体-MPS过程。用具有天然核碱基的未标记RT替换标记的RT,并将结合缓冲液中四种标记抗体(对每种天然核碱基具有特异性)的混合物加到料筒中。用荧光染料标记抗体以实现当前测序仪上的成像,所述荧光染料具有与标记RT中使用的相似激发和发射光谱。每个测序循环包括利用经修饰的聚合酶掺入可逆终止子,然后结合抗体。在洗涤过量的未结合抗体后,进行标准成像,然后去除结合的抗体,并作为一个步骤或两个独立步骤进行标准3'去阻断。

在对于四种核苷酸中每一者的几种ELISA阳性抗体的初始DNBSEQ筛选中,发现多达50%具有相对弱的阳性信号。可能的解释是克隆扩增失败或ELISA假阳性。选择一组四种具有良好信号和低背景的抗体。然后,评估了测序所需的这些抗体的关键特性。来自有希望的克隆的原代脾细胞上清液也是如此。

准确的序列确定要求抗体对与3'可逆终止核糖缔合的碱基具有特异性。为了证明每种抗体种类对每个单独碱基都是特异性的,形成DNA纳米球的阵列并与引物杂交,然后用可逆终止子将其延伸一个核苷酸。

图2A示出了在与荧光抗体结合之后,在单个成像视野内的两个通道中的DNB群的荧光强度。不具有光谱染料串扰的通道对(例如A-G、A-C、T-G、T-C)不示出任何抗体交叉结合。DNB在两个通道中均为负,或在一个通道中为正,但在另一个通道中不为正(DNB簇在x和y轴上)。使用模拟测序过程中掺入的RT的寡核苷酸构建体进行阳性抗体和阴性抗体选择有助于实现高抗体特异性。

将来自一个循环的抗体-MPS产生的DNB强度绘制在成对的成像通道中。代表FOV中100,000个DNB的随机选择。提出了不具有染料串扰校正的减去背景的强度。仅示出不具有染料串扰的成对通道。对于每个对,如果在X-Y坐标表示上没有抗体交叉结合,则预期存在3个DNB簇:-/-:低X和Y强度,+/-:高X强度和低Y强度,-/+:低X强度和高Y强度。如果存在交叉结合,则+/-或-/+簇将从X或Y以一定角度偏移。在所有四个对中,仅观察到一种抗体的强结合(相对信号在1000个计数的范围内),但没有可检测的交叉结合。

免疫原使用带有3'叠氮甲基封端基团的核苷酸。确认碱基特异性之后,接着确定强结合是否需要叠氮甲基。

图2B是检测到的荧光的图,其示出抗体结合依赖于碱基和具有3'叠氮甲基嵌段的糖。在三个常规测序循环中,其中在抗体结合和成像后去除3'封端基团,之后进行三个循环,其中在抗体结合和成像之前将3'叠氮基甲基裂解。示出了减去背景的、相位校正和光谱串扰校正的强度,和/或描绘了每个成像通道(对应于每个碱基),该通道中具有最高强度的DNB的平均强度。

在前3个循环中,当将单个抗体与表面缔合的DNB温育时,实现荧光强度。在此,将强度报告为分配给成像场内的荧光团通道(在该通道中具有最强强度)的DNB的平均群强度的减去背景并经光谱串扰校正的测量值。

当在抗体结合期间存在叠氮甲基时,所有四种抗体均产生强信号(400-600个计数)。从第4个循环开始,每个循环在结合抗体之前都具有裂解步骤。除去3'叠氮甲基封端基团后,没有明显的检测信号,这表明除碱基之外,该化学部分对于强抗体结合也很重要,其可能会阻止抗体与DNA中的其他靶碱基结合。非末端核苷酸上的碱基也可通过其他空间或化学特征加以区分,因为它们在5'和3'侧具有堆积碱基和磷酸盐。

在优化抗体结合条件时,发现低盐(50mM)Tris缓冲液(pH7.6)在35-40℃下提供有效结合。

参见图2C,显示标记抗体与未标记的RT核苷酸结合的30、60或90秒的效果,并通过DNBSEQ测序将其掺入。随着温育时间增加,观察到荧光强度的最小增加。尽管这表明温育时间可能比30秒短,但必须记住,这代表了群体平均和特定序列环境的行为可不同地表现。

在35℃下的三个温育时间中,使相同浓度的抗体(

在成像之后并且在核苷酸掺入的下一循环之前,充分去除(例如,至少95%或完全去除)结合的抗体对于高质量测序是至关重要的。在一些情况下,抗体去除和3'阻断裂解同时进行。在一些情况下,抗体去除和第二掺入同时进行,参见上文。

图2D是强度数据的图,显示了在结合至RT后,去除荧光抗体的作用。在循环1-10中,在40℃下用pH 7 SSC缓冲液短暂洗涤流动池,然后在20℃下成像。在循环11-20中,将流动池在50mM Tris pH 9缓冲液(包括RT)中于57℃温育1分钟,持续60秒,然后成像。循环21-30显示在不具有核苷酸的相同缓冲液中温育60秒后,在成像前的强度。使用减去背景和经光谱串扰校正的强度,和/或描绘了每个成像通道(对应于每个碱基)的在该通道中具有最高强度的DNB的平均强度。

发现高pH(>pH 8)和超过55℃的温度定量抗体去除中是有效的。还发现,在去除缓冲液中包含未标记的RT可以加快解离速度。不包括RT的缓冲液条件与叠氮甲基裂解反应相容。

由于邻近淬灭,标记的RT可仅使一种染料附着在碱基上。为了最大程度地减少基础疤痕的不利影响,通常仅标记60-70%。抗体-MPS抗体可用每个抗体分子多个染料分子进行标记,从而可能提供更强的测序信号。

测试了由当前随机标记过程提供的信号强度,其平衡了每个抗体的荧光团数和抗体失活。发现在包含标记抗体的组合物中,单个抗体分子通常被1-5个荧光团标记或未标记。在一些实施方案中,至少50%(摩尔%)的抗体被多于一个荧光团分子(例如2-5个荧光团分子)标记。在一些实施方案中,至少75%的抗体被多于一个荧光团分子(例如2-5个荧光团分子)标记。出于例示而非限制,示例性染料在Drmanac等人[0059]、[0171]-[0174]中有所描述。

图2E是比较在返回到碱基标记的RT之前,利用抗体标记的检测,在前10个循环位置上,接着是在另外80个循环位置上的碱基标记的核苷酸的相对强度的图。相对于核苷酸的碱基标记,抗体检测产生了更强的信号,其中一些荧光团相对于其碱基标记的对应物强度提高了200%以上。不同荧光团的响应范围可能反映染料对特定抗体的标记效率、抗体结合亲和力或荧光团淬灭。强度提高的有益效果包括在整个长测序运行、低暴露时间或更快速成像期间,在低拷贝DNB中保留足够的信号。

进行十个碱基标记的测序循环,然后切换至抗体-MPS测序(循环10-90),然后返回标准直接碱基标记测序。示出了减去背景、相位校正和光谱串扰校正的强度或对于每个成像通道(对应于每个碱基),对于每个循环,描绘了该通道中具有最高强度的DNB的平均强度。

观察到标记的RT在随后的循环中产生一些信号抑制(例如淬灭),这很可能是由于修饰的(“疤痕”)碱基。由于抗体-MPS使用未标记的RT,因此预期不产生这种效果。

图2F提供了数据,其比较了两个连续循环中DNB组中的信号(来自一个视野),并证明了使用标记的RT时,在前一个周期中具有G并且在当前周期中具有T的DNB抑制T信号。低于预期的T信号导致GT簇从对角线向Y轴移动,从而代表G信号。在使用具有天然碱基且不具有任何疤痕的未标记RT的抗体-MPS中未观察到抑制作用。此外,T抗体上的染料距离G碱基较远,从而避免了淬灭。

这些数据示出,抗体-MPS技术消除了信号抑制。将DNB组中的DNB信号在前一个循环的通道G(Y轴)和当前循环的通道T(X轴)中进行比较。示出了标记的RT化学和抗体-MPS化学(天然未标记的碱基、标记的碱基特异性抗体)。图上的每个点均是DNB,其形成4个簇:无G/无T、G/无T、T/无G和G/T。在标记RT的情况下,观察到T信号低于预期(GT DNB的簇向Y轴偏移)。在抗体-MPS中未观察到抑制。

MPS读数长于100个碱基是非常有用的。作为对抗体-MPS潜力的初步验证测试,获得了200个碱基读数。在装入DNBSEQ-G400测序仪流动池的泳道中的DNB上进行200个测序循环。DNB使用MGI方案由大肠杆菌DNA的标准的300个碱基文库制备。

图3A示出了具有最佳射流和光学,在阵列的选定区域中的DNB的平均调用碱基强度,以突出这种新化学的潜力。示出在200个单端读数循环内的标记强度的变化。示出了减去背景、相位校正和光谱串扰校正的强度,并且对于每个成像通道(对应于每个碱基),描绘了该通道中具有最高强度的DNB的平均强度。

如先前由直接标记的核苷酸观察的,随着循环进行,观察到强度下降。造成这种情况的多个因素包括:i)异相信号,ii)部分地由于不纯RT以及成像时DNA损伤的不可逆终止;或ii)DNA丢失。发现即使不具有抗体结合和成像,仅具有未标记RT的掺入循环(数据未显示),类似的信号也丢失。这不包括抗体结合、成像或去除的影响。据推测,碱基之间的下降速率的差异是由于背景的变化或循环期间光收集的照明效率的影响所致。尽管在运行期间料筒中可能发生染料强度下降,但这是一个很小的原因,因为在运行过程中添加新鲜试剂时,观察到强度的增加最小(数据未显示)。然而,200个循环后的剩余信号仍然高,这支持了更长的抗体-MPS读数的可能性。

与带有可逆终止子的标准MPS一样,位置不一致随着循环推移而增加。这是由于:i)异相信号的积累,其变得与染料串扰相混淆;以及ii)相对于背景的信号损失,尤其是影响模板拷贝数低的DNB。每个周期的滞后(-1信号)和连续(+1信号)相对较低(<0.1%),但在200个循环内仍累积至

图3B示出了SE测序的200个循环的位置不一致。注意:在循环185之后,高不一致率增加是由于较短的插入片段和衔接子区域中的读取不匹配人类参考。从阵列中所有结合点中滤除5%的空点和混合的DNB后,其余95%的DNB的映射率为99%,总体不一致性为0.11%,在碱基检出中进一步降低至0.06%,其中质量得分>Q10。对于200个碱基读数而言,这是非常有希望的结果,示出较高的准确性和94%测序收率(0.95过滤读数x 0.99映射率)。

进一步评估了无PCR的大肠杆菌文库中的100个碱基读数中的序列不一致性。获得了0.029%的总体不一致性(与3500个调用碱基中的参照物相差1个)。然后,计算不同的碱基检出质量过滤条件下的不一致性。质量得分>20的碱基检出(接近所有碱基检出的99.8%)的错误减少五至六倍(不一致性接近0.0005%或20,000个碱基中一个不匹配)。剩余的高质量不一致可能是由DNA复制错误、DNA损坏或实际测序错误引起的。这表明抗体-MPS对于高质量测序的巨大潜力,总体错误率极低,并且极少出现高质量错误。

表11

双端(PE)测序提供了非常有用的MPS读数,其桥接比读数更长的重复序列,并且最小化较长连续读数的需求。最常用的是PE150(300-600b插入片段两端的150个碱基)。

测试抗体-MPS PE150以证明使用抗体不会干扰受控MDA的DNBSEQ PE过程。图4A显示了在第一链的150个循环中的强度变化,然后线束了作为互补模板的第二链上的强度的良好恢复,并且将相应的测序引物用于延伸。在该测试中,用于第二链的抗体浓度是第一链浓度的两倍。总体而言,第一链的150个位置内的强度值下降约30-50%,第二链的强度值下降40-50%,这部分是由于第二链中较高的掺入不完全(滞后)。

在过滤约11-13%的空阵列和低质量阵列点后,对于大肠杆菌(300b插入片段)和人(400b插入片段)DNA库的第一链,映射率>99%,并且不一致率分别为0.08%和0.26%(图4B)。对于第二个链,映射率约为99%,不一致率分别为0.22%和0.62%。在过滤质量分数<10的0.4%和0.8%的碱基检出后,在大肠杆菌和人类DNA文库的组合不一致性分别降至0.06%和0.24%。部分不一致性是由于文库制备中引入的PCR错误。由于样品相对于人类参照物的多态性,期望人类文库具有更高的不一致性。

尽管信号较高,但第二读数中的不一致性较高是由于用于DNB过滤的滞后时间较长和质量阈值较低。第二读数中的较高滞后(异相-1)可能是由于未完全去除以高浓度用于互补链制备的Phi 29聚合酶。在使用优化的Phi29去除的PE100运行中证实了这一点,将累积的滞后从约15%降低至约11%(图4B和4C)。此外,滞后累积更具线性,表明-2相更少。该结果说明了MPS工艺的复杂性(具有多个相互依赖的许多生化步骤),其需要仔细平衡优化。

参见图4A,示出了人类DNA文库的PE150强度,其中减去了背景并校正了光谱串扰,或者对于每个成像通道(对应于每个碱基),描绘了该通道中具有最高强度的DNB的平均强度。

表12

图4B显示了与图4A相同的过程中的PE150滞后(异相掺入-1)。滞后表示先前(-1)碱基对当前循环的强度贡献。

图4C显示了利用经优化的Ph29去除的PE100运行(大肠杆菌文库)中的PE100滞后。存在许多开发的工具以进一步优化抗体-MPS过程,包括用较小的版本(诸如ScFv或细菌宿主中表达的纳米抗体)替代完整抗体,并在靶位点处进行有效标记。与利用抗体进行检测的许多常见程序(例如Western blot,ELISA)相比,抗体的结合时间被证明相对较快,仅具30秒,从而证明有效产生足够的强度以提供低错误的碱基检出。抗体结合时间的增加对强度增加的影响最小,从而表明大多数可用的靶位点在30秒内被占据。此外,约4ug/ml的抗体足以结合大多数掺入的RT。

这是令人惊讶的,因为目标核苷酸存在于dsDNA中,并且所用的免疫原是单个单磷酸可逆终止核苷酸。最有可能存在一些瞬时dsDNA末端熔融,从而使抗体能够结合。优选的低盐、无Mg++的结合缓冲液(有助于DNA末端的呼吸)支持这种解释。

抗体-MPS的特定有益效果是,在所有未标记的RT进行单次反应掺入后,进行逐步碱基检测的可能性。通过快速结合和去除标记的抗体但不去除3'封端基团,可实现这一点。可使用较高效率和成本有效的2色或1色成像仪在单独的图像中检测每个碱基,而4色成像仪上不出现染料串扰。对于2色成像仪,将首先使用不同染料标记的两个抗体结合,并生成两个图像。在快速去除结合的抗体后,将用同一对染料标记的另外两个抗体结合在一起,以产生两个以上的图像,每个碱基一个图像。对于快速成像仪,整个过程将花费稍长的时间,但是预期序列质量要高得多,因为2色成像仪可收集2-3种以上的光(较宽的滤光带),而不发生染料串扰。

除了无PCR的DNBSEQ MPS平台之外,抗体-MPS还可用于任何MPS平台,其包括基于PCR的克隆阵列(支撑体或小珠上的PCR簇)或单分子阵列。高质量、低成本的抗体-MPS化学和无PCR的高性价比DNB纳米阵列的组合创建了新型高级MPS平台,以推动需要基于全面、准确和评价测序的筛选测试的基于基因组学的健康监测的实施。

尽管出于清楚理解的目的,通过说明和实施例详细地描述了前述发明,但本领域技术人员将理解,可以在所附权利要求的范围内实施某些改变和修改。另外,本文提供的每篇参考文献均通过引用整体并入本文,其程度如同每篇参考文献通过引用单独并入。如果本申请与本文提供的参考文献之间存在冲突,则应以本申请为准。

序列表

<110> 深圳华大智造科技股份有限公司

深圳华大生命科学研究院

<120> 使用未标记的核苷酸进行大规模平行测序

<130> 092171-1164247

<150> 62/914,915

<151> 2019-10-14

<150> 62/914,940

<151> 2019-10-14

<150> 62/914,877

<151> 2019-10-14

<150> 62/758,317

<151> 2018-11-09

<160> 165

<170> PatentIn 版本3.5

<210> 1

<211> 464

<212> PRT

<213> 人工序列

<220>

<223> 人工序列描述: 合成多肽

<400> 1

Met Glu Thr Gly Leu Arg Trp Leu Leu Leu Val Ala Val Leu Lys Gly

1 5 10 15

Val Gln Cys Gln Glu Gln Leu Glu Glu Ser Gly Gly Asp Leu Val Lys

20 25 30

Pro Glu Gly Ser Leu Thr Leu Thr Cys Lys Ala Ser Gly Phe Asp Phe

35 40 45

Ser Ser Tyr Tyr Tyr Met Cys Trp Val Arg Gln Ala Pro Gly Lys Gly

50 55 60

Leu Glu Trp Ile Ala Cys Ile Tyr Gly Gly Ser Ser Gly Thr Thr Tyr

65 70 75 80

Tyr Ala Ser Trp Pro Lys Gly Arg Phe Thr Ile Ser Lys Thr Ser Ser

85 90 95

Thr Thr Val Thr Leu Gln Met Thr Ser Leu Thr Ala Ala Asp Thr Ala

100 105 110

Thr Tyr Phe Cys Met Arg Gly Ala Asn Gly Ala Gly Phe Gly Asp Ala

115 120 125

Asn Leu Trp Gly Pro Gly Thr Leu Val Thr Val Ser Ser Gly Gln Pro

130 135 140

Lys Ala Pro Ser Val Phe Pro Leu Ala Pro Cys Cys Gly Asp Thr Pro

145 150 155 160

Ser Ser Thr Val Thr Leu Gly Cys Leu Val Lys Gly Tyr Leu Pro Glu

165 170 175

Pro Val Thr Val Thr Trp Asn Ser Gly Thr Leu Thr Asn Gly Val Arg

180 185 190

Thr Phe Pro Ser Val Arg Gln Ser Ser Gly Leu Tyr Ser Leu Ser Ser

195 200 205

Val Val Ser Val Thr Ser Ser Ser Gln Pro Val Thr Cys Asn Val Ala

210 215 220

His Pro Ala Thr Asn Thr Lys Val Asp Lys Thr Val Ala Pro Ser Thr

225 230 235 240

Cys Ser Lys Pro Met Cys Pro Pro Pro Glu Leu Pro Gly Gly Pro Ser

245 250 255

Val Phe Ile Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser Arg

260 265 270

Thr Pro Glu Val Thr Cys Val Val Val Asp Val Ser Gln Asp Asp Pro

275 280 285

Glu Val Gln Phe Thr Trp Tyr Ile Asn Asn Glu Gln Val Arg Thr Ala

290 295 300

Arg Pro Pro Leu Arg Glu Gln Gln Phe Asn Ser Thr Ile Arg Val Val

305 310 315 320

Ser Thr Leu Pro Ile Ala His Gln Asp Trp Leu Arg Gly Lys Glu Phe

325 330 335

Lys Cys Lys Val His Asn Lys Ala Leu Pro Ala Pro Ile Glu Lys Thr

340 345 350

Ile Ser Lys Ala Arg Gly Gln Pro Leu Glu Pro Lys Val Tyr Thr Met

355 360 365

Gly Pro Pro Arg Glu Glu Leu Ser Ser Arg Ser Val Ser Leu Thr Cys

370 375 380

Met Ile Asn Gly Phe Tyr Pro Ser Asp Ile Ser Val Glu Trp Glu Lys

385 390 395 400

Asn Gly Lys Ala Glu Asp Asn Tyr Lys Thr Thr Pro Thr Val Leu Asp

405 410 415

Ser Asp Gly Ser Tyr Phe Leu Tyr Ser Lys Leu Ser Val Pro Thr Ser

420 425 430

Glu Trp Gln Arg Gly Asp Val Phe Thr Cys Ser Val Met His Glu Ala

435 440 445

Leu His Asn His Tyr Thr Gln Lys Ser Ile Ser Arg Ser Pro Gly Lys

450 455 460

<210> 2

<211> 238

<212> PRT

<213> 人工序列

<220>

<223> 人工序列描述: 合成多肽

<400> 2

Met Asp Thr Arg Ala Pro Thr Gln Leu Leu Gly Leu Leu Leu Leu Trp

1 5 10 15

Leu Pro Gly Ala Thr Phe Ala Gln Val Leu Thr Gln Thr Pro Ser Ser

20 25 30

Val Ser Ala Ala Val Gly Gly Thr Val Thr Ile Asn Cys Gln Ser Ser

35 40 45

Pro Ser Val Tyr Ser Asn Tyr Leu Ser Trp Phe Gln Gln Lys Pro Gly

50 55 60

Gln Pro Pro Lys Leu Leu Ile Tyr Ser Ala Ser Thr Leu Ala Ser Gly

65 70 75 80

Val Pro Ser Arg Phe Arg Gly Ser Gly Ser Gly Thr Gln Phe Thr Leu

85 90 95

Thr Ile Ser Asp Val Gln Cys Asp Asp Ala Ala Asn Tyr Tyr Cys Ala

100 105 110

Gly Gly Tyr Thr Tyr Thr Ser Asp Ser Ile Trp Ala Phe Gly Gly Gly

115 120 125

Thr Glu Val Val Val Lys Gly Asp Pro Val Ala Pro Thr Val Leu Ile

130 135 140

Phe Pro Pro Ala Ala Asp Gln Val Ala Thr Gly Thr Val Thr Ile Val

145 150 155 160

Cys Val Ala Asn Lys Tyr Phe Pro Asp Val Thr Val Thr Trp Glu Val

165 170 175

Asp Gly Thr Thr Gln Thr Thr Gly Ile Glu Asn Ser Lys Thr Pro Gln

180 185 190

Asn Ser Ala Asp Cys Thr Tyr Asn Leu Ser Ser Thr Leu Thr Leu Thr

195 200 205

Ser Thr Gln Tyr Asn Ser His Lys Glu Tyr Thr Cys Lys Val Thr Gln

210 215 220

Gly Thr Thr Ser Val Val Gln Ser Phe Asn Arg Gly Asp Cys

225 230 235

<210> 3

<211> 464

<212> PRT

<213> 人工序列

<220>

<223> 人工序列描述: 合成多肽

<400> 3

Met Glu Thr Gly Leu Arg Trp Leu Leu Leu Val Ala Val Leu Lys Gly

1 5 10 15

Val Gln Cys Gln Glu Gln Leu Glu Glu Ala Gly Gly Asp Leu Val Lys

20 25 30

Pro Glu Gly Ser Leu Arg Leu Thr Cys Lys Ala Ser Gly Phe Asp Phe

35 40 45

Ser Ser Tyr Tyr Tyr Met Cys Trp Val Arg Gln Ala Pro Gly Lys Gly

50 55 60

Leu Glu Trp Ile Ala Cys Ile Tyr Gly Gly Ala Ser Gly Thr Thr Tyr

65 70 75 80

Tyr Ala Ser Trp Ala Lys Gly Arg Phe Thr Ile Ser Lys Thr Ser Ser

85 90 95

Thr Thr Val Thr Leu Gln Met Thr Ser Leu Thr Ala Ala Asp Thr Ala

100 105 110

Thr Tyr Phe Cys Met Arg Gly Ala Asn Gly Ala Gly Phe Gly Asp Ala

115 120 125

Asn Leu Trp Gly Pro Gly Thr Leu Val Thr Val Ser Ser Gly Gln Pro

130 135 140

Lys Ala Pro Ser Val Phe Pro Leu Ala Pro Cys Cys Gly Asp Thr Pro

145 150 155 160

Ser Ser Thr Val Thr Leu Gly Cys Leu Val Lys Gly Tyr Leu Pro Glu

165 170 175

Pro Val Thr Val Thr Trp Asn Ser Gly Thr Leu Thr Asn Gly Val Arg

180 185 190

Thr Phe Pro Ser Val Arg Gln Ser Ser Gly Leu Tyr Ser Leu Ser Ser

195 200 205

Val Val Ser Val Thr Ser Ser Ser Gln Pro Val Thr Cys Asn Val Ala

210 215 220

His Pro Ala Thr Asn Thr Lys Val Asp Lys Thr Val Ala Pro Ser Thr

225 230 235 240

Cys Ser Lys Pro Met Cys Pro Pro Pro Glu Leu Pro Gly Gly Pro Ser

245 250 255

Val Phe Ile Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser Arg

260 265 270

Thr Pro Glu Val Thr Cys Val Val Val Asp Val Ser Gln Asp Asp Pro

275 280 285

Glu Val Gln Phe Thr Trp Tyr Ile Asn Asn Glu Gln Val Arg Thr Ala

290 295 300

Arg Pro Pro Leu Arg Glu Gln Gln Phe Asn Ser Thr Ile Arg Val Val

305 310 315 320

Ser Thr Leu Pro Ile Ala His Gln Asp Trp Leu Arg Gly Lys Glu Phe

325 330 335

Lys Cys Lys Val His Asn Lys Ala Leu Pro Ala Pro Ile Glu Lys Thr

340 345 350

Ile Ser Lys Ala Arg Gly Gln Pro Leu Glu Pro Lys Val Tyr Thr Met

355 360 365

Gly Pro Pro Arg Glu Glu Leu Ser Ser Arg Ser Val Ser Leu Thr Cys

370 375 380

Met Ile Asn Gly Phe Tyr Pro Ser Asp Ile Ser Val Glu Trp Glu Lys

385 390 395 400

Asn Gly Lys Ala Glu Asp Asn Tyr Lys Thr Thr Pro Thr Val Leu Asp

405 410 415

Ser Asp Gly Ser Tyr Phe Leu Tyr Ser Lys Leu Ser Val Pro Thr Ser

420 425 430

Glu Trp Gln Arg Gly Asp Val Phe Thr Cys Ser Val Met His Glu Ala

435 440 445

Leu His Asn His Tyr Thr Gln Lys Ser Ile Ser Arg Ser Pro Gly Lys

450 455 460

<210> 4

<211> 238

<212> PRT

<213> 人工序列

<220>

<223> 人工序列描述: 合成多肽

<400> 4

Met Asp Thr Arg Ala Pro Thr Gln Leu Leu Gly Leu Leu Leu Leu Trp

1 5 10 15

Leu Pro Gly Ala Thr Phe Ala Gln Val Leu Thr Gln Thr Pro Ser Pro

20 25 30

Val Ser Ala Ala Val Gly Gly Thr Val Thr Ile Asn Cys Gln Ser Ser

35 40 45

Pro Ser Val Tyr Ser Asn Tyr Leu Ser Trp Phe Gln Gln Lys Pro Gly

50 55 60

Gln Pro Pro Lys Leu Leu Ile Tyr Ser Ala Ser Thr Leu Ala Ser Gly

65 70 75 80

Val Pro Ser Arg Phe Arg Gly Ser Gly Ser Gly Thr Gln Phe Thr Leu

85 90 95

Thr Ile Ser Asp Val Gln Cys Asp Asp Ala Ala Asn Tyr Tyr Cys Ala

100 105 110

Gly Gly Tyr Thr Tyr Thr Ser Asp Ser Ile Trp Ala Phe Gly Gly Gly

115 120 125

Thr Glu Val Val Val Lys Gly Asp Pro Val Ala Pro Thr Val Leu Ile

130 135 140

Phe Pro Pro Ala Ala Asp Gln Val Ala Thr Gly Thr Val Thr Ile Val

145 150 155 160

Cys Val Ala Asn Lys Tyr Phe Pro Asp Val Thr Val Thr Trp Glu Val

165 170 175

Asp Gly Thr Thr Gln Thr Thr Gly Ile Glu Asn Ser Lys Thr Pro Gln

180 185 190

Asn Ser Ala Asp Cys Thr Tyr Asn Leu Ser Ser Thr Leu Thr Leu Thr

195 200 205

Ser Thr Gln Tyr Asn Ser His Lys Glu Tyr Thr Cys Lys Val Thr Gln

210 215 220

Gly Thr Thr Ser Val Val Gln Ser Phe Asn Arg Gly Asp Cys

225 230 235

<210> 5

<211> 468

<212> PRT

<213> 人工序列

<220>

<223> 人工序列描述: 合成多肽

<400> 5

Met Glu Thr Gly Leu Arg Trp Leu Leu Leu Val Ala Val Leu Lys Gly

1 5 10 15

Val Gln Cys Gln Gln Gln Met Glu Glu Ser Gly Gly Gly Leu Val Gln

20 25 30

Pro Glu Gly Ser Leu Thr Leu Thr Cys Lys Ala Ser Gly Ile Asp Phe

35 40 45

Ser Ser Tyr Tyr Tyr Met Cys Trp Val Arg Gln Ala Pro Gly Lys Gly

50 55 60

Leu Glu Leu Ile Ala Cys Ile Tyr Leu Ser Ser Gly Ser Thr Trp Tyr

65 70 75 80

Ala Ser Trp Val Asn Gly Arg Phe Thr Ile Ser Arg Ser Thr Ser Leu

85 90 95

Asn Thr Val Thr Leu Gln Met Thr Ser Leu Thr Ala Ala Asp Thr Ala

100 105 110

Thr Tyr Phe Cys Ala Arg Gly Gly Phe Cys Thr Ala Tyr Ser Gly Asp

115 120 125

Gly Cys Tyr Phe Thr Leu Trp Gly Pro Gly Thr Leu Val Thr Val Ser

130 135 140

Ser Gly Gln Pro Lys Ala Pro Ser Val Phe Pro Leu Ala Pro Cys Cys

145 150 155 160

Gly Asp Thr Pro Ser Ser Thr Val Thr Leu Gly Cys Leu Val Lys Gly

165 170 175

Tyr Leu Pro Glu Pro Val Thr Val Thr Trp Asn Ser Gly Thr Leu Thr

180 185 190

Asn Gly Val Arg Thr Phe Pro Ser Val Arg Gln Ser Ser Gly Leu Tyr

195 200 205

Ser Leu Ser Ser Val Val Ser Val Thr Ser Ser Ser Gln Pro Val Thr

210 215 220

Cys Asn Val Ala His Pro Ala Thr Asn Thr Lys Val Asp Lys Thr Val

225 230 235 240

Ala Pro Ser Thr Cys Ser Lys Pro Met Cys Pro Pro Pro Glu Leu Pro

245 250 255

Gly Gly Pro Ser Val Phe Ile Phe Pro Pro Lys Pro Lys Asp Thr Leu

260 265 270

Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val Val Asp Val Ser

275 280 285

Gln Asp Asp Pro Glu Val Gln Phe Thr Trp Tyr Ile Asn Asn Glu Gln

290 295 300

Val Arg Thr Ala Arg Pro Pro Leu Arg Glu Gln Gln Phe Asn Ser Thr

305 310 315 320

Ile Arg Val Val Ser Thr Leu Pro Ile Ala His Gln Asp Trp Leu Arg

325 330 335

Gly Lys Glu Phe Lys Cys Lys Val His Asn Lys Ala Leu Pro Ala Pro

340 345 350

Ile Glu Lys Thr Ile Ser Lys Ala Arg Gly Gln Pro Leu Glu Pro Lys

355 360 365

Val Tyr Thr Met Gly Pro Pro Arg Glu Glu Leu Ser Ser Arg Ser Val

370 375 380

Ser Leu Thr Cys Met Ile Asn Gly Phe Tyr Pro Ser Asp Ile Ser Val

385 390 395 400

Glu Trp Glu Lys Asn Gly Lys Ala Glu Asp Asn Tyr Lys Thr Thr Pro

405 410 415

Thr Val Leu Asp Ser Asp Gly Ser Tyr Phe Leu Tyr Ser Lys Leu Ser

420 425 430

Val Pro Thr Ser Glu Trp Gln Arg Gly Asp Val Phe Thr Cys Ser Val

435 440 445

Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser Ile Ser Arg

450 455 460

Ser Pro Gly Lys

465

<210> 6

<211> 236

<212> PRT

<213> 人工序列

<220>

<223>人工序列描述: 合成多肽

<400> 6

Met Asp Thr Arg Ala Pro Thr Gln Leu Leu Gly Leu Leu Leu Leu Trp

1 5 10 15

Leu Pro Gly Ala Thr Phe Ala Ile Lys Met Thr Gln Pro Pro Ala Ser

20 25 30

Val Ser Ala Ala Val Gly Gly Thr Val Thr Ile Asn Cys Arg Ala Ser

35 40 45

Glu Asp Ile Asp Ser Tyr Leu Ala Trp Tyr Gln Gln Lys Pro Gly Gln

50 55 60

Pro Pro Gln Leu Leu Ile Tyr Arg Ala Ser Thr Leu Ala Ser Gly Val

65 70 75 80

Pro Ser Arg Phe Ser Gly Ser Gly Ser Gly Thr Gln Phe Thr Leu Thr

85 90 95

Ile Ser Gly Val Gln Cys Asp Asp Ala Ala Thr Tyr Tyr Cys Gln Ser

100 105 110

Thr Tyr Tyr Ser Ser Asn Pro Glu Gly Val Phe Gly Gly Gly Thr Glu

115 120 125

Val Val Val Lys Gly Asp Pro Val Ala Pro Thr Val Leu Ile Phe Pro

130 135 140

Pro Ala Ala Asp Gln Val Ala Thr Gly Thr Val Thr Ile Val Cys Val

145 150 155 160

Ala Asn Lys Tyr Phe Pro Asp Val Thr Val Thr Trp Glu Val Asp Gly

165 170 175

Thr Thr Gln Thr Thr Gly Ile Glu Asn Ser Lys Thr Pro Gln Asn Ser

180 185 190

Ala Asp Cys Thr Tyr Asn Leu Ser Ser Thr Leu Thr Leu Thr Ser Thr

195 200 205

Gln Tyr Asn Ser His Lys Glu Tyr Thr Cys Lys Val Thr Gln Gly Thr

210 215 220

Thr Ser Val Val Gln Ser Phe Asn Arg Gly Asp Cys

225 230 235

<210> 7

<211> 462

<212> PRT

<213> 人工序列

<220>

<223> 人工序列描述: 合成多肽

<400> 7

Met Glu Thr Gly Leu Arg Trp Leu Leu Leu Val Ala Val Leu Lys Gly

1 5 10 15

Val Gln Cys Gln Glu Gln Leu Val Glu Ser Gly Gly Gly Leu Val Lys

20 25 30

Pro Glu Gly Ser Leu Thr Leu Thr Cys Thr Ala Ser Gly Phe Ser Phe

35 40 45

Ser Ser Tyr Tyr Tyr Met Cys Trp Val Arg Gln Ala Pro Gly Lys Gly

50 55 60

Leu Glu Leu Ser Ala Cys Ile Asp Thr Gly Ser Gly Ser Thr Trp Tyr

65 70 75 80

Pro Ser Trp Val Asn Gly Arg Phe Thr Ile Ser Arg Ser Thr Ser Leu

85 90 95

Asn Thr Val Asp Leu Lys Met Thr Ser Leu Thr Ala Ala Asp Thr Ala

100 105 110

Thr Tyr Phe Cys Ala Arg Glu Tyr Ser Thr Ala Trp Tyr Phe Asn Leu

115 120 125

Trp Gly Pro Gly Thr Leu Val Thr Val Ser Ser Gly Gln Pro Lys Ala

130 135 140

Pro Ser Val Phe Pro Leu Ala Pro Cys Cys Gly Asp Thr Pro Ser Ser

145 150 155 160

Thr Val Thr Leu Gly Cys Leu Val Lys Gly Tyr Leu Pro Glu Pro Val

165 170 175

Thr Val Thr Trp Asn Ser Gly Thr Leu Thr Asn Gly Val Arg Thr Phe

180 185 190

Pro Ser Val Arg Gln Ser Ser Gly Leu Tyr Ser Leu Ser Ser Val Val

195 200 205

Ser Val Thr Ser Ser Ser Gln Pro Val Thr Cys Asn Val Ala His Pro

210 215 220

Ala Thr Asn Thr Lys Val Asp Lys Thr Val Ala Pro Ser Thr Cys Ser

225 230 235 240

Lys Pro Met Cys Pro Pro Pro Glu Leu Pro Gly Gly Pro Ser Val Phe

245 250 255

Ile Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser Arg Thr Pro

260 265 270

Glu Val Thr Cys Val Val Val Asp Val Ser Gln Asp Asp Pro Glu Val

275 280 285

Gln Phe Thr Trp Tyr Ile Asn Asn Glu Gln Val Arg Thr Ala Arg Pro

290 295 300

Pro Leu Arg Glu Gln Gln Phe Asn Ser Thr Ile Arg Val Val Ser Thr

305 310 315 320

Leu Pro Ile Ala His Gln Asp Trp Leu Arg Gly Lys Glu Phe Lys Cys

325 330 335

Lys Val His Asn Lys Ala Leu Pro Ala Pro Ile Glu Lys Thr Ile Ser

340 345 350

Lys Ala Arg Gly Gln Pro Leu Glu Pro Lys Val Tyr Thr Met Gly Pro

355 360 365

Pro Arg Glu Glu Leu Ser Ser Arg Ser Val Ser Leu Thr Cys Met Ile

370 375 380

Asn Gly Phe Tyr Pro Ser Asp Ile Ser Val Glu Trp Glu Lys Asn Gly

385 390 395 400

Lys Ala Glu Asp Asn Tyr Lys Thr Thr Pro Thr Val Leu Asp Ser Asp

405 410 415

Gly Ser Tyr Phe Leu Tyr Ser Lys Leu Ser Val Pro Thr Ser Glu Trp

420 425 430

Gln Arg Gly Asp Val Phe Thr Cys Ser Val Met His Glu Ala Leu His

435 440 445

Asn His Tyr Thr Gln Lys Ser Ile Ser Arg Ser Pro Gly Lys

450 455 460

<210> 8

<211> 236

<212> PRT

<213> 人工序列

<220>

<223> 人工序列描述: 合成多肽

<400> 8

Met Asp Thr Arg Ala Pro Thr Gln Leu Leu Gly Leu Leu Leu Leu Trp

1 5 10 15

Leu Pro Gly Ala Thr Phe Ala Ile Lys Met Thr Gln Thr Pro Gly Ser

20 25 30

Val Glu Val Ala Val Gly Gly Thr Val Thr Ile Asn Cys Gln Ala Ser

35 40 45

Gln Ser Ile Ser Thr Ala Leu Ala Trp Tyr Gln Gln Lys Pro Gly Gln

50 55 60

Arg Pro Lys Leu Leu Ile Tyr Asp Ala Ser Arg Leu Ala Ser Gly Val

65 70 75 80

Pro Ser Arg Phe Ser Gly Ser Gly Ser Gly Thr Glu Phe Thr Leu Thr

85 90 95

Ile Ser Gly Val Glu Cys Ala Asp Ala Ala Thr Tyr Tyr Cys His Gln

100 105 110

Gly Phe Gly Ala Ser Asn Val Asp Asn Pro Phe Gly Gly Gly Thr Glu

115 120 125

Val Val Val Glu Gly Asp Pro Val Ala Pro Thr Val Leu Ile Phe Pro

130 135 140

Pro Ala Ala Asp Gln Val Ala Thr Gly Thr Val Thr Ile Val Cys Val

145 150 155 160

Ala Asn Lys Tyr Phe Pro Asp Val Thr Val Thr Trp Glu Val Asp Gly

165 170 175

Thr Thr Gln Thr Thr Gly Ile Glu Asn Ser Lys Thr Pro Gln Asn Ser

180 185 190

Ala Asp Cys Thr Tyr Asn Leu Ser Ser Thr Leu Thr Leu Thr Ser Thr

195 200 205

Gln Tyr Asn Ser His Lys Glu Tyr Thr Cys Lys Val Thr Gln Gly Thr

210 215 220

Thr Ser Val Val Gln Ser Phe Asn Arg Gly Asp Cys

225 230 235

<210> 9

<211> 461

<212> PRT

<213> 人工序列

<220>

<223> 人工序列描述: 合成多肽

<400> 9

Met Glu Thr Gly Leu Arg Trp Leu Leu Leu Val Ala Val Leu Lys Gly

1 5 10 15

Val Gln Cys Gln Glu Gln Leu Glu Glu Ser Gly Gly Gly Leu Val Gln

20 25 30

Pro Glu Gly Ser Leu Thr Leu Thr Cys Thr Ala Ser Gly Phe Ser Phe

35 40 45

Ser Asp Asn Ala Trp Ile Cys Trp Val Arg Gln Ala Pro Gly Lys Gly

50 55 60

Leu Glu Trp Ile Gly Cys Ile Tyr Ile Gly Ser Ser Ser Thr Tyr Tyr

65 70 75 80

Ala Ser Trp Ala Lys Gly Arg Phe Thr Ile Ser Arg Thr Ser Ser Thr

85 90 95

Thr Val Asn Leu Gln Met Thr Ser Leu Thr Asp Ala Asp Thr Ala Thr

100 105 110

Tyr Phe Cys Gly Arg Asp Pro Thr Ala Ala Trp Gly Gly Gly Leu Trp

115 120 125

Gly Pro Gly Thr Leu Val Thr Val Ser Ser Gly Gln Pro Lys Ala Pro

130 135 140

Ser Val Phe Pro Leu Ala Pro Cys Cys Gly Asp Thr Pro Ser Ser Thr

145 150 155 160

Val Thr Leu Gly Cys Leu Val Lys Gly Tyr Leu Pro Glu Pro Val Thr

165 170 175

Val Thr Trp Asn Ser Gly Thr Leu Thr Asn Gly Val Arg Thr Phe Pro

180 185 190

Ser Val Arg Gln Ser Ser Gly Leu Tyr Ser Leu Ser Ser Val Val Ser

195 200 205

Val Thr Ser Ser Ser Gln Pro Val Thr Cys Asn Val Ala His Pro Ala

210 215 220

Thr Asn Thr Lys Val Asp Lys Thr Val Ala Pro Ser Thr Cys Ser Lys

225 230 235 240

Pro Met Cys Pro Pro Pro Glu Leu Pro Gly Gly Pro Ser Val Phe Ile

245 250 255

Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser Arg Thr Pro Glu

260 265 270

Val Thr Cys Val Val Val Asp Val Ser Gln Asp Asp Pro Glu Val Gln

275 280 285

Phe Thr Trp Tyr Ile Asn Asn Glu Gln Val Arg Thr Ala Arg Pro Pro

290 295 300

Leu Arg Glu Gln Gln Phe Asn Ser Thr Ile Arg Val Val Ser Thr Leu

305 310 315 320

Pro Ile Ala His Gln Asp Trp Leu Arg Gly Lys Glu Phe Lys Cys Lys

325 330 335

Val His Asn Lys Ala Leu Pro Ala Pro Ile Glu Lys Thr Ile Ser Lys

340 345 350

Ala Arg Gly Gln Pro Leu Glu Pro Lys Val Tyr Thr Met Gly Pro Pro

355 360 365

Arg Glu Glu Leu Ser Ser Arg Ser Val Ser Leu Thr Cys Met Ile Asn

370 375 380

Gly Phe Tyr Pro Ser Asp Ile Ser Val Glu Trp Glu Lys Asn Gly Lys

385 390 395 400

Ala Glu Asp Asn Tyr Lys Thr Thr Pro Thr Val Leu Asp Ser Asp Gly

405 410 415

Ser Tyr Phe Leu Tyr Ser Lys Leu Ser Val Pro Thr Ser Glu Trp Gln

420 425 430

Arg Gly Asp Val Phe Thr Cys Ser Val Met His Glu Ala Leu His Asn

435 440 445

His Tyr Thr Gln Lys Ser Ile Ser Arg Ser Pro Gly Lys

450 455 460

<210> 10

<211> 235

<212> PRT

<213> 人工序列

<220>

<223> 人工序列描述: 合成多肽

<400> 10

Met Asp Thr Arg Ala Pro Thr Gln Leu Leu Gly Leu Leu Leu Leu Trp

1 5 10 15

Leu Pro Gly Ala Ile Cys Asp Pro Val Met Thr Gln Thr Pro Ser Ser

20 25 30

Thr Ser Ala Ala Val Gly Gly Thr Val Thr Ile Ser Cys Gln Ser Ser

35 40 45

Gln Ser Val Tyr Asn Asn Asn Tyr Leu Ala Trp Tyr Gln Gln Lys Pro

50 55 60

Gly Gln Pro Pro Lys Arg Leu Ile Tyr Glu Ser Ser Lys Leu Ala Ser

65 70 75 80

Gly Val Pro Ser Arg Phe Arg Gly Ser Gly Ser Gly Ala Gln Phe Thr

85 90 95

Leu Thr Ile Ser Asp Leu Glu Cys Asp Asp Ala Ala Thr Tyr Tyr Cys

100 105 110

Leu Gly Ala Tyr Tyr Thr Thr Leu Asp Phe Gly Gly Gly Thr Glu Val

115 120 125

Val Val Arg Gly Asp Pro Val Ala Pro Thr Val Leu Ile Phe Pro Pro

130 135 140

Ala Ala Asp Gln Val Ala Thr Gly Thr Val Thr Ile Val Cys Val Ala

145 150 155 160

Asn Lys Tyr Phe Pro Asp Val Thr Val Thr Trp Glu Val Asp Gly Thr

165 170 175

Thr Gln Thr Thr Gly Ile Glu Asn Ser Lys Thr Pro Gln Asn Ser Ala

180 185 190

Asp Cys Thr Tyr Asn Leu Ser Ser Thr Leu Thr Leu Thr Ser Thr Gln

195 200 205

Tyr Asn Ser His Lys Glu Tyr Thr Cys Lys Val Thr Gln Gly Thr Thr

210 215 220

Ser Val Val Gln Ser Phe Asn Arg Gly Asp Cys

225 230 235

<210> 11

<211> 458

<212> PRT

<213> 人工序列

<220>

<223> 人工序列描述: 合成多肽

<400> 11

Met Glu Thr Gly Leu Arg Trp Leu Leu Leu Val Ala Val Leu Lys Gly

1 5 10 15

Val Gln Cys Gln Ser Leu Glu Glu Ser Gly Gly Asp Leu Val Lys Pro

20 25 30

Gly Ala Ser Leu Thr Leu Thr Cys Lys Ala Ser Gly Ile Asp Phe Ser

35 40 45

Ser Ser Tyr Trp Ile Cys Trp Val Arg Gln Ala Pro Gly Lys Gly Leu

50 55 60

Glu Trp Ile Ala Cys Ile Asp Thr Gly Ser Ser Gly Ser Thr Tyr Tyr

65 70 75 80

Ala Ser Trp Ala Lys Gly Arg Phe Thr Ile Ser Lys Pro Ser Ser Thr

85 90 95

Thr Val Ser Leu Gln Met Thr Ser Leu Gln Ala Ala Asp Thr Ala Thr

100 105 110

Tyr Phe Cys Ala Arg Lys Gly Asp Gly Thr Asp Leu Trp Gly Pro Gly

115 120 125

Thr Leu Val Thr Val Ser Ser Gly Gln Pro Lys Ala Pro Ser Val Phe

130 135 140

Pro Leu Ala Pro Cys Cys Gly Asp Thr Pro Ser Ser Thr Val Thr Leu

145 150 155 160

Gly Cys Leu Val Lys Gly Tyr Leu Pro Glu Pro Val Thr Val Thr Trp

165 170 175

Asn Ser Gly Thr Leu Thr Asn Gly Val Arg Thr Phe Pro Ser Val Arg

180 185 190

Gln Ser Ser Gly Leu Tyr Ser Leu Ser Ser Val Val Ser Val Thr Ser

195 200 205

Ser Ser Gln Pro Val Thr Cys Asn Val Ala His Pro Ala Thr Asn Thr

210 215 220

Lys Val Asp Lys Thr Val Ala Pro Ser Thr Cys Ser Lys Pro Met Cys

225 230 235 240

Pro Pro Pro Glu Leu Pro Gly Gly Pro Ser Val Phe Ile Phe Pro Pro

245 250 255

Lys Pro Lys Asp Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys

260 265 270

Val Val Val Asp Val Ser Gln Asp Asp Pro Glu Val Gln Phe Thr Trp

275 280 285

Tyr Ile Asn Asn Glu Gln Val Arg Thr Ala Arg Pro Pro Leu Arg Glu

290 295 300

Gln Gln Phe Asn Ser Thr Ile Arg Val Val Ser Thr Leu Pro Ile Ala

305 310 315 320

His Gln Asp Trp Leu Arg Gly Lys Glu Phe Lys Cys Lys Val His Asn

325 330 335

Lys Ala Leu Pro Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala Arg Gly

340 345 350

Gln Pro Leu Glu Pro Lys Val Tyr Thr Met Gly Pro Pro Arg Glu Glu

355 360 365

Leu Ser Ser Arg Ser Val Ser Leu Thr Cys Met Ile Asn Gly Phe Tyr

370 375 380

Pro Ser Asp Ile Ser Val Glu Trp Glu Lys Asn Gly Lys Ala Glu Asp

385 390 395 400

Asn Tyr Lys Thr Thr Pro Thr Val Leu Asp Ser Asp Gly Ser Tyr Phe

405 410 415

Leu Tyr Ser Lys Leu Ser Val Pro Thr Ser Glu Trp Gln Arg Gly Asp

420 425 430

Val Phe Thr Cys Ser Val Met His Glu Ala Leu His Asn His Tyr Thr

435 440 445

Gln Lys Ser Ile Ser Arg Ser Pro Gly Lys

450 455

<210> 12

<211> 236

<212> PRT

<213> 人工序列

<220>

<223> 人工序列描述: 合成多肽

<400> 12

Met Asp Thr Arg Ala Pro Thr Gln Leu Leu Gly Leu Leu Leu Leu Trp

1 5 10 15

Leu Pro Gly Ala Arg Cys Ala Leu Val Met Thr Gln Thr Pro Ala Ser

20 25 30

Val Glu Ala Ala Val Gly Gly Thr Val Thr Ile Lys Cys Gln Ala Ser

35 40 45

Gln Ser Ile Ser Ser Tyr Leu Asn Trp Tyr Gln Gln Lys Ser Gly Gln

50 55 60

Pro Pro Lys Asn Leu Ile Tyr Arg Ala Ser Thr Leu Ala Ser Gly Val

65 70 75 80

Ser Ser Arg Phe Lys Gly Ser Gly Ser Gly Thr Glu Phe Thr Leu Thr

85 90 95

Ile Asn Asp Leu Glu Cys Ala Asp Ala Ala Thr Tyr Tyr Cys Gln Ser

100 105 110

Tyr Gly Gly Tyr Ser Ile Tyr Gly Leu Val Phe Gly Gly Gly Thr Glu

115 120 125

Val Val Val Lys Gly Asp Pro Val Ala Pro Thr Val Leu Ile Phe Pro

130 135 140

Pro Ala Ala Asp Gln Val Ala Thr Gly Thr Val Thr Ile Val Cys Val

145 150 155 160

Ala Asn Lys Tyr Phe Pro Asp Val Thr Val Thr Trp Glu Val Asp Gly

165 170 175

Thr Thr Gln Thr Thr Gly Ile Glu Asn Ser Lys Thr Pro Gln Asn Ser

180 185 190

Ala Asp Cys Thr Tyr Asn Leu Ser Ser Thr Leu Thr Leu Thr Ser Thr

195 200 205

Gln Tyr Asn Ser His Lys Glu Tyr Thr Cys Lys Val Thr Gln Gly Thr

210 215 220

Thr Ser Val Val Gln Ser Phe Asn Arg Gly Asp Cys

225 230 235

<210> 13

<211> 458

<212> PRT

<213> 人工序列

<220>

<223> 人工序列描述: 合成多肽

<400> 13

Met Glu Thr Gly Leu Arg Trp Leu Leu Leu Val Ala Val Leu Lys Gly

1 5 10 15

Val Gln Cys Gln Glu Gln Leu Glu Glu Ser Gly Gly Gly Leu Val Lys

20 25 30

Pro Glu Glu Ser Leu Thr Leu Thr Cys Thr Ala Ser Gly Phe Ser Phe

35 40 45

Ile Ser Ser Asp Trp Ile Cys Trp Val Arg Gln Ala Pro Gly Lys Gly

50 55 60

Leu Glu Trp Ile Ala Cys Ile Tyr Ile Gly Gly His Thr Pro Tyr Tyr

65 70 75 80

Ala Ser Trp Ala Arg Gly Arg Phe Thr Ile Ser Lys Thr Ser Ser Thr

85 90 95

Ala Val Thr Leu Gln Met Ser Ser Leu Thr Ala Ala Asp Thr Ala Thr

100 105 110

Tyr Phe Cys Ala Arg Gly Ile Ala Gly Pro Ala Leu Trp Gly Pro Gly

115 120 125

Thr Leu Val Thr Val Ser Ser Gly Gln Pro Lys Ala Pro Ser Val Phe

130 135 140

Pro Leu Ala Pro Cys Cys Gly Asp Thr Pro Ser Ser Thr Val Thr Leu

145 150 155 160

Gly Cys Leu Val Lys Gly Tyr Leu Pro Glu Pro Val Thr Val Thr Trp

165 170 175

Asn Ser Gly Thr Leu Thr Asn Gly Val Arg Thr Phe Pro Ser Val Arg

180 185 190

Gln Ser Ser Gly Leu Tyr Ser Leu Ser Ser Val Val Ser Val Thr Ser

195 200 205

Ser Ser Gln Pro Val Thr Cys Asn Val Ala His Pro Ala Thr Asn Thr

210 215 220

Lys Val Asp Lys Thr Val Ala Pro Ser Thr Cys Ser Lys Pro Met Cys

225 230 235 240

Pro Pro Pro Glu Leu Pro Gly Gly Pro Ser Val Phe Ile Phe Pro Pro

245 250 255

Lys Pro Lys Asp Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys

260 265 270

Val Val Val Asp Val Ser Gln Asp Asp Pro Glu Val Gln Phe Thr Trp

275 280 285

Tyr Ile Asn Asn Glu Gln Val Arg Thr Ala Arg Pro Pro Leu Arg Glu

290 295 300

Gln Gln Phe Asn Ser Thr Ile Arg Val Val Ser Thr Leu Pro Ile Ala

305 310 315 320

His Gln Asp Trp Leu Arg Gly Lys Glu Phe Lys Cys Lys Val His Asn

325 330 335

Lys Ala Leu Pro Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala Arg Gly

340 345 350

Gln Pro Leu Glu Pro Lys Val Tyr Thr Met Gly Pro Pro Arg Glu Glu

355 360 365

Leu Ser Ser Arg Ser Val Ser Leu Thr Cys Met Ile Asn Gly Phe Tyr

370 375 380

Pro Ser Asp Ile Ser Val Glu Trp Glu Lys Asn Gly Lys Ala Glu Asp

385 390 395 400

Asn Tyr Lys Thr Thr Pro Thr Val Leu Asp Ser Asp Gly Ser Tyr Phe

405 410 415

Leu Tyr Ser Lys Leu Ser Val Pro Thr Ser Glu Trp Gln Arg Gly Asp

420 425 430

Val Phe Thr Cys Ser Val Met His Glu Ala Leu His Asn His Tyr Thr

435 440 445

Gln Lys Ser Ile Ser Arg Ser Pro Gly Lys

450 455

<210> 14

<211> 235

<212> PRT

<213> 人工序列

<220>

<223> 人工序列描述: 合成多肽

<400> 14

Met Asp Thr Arg Ala Pro Thr Gln Leu Leu Gly Leu Leu Leu Leu Trp

1 5 10 15

Leu Pro Gly Ala Thr Phe Ala Gln Val Leu Thr Gln Thr Pro Ser Pro

20 25 30

Val Ser Ala Ala Val Gly Gly Thr Val Thr Ile Asn Cys Gln Ala Ser

35 40 45

Gln Ser Val Phe Arg Asn Asn Tyr Leu Ala Trp Tyr Gln Gln Lys Pro

50 55 60

Gly Gln Pro Pro Thr Gln Leu Ile Tyr Leu Ala Ser Thr Leu Ala Ser

65 70 75 80

Gly Val Pro Ser Arg Phe Ser Gly Ser Gly Ser Gly Thr Gln Phe Thr

85 90 95

Leu Thr Ile Ser Asp Val Gln Cys Asp Asp Ala Ala Thr Tyr Tyr Cys

100 105 110

Ala Gly Ala Thr Ser Ser Ile Ile Ile Phe Gly Gly Gly Thr Glu Val

115 120 125

Val Val Lys Gly Asp Pro Val Ala Pro Thr Val Leu Ile Phe Pro Pro

130 135 140

Ala Ala Asp Gln Val Ala Thr Gly Thr Val Thr Ile Val Cys Val Ala

145 150 155 160

Asn Lys Tyr Phe Pro Asp Val Thr Val Thr Trp Glu Val Asp Gly Thr

165 170 175

Thr Gln Thr Thr Gly Ile Glu Asn Ser Lys Thr Pro Gln Asn Ser Ala

180 185 190

Asp Cys Thr Tyr Asn Leu Ser Ser Thr Leu Thr Leu Thr Ser Thr Gln

195 200 205

Tyr Asn Ser His Lys Glu Tyr Thr Cys Lys Val Thr Gln Gly Thr Thr

210 215 220

Ser Val Val Gln Ser Phe Asn Arg Gly Asp Cys

225 230 235

<210> 15

<211> 461

<212> PRT

<213> 人工序列

<220>

<223> 人工序列描述: 合成多肽

<400> 15

Met Glu Thr Gly Leu Arg Trp Leu Leu Leu Val Ala Val Leu Lys Gly

1 5 10 15

Val Gln Cys Gln Glu Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln

20 25 30

Pro Glu Gly Ser Leu Thr Leu Thr Cys Thr Ala Ser Gly Phe Ser Phe

35 40 45

Ser Ala Asn His Trp Ile Cys Trp Val Arg Gln Ala Pro Gly Lys Gly

50 55 60

Leu Glu Trp Val Gly Cys Ile Tyr Ile Gly Ser Gly Asn Thr Tyr Tyr

65 70 75 80

Ala Ser Trp Ala Lys Gly Arg Phe Thr Ile Ser Lys Thr Ser Ser Thr

85 90 95

Thr Val Thr Leu Gln Met Thr Ser Leu Thr Asp Ala Asp Thr Ala Met

100 105 110

Tyr Phe Cys Gly Arg Asp Pro Thr Ala Gly Trp Gly Gly Gly Leu Trp

115 120 125

Gly Pro Gly Thr Leu Val Thr Val Ser Ser Gly Gln Pro Lys Ala Pro

130 135 140

Ser Val Phe Pro Leu Ala Pro Cys Cys Gly Asp Thr Pro Ser Ser Thr

145 150 155 160

Val Thr Leu Gly Cys Leu Val Lys Gly Tyr Leu Pro Glu Pro Val Thr

165 170 175

Val Thr Trp Asn Ser Gly Thr Leu Thr Asn Gly Val Arg Thr Phe Pro

180 185 190

Ser Val Arg Gln Ser Ser Gly Leu Tyr Ser Leu Ser Ser Val Val Ser

195 200 205

Val Thr Ser Ser Ser Gln Pro Val Thr Cys Asn Val Ala His Pro Ala

210 215 220

Thr Asn Thr Lys Val Asp Lys Thr Val Ala Pro Ser Thr Cys Ser Lys

225 230 235 240

Pro Met Cys Pro Pro Pro Glu Leu Pro Gly Gly Pro Ser Val Phe Ile

245 250 255

Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser Arg Thr Pro Glu

260 265 270

Val Thr Cys Val Val Val Asp Val Ser Gln Asp Asp Pro Glu Val Gln

275 280 285

Phe Thr Trp Tyr Ile Asn Asn Glu Gln Val Arg Thr Ala Arg Pro Pro

290 295 300

Leu Arg Glu Gln Gln Phe Asn Ser Thr Ile Arg Val Val Ser Thr Leu

305 310 315 320

Pro Ile Ala His Gln Asp Trp Leu Arg Gly Lys Glu Phe Lys Cys Lys

325 330 335

Val His Asn Lys Ala Leu Pro Ala Pro Ile Glu Lys Thr Ile Ser Lys

340 345 350

Ala Arg Gly Gln Pro Leu Glu Pro Lys Val Tyr Thr Met Gly Pro Pro

355 360 365

Arg Glu Glu Leu Ser Ser Arg Ser Val Ser Leu Thr Cys Met Ile Asn

370 375 380

Gly Phe Tyr Pro Ser Asp Ile Ser Val Glu Trp Glu Lys Asn Gly Lys

385 390 395 400

Ala Glu Asp Asn Tyr Lys Thr Thr Pro Thr Val Leu Asp Ser Asp Gly

405 410 415

Ser Tyr Phe Leu Tyr Ser Lys Leu Ser Val Pro Thr Ser Glu Trp Gln

420 425 430

Arg Gly Asp Val Phe Thr Cys Ser Val Met His Glu Ala Leu His Asn

435 440 445

His Tyr Thr Gln Lys Ser Ile Ser Arg Ser Pro Gly Lys

450 455 460

<210> 16

<211> 235

<212> PRT

<213> 人工序列

<220>

<223> 人工序列描述: 合成多肽

<400> 16

Met Asp Thr Arg Ala Pro Thr Gln Leu Leu Gly Leu Leu Leu Leu Trp

1 5 10 15

Leu Pro Gly Ala Thr Phe Ala Gln Val Leu Thr Gln Thr Pro Ser Ser

20 25 30

Val Ser Ala Ala Val Gly Gly Thr Val Thr Ile Ser Cys Gln Ser Ser

35 40 45

Gln Ser Val Tyr Asn Asn Asn Tyr Leu Ala Trp Tyr Gln Gln Lys Pro

50 55 60

Gly Gln Pro Pro Lys Arg Leu Ile Tyr Glu Ala Ser Lys Leu Ala Ser

65 70 75 80

Gly Val Pro Ser Arg Phe Arg Gly Ser Gly Ser Gly Thr His Phe Thr

85 90 95

Leu Thr Ile Ser Gly Val Gln Cys Asp Asp Ala Ala Thr Tyr Tyr Cys

100 105 110

Leu Gly Ala Tyr Phe Thr Thr Ile Val Phe Gly Gly Gly Thr Glu Val

115 120 125

Val Val Arg Gly Asp Pro Val Ala Pro Thr Val Leu Ile Phe Pro Pro

130 135 140

Ala Ala Asp Gln Val Ala Thr Gly Thr Val Thr Ile Val Cys Val Ala

145 150 155 160

Asn Lys Tyr Phe Pro Asp Val Thr Val Thr Trp Glu Val Asp Gly Thr

165 170 175

Thr Gln Thr Thr Gly Ile Glu Asn Ser Lys Thr Pro Gln Asn Ser Ala

180 185 190

Asp Cys Thr Tyr Asn Leu Ser Ser Thr Leu Thr Leu Thr Ser Thr Gln

195 200 205

Tyr Asn Ser His Lys Glu Tyr Thr Cys Lys Val Thr Gln Gly Thr Thr

210 215 220

Ser Val Val Gln Ser Phe Asn Arg Gly Asp Cys

225 230 235

<210> 17

<211> 458

<212> PRT

<213> 人工序列

<220>

<223> 人工序列描述: 合成多肽

<400> 17

Met Glu Thr Gly Leu Arg Trp Leu Leu Leu Val Ala Val Leu Lys Gly

1 5 10 15

Val Gln Cys Gln Glu Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln

20 25 30

Pro Glu Gly Ser Leu Thr Leu Thr Cys Lys Ala Ser Gly Phe Ser Phe

35 40 45

Ser Ser Ser Tyr Trp Ile Cys Trp Val Arg Gln Ala Pro Gly Lys Gly

50 55 60

Pro Glu Trp Ile Ala Cys Ile Tyr Ile Gly Ala Gly Ser Thr Tyr Tyr

65 70 75 80

Ala Asn Trp Ala Lys Gly Arg Phe Thr Ile Ser Lys Thr Ser Ser Thr

85 90 95

Thr Val Thr Leu Gln Met Thr Ser Leu Thr Ala Ala Asp Thr Ala Thr

100 105 110

Tyr Phe Cys Ser Arg Gly Ile Ala Gly Val Ala Leu Trp Gly Pro Gly

115 120 125

Thr Leu Val Thr Val Ser Ser Gly Gln Pro Lys Ala Pro Ser Val Phe

130 135 140

Pro Leu Ala Pro Cys Cys Gly Asp Thr Pro Ser Ser Thr Val Thr Leu

145 150 155 160

Gly Cys Leu Val Lys Gly Tyr Leu Pro Glu Pro Val Thr Val Thr Trp

165 170 175

Asn Ser Gly Thr Leu Thr Asn Gly Val Arg Thr Phe Pro Ser Val Arg

180 185 190

Gln Ser Ser Gly Leu Tyr Ser Leu Ser Ser Val Val Ser Val Thr Ser

195 200 205

Ser Ser Gln Pro Val Thr Cys Asn Val Ala His Pro Ala Thr Asn Thr

210 215 220

Lys Val Asp Lys Thr Val Ala Pro Ser Thr Cys Ser Lys Pro Met Cys

225 230 235 240

Pro Pro Pro Glu Leu Pro Gly Gly Pro Ser Val Phe Ile Phe Pro Pro

245 250 255

Lys Pro Lys Asp Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys

260 265 270

Val Val Val Asp Val Ser Gln Asp Asp Pro Glu Val Gln Phe Thr Trp

275 280 285

Tyr Ile Asn Asn Glu Gln Val Arg Thr Ala Arg Pro Pro Leu Arg Glu

290 295 300

Gln Gln Phe Asn Ser Thr Ile Arg Val Val Ser Thr Leu Pro Ile Ala

305 310 315 320

His Gln Asp Trp Leu Arg Gly Lys Glu Phe Lys Cys Lys Val His Asn

325 330 335

Lys Ala Leu Pro Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala Arg Gly

340 345 350

Gln Pro Leu Glu Pro Lys Val Tyr Thr Met Gly Pro Pro Arg Glu Glu

355 360 365

Leu Ser Ser Arg Ser Val Ser Leu Thr Cys Met Ile Asn Gly Phe Tyr

370 375 380

Pro Ser Asp Ile Ser Val Glu Trp Glu Lys Asn Gly Lys Ala Glu Asp

385 390 395 400

Asn Tyr Lys Thr Thr Pro Thr Val Leu Asp Ser Asp Gly Ser Tyr Phe

405 410 415

Leu Tyr Ser Lys Leu Ser Val Pro Thr Ser Glu Trp Gln Arg Gly Asp

420 425 430

Val Phe Thr Cys Ser Val Met His Glu Ala Leu His Asn His Tyr Thr

435 440 445

Gln Lys Ser Ile Ser Arg Ser Pro Gly Lys

450 455

<210> 18

<211> 235

<212> PRT

<213> 人工序列

<220>

<223> 人工序列描述: 合成多肽

<400> 18

Met Asp Thr Arg Ala Pro Thr Gln Leu Leu Gly Leu Leu Leu Leu Trp

1 5 10 15

Leu Pro Gly Ala Thr Phe Ala Gln Val Leu Thr Gln Thr Pro Ser Pro

20 25 30

Val Ser Ala Ala Val Gly Ser Thr Val Thr Ile Asn Cys Gln Ala Ser

35 40 45

Gln Ser Val Tyr Lys Asn Asn Tyr Leu Ala Trp Tyr Gln Gln Lys Pro

50 55 60

Gly Gln Pro Pro Lys Gln Leu Ile Tyr Asp Ala Ser Thr Leu Ala Ser

65 70 75 80

Gly Val Pro Thr Arg Phe Lys Gly Ser Gly Ser Gly Thr Gln Phe Thr

85 90 95

Leu Thr Ile Ser Asp Val Gln Cys Asp Asp Ala Ala Thr Tyr Tyr Cys

100 105 110

Ala Gly Ala Tyr Ser Thr Val Val Val Phe Gly Gly Gly Thr Glu Val

115 120 125

Val Val Lys Gly Asp Pro Val Ala Pro Thr Val Leu Ile Phe Pro Pro

130 135 140

Ala Ala Asp Gln Val Ala Thr Gly Thr Val Thr Ile Val Cys Val Ala

145 150 155 160

Asn Lys Tyr Phe Pro Asp Val Thr Val Thr Trp Glu Val Asp Gly Thr

165 170 175

Thr Gln Thr Thr Gly Ile Glu Asn Ser Lys Thr Pro Gln Asn Ser Ala

180 185 190

Asp Cys Thr Tyr Asn Leu Ser Ser Thr Leu Thr Leu Thr Ser Thr Gln

195 200 205

Tyr Asn Ser His Lys Glu Tyr Thr Cys Lys Val Thr Gln Gly Thr Thr

210 215 220

Ser Val Val Gln Ser Phe Asn Arg Gly Asp Cys

225 230 235

<210> 19

<211> 469

<212> PRT

<213> 人工序列

<220>

<223> 人工序列描述: 合成多肽

<400> 19

Met Glu Thr Gly Leu Arg Trp Leu Leu Leu Val Ala Val Leu Lys Gly

1 5 10 15

Val Gln Cys Gln Gln Gln Leu Glu Glu Ser Gly Gly Gly Leu Val Lys

20 25 30

Pro Gly Gly Thr Leu Thr Leu Thr Cys Arg Ala Ser Gly Ile Asp Phe

35 40 45

Ser Ser Tyr Tyr Tyr Met Cys Trp Val Arg Gln Ala Pro Gly Arg Gly

50 55 60

Leu Glu Leu Val Ala Cys Ile Glu Pro Ser Thr Val Ser Thr Trp Tyr

65 70 75 80

Ala Asn Trp Val Ile Gly Arg Phe Thr Ile Ser Arg Thr Ser Ser Thr

85 90 95

Thr Val Thr Leu Gln Met Thr Ser Leu Thr Ala Ala Asp Thr Ala Thr

100 105 110

Tyr Phe Cys Ala Thr Ser Tyr Ser Tyr Gly Arg Ser Gly Tyr Ala Ser

115 120 125

Thr Thr Thr Arg Leu Asp Leu Trp Gly Gln Gly Thr Leu Val Thr Val

130 135 140

Ser Ser Gly Gln Pro Lys Ala Pro Ser Val Phe Pro Leu Ala Pro Cys

145 150 155 160

Cys Gly Asp Thr Pro Ser Ser Thr Val Thr Leu Gly Cys Leu Val Lys

165 170 175

Gly Tyr Leu Pro Glu Pro Val Thr Val Thr Trp Asn Ser Gly Thr Leu

180 185 190

Thr Asn Gly Val Arg Thr Phe Pro Ser Val Arg Gln Ser Ser Gly Leu

195 200 205

Tyr Ser Leu Ser Ser Val Val Ser Val Thr Ser Ser Ser Gln Pro Val

210 215 220

Thr Cys Asn Val Ala His Pro Ala Thr Asn Thr Lys Val Asp Lys Thr

225 230 235 240

Val Ala Pro Ser Thr Cys Ser Lys Pro Met Cys Pro Pro Pro Glu Leu

245 250 255

Pro Gly Gly Pro Ser Val Phe Ile Phe Pro Pro Lys Pro Lys Asp Thr

260 265 270

Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val Val Asp Val

275 280 285

Ser Gln Asp Asp Pro Glu Val Gln Phe Thr Trp Tyr Ile Asn Asn Glu

290 295 300

Gln Val Arg Thr Ala Arg Pro Pro Leu Arg Glu Gln Gln Phe Asn Ser

305 310 315 320

Thr Ile Arg Val Val Ser Thr Leu Pro Ile Ala His Gln Asp Trp Leu

325 330 335

Arg Gly Lys Glu Phe Lys Cys Lys Val His Asn Lys Ala Leu Pro Ala

340 345 350

Pro Ile Glu Lys Thr Ile Ser Lys Ala Arg Gly Gln Pro Leu Glu Pro

355 360 365

Lys Val Tyr Thr Met Gly Pro Pro Arg Glu Glu Leu Ser Ser Arg Ser

370 375 380

Val Ser Leu Thr Cys Met Ile Asn Gly Phe Tyr Pro Ser Asp Ile Ser

385 390 395 400

Val Glu Trp Glu Lys Asn Gly Lys Ala Glu Asp Asn Tyr Lys Thr Thr

405 410 415

Pro Thr Val Leu Asp Ser Asp Gly Ser Tyr Phe Leu Tyr Ser Lys Leu

420 425 430

Ser Val Pro Thr Ser Glu Trp Gln Arg Gly Asp Val Phe Thr Cys Ser

435 440 445

Val Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser Ile Ser

450 455 460

Arg Ser Pro Gly Lys

465

<210> 20

<211> 238

<212> PRT

<213> 人工序列

<220>

<223> 人工序列描述: 合成多肽

<400> 20

Met Asp Thr Arg Ala Pro Thr Gln Leu Leu Gly Leu Leu Leu Leu Trp

1 5 10 15

Leu Pro Gly Ala Thr Phe Ala Ala Val Leu Thr Gln Thr Pro Ser Pro

20 25 30

Val Ser Ala Ala Val Gly Gly Ala Val Thr Ile Asn Cys Gln Ser Ser

35 40 45

Lys Ser Val Tyr Asn Asn Asn Glu Leu Ser Trp Tyr Gln Gln Lys Pro

50 55 60

Gly Gln Pro Pro Lys Leu Leu Ile Tyr Leu Ala Ser Asn Leu Ala Ser

65 70 75 80

Gly Val Pro Ser Arg Phe Lys Gly Ser Gly Ser Gly Thr Gln Phe Thr

85 90 95

Leu Thr Ile Ser Asp Val Gln Cys Asp Asp Ala Ala Thr Tyr Tyr Cys

100 105 110

Ile Gly Gly Trp Ser Ser Ser Ser Asp Gln Asn Gly Phe Gly Gly Gly

115 120 125

Thr Glu Val Val Val Lys Gly Asp Pro Val Ala Pro Thr Val Leu Ile

130 135 140

Phe Pro Pro Ala Ala Asp Gln Val Ala Thr Gly Thr Val Thr Ile Val

145 150 155 160

Cys Val Ala Asn Lys Tyr Phe Pro Asp Val Thr Val Thr Trp Glu Val

165 170 175

Asp Gly Thr Thr Gln Thr Thr Gly Ile Glu Asn Ser Lys Thr Pro Gln

180 185 190

Asn Ser Ala Asp Cys Thr Tyr Asn Leu Ser Ser Thr Leu Thr Leu Thr

195 200 205

Ser Thr Gln Tyr Asn Ser His Lys Glu Tyr Thr Cys Lys Val Thr Gln

210 215 220

Gly Thr Thr Ser Val Val Gln Ser Phe Asn Arg Gly Asp Cys

225 230 235

<210> 21

<211> 462

<212> PRT

<213> 人工序列

<220>

<223> 人工序列描述: 合成多肽

<400> 21

Met Glu Thr Gly Leu Arg Trp Leu Leu Leu Val Ala Val Leu Lys Gly

1 5 10 15

Val Gln Cys Gln Glu Gln Leu Val Glu Ser Gly Gly Gly Leu Val Lys

20 25 30

Pro Gly Ala Ser Leu Ala Leu Thr Cys Lys Ala Ser Gly Ile Asp Phe

35 40 45

Asn Ser Gly Tyr Tyr Ile Cys Trp Val Arg Gln Ala Pro Gly Lys Gly

50 55 60

Leu Glu Trp Ile Ala Cys Ile Asp Thr Gly Thr Ala Asp Thr Ala Tyr

65 70 75 80

Ala Thr Trp Ala Lys Gly Arg Phe Thr Ile Ser Lys Thr Ser Ser Thr

85 90 95

Thr Val Thr Leu Gln Met Thr Ser Leu Thr Gly Ala Asp Thr Ala Thr

100 105 110

Tyr Phe Cys Ser Arg Asp Leu Gly Gly Gly Gly Tyr Asp Pro Asp Leu

115 120 125

Trp Gly Pro Gly Thr Leu Val Thr Val Ser Ser Gly Gln Pro Lys Ala

130 135 140

Pro Ser Val Phe Pro Leu Ala Pro Cys Cys Gly Asp Thr Pro Ser Ser

145 150 155 160

Thr Val Thr Leu Gly Cys Leu Val Lys Gly Tyr Leu Pro Glu Pro Val

165 170 175

Thr Val Thr Trp Asn Ser Gly Thr Leu Thr Asn Gly Val Arg Thr Phe

180 185 190

Pro Ser Val Arg Gln Ser Ser Gly Leu Tyr Ser Leu Ser Ser Val Val

195 200 205

Ser Val Thr Ser Ser Ser Gln Pro Val Thr Cys Asn Val Ala His Pro

210 215 220

Ala Thr Asn Thr Lys Val Asp Lys Thr Val Ala Pro Ser Thr Cys Ser

225 230 235 240

Lys Pro Met Cys Pro Pro Pro Glu Leu Pro Gly Gly Pro Ser Val Phe

245 250 255

Ile Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser Arg Thr Pro

260 265 270

Glu Val Thr Cys Val Val Val Asp Val Ser Gln Asp Asp Pro Glu Val

275 280 285

Gln Phe Thr Trp Tyr Ile Asn Asn Glu Gln Val Arg Thr Ala Arg Pro

290 295 300

Pro Leu Arg Glu Gln Gln Phe Asn Ser Thr Ile Arg Val Val Ser Thr

305 310 315 320

Leu Pro Ile Ala His Gln Asp Trp Leu Arg Gly Lys Glu Phe Lys Cys

325 330 335

Lys Val His Asn Lys Ala Leu Pro Ala Pro Ile Glu Lys Thr Ile Ser

340 345 350

Lys Ala Arg Gly Gln Pro Leu Glu Pro Lys Val Tyr Thr Met Gly Pro

355 360 365

Pro Arg Glu Glu Leu Ser Ser Arg Ser Val Ser Leu Thr Cys Met Ile

370 375 380

Asn Gly Phe Tyr Pro Ser Asp Ile Ser Val Glu Trp Glu Lys Asn Gly

385 390 395 400

Lys Ala Glu Asp Asn Tyr Lys Thr Thr Pro Thr Val Leu Asp Ser Asp

405 410 415

Gly Ser Tyr Phe Leu Tyr Ser Lys Leu Ser Val Pro Thr Ser Glu Trp

420 425 430

Gln Arg Gly Asp Val Phe Thr Cys Ser Val Met His Glu Ala Leu His

435 440 445

Asn His Tyr Thr Gln Lys Ser Ile Ser Arg Ser Pro Gly Lys

450 455 460

<210> 22

<211> 237

<212> PRT

<213> 人工序列

<220>

<223> 人工序列描述: 合成多肽

<400> 22

Met Asp Thr Arg Ala Pro Thr Gln Leu Leu Gly Leu Leu Leu Leu Trp

1 5 10 15

Leu Pro Gly Ala Arg Cys Ala Ala Asp Met Thr Gln Thr Pro Ser Ser

20 25 30

Val Ser Pro Thr Val Gly Gly Thr Val Thr Ile Asn Cys Gln Ser Ser

35 40 45

Pro Ser Val Trp Asn Asn Tyr Leu Ser Trp Phe Gln Gln Lys Pro Gly

50 55 60

Gln Pro Pro Lys Leu Leu Ile Tyr Gly Ala Ser Thr Leu Ala Ser Gly

65 70 75 80

Val Pro Ser Arg Phe Gln Gly Ser Gly Ser Gly Thr Gln Phe Thr Leu

85 90 95

Thr Ile Ser Asp Val Gln Cys Asp Asp Ala Ala Thr Tyr Tyr Cys Ala

100 105 110

Gly Gly Tyr Arg Ser Tyr Thr Asp Thr Phe Val Phe Gly Gly Gly Thr

115 120 125

Glu Val Val Val Lys Gly Asp Pro Val Ala Pro Thr Val Leu Ile Phe

130 135 140

Pro Pro Ala Ala Asp Gln Val Ala Thr Gly Thr Val Thr Ile Val Cys

145 150 155 160

Val Ala Asn Lys Tyr Phe Pro Asp Val Thr Val Thr Trp Glu Val Asp

165 170 175

Gly Thr Thr Gln Thr Thr Gly Ile Glu Asn Ser Lys Thr Pro Gln Asn

180 185 190

Ser Ala Asp Cys Thr Tyr Asn Leu Ser Ser Thr Leu Thr Leu Thr Ser

195 200 205

Thr Gln Tyr Asn Ser His Lys Glu Tyr Thr Cys Lys Val Thr Gln Gly

210 215 220

Thr Thr Ser Val Val Gln Ser Phe Asn Arg Gly Asp Cys

225 230 235

<210> 23

<211> 457

<212> PRT

<213> 人工序列

<220>

<223> 人工序列描述: 合成多肽

<400> 23

Met Glu Thr Gly Leu Arg Trp Leu Leu Leu Val Ala Val Leu Lys Gly

1 5 10 15

Val Gln Cys Gln Ser Leu Glu Glu Ser Gly Gly Gly Leu Val Gln Pro

20 25 30

Glu Gly Ser Leu Thr Leu Thr Cys Thr Ala Ser Gly Phe Ser Phe Thr

35 40 45

Met Tyr Gly Ile Ile Trp Val Arg Gln Ala Pro Gly Lys Gly Leu Glu

50 55 60

Trp Ile Ala Cys Ile Asp Ala Gly Arg Ser Gly Ser Thr Tyr Tyr Ala

65 70 75 80

Ser Trp Ala Lys Gly Arg Phe Thr Ile Ser Lys Thr Ser Ser Thr Thr

85 90 95

Val Thr Leu Gln Met Thr Ser Leu Thr Ala Ala Asp Thr Ala Thr Tyr

100 105 110

Phe Cys Ala Arg Gly Gly Ala Gly Phe Thr Leu Trp Gly Pro Gly Thr

115 120 125

Leu Val Thr Val Ser Ser Gly Gln Pro Lys Ala Pro Ser Val Phe Pro

130 135 140

Leu Ala Pro Cys Cys Gly Asp Thr Pro Ser Ser Thr Val Thr Leu Gly

145 150 155 160

Cys Leu Val Lys Gly Tyr Leu Pro Glu Pro Val Thr Val Thr Trp Asn

165 170 175

Ser Gly Thr Leu Thr Asn Gly Val Arg Thr Phe Pro Ser Val Arg Gln

180 185 190

Ser Ser Gly Leu Tyr Ser Leu Ser Ser Val Val Ser Val Thr Ser Ser

195 200 205

Ser Gln Pro Val Thr Cys Asn Val Ala His Pro Ala Thr Asn Thr Lys

210 215 220

Val Asp Lys Thr Val Ala Pro Ser Thr Cys Ser Lys Pro Met Cys Pro

225 230 235 240

Pro Pro Glu Leu Pro Gly Gly Pro Ser Val Phe Ile Phe Pro Pro Lys

245 250 255

Pro Lys Asp Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val

260 265 270

Val Val Asp Val Ser Gln Asp Asp Pro Glu Val Gln Phe Thr Trp Tyr

275 280 285

Ile Asn Asn Glu Gln Val Arg Thr Ala Arg Pro Pro Leu Arg Glu Gln

290 295 300

Gln Phe Asn Ser Thr Ile Arg Val Val Ser Thr Leu Pro Ile Ala His

305 310 315 320

Gln Asp Trp Leu Arg Gly Lys Glu Phe Lys Cys Lys Val His Asn Lys

325 330 335

Ala Leu Pro Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala Arg Gly Gln

340 345 350

Pro Leu Glu Pro Lys Val Tyr Thr Met Gly Pro Pro Arg Glu Glu Leu

355 360 365

Ser Ser Arg Ser Val Ser Leu Thr Cys Met Ile Asn Gly Phe Tyr Pro

370 375 380

Ser Asp Ile Ser Val Glu Trp Glu Lys Asn Gly Lys Ala Glu Asp Asn

385 390 395 400

Tyr Lys Thr Thr Pro Thr Val Leu Asp Ser Asp Gly Ser Tyr Phe Leu

405 410 415

Tyr Ser Lys Leu Ser Val Pro Thr Ser Glu Trp Gln Arg Gly Asp Val

420 425 430

Phe Thr Cys Ser Val Met His Glu Ala Leu His Asn His Tyr Thr Gln

435 440 445

Lys Ser Ile Ser Arg Ser Pro Gly Lys

450 455

<210> 24

<211> 238

<212> PRT

<213> 人工序列

<220>

<223> 人工序列描述: 合成多肽

<400> 24

Met Asp Thr Arg Ala Pro Thr Gln Leu Leu Gly Leu Leu Leu Leu Trp

1 5 10 15

Leu Pro Gly Ala Thr Phe Ala Ile Val Met Thr Gln Thr Pro Ala Ser

20 25 30

Val Ser Ala Ala Val Gly Gly Thr Val Ser Ile Ser Cys Gln Ser Ser

35 40 45

Glu Ser Val Tyr Lys Asn Asn Tyr Leu Ser Trp Tyr Gln Gln Lys Pro

50 55 60

Gly Gln Pro Pro Lys Arg Leu Ile Tyr Asp Ala Ser Thr Leu Ala Ser

65 70 75 80

Gly Val Pro Ser Arg Phe Lys Gly Ser Gly Ser Gly Thr Gln Phe Thr

85 90 95

Leu Thr Ile Ser Asp Val Val Cys Asp Asp Ala Ala Thr Tyr Tyr Cys

100 105 110

Ala Gly Tyr Lys Ser Ser Ala Thr Asp Gly Ile Ala Phe Gly Gly Gly

115 120 125

Thr Glu Val Val Val Lys Gly Asp Pro Val Ala Pro Thr Val Leu Ile

130 135 140

Phe Pro Pro Ala Ala Asp Gln Val Ala Thr Gly Thr Val Thr Ile Val

145 150 155 160

Cys Val Ala Asn Lys Tyr Phe Pro Asp Val Thr Val Thr Trp Glu Val

165 170 175

Asp Gly Thr Thr Gln Thr Thr Gly Ile Glu Asn Ser Lys Thr Pro Gln

180 185 190

Asn Ser Ala Asp Cys Thr Tyr Asn Leu Ser Ser Thr Leu Thr Leu Thr

195 200 205

Ser Thr Gln Tyr Asn Ser His Lys Glu Tyr Thr Cys Lys Val Thr Gln

210 215 220

Gly Thr Thr Ser Val Val Gln Ser Phe Asn Arg Gly Asp Cys

225 230 235

<210> 25

<211> 457

<212> PRT

<213> 人工序列

<220>

<223> 人工序列描述: 合成多肽

<400> 25

Met Glu Thr Gly Leu Arg Trp Leu Leu Leu Val Ala Val Leu Lys Gly

1 5 10 15

Val Gln Cys Gln Glu Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln

20 25 30

Pro Glu Gly Ser Leu Thr Leu Thr Cys Lys Ala Ser Gly Leu Asp Phe

35 40 45

Leu Ser Asn Tyr Trp Ile Cys Trp Val Arg Gln Ala Pro Gly Lys Gly

50 55 60

Leu Glu Trp Ile Ala Cys Ile Tyr Ile Asp Asp Gly Thr Thr Tyr Tyr

65 70 75 80

Ala Asn Trp Ala Lys Gly Arg Phe Thr Ile Ser Arg Thr Ser Ser Thr

85 90 95

Thr Val Thr Leu Gln Met Ala Ser Leu Thr Ala Ala Asp Thr Ala Thr

100 105 110

Tyr Phe Cys Ala Arg Gly Asn Pro Phe Thr Leu Trp Gly Pro Gly Thr

115 120 125

Leu Val Thr Val Ser Ser Gly Gln Pro Lys Ala Pro Ser Val Phe Pro

130 135 140

Leu Ala Pro Cys Cys Gly Asp Thr Pro Ser Ser Thr Val Thr Leu Gly

145 150 155 160

Cys Leu Val Lys Gly Tyr Leu Pro Glu Pro Val Thr Val Thr Trp Asn

165 170 175

Ser Gly Thr Leu Thr Asn Gly Val Arg Thr Phe Pro Ser Val Arg Gln

180 185 190

Ser Ser Gly Leu Tyr Ser Leu Ser Ser Val Val Ser Val Thr Ser Ser

195 200 205

Ser Gln Pro Val Thr Cys Asn Val Ala His Pro Ala Thr Asn Thr Lys

210 215 220

Val Asp Lys Thr Val Ala Pro Ser Thr Cys Ser Lys Pro Met Cys Pro

225 230 235 240

Pro Pro Glu Leu Pro Gly Gly Pro Ser Val Phe Ile Phe Pro Pro Lys

245 250 255

Pro Lys Asp Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val

260 265 270

Val Val Asp Val Ser Gln Asp Asp Pro Glu Val Gln Phe Thr Trp Tyr

275 280 285

Ile Asn Asn Glu Gln Val Arg Thr Ala Arg Pro Pro Leu Arg Glu Gln

290 295 300

Gln Phe Asn Ser Thr Ile Arg Val Val Ser Thr Leu Pro Ile Ala His

305 310 315 320

Gln Asp Trp Leu Arg Gly Lys Glu Phe Lys Cys Lys Val His Asn Lys

325 330 335

Ala Leu Pro Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala Arg Gly Gln

340 345 350

Pro Leu Glu Pro Lys Val Tyr Thr Met Gly Pro Pro Arg Glu Glu Leu

355 360 365

Ser Ser Arg Ser Val Ser Leu Thr Cys Met Ile Asn Gly Phe Tyr Pro

370 375 380

Ser Asp Ile Ser Val Glu Trp Glu Lys Asn Gly Lys Ala Glu Asp Asn

385 390 395 400

Tyr Lys Thr Thr Pro Thr Val Leu Asp Ser Asp Gly Ser Tyr Phe Leu

405 410 415

Tyr Ser Lys Leu Ser Val Pro Thr Ser Glu Trp Gln Arg Gly Asp Val

420 425 430

Phe Thr Cys Ser Val Met His Glu Ala Leu His Asn His Tyr Thr Gln

435 440 445

Lys Ser Ile Ser Arg Ser Pro Gly Lys

450 455

<210> 26

<211> 237

<212> PRT

<213> 人工序列

<220>

<223> 人工序列描述: 合成多肽

<400> 26

Met Asp Thr Arg Ala Pro Thr Gln Leu Leu Gly Leu Leu Leu Leu Trp

1 5 10 15

Leu Pro Gly Ala Thr Phe Ala Gln Val Leu Thr Gln Thr Pro Ser Ser

20 25 30

Val Ser Ala Ala Val Gly Gly Thr Val Thr Ile Asn Cys Gln Ser Ser

35 40 45

Pro Ser Val Tyr Arg Asn Tyr Leu Ser Trp Tyr Gln Gln Lys Pro Gly

50 55 60

Gln Arg Pro Lys Leu Leu Ile Tyr His Ala Ser Thr Leu Ala Ser Gly

65 70 75 80

Val Pro Ser Arg Phe Ser Ala Ser Gly Ser Gly Thr Gln Phe Ser Leu

85 90 95

Thr Ile Ser Asp Ala His Cys Asp Asp Ala Ala Thr Tyr Tyr Cys Ala

100 105 110

Gly Gly Tyr Ile Gly Ser Ser Asp Ala Trp Ala Phe Gly Gly Gly Thr

115 120 125

Glu Val Val Val Arg Gly Asp Pro Val Ala Pro Thr Val Leu Ile Phe

130 135 140

Pro Pro Ala Ala Asp Gln Val Ala Thr Gly Thr Val Thr Ile Val Cys

145 150 155 160

Val Ala Asn Lys Tyr Phe Pro Asp Val Thr Val Thr Trp Glu Val Asp

165 170 175

Gly Thr Thr Gln Thr Thr Gly Ile Glu Asn Ser Lys Thr Pro Gln Asn

180 185 190

Ser Ala Asp Cys Thr Tyr Asn Leu Ser Ser Thr Leu Thr Leu Thr Ser

195 200 205

Thr Gln Tyr Asn Ser His Lys Glu Tyr Thr Cys Lys Val Thr Gln Gly

210 215 220

Thr Thr Ser Val Val Gln Ser Phe Asn Arg Gly Asp Cys

225 230 235

<210> 27

<211> 457

<212> PRT

<213> 人工序列

<220>

<223> 人工序列描述: 合成多肽

<400> 27

Met Glu Thr Gly Leu Arg Trp Leu Leu Leu Val Ala Val Leu Lys Gly

1 5 10 15

Val Gln Cys Gln Glu Gln Leu Lys Glu Ser Gly Gly Asp Leu Val Thr

20 25 30

Pro Gly Thr Pro Leu Thr Leu Thr Cys Thr Val Ser Gly Phe Ser Leu

35 40 45

Ser Ser Ser Tyr Met Ser Trp Val Arg Gln Ala Pro Gly Lys Gly Leu

50 55 60

Glu Trp Ile Gly Ile Ile Phe Ala Ser Gly Ser Thr Tyr Tyr Ala Thr

65 70 75 80

Trp Ala Lys Gly Arg Phe Thr Ile Ser Arg Thr Ser Thr Thr Val Asp

85 90 95

Leu Lys Met Thr Ser Leu Thr Thr Glu Asp Thr Ala Thr Tyr Phe Cys

100 105 110

Ala Arg Asn Ser Pro Gly Tyr Gly Ser Asp Ile Trp Gly Pro Gly Thr

115 120 125

Leu Val Thr Val Ser Leu Gly Gln Pro Lys Ala Pro Ser Val Phe Pro

130 135 140

Leu Ala Pro Cys Cys Gly Asp Thr Pro Ser Ser Thr Val Thr Leu Gly

145 150 155 160

Cys Leu Val Lys Gly Tyr Leu Pro Glu Pro Val Thr Val Thr Trp Asn

165 170 175

Ser Gly Thr Leu Thr Asn Gly Val Arg Thr Phe Pro Ser Val Arg Gln

180 185 190

Ser Ser Gly Leu Tyr Ser Leu Ser Ser Val Val Ser Val Thr Ser Ser

195 200 205

Ser Gln Pro Val Thr Cys Asn Val Ala His Pro Ala Thr Asn Thr Lys

210 215 220

Val Asp Lys Thr Val Ala Pro Ser Thr Cys Ser Lys Pro Met Cys Pro

225 230 235 240

Pro Pro Glu Leu Pro Gly Gly Pro Ser Val Phe Ile Phe Pro Pro Lys

245 250 255

Pro Lys Asp Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val

260 265 270

Val Val Asp Val Ser Gln Asp Asp Pro Glu Val Gln Phe Thr Trp Tyr

275 280 285

Ile Asn Asn Glu Gln Val Arg Thr Ala Arg Pro Pro Leu Arg Glu Gln

290 295 300

Gln Phe Asn Ser Thr Ile Arg Val Val Ser Thr Leu Pro Ile Ala His

305 310 315 320

Gln Asp Trp Leu Arg Gly Lys Glu Phe Lys Cys Lys Val His Asn Lys

325 330 335

Ala Leu Pro Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala Arg Gly Gln

340 345 350

Pro Leu Glu Pro Lys Val Tyr Thr Met Gly Pro Pro Arg Glu Glu Leu

355 360 365

Ser Ser Arg Ser Val Ser Leu Thr Cys Met Ile Asn Gly Phe Tyr Pro

370 375 380

Ser Asp Ile Ser Val Glu Trp Glu Lys Asn Gly Lys Ala Glu Asp Asn

385 390 395 400

Tyr Lys Thr Thr Pro Thr Val Leu Asp Ser Asp Gly Ser Tyr Phe Leu

405 410 415

Tyr Ser Lys Leu Ser Val Pro Thr Ser Glu Trp Gln Arg Gly Asp Val

420 425 430

Phe Thr Cys Ser Val Met His Glu Ala Leu His Asn His Tyr Thr Gln

435 440 445

Lys Ser Ile Ser Arg Ser Pro Gly Lys

450 455

<210> 28

<211> 236

<212> PRT

<213> 人工序列

<220>

<223> 人工序列描述: 合成多肽

<400> 28

Met Asp Thr Arg Ala Pro Thr Gln Leu Leu Gly Leu Leu Leu Leu Trp

1 5 10 15

Leu Pro Gly Ala Thr Phe Ala Gln Val Leu Thr Gln Thr Pro Ser Ser

20 25 30

Val Ser Ala Ala Val Gly Gly Thr Val Thr Ile Asn Cys Gln Ser Ser

35 40 45

Gln Ser Val Tyr Ala Asn Asn His Leu Ser Trp Tyr Gln Gln Lys Pro

50 55 60

Gly Gln Pro Pro Lys Leu Leu Val Tyr Arg Ala Ser Asn Leu Glu Thr

65 70 75 80

Gly Val Pro Ser Arg Phe Ser Gly Ser Gly Ser Gly Thr Gln Phe Ser

85 90 95

Leu Thr Ile Ser Gly Val Gln Cys Asp Asp Ala Ala Ala Tyr Tyr Cys

100 105 110

Gly Gly Asp Val Ser Ala Ser Thr Gly Gly Phe Gly Gly Gly Thr Glu

115 120 125

Val Val Val Lys Gly Asp Pro Val Ala Pro Thr Val Leu Ile Phe Pro

130 135 140

Pro Ala Ala Asp Gln Val Ala Thr Gly Thr Val Thr Ile Val Cys Val

145 150 155 160

Ala Asn Lys Tyr Phe Pro Asp Val Thr Val Thr Trp Glu Val Asp Gly

165 170 175

Thr Thr Gln Thr Thr Gly Ile Glu Asn Ser Lys Thr Pro Gln Asn Ser

180 185 190

Ala Asp Cys Thr Tyr Asn Leu Ser Ser Thr Leu Thr Leu Thr Ser Thr

195 200 205

Gln Tyr Asn Ser His Lys Glu Tyr Thr Cys Lys Val Thr Gln Gly Thr

210 215 220

Thr Ser Val Val Gln Ser Phe Asn Arg Gly Asp Cys

225 230 235

<210> 29

<211> 463

<212> PRT

<213> 人工序列

<220>

<223> 人工序列描述: 合成多肽

<400> 29

Met Glu Thr Gly Leu Arg Trp Leu Leu Leu Val Ala Val Leu Lys Gly

1 5 10 15

Val Gln Cys Gln Ser Leu Glu Glu Ser Gly Gly Asp Leu Val Lys Pro

20 25 30

Gly Ala Ser Leu Thr Leu Thr Cys Lys Ala Ser Gly Phe Asp Leu Ser

35 40 45

Ser Ser Tyr Phe Met Cys Trp Val Arg Gln Ala Pro Gly Arg Gly Leu

50 55 60

Glu Trp Ile Ala Cys Ile Asp Thr Arg Asn Ile Asp Thr Ala Tyr Ala

65 70 75 80

Thr Trp Ala Lys Gly Arg Phe Thr Ile Ser Lys Thr Ser Ser Thr Thr

85 90 95

Val Thr Leu Gln Met Thr Ser Leu Thr Ala Ala Asp Thr Ala Lys Tyr

100 105 110

Phe Cys Gly Arg Gly Gly Asn Ile Asn Gly Leu Ala Thr Gly Phe Ala

115 120 125

Leu Trp Gly Pro Gly Thr Leu Val Thr Val Ser Ser Gly Gln Pro Lys

130 135 140

Ala Pro Ser Val Phe Pro Leu Ala Pro Cys Cys Gly Asp Thr Pro Ser

145 150 155 160

Ser Thr Val Thr Leu Gly Cys Leu Val Lys Gly Tyr Leu Pro Glu Pro

165 170 175

Val Thr Val Thr Trp Asn Ser Gly Thr Leu Thr Asn Gly Val Arg Thr

180 185 190

Phe Pro Ser Val Arg Gln Ser Ser Gly Leu Tyr Ser Leu Ser Ser Val

195 200 205

Val Ser Val Thr Ser Ser Ser Gln Pro Val Thr Cys Asn Val Ala His

210 215 220

Pro Ala Thr Asn Thr Lys Val Asp Lys Thr Val Ala Pro Ser Thr Cys

225 230 235 240

Ser Lys Pro Met Cys Pro Pro Pro Glu Leu Pro Gly Gly Pro Ser Val

245 250 255

Phe Ile Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser Arg Thr

260 265 270

Pro Glu Val Thr Cys Val Val Val Asp Val Ser Gln Asp Asp Pro Glu

275 280 285

Val Gln Phe Thr Trp Tyr Ile Asn Asn Glu Gln Val Arg Thr Ala Arg

290 295 300

Pro Pro Leu Arg Glu Gln Gln Phe Asn Ser Thr Ile Arg Val Val Ser

305 310 315 320

Thr Leu Pro Ile Ala His Gln Asp Trp Leu Arg Gly Lys Glu Phe Lys

325 330 335

Cys Lys Val His Asn Lys Ala Leu Pro Ala Pro Ile Glu Lys Thr Ile

340 345 350

Ser Lys Ala Arg Gly Gln Pro Leu Glu Pro Lys Val Tyr Thr Met Gly

355 360 365

Pro Pro Arg Glu Glu Leu Ser Ser Arg Ser Val Ser Leu Thr Cys Met

370 375 380

Ile Asn Gly Phe Tyr Pro Ser Asp Ile Ser Val Glu Trp Glu Lys Asn

385 390 395 400

Gly Lys Ala Glu Asp Asn Tyr Lys Thr Thr Pro Thr Val Leu Asp Ser

405 410 415

Asp Gly Ser Tyr Phe Leu Tyr Ser Lys Leu Ser Val Pro Thr Ser Glu

420 425 430

Trp Gln Arg Gly Asp Val Phe Thr Cys Ser Val Met His Glu Ala Leu

435 440 445

His Asn His Tyr Thr Gln Lys Ser Ile Ser Arg Ser Pro Gly Lys

450 455 460

<210> 30

<211> 238

<212> PRT

<213> 人工序列

<220>

<223> 人工序列描述: 合成多肽

<400> 30

Met Asp Thr Arg Ala Pro Thr Gln Leu Leu Gly Leu Leu Leu Leu Trp

1 5 10 15

Leu Pro Gly Ala Thr Phe Ala Ala Val Leu Thr Gln Thr Pro Ser Pro

20 25 30

Val Ser Ala Ala Val Gly Gly Thr Val Thr Ile Ser Cys Gln Ala Ser

35 40 45

Gln Ser Val Tyr Asn Asn Asn Trp Leu Ala Trp Tyr Gln Gln Lys Pro

50 55 60

Gly Gln Pro Pro Lys Leu Leu Ile Tyr Trp Ala Ser Thr Leu Ala Ser

65 70 75 80

Gly Val Pro Ser Arg Phe Lys Gly Ser Gly Ser Gly Thr Gln Phe Thr

85 90 95

Leu Thr Ile Ser Asp Leu Glu Cys Asp Asp Ala Ala Thr Tyr Tyr Cys

100 105 110

Gln Gly Gly Tyr Phe Arg Arg Val Asp Ser Phe Pro Phe Gly Gly Gly

115 120 125

Thr Glu Val Val Val Lys Gly Asp Pro Val Ala Pro Thr Val Leu Ile

130 135 140

Phe Pro Pro Ala Ala Asp Gln Val Ala Thr Gly Thr Val Thr Ile Val

145 150 155 160

Cys Val Ala Asn Lys Tyr Phe Pro Asp Val Thr Val Thr Trp Glu Val

165 170 175

Asp Gly Thr Thr Gln Thr Thr Gly Ile Glu Asn Ser Lys Thr Pro Gln

180 185 190

Asn Ser Ala Asp Cys Thr Tyr Asn Leu Ser Ser Thr Leu Thr Leu Thr

195 200 205

Ser Thr Gln Tyr Asn Ser His Lys Glu Tyr Thr Cys Lys Val Thr Gln

210 215 220

Gly Thr Thr Ser Val Val Gln Ser Phe Asn Arg Gly Asp Cys

225 230 235

<210> 31

<211> 463

<212> PRT

<213> 人工序列

<220>

<223> 人工序列描述: 合成多肽

<400> 31

Met Glu Thr Gly Leu Arg Trp Leu Leu Leu Val Ala Val Leu Lys Gly

1 5 10 15

Val Gln Cys Gln Ser Leu Glu Glu Ser Gly Gly Asp Leu Val Lys Pro

20 25 30

Gly Ala Ser Leu Thr Leu Thr Cys Lys Ala Ser Gly Phe Asp Leu Ser

35 40 45

Ser Ser Tyr Phe Met Cys Trp Val Arg Gln Ala Pro Gly Arg Gly Leu

50 55 60

Glu Trp Ile Ala Cys Ile Asp Thr Arg Asn Ile Asp Thr Ala Tyr Ala

65 70 75 80

Ser Trp Ala Lys Gly Arg Phe Thr Ile Ser Lys Thr Ser Ser Thr Thr

85 90 95

Val Thr Leu Gln Met Thr Ser Leu Thr Ala Ala Asp Thr Ala Arg Tyr

100 105 110

Phe Cys Gly Arg Gly Gly Asn Ile Asn Gly Leu Ala Thr Gly Phe Asn

115 120 125

Leu Trp Gly Pro Gly Thr Leu Val Thr Val Ser Ser Gly Gln Pro Lys

130 135 140

Ala Pro Ser Val Phe Pro Leu Ala Pro Cys Cys Gly Asp Thr Pro Ser

145 150 155 160

Ser Thr Val Thr Leu Gly Cys Leu Val Lys Gly Tyr Leu Pro Glu Pro

165 170 175

Val Thr Val Thr Trp Asn Ser Gly Thr Leu Thr Asn Gly Val Arg Thr

180 185 190

Phe Pro Ser Val Arg Gln Ser Ser Gly Leu Tyr Ser Leu Ser Ser Val

195 200 205

Val Ser Val Thr Ser Ser Ser Gln Pro Val Thr Cys Asn Val Ala His

210 215 220

Pro Ala Thr Asn Thr Lys Val Asp Lys Thr Val Ala Pro Ser Thr Cys

225 230 235 240

Ser Lys Pro Met Cys Pro Pro Pro Glu Leu Pro Gly Gly Pro Ser Val

245 250 255

Phe Ile Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser Arg Thr

260 265 270

Pro Glu Val Thr Cys Val Val Val Asp Val Ser Gln Asp Asp Pro Glu

275 280 285

Val Gln Phe Thr Trp Tyr Ile Asn Asn Glu Gln Val Arg Thr Ala Arg

290 295 300

Pro Pro Leu Arg Glu Gln Gln Phe Asn Ser Thr Ile Arg Val Val Ser

305 310 315 320

Thr Leu Pro Ile Ala His Gln Asp Trp Leu Arg Gly Lys Glu Phe Lys

325 330 335

Cys Lys Val His Asn Lys Ala Leu Pro Ala Pro Ile Glu Lys Thr Ile

340 345 350

Ser Lys Ala Arg Gly Gln Pro Leu Glu Pro Lys Val Tyr Thr Met Gly

355 360 365

Pro Pro Arg Glu Glu Leu Ser Ser Arg Ser Val Ser Leu Thr Cys Met

370 375 380

Ile Asn Gly Phe Tyr Pro Ser Asp Ile Ser Val Glu Trp Glu Lys Asn

385 390 395 400

Gly Lys Ala Glu Asp Asn Tyr Lys Thr Thr Pro Thr Val Leu Asp Ser

405 410 415

Asp Gly Ser Tyr Phe Leu Tyr Ser Lys Leu Ser Val Pro Thr Ser Glu

420 425 430

Trp Gln Arg Gly Asp Val Phe Thr Cys Ser Val Met His Glu Ala Leu

435 440 445

His Asn His Tyr Thr Gln Lys Ser Ile Ser Arg Ser Pro Gly Lys

450 455 460

<210> 32

<211> 238

<212> PRT

<213> 人工序列

<220>

<223> 人工序列描述: 合成多肽

<400> 32

Met Asp Thr Arg Ala Pro Thr Gln Leu Leu Gly Leu Leu Leu Leu Trp

1 5 10 15

Leu Pro Gly Ala Thr Phe Ala Val Val Leu Thr Gln Thr Pro Ser Pro

20 25 30

Val Ser Ala Ala Val Gly Gly Thr Val Thr Ile Ser Cys Gln Ala Ser

35 40 45

Gln Ser Val Tyr Asn Asn Asp Trp Leu Ala Trp Tyr Gln Gln Lys Pro

50 55 60

Gly Gln Pro Pro Lys Leu Leu Ile Tyr Trp Ala Ser Thr Leu Ala Ser

65 70 75 80

Gly Val Pro Ser Arg Phe Lys Gly Ser Gly Ser Gly Thr Gln Phe Thr

85 90 95

Leu Thr Ile Ser Asp Leu Glu Cys Asp Asp Ala Ala Thr Tyr Tyr Cys

100 105 110

Gln Gly Gly Tyr Phe Arg Arg Val Asp Ser Phe Pro Phe Gly Gly Gly

115 120 125

Thr Glu Val Val Val Lys Gly Asp Pro Val Ala Pro Thr Val Leu Ile

130 135 140

Phe Pro Pro Ala Ala Asp Gln Val Ala Thr Gly Thr Val Thr Ile Val

145 150 155 160

Cys Val Ala Asn Lys Tyr Phe Pro Asp Val Thr Val Thr Trp Glu Val

165 170 175

Asp Gly Thr Thr Gln Thr Thr Gly Ile Glu Asn Ser Lys Thr Pro Gln

180 185 190

Asn Ser Ala Asp Cys Thr Tyr Asn Leu Ser Ser Thr Leu Thr Leu Thr

195 200 205

Ser Thr Gln Tyr Asn Ser His Lys Glu Tyr Thr Cys Lys Val Thr Gln

210 215 220

Gly Thr Thr Ser Val Val Gln Ser Phe Asn Arg Gly Asp Cys

225 230 235

<210> 33

<211> 456

<212> PRT

<213> 人工序列

<220>

<223> 人工序列描述: 合成多肽

<400> 33

Met Glu Thr Gly Leu Arg Trp Leu Leu Leu Val Ala Val Leu Lys Gly

1 5 10 15

Val Gln Cys Gln Ser Leu Glu Glu Ser Gly Gly Arg Leu Val Thr Pro

20 25 30

Gly Thr Pro Leu Thr Leu Thr Cys Thr Ala Ser Gly Phe Ser Leu Ser

35 40 45

Pro Thr Tyr Met Ile Trp Val Arg Gln Ala Pro Gly Lys Gly Leu Glu

50 55 60

Trp Ile Gly Val Ile Tyr Pro Asn Gly Ile Pro Tyr Tyr Ala Thr Trp

65 70 75 80

Ala Lys Gly Arg Phe Thr Ile Ser Lys Thr Ser Thr Thr Val Asp Leu

85 90 95

Arg Ile Thr Ser Pro Thr Thr Glu Asp Thr Ala Thr Tyr Phe Cys Gly

100 105 110

Arg Asn Ser Pro Gly Trp Gly Thr Asp Met Trp Gly Pro Gly Thr Leu

115 120 125

Val Thr Val Ser Phe Gly Gln Pro Lys Ala Pro Ser Val Phe Pro Leu

130 135 140

Ala Pro Cys Cys Gly Asp Thr Pro Ser Ser Thr Val Thr Leu Gly Cys

145 150 155 160

Leu Val Lys Gly Tyr Leu Pro Glu Pro Val Thr Val Thr Trp Asn Ser

165 170 175

Gly Thr Leu Thr Asn Gly Val Arg Thr Phe Pro Ser Val Arg Gln Ser

180 185 190

Ser Gly Leu Tyr Ser Leu Ser Ser Val Val Ser Val Thr Ser Ser Ser

195 200 205

Gln Pro Val Thr Cys Asn Val Ala His Pro Ala Thr Asn Thr Lys Val

210 215 220

Asp Lys Thr Val Ala Pro Ser Thr Cys Ser Lys Pro Met Cys Pro Pro

225 230 235 240

Pro Glu Leu Pro Gly Gly Pro Ser Val Phe Ile Phe Pro Pro Lys Pro

245 250 255

Lys Asp Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val

260 265 270

Val Asp Val Ser Gln Asp Asp Pro Glu Val Gln Phe Thr Trp Tyr Ile

275 280 285

Asn Asn Glu Gln Val Arg Thr Ala Arg Pro Pro Leu Arg Glu Gln Gln

290 295 300

Phe Asn Ser Thr Ile Arg Val Val Ser Thr Leu Pro Ile Ala His Gln

305 310 315 320

Asp Trp Leu Arg Gly Lys Glu Phe Lys Cys Lys Val His Asn Lys Ala

325 330 335

Leu Pro Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala Arg Gly Gln Pro

340 345 350

Leu Glu Pro Lys Val Tyr Thr Met Gly Pro Pro Arg Glu Glu Leu Ser

355 360 365

Ser Arg Ser Val Ser Leu Thr Cys Met Ile Asn Gly Phe Tyr Pro Ser

370 375 380

Asp Ile Ser Val Glu Trp Glu Lys Asn Gly Lys Ala Glu Asp Asn Tyr

385 390 395 400

Lys Thr Thr Pro Thr Val Leu Asp Ser Asp Gly Ser Tyr Phe Leu Tyr

405 410 415

Ser Lys Leu Ser Val Pro Thr Ser Glu Trp Gln Arg Gly Asp Val Phe

420 425 430

Thr Cys Ser Val Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys

435 440 445

Ser Ile Ser Arg Ser Pro Gly Lys

450 455

<210> 34

<211> 236

<212> PRT

<213> 人工序列

<220>

<223> 人工序列描述: 合成多肽

<400> 34

Met Asp Thr Arg Ala Pro Thr Gln Leu Leu Gly Leu Leu Leu Leu Trp

1 5 10 15

Leu Pro Gly Ala Ile Cys Asp Pro Val Leu Thr Gln Thr Pro Ser Ser

20 25 30

Val Ser Ala Val Val Gly Gly Thr Val Thr Ile Asn Cys Gln Ala Ser

35 40 45

Gln Ser Val Tyr Asn Asn Asn His Leu Ser Trp Tyr Gln Gln Lys Ala

50 55 60

Gly Gln Pro Pro Asn Leu Leu Ile Tyr Lys Ile Ser Thr Leu Ala Ser

65 70 75 80

Gly Val Pro Ser Arg Phe Ser Gly Ser Gly Ser Gly Thr Gln Phe Thr

85 90 95

Leu Thr Ile Ser Gly Val Gln Cys Asp Asp Ala Ala Thr Tyr Tyr Cys

100 105 110

Gly Gly Asp Phe Gly Val Asp Val Ala Ser Tyr Gly Gly Gly Thr Glu

115 120 125

Val Val Val Lys Gly Asp Pro Val Ala Pro Thr Val Leu Ile Phe Pro

130 135 140

Pro Ala Ala Asp Gln Val Ala Thr Gly Thr Val Thr Ile Val Cys Val

145 150 155 160

Ala Asn Lys Tyr Phe Pro Asp Val Thr Val Thr Trp Glu Val Asp Gly

165 170 175

Thr Thr Gln Thr Thr Gly Ile Glu Asn Ser Lys Thr Pro Gln Asn Ser

180 185 190

Ala Asp Cys Thr Tyr Asn Leu Ser Ser Thr Leu Thr Leu Thr Ser Thr

195 200 205

Gln Tyr Asn Ser His Lys Glu Tyr Thr Cys Lys Val Thr Gln Gly Thr

210 215 220

Thr Ser Val Val Gln Ser Phe Asn Arg Gly Asp Cys

225 230 235

<210> 35

<211> 461

<212> PRT

<213> 人工序列

<220>

<223> 人工序列描述: 合成多肽

<400> 35

Met Glu Thr Gly Leu Arg Trp Leu Leu Leu Val Ala Val Leu Lys Asp

1 5 10 15

Ile Gln Cys Gln Glu Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln

20 25 30

Pro Glu Gly Ser Leu Thr Leu Thr Cys Thr Ala Ser Gly Phe Ser Phe

35 40 45

Ser Ser Ser His Trp Ile Cys Trp Val Arg Gln Ala Pro Gly Lys Gly

50 55 60

Leu Glu Trp Ile Gly Cys Ile Tyr Ile Gly Asn Gly Arg Thr Tyr Tyr

65 70 75 80

Ala Ser Trp Ala Lys Gly Arg Phe Thr Ile Ser Lys Thr Ser Ser Thr

85 90 95

Thr Met Thr Leu Gln Ile Ser Ser Leu Thr Asp Ala Asp Thr Ala Thr

100 105 110

Tyr Phe Ser Val Arg Asp Pro Thr Ala Gly Trp Gly Gly Gly Leu Trp

115 120 125

Gly Pro Gly Thr Leu Val Thr Val Ser Ser Gly Gln Pro Lys Ala Pro

130 135 140

Ser Val Phe Pro Leu Ala Pro Cys Cys Gly Asp Thr Pro Ser Ser Thr

145 150 155 160

Val Thr Leu Gly Cys Leu Val Lys Gly Tyr Leu Pro Glu Pro Val Thr

165 170 175

Val Thr Trp Asn Ser Gly Thr Leu Thr Asn Gly Val Arg Thr Phe Pro

180 185 190

Ser Val Arg Gln Ser Ser Gly Leu Tyr Ser Leu Ser Ser Val Val Ser

195 200 205

Val Thr Ser Ser Ser Gln Pro Val Thr Cys Asn Val Ala His Pro Ala

210 215 220

Thr Asn Thr Lys Val Asp Lys Thr Val Ala Pro Ser Thr Cys Ser Lys

225 230 235 240

Pro Met Cys Pro Pro Pro Glu Leu Pro Gly Gly Pro Ser Val Phe Ile

245 250 255

Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser Arg Thr Pro Glu

260 265 270

Val Thr Cys Val Val Val Asp Val Ser Gln Asp Asp Pro Glu Val Gln

275 280 285

Phe Thr Trp Tyr Ile Asn Asn Glu Gln Val Arg Thr Ala Arg Pro Pro

290 295 300

Leu Arg Glu Gln Gln Phe Asn Ser Thr Ile Arg Val Val Ser Thr Leu

305 310 315 320

Pro Ile Ala His Gln Asp Trp Leu Arg Gly Lys Glu Phe Lys Cys Lys

325 330 335

Val His Asn Lys Ala Leu Pro Ala Pro Ile Glu Lys Thr Ile Ser Lys

340 345 350

Ala Arg Gly Gln Pro Leu Glu Pro Lys Val Tyr Thr Met Gly Pro Pro

355 360 365

Arg Glu Glu Leu Ser Ser Arg Ser Val Ser Leu Thr Cys Met Ile Asn

370 375 380

Gly Phe Tyr Pro Ser Asp Ile Ser Val Glu Trp Glu Lys Asn Gly Lys

385 390 395 400

Ala Glu Asp Asn Tyr Lys Thr Thr Pro Thr Val Leu Asp Ser Asp Gly

405 410 415

Ser Tyr Phe Leu Tyr Ser Lys Leu Ser Val Pro Thr Ser Glu Trp Gln

420 425 430

Arg Gly Asp Val Phe Thr Cys Ser Val Met His Glu Ala Leu His Asn

435 440 445

His Tyr Thr Gln Lys Ser Ile Ser Arg Ser Pro Gly Lys

450 455 460

<210> 36

<211> 235

<212> PRT

<213> 人工序列

<220>

<223> 人工序列描述: 合成多肽

<400> 36

Met Asp Thr Arg Ala Pro Thr Gln Leu Leu Gly Leu Leu Leu Leu Trp

1 5 10 15

Leu Pro Gly Ala Ile Cys Asp Pro Val Met Thr Gln Thr Pro Ser Ser

20 25 30

Thr Ser Ala Ala Val Gly Gly Thr Val Thr Ile Ser Cys Gln Ser Ser

35 40 45

Gln Ser Val Tyr Asn Asn Asn Tyr Leu Ala Trp Tyr Gln Gln Lys Pro

50 55 60

Gly Gln Pro Pro Lys Arg Leu Ile Tyr Glu Ala Ser Ser Leu Ala Ser

65 70 75 80

Gly Val Pro Ser Arg Phe Lys Gly Ser Gly Ser Gly Ala Gln Phe Ala

85 90 95

Leu Thr Ile Ser Gly Val Gln Cys Asp Asp Ala Ala Thr Tyr Tyr Cys

100 105 110

Leu Gly Ala Tyr Tyr Thr Thr Leu Val Phe Gly Gly Gly Thr Glu Val

115 120 125

Val Val Arg Gly Asp Pro Val Ala Pro Thr Val Leu Ile Phe Pro Pro

130 135 140

Ala Ala Asp Gln Val Ala Thr Gly Thr Val Thr Ile Val Cys Val Ala

145 150 155 160

Asn Lys Tyr Phe Pro Asp Val Thr Val Thr Trp Glu Val Asp Gly Thr

165 170 175

Thr Gln Thr Thr Gly Ile Glu Asn Ser Lys Thr Pro Gln Asn Ser Ala

180 185 190

Asp Cys Thr Tyr Asn Leu Ser Ser Thr Leu Thr Leu Thr Ser Thr Gln

195 200 205

Tyr Asn Ser His Lys Glu Tyr Thr Cys Lys Val Thr Gln Gly Thr Thr

210 215 220

Ser Val Val Gln Ser Phe Asn Arg Gly Asp Cys

225 230 235

<210> 37

<211> 3

<212> PRT

<213> 人工序列

<220>

<223> 人工序列描述: 合成多肽

<400> 37

Phe Ser Ser

1

<210> 38

<211> 3

<212> PRT

<213> 人工序列

<220>

<223> 人工序列描述: 合成多肽

<400> 38

Phe Asn Ser

1

<210> 39

<211> 3

<212> PRT

<213> 人工序列

<220>

<223> 人工序列描述: 合成多肽

<400> 39

Thr Met Tyr

1

<210> 40

<211> 3

<212> PRT

<213> 人工序列

<220>

<223> 人工序列描述: 合成多肽

<400> 40

Phe Leu Ser

1

<210> 41

<211> 3

<212> PRT

<213> 人工序列

<220>

<223> 人工序列描述: 合成多肽

<400> 41

Ser Gly Tyr

1

<210> 42

<211> 10

<212> PRT

<213> 人工序列

<220>

<223> 人工序列描述: 合成多肽

<400> 42

Val Ala Cys Ile Glu Pro Ser Thr Val Ser

1 5 10

<210> 43

<211> 10

<212> PRT

<213> 人工序列

<220>

<223> 人工序列描述: 合成多肽

<400> 43

Ile Ala Cys Ile Asp Thr Gly Thr Ala Asp

1 5 10

<210> 44

<211> 10

<212> PRT

<213> 人工序列

<220>

<223> 人工序列描述: 合成多肽

<400> 44

Cys Ile Asp Ala Gly Arg Ser Gly Ser Thr

1 5 10

<210> 45

<211> 10

<212> PRT

<213> 人工序列

<220>

<223> 人工序列描述: 合成多肽

<400> 45

Ile Ala Cys Ile Tyr Ile Asp Asp Gly Thr

1 5 10

<210> 46

<211> 10

<212> PRT

<213> 人工序列

<220>

<223> 人工序列描述: 合成多肽

<400> 46

Ala Ile Asp Arg Gly Ser Tyr Gly Thr Thr

1 5 10

<210> 47

<211> 10

<212> PRT

<213> 人工序列

<220>

<223> 人工序列描述: 合成多肽

<400> 47

Ile Ala Cys Ile Tyr His Phe Ser Gly Arg

1 5 10

<210> 48

<211> 8

<212> PRT

<213> 人工序列

<220>

<223> 人工序列描述: 合成多肽

<400> 48

Phe Cys Ala Thr Ser Tyr Ser Tyr

1 5

<210> 49

<211> 8

<212> PRT

<213> 人工序列

<220>

<223> 人工序列描述: 合成多肽

<400> 49

Phe Cys Ser Arg Asp Leu Gly Gly

1 5

<210> 50

<211> 8

<212> PRT

<213> 人工序列

<220>

<223> 人工序列描述: 合成多肽

<400> 50

Cys Ala Arg Gly Gly Ala Gly Phe

1 5

<210> 51

<211> 8

<212> PRT

<213> 人工序列

<220>

<223> 人工序列描述: 合成多肽

<400> 51

Phe Cys Ala Arg Gly Asn Pro Phe

1 5

<210> 52

<211> 8

<212> PRT

<213> 人工序列

<220>

<223> 人工序列描述: 合成多肽

<400> 52

Cys Val Arg Gly Gly Ala Gly Phe

1 5

<210> 53

<211> 8

<212> PRT

<213> 人工序列

<220>

<223> 人工序列描述: 合成多肽

<400> 53

Phe Cys Ala Arg Asp Gly Ile Gly

1 5

<210> 54

<211> 8

<212> PRT

<213> 人工序列

<220>

<223> 人工序列描述: 合成多肽

<400> 54

Val Tyr Asn Asn Asn Glu Leu Ser

1 5

<210> 55

<211> 8

<212> PRT

<213> 人工序列

<220>

<223> 人工序列描述: 合成多肽

<400> 55

Val Trp Asn Asn Tyr Leu Ser Trp

1 5

<210> 56

<211> 8

<212> PRT

<213> 人工序列

<220>

<223> 人工序列描述: 合成多肽

<400> 56

Val Tyr Lys Asn Asn Tyr Leu Ser

1 5

<210> 57

<211> 8

<212> PRT

<213> 人工序列

<220>

<223> 人工序列描述: 合成多肽

<400> 57

Val Tyr Arg Asn Tyr Leu Ser Trp

1 5

<210> 58

<211> 8

<212> PRT

<213> 人工序列

<220>

<223> 人工序列描述: 合成多肽

<400> 58

Val Tyr Asn Asn Tyr Leu Ser Trp

1 5

<210> 59

<211> 8

<212> PRT

<213> 人工序列

<220>

<223> 人工序列描述: 合成多肽

<400> 59

Leu Tyr Asn Tyr Asn Gln Leu Ser

1 5

<210> 60

<211> 8

<212> PRT

<213> 人工序列

<220>

<223> 人工序列描述: 合成多肽

<400> 60

Ile Tyr Leu Ala Ser Asn Leu Ala

1 5

<210> 61

<211> 8

<212> PRT

<213> 人工序列

<220>

<223> 人工序列描述: 合成多肽

<400> 61

Tyr Gly Ala Ser Thr Leu Ala Ser

1 5

<210> 62

<211> 8

<212> PRT

<213> 人工序列

<220>

<223> 人工序列描述: 合成多肽

<400> 62

Ile Tyr Asp Ala Ser Thr Leu Ala

1 5

<210> 63

<211> 8

<212> PRT

<213> 人工序列

<220>

<223> 人工序列描述: 合成多肽

<400> 63

Tyr His Ala Ser Thr Leu Ala Ser

1 5

<210> 64

<211> 8

<212> PRT

<213> 人工序列

<220>

<223> 人工序列描述: 合成多肽

<400> 64

Tyr Asp Thr Ser Thr Leu Ala Ser

1 5

<210> 65

<211> 8

<212> PRT

<213> 人工序列

<220>

<223> 人工序列描述: 合成多肽

<400> 65

Ile Tyr Ser Ala Ser Thr Leu Ala

1 5

<210> 66

<211> 8

<212> PRT

<213> 人工序列

<220>

<223> 人工序列描述: 合成多肽

<400> 66

Gly Gly Trp Ser Ser Ser Ser Asp

1 5

<210> 67

<211> 8

<212> PRT

<213> 人工序列

<220>

<223> 人工序列描述: 合成多肽

<400> 67

Gly Tyr Arg Ser Tyr Thr Asp Thr

1 5

<210> 68

<211> 8

<212> PRT

<213> 人工序列

<220>

<223> 人工序列描述: 合成多肽

<400> 68

Gly Tyr Lys Ser Ser Ala Thr Asp

1 5

<210> 69

<211> 8

<212> PRT

<213> 人工序列

<220>

<223> 人工序列描述: 合成多肽

<400> 69

Gly Tyr Ile Gly Ser Ser Asp Ala

1 5

<210> 70

<211> 8

<212> PRT

<213> 人工序列

<220>

<223> 人工序列描述: 合成多肽

<400> 70

Tyr Lys Ser Ser Thr Thr Asp Gly

1 5

<210> 71

<211> 8

<212> PRT

<213> 人工序列

<220>

<223> 人工序列描述: 合成多肽

<400> 71

Gly Thr Tyr Ile Thr Ser His Asn

1 5

<210> 72

<211> 3

<212> PRT

<213> 人工序列

<220>

<223> 人工序列描述: 合成多肽

<400> 72

Ser Asn Asn

1

<210> 73

<211> 3

<212> PRT

<213> 人工序列

<220>

<223> 人工序列描述: 合成多肽

<400> 73

Ser Ser Arg

1

<210> 74

<211> 10

<212> PRT

<213> 人工序列

<220>

<223> 人工序列描述: 合成多肽

<400> 74

Ile Ala Cys Ile Tyr Gly Gly Ser Ser Gly

1 5 10

<210> 75

<211> 10

<212> PRT

<213> 人工序列

<220>

<223> 人工序列描述: 合成多肽

<400> 75

Ile Ala Cys Ile Tyr Gly Gly Ala Ser Gly

1 5 10

<210> 76

<211> 10

<212> PRT

<213> 人工序列

<220>

<223> 人工序列描述: 合成多肽

<400> 76

Ile Ala Cys Ile Tyr Leu Ser Ser Gly Ser

1 5 10

<210> 77

<211> 10

<212> PRT

<213> 人工序列

<220>

<223> 人工序列描述: 合成多肽

<400> 77

Ser Ala Cys Ile Asp Thr Gly Ser Gly Ser

1 5 10

<210> 78

<211> 10

<212> PRT

<213> 人工序列

<220>

<223> 人工序列描述: 合成多肽

<400> 78

Ala Cys Ile Asn Thr Gly Val Tyr Asp Thr

1 5 10

<210> 79

<211> 10

<212> PRT

<213> 人工序列

<220>

<223> 人工序列描述: 合成多肽

<400> 79

Ala Cys Ile Tyr Thr Gly Val Gly Ser Thr

1 5 10

<210> 80

<211> 8

<212> PRT

<213> 人工序列

<220>

<223> 人工序列描述: 合成多肽

<400> 80

Tyr Phe Cys Met Arg Gly Ala Asn

1 5

<210> 81

<211> 8

<212> PRT

<213> 人工序列

<220>

<223> 人工序列描述: 合成多肽

<400> 81

Tyr Phe Cys Ala Arg Gly Gly Phe

1 5

<210> 82

<211> 8

<212> PRT

<213> 人工序列

<220>

<223> 人工序列描述: 合成多肽

<400> 82

Tyr Phe Cys Ala Arg Glu Tyr Ser

1 5

<210> 83

<211> 8

<212> PRT

<213> 人工序列

<220>

<223> 人工序列描述: 合成多肽

<400> 83

Phe Cys Ala Arg Asp Leu Thr His

1 5

<210> 84

<211> 8

<212> PRT

<213> 人工序列

<220>

<223> 人工序列描述: 合成多肽

<400> 84

Cys Ala Arg Asp Tyr Asp Leu Trp

1 5

<210> 85

<211> 8

<212> PRT

<213> 人工序列

<220>

<223> 人工序列描述: 合成多肽

<400> 85

Val Tyr Ser Asn Tyr Leu Ser Trp

1 5

<210> 86

<211> 8

<212> PRT

<213> 人工序列

<220>

<223> 人工序列描述: 合成多肽

<400> 86

Ile Asp Ser Tyr Leu Ala Trp Tyr

1 5

<210> 87

<211> 8

<212> PRT

<213> 人工序列

<220>

<223> 人工序列描述: 合成多肽

<400> 87

Ile Ser Thr Ala Leu Ala Trp Tyr

1 5

<210> 88

<211> 8

<212> PRT

<213> 人工序列

<220>

<223> 人工序列描述: 合成多肽

<400> 88

Ile Tyr Asn His Asn Tyr Leu Ser

1 5

<210> 89

<211> 8

<212> PRT

<213> 人工序列

<220>

<223> 人工序列描述: 合成多肽

<400> 89

Val Tyr Asn Asn Asn Phe Ser Trp

1 5

<210> 90

<211> 8

<212> PRT

<213> 人工序列

<220>

<223> 人工序列描述: 合成多肽

<400> 90

Tyr Ser Ala Ser Thr Leu Ala Ser

1 5

<210> 91

<211> 8

<212> PRT

<213> 人工序列

<220>

<223> 人工序列描述: 合成多肽

<400> 91

Arg Ala Ser Thr Leu Ala Ser Gly

1 5

<210> 92

<211> 8

<212> PRT

<213> 人工序列

<220>

<223> 人工序列描述: 合成多肽

<400> 92

Asp Ala Ser Arg Leu Ala Ser Gly

1 5

<210> 93

<211> 8

<212> PRT

<213> 人工序列

<220>

<223> 人工序列描述: 合成多肽

<400> 93

Ile Tyr His Ala Ser Thr Leu Ala

1 5

<210> 94

<211> 8

<212> PRT

<213> 人工序列

<220>

<223> 人工序列描述: 合成多肽

<400> 94

Tyr Lys Pro Ser Thr Leu Ala Ser

1 5

<210> 95

<211> 8

<212> PRT

<213> 人工序列

<220>

<223> 人工序列描述: 合成多肽

<400> 95

Gly Tyr Thr Tyr Thr Ser Asp Ser

1 5

<210> 96

<211> 8

<212> PRT

<213> 人工序列

<220>

<223> 人工序列描述: 合成多肽

<400> 96

Tyr Tyr Ser Ser Asn Pro Glu Gly

1 5

<210> 97

<211> 8

<212> PRT

<213> 人工序列

<220>

<223> 人工序列描述: 合成多肽

<400> 97

Phe Gly Ala Ser Asn Val Asp Asn

1 5

<210> 98

<211> 8

<212> PRT

<213> 人工序列

<220>

<223> 人工序列描述: 合成多肽

<400> 98

Gly Ala Tyr Ala Asn Thr Tyr Ser

1 5

<210> 99

<211> 8

<212> PRT

<213> 人工序列

<220>

<223> 人工序列描述: 合成多肽

<400> 99

Ser Ser Ser Thr Asp Ser Ala Phe

1 5

<210> 100

<211> 3

<212> PRT

<213> 人工序列

<220>

<223> 人工序列描述: 合成多肽

<400> 100

Phe Ser Asp

1

<210> 101

<211> 3

<212> PRT

<213> 人工序列

<220>

<223> 人工序列描述: 合成多肽

<400> 101

Ser Ser Ser

1

<210> 102

<211> 3

<212> PRT

<213> 人工序列

<220>

<223> 人工序列描述: 合成多肽

<400> 102

Phe Ile Ser

1

<210> 103

<211> 3

<212> PRT

<213> 人工序列

<220>

<223> 人工序列描述: 合成多肽

<400> 103

Phe Ser Ala

1

<210> 104

<211> 3

<212> PRT

<213> 人工序列

<220>

<223> 人工序列描述: 合成多肽

<400> 104

Phe Ser Arg

1

<210> 105

<211> 3

<212> PRT

<213> 人工序列

<220>

<223> 人工序列描述: 合成多肽

<400> 105

Phe Ser Asn

1

<210> 106

<211> 3

<212> PRT

<213> 人工序列

<220>

<223> 人工序列描述: 合成多肽

<400> 106

Ile Ser Ser

1

<210> 107

<211> 10

<212> PRT

<213> 人工序列

<220>

<223> 人工序列描述: 合成多肽

<400> 107

Ile Gly Cys Ile Tyr Ile Gly Ser Ser Ser

1 5 10

<210> 108

<211> 10

<212> PRT

<213> 人工序列

<220>

<223> 人工序列描述: 合成多肽

<400> 108

Ala Cys Ile Asp Thr Gly Ser Ser Gly Ser

1 5 10

<210> 109

<211> 10

<212> PRT

<213> 人工序列

<220>

<223> 人工序列描述: 合成多肽

<400> 109

Ile Ala Cys Ile Tyr Ile Gly Gly His Thr

1 5 10

<210> 110

<211> 10

<212> PRT

<213> 人工序列

<220>

<223> 人工序列描述: 合成多肽

<400> 110

Val Gly Cys Ile Tyr Ile Gly Ser Gly Asn

1 5 10

<210> 111

<211> 10

<212> PRT

<213> 人工序列

<220>

<223> 人工序列描述: 合成多肽

<400> 111

Ile Ala Cys Ile Tyr Ile Gly Ala Gly Ser

1 5 10

<210> 112

<211> 10

<212> PRT

<213> 人工序列

<220>

<223> 人工序列描述: 合成多肽

<400> 112

Ile Gly Cys Ile Tyr Ile Gly Asn Gly Arg

1 5 10

<210> 113

<211> 10

<212> PRT

<213> 人工序列

<220>

<223> 人工序列描述: 合成多肽

<400> 113

Ile Gly Cys Leu Tyr Val Gly Ser Gly Arg

1 5 10

<210> 114

<211> 10

<212> PRT

<213> 人工序列

<220>

<223> 人工序列描述: 合成多肽

<400> 114

Ile Gly Cys Ile Tyr Ile Gly Ser Ser Gly

1 5 10

<210> 115

<211> 10

<212> PRT

<213> 人工序列

<220>

<223> 人工序列描述: 合成多肽

<400> 115

Ile Gly Cys Ile Tyr Ile Gly Ser Val Arg

1 5 10

<210> 116

<211> 10

<212> PRT

<213> 人工序列

<220>

<223> 人工序列描述: 合成多肽

<400> 116

Ile Gly Cys Ile Trp Ile Gly Gly Gly Gly

1 5 10

<210> 117

<211> 10

<212> PRT

<213> 人工序列

<220>

<223> 人工序列描述: 合成多肽

<400> 117

Ile Gly Cys Ile Tyr Thr Gly Ser Gly Arg

1 5 10

<210> 118

<211> 8

<212> PRT

<213> 人工序列

<220>

<223> 人工序列描述: 合成多肽

<400> 118

Phe Cys Gly Arg Asp Pro Thr Ala

1 5

<210> 119

<211> 8

<212> PRT

<213> 人工序列

<220>

<223> 人工序列描述: 合成多肽

<400> 119

Phe Cys Ala Arg Lys Gly Asp Gly

1 5

<210> 120

<211> 8

<212> PRT

<213> 人工序列

<220>

<223> 人工序列描述: 合成多肽

<400> 120

Phe Cys Ala Arg Gly Ile Ala Gly

1 5

<210> 121

<211> 8

<212> PRT

<213> 人工序列

<220>

<223> 人工序列描述: 合成多肽

<400> 121

Phe Cys Ser Arg Gly Ile Ala Gly

1 5

<210> 122

<211> 8

<212> PRT

<213> 人工序列

<220>

<223> 人工序列描述: 合成多肽

<400> 122

Phe Ser Val Arg Asp Pro Thr Ala

1 5

<210> 123

<211> 8

<212> PRT

<213> 人工序列

<220>

<223> 人工序列描述: 合成多肽

<400> 123

Tyr Phe Cys Gly Arg Asp Pro Thr

1 5

<210> 124

<211> 8

<212> PRT

<213> 人工序列

<220>

<223> 人工序列描述: 合成多肽

<400> 124

Ser Val Tyr Asn Asn Asn Tyr Leu

1 5

<210> 125

<211> 8

<212> PRT

<213> 人工序列

<220>

<223> 人工序列描述: 合成多肽

<400> 125

Ser Ile Ser Ser Tyr Leu Asn Trp

1 5

<210> 126

<211> 8

<212> PRT

<213> 人工序列

<220>

<223> 人工序列描述: 合成多肽

<400> 126

Ser Val Phe Arg Asn Asn Tyr Leu

1 5

<210> 127

<211> 8

<212> PRT

<213> 人工序列

<220>

<223> 人工序列描述: 合成多肽

<400> 127

Ser Val Tyr Lys Asn Asn Tyr Leu

1 5

<210> 128

<211> 8

<212> PRT

<213> 人工序列

<220>

<223> 人工序列描述: 合成多肽

<400> 128

Ser Leu Phe Asn Asn Asn Tyr Leu

1 5

<210> 129

<211> 8

<212> PRT

<213> 人工序列

<220>

<223> 人工序列描述: 合成多肽

<400> 129

Ser Val Tyr Asn Val Asn Tyr Leu

1 5

<210> 130

<211> 8

<212> PRT

<213> 人工序列

<220>

<223> 人工序列描述: 合成多肽

<400> 130

Asn Val Tyr Ser Asn Asn Tyr Leu

1 5

<210> 131

<211> 8

<212> PRT

<213> 人工序列

<220>

<223> 人工序列描述: 合成多肽

<400> 131

Ser Val Tyr Val Asn Asn Tyr Leu

1 5

<210> 132

<211> 8

<212> PRT

<213> 人工序列

<220>

<223> 人工序列描述: 合成多肽

<400> 132

Leu Ile Tyr Glu Ser Ser Lys Leu

1 5

<210> 133

<211> 8

<212> PRT

<213> 人工序列

<220>

<223> 人工序列描述: 合成多肽

<400> 133

Tyr Arg Ala Ser Thr Leu Ala Ser

1 5

<210> 134

<211> 8

<212> PRT

<213> 人工序列

<220>

<223> 人工序列描述: 合成多肽

<400> 134

Leu Ile Tyr Leu Ala Ser Thr Leu

1 5

<210> 135

<211> 8

<212> PRT

<213> 人工序列

<220>

<223> 人工序列描述: 合成多肽

<400> 135

Leu Ile Tyr Glu Ala Ser Lys Leu

1 5

<210> 136

<211> 8

<212> PRT

<213> 人工序列

<220>

<223> 人工序列描述: 合成多肽

<400> 136

Leu Ile Tyr Asp Ala Ser Thr Leu

1 5

<210> 137

<211> 8

<212> PRT

<213> 人工序列

<220>

<223> 人工序列描述: 合成多肽

<400> 137

Leu Ile Tyr Glu Ala Ser Ser Leu

1 5

<210> 138

<211> 8

<212> PRT

<213> 人工序列

<220>

<223> 人工序列描述: 合成多肽

<400> 138

Leu Ile Tyr Glu Ala Ser Arg Leu

1 5

<210> 139

<211> 8

<212> PRT

<213> 人工序列

<220>

<223> 人工序列描述: 合成多肽

<400> 139

Leu Ile Tyr Glu Thr Ser Lys Leu

1 5

<210> 140

<211> 8

<212> PRT

<213> 人工序列

<220>

<223> 人工序列描述: 合成多肽

<400> 140

Leu Gly Ala Tyr Tyr Thr Thr Leu

1 5

<210> 141

<211> 8

<212> PRT

<213> 人工序列

<220>

<223> 人工序列描述: 合成多肽

<400> 141

Tyr Gly Gly Tyr Ser Ile Tyr Gly

1 5

<210> 142

<211> 8

<212> PRT

<213> 人工序列

<220>

<223> 人工序列描述: 合成多肽

<400> 142

Ala Gly Ala Thr Ser Ser Ile Ile

1 5

<210> 143

<211> 8

<212> PRT

<213> 人工序列

<220>

<223> 人工序列描述: 合成多肽

<400> 143

Leu Gly Ala Tyr Phe Thr Thr Ile

1 5

<210> 144

<211> 8

<212> PRT

<213> 人工序列

<220>

<223> 人工序列描述: 合成多肽

<400> 144

Ala Gly Ala Tyr Ser Thr Val Val

1 5

<210> 145

<211> 8

<212> PRT

<213> 人工序列

<220>

<223> 人工序列描述: 合成多肽

<400> 145

Leu Gly Ala Phe Tyr Thr Thr Leu

1 5

<210> 146

<211> 8

<212> PRT

<213> 人工序列

<220>

<223> 人工序列描述: 合成多肽

<400> 146

Leu Gly Ala Tyr Tyr Ser Thr Leu

1 5

<210> 147

<211> 8

<212> PRT

<213> 人工序列

<220>

<223> 人工序列描述: 合成多肽

<400> 147

Ala Gly Ala Tyr Tyr Thr Thr Ile

1 5

<210> 148

<211> 3

<212> PRT

<213> 人工序列

<220>

<223> 人工序列描述: 合成多肽

<400> 148

Leu Ser Ser

1

<210> 149

<211> 3

<212> PRT

<213> 人工序列

<220>

<223> 人工序列描述: 合成多肽

<400> 149

Ser Pro Thr

1

<210> 150

<211> 10

<212> PRT

<213> 人工序列

<220>

<223> 人工序列描述: 合成多肽

<400> 150

Gly Ile Ile Phe Ala Ser Gly Ser Thr Tyr

1 5 10

<210> 151

<211> 10

<212> PRT

<213> 人工序列

<220>

<223> 人工序列描述: 合成多肽

<400> 151

Ala Cys Ile Asp Thr Arg Asn Ile Asp Thr

1 5 10

<210> 152

<211> 10

<212> PRT

<213> 人工序列

<220>

<223> 人工序列描述: 合成多肽

<400> 152

Val Ile Tyr Pro Asn Gly Ile Pro Tyr Tyr

1 5 10

<210> 153

<211> 8

<212> PRT

<213> 人工序列

<220>

<223> 人工序列描述: 合成多肽

<400> 153

Arg Asn Ser Pro Gly Tyr Gly Ser

1 5

<210> 154

<211> 8

<212> PRT

<213> 人工序列

<220>

<223> 人工序列描述: 合成多肽

<400> 154

Cys Gly Arg Gly Gly Asn Ile Asn

1 5

<210> 155

<211> 8

<212> PRT

<213> 人工序列

<220>

<223> 人工序列描述: 合成多肽

<400> 155

Asn Ser Pro Gly Trp Gly Thr Asp

1 5

<210> 156

<211> 8

<212> PRT

<213> 人工序列

<220>

<223> 人工序列描述: 合成多肽

<400> 156

Val Tyr Ala Asn Asn His Leu Ser

1 5

<210> 157

<211> 8

<212> PRT

<213> 人工序列

<220>

<223> 人工序列描述: 合成多肽

<400> 157

Val Tyr Asn Asn Asn Trp Leu Ala

1 5

<210> 158

<211> 8

<212> PRT

<213> 人工序列

<220>

<223> 人工序列描述: 合成多肽

<400> 158

Val Tyr Asn Asn Asp Trp Leu Ala

1 5

<210> 159

<211> 8

<212> PRT

<213> 人工序列

<220>

<223> 人工序列描述: 合成多肽

<400> 159

Val Tyr Asn Asn Asn His Leu Ser

1 5

<210> 160

<211> 8

<212> PRT

<213> 人工序列

<220>

<223> 人工序列描述: 合成多肽

<400> 160

Val Tyr Arg Ala Ser Asn Leu Glu

1 5

<210> 161

<211> 8

<212> PRT

<213> 人工序列

<220>

<223> 人工序列描述: 合成多肽

<400> 161

Ile Tyr Trp Ala Ser Thr Leu Ala

1 5

<210> 162

<211> 8

<212> PRT

<213> 人工序列

<220>

<223> 人工序列描述: 合成多肽

<400> 162

Ile Tyr Lys Ile Ser Thr Leu Ala

1 5

<210> 163

<211> 8

<212> PRT

<213> 人工序列

<220>

<223> 人工序列描述: 合成多肽

<400> 163

Gly Asp Val Ser Ala Ser Thr Gly

1 5

<210> 164

<211> 8

<212> PRT

<213> 人工序列

<220>

<223> 人工序列描述: 合成多肽

<400> 164

Gly Gly Tyr Phe Arg Arg Val Asp

1 5

<210> 165

<211> 8

<212> PRT

<213> 人工序列

<220>

<223> 人工序列描述: 合成多肽

<400> 165

Gly Asp Phe Gly Val Asp Val Ala

1 5

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号