首页> 中国专利> 涉及用于抗体发现和/或优化的高通量模型的方法和组合物

涉及用于抗体发现和/或优化的高通量模型的方法和组合物

摘要

本文描述的是涉及经工程化的Ig基因座的组合物(例如细胞和转基因动物)和方法,其使得能够表达特定抗体或抗体区段,同时仍允许重组和/或成熟过程以用于抗体优化。

著录项

  • 公开/公告号CN112566931A

    专利类型发明专利

  • 公开/公告日2021-03-26

    原文格式PDF

  • 申请/专利权人 儿童医疗中心有限公司;

    申请/专利号CN201980053036.7

  • 申请日2019-06-10

  • 分类号C07K16/00(20060101);C07K16/10(20060101);C12N15/85(20060101);A01K67/027(20060101);

  • 代理机构11290 北京信慧永光知识产权代理有限责任公司;

  • 代理人董世豪;张淑珍

  • 地址 美国马萨诸塞州

  • 入库时间 2023-06-19 10:22:47

说明书

相关申请的交叉引用

根据35U.S.C.§119(e),本申请要求2018年6月13日提交的美国临时申请号62/684,367的权益,以引用的方式将其内容整体并入本文。

政府支持

本发明是在美国国立卫生研究院授予的基金号AI020047、AI117892和AI000645的政府支持下做出的。美国政府对本发明拥有一定的权利。

序列表

本申请包含序列表,所述序列表已经以ASCII格式电子提交,并在此以引用的方式将其整体并入。所述ASCII副本创建于2019年6月6日,命名为701039-092250WOPT_SL.txt并且大小为25762字节。

技术领域

本发明涉及经工程化的抗体以及发现和/或优化抗体的方法。

背景技术

哺乳动物适应性免疫应答依赖于抗体。健康的动物会产生大量不同的抗体,每种抗体都可以选择性地结合至不同的分子,所述分子称为抗原。抗体与抗原的结合触发免疫应答,使机体能够破坏抗原。如果抗原是病原体上的分子,这使得机体能够通过攻击病原体来抵抗感染。

抗体由两个相同的Ig重链(IgH)多肽和两个相同的轻链(IgL)多肽组成。IgH和IgL链的称为可变区的部分形成抗原结合位点。抗原结合位点的序列决定了抗体可以结合至何种抗原以及该结合的紧密程度。为了产生稳健的免疫应答,具有以下二者对于动物而言是重要的:抗体群中代表性的广泛种类的抗原结合位点,以便机体可以识别任何给定的抗原;以及使一抗亲和力成熟的机制,以改善识别任何给定抗原的能力。

IgH可变区从称为V

如果抗体遇到它可以结合的外源抗原,则制造该特定抗体的B细胞将被激活。这将引起B细胞复制,并且那些产生的B细胞可能经受额外的基因组改变,所述基因组改变可引起其抗体的进一步的多样化/亲和力成熟(例如,通过体细胞超突变(SHM)或生发中心反应(GC))。抗体的功效取决于其对相关抗原的特异性和亲和力。如上所述,V(D)J重组和SHM在这方面都做出了重要贡献,但是处于抗体进化的不同点。V(D)J重组产生抗原结合位点的大池(pool),所述抗原结合位点单独地在稳态B细胞群中的特定B细胞上表达,使得任何潜在的抗原都可能找到合理的匹配;一旦找到匹配的B细胞,体细胞超突变和GC应答就微调抗原结合位点,以完善抗体与抗原的相互作用。

通过研究天然的免疫应答或外周B细胞库,可以鉴别何种V区段、D区段和/或J区段最常表达,并且通过延伸具有强的机会参与产生针对特定抗原的免疫应答。然而,当前的抗体生产方法将V(D)J重组、SHM和GC过程的影响力(Lonberg,Nature Biotechnology 23,1117(2005))用于优化小鼠中的现有抗体的能力有限,例如,由于小鼠免疫系统的大小要小得多,因此小鼠中潜在表达的抗体的总库与人相比相当小,并且相应地,B细胞和靶向特定免疫应答的潜在的前体的数量也要少得多。

发明内容

本发明在很大程度上涉及使用新的经工程化的免疫系统(例如在小鼠中)产生新的抗体(例如,治疗性抗体和/或人抗体)的新的方法,以及优化现有的治疗性抗体或新发现的候选抗体的新的系统/方法。在一些实施方式中,该系统和/或方法涉及经工程化的小鼠免疫系统。对经工程化的免疫系统进行修饰,以使得能够轻松地将一种或多种非天然组分插入模式动物的模型细胞的Ig基因座中。对经工程化的免疫系统进行修饰,以驱动具有任何期望的组分(例如期望的V

本发明至少部分基于以下发现:可以通过在经工程化的Ig基因座中提供非天然CBE序列来控制哪个IgH基因座V区段最强烈地经受V(D)J重组,例如,通过向几乎不重排(且缺乏内源性CBE)的最近端的IgH VH5-1提供CBE,从而使其成为最高度重排的VH。因此,如果将经工程化的VH 5-1替换为人VH(并在经工程化的基因座中包括下游经工程化的CBE),则人VH将以与不存在CBE的情况相比高得多的频率重排。

还可以通过使下游IGCR1无功能的来获得此类VH区段的重组的增加。将这些修饰一起进行工程化极大地提高靶VH的利用,使其成为最主要使用的VH。其原因在于,在不存在IGCR1的情况下,结合至DJ

在IgL(κ)基因座中,由于类似于在IgH基因座中不存在IGCR1功能的情况下出现的扫描机制,使Cer/Sis序列无功能的也增强了近端Vκ区段的利用。如本文所证明的,使用基于Cas9-gRNA的方法来删除小鼠v-Abl pre-B细胞系中的Igk基因座的Sis/Cer元件,所述细胞系可以在体外被诱导以经历IgκV(D)J重组。在诱导对照和Sis/Cer缺失的v-Abl pre-B细胞经历其内源性Igκ基因座的V(D)J重组后,使用基于HTGTS的高通量V(D)J重组分析法来分析不同的内源性Vκ区段重排至Jk4诱饵序列(bait sequence)的频率。证实了Cer/Sis元件的缺失实质上增加了近端Vκ3-1、Vκ3-2和Vκ3-3区段的重排频率(图15A-图15C),这与允许Jκ重组中心和近端Vκ之间的RAG扫描相一致。

因此,如本文所述,在Sis/Cer缺失的背景下,当将靶V区段(例如,人Vκ3-20或Vk1-33区段)放置替代近端的小鼠Vκ区段时,靶V区段在V(D)J重组期间也将优选利用。由于连接多样化,该模型中的B细胞群表达Vκ3-20和/或Vk1-33轻链的多样的库;并且如上所述,可以通过在基于ES细胞的模型中并入组成性TdT表达(这增加了CDR 3多样性)来使此类多样性更加人样化。在v-Abl模型细胞系系统中,仅Cer缺失提供了关于近端的Vκ重排的与Cer/Sis缺失相似的表型,表明Cer缺失足以诱导近端的Vκ区段的优先重排。

此外,基于本文其它地方所述的IgH结果,向近端的IgL Vκ添加CBE将引起其额外的增强的利用(特别是在不存在Cer/Sis的情况下)以允许从Jκ重组中心进行的不减弱的RAG扫描。结合将V区段自身(例如,近端的小鼠VH和VL区段)替代为特别感兴趣的IGH和/或IgL V区段的能力,此类修饰在结合时将允许创建包含感兴趣的VH和VL区段的免疫球蛋白库,所述感兴趣的VH和VL区段以比天然存在的频率高得多的频率结合多样的CDR3,该频率将更接近于更大的人新生抗体(BCR)库中的这些BCR的频率。这一发现使得能够对包含期望的VH和VL区段的抗体进行工程化,同时仍允许抗体参与V(D)J重组、体细胞超突变和生发中心反应(有助于抗体多样性(例如,CDR 3多样性)和功能的重要过程)。值得注意的是,CDR3的复杂性(可以说是抗原接触多样性的最大位点)将远远高于其它现有的人源化小鼠模型中的复杂性,这使得在免疫时能够选择比先前的小鼠模型中存在的更广泛的特异性抗体前体的组,然后,在GC反应期间的进一步免疫和选择时,将通过所有三个CDR(包括CDR3)的SHM进一步优化所选的前体抗体。因此,本文所述的这些方法和组合物可以允许发现新的治疗性抗体和/或也可以用于进一步改善现有抗体的特异性和/或亲和力。

在任何实施方式的一方面,本文描述的是一种细胞,所述细胞包含以下中的至少一种:

a.经工程化的IgH基因座,所述经工程化的IgH基因座包含如下核酸序列中的CBE元件,所述核酸序列将靶V

b.经工程化的IgL基因座,所述经工程化的IgL基因座包含以下中的至少一种:

i.如下核酸序列中的非功能性Cer/Sis序列,所述核酸序列将最为3'的V

ii.如下核酸序列中的CBE元件,所述核酸序列将靶V

在任何方面的一些实施方式中,CBE元件位于基因座中至少一个V区段的5'。在任何方面的一些实施方式中,CBE元件与靶区段处于相同取向。在任何方面的一些实施方式中,CBE元件相对于靶区段处于倒位取向。在任何方面的一些实施方式中,CBE元件位于靶V区段的VH重组信号序列的3'。

在任何方面的一些实施方式中,靶V

在任何方面的一些实施方式中,细胞是干细胞或胚胎干细胞。在任何方面的一些实施方式中,细胞是鼠细胞,任选地为鼠干细胞或鼠胚胎干细胞。

在任何方面的一些实施方式中,细胞对于经工程化的IgH基因座和/或IgL基因座而言是杂合的,并且其它的IgH基因座和/或IgL基因座已经工程化至失活,其中,所述细胞将仅从所述经工程化的IgH基因座和/或IgL基因座表达IgH链和/或IgL链。在任何方面的一些实施方式中,所述细胞进一步包含IgH基因座中的将所述IgH基因座的最为3'的V

在任一方面的一些实施方式中,细胞进一步包含以下中的至少一种:

a.具有人序列的IgL基因座;

b.人源化的IgL基因座;

c.人IgL基因座;

d.具有人序列的IgH基因座;

e.人源化的IgH基因座;以及

f.人IgH基因座。

在任何方面的一些实施方式中,细胞进一步包含以下中的至少一种:

a.进一步经工程化以包含仅一个V

b.进一步经工程化以包含仅一个V

c.经工程化以包含一个J

d.经工程化以包含一个J

e.经工程化以包含一个D

在任何一个方面的一些实施方式中,细胞进一步包含能够激活基因、使基因失活或修饰基因的突变,所述基因引起增加的GC抗体成熟应答。在任何方面的一些实施方式中,细胞进一步包含靶区段中的盒靶向序列,这使得能够替换所述靶区段。在任何方面的一些实施方式中,盒靶向序列选自于由如下所组成的组:I-SceI大范围核酸酶位点;Cas9/CRISPR靶序列;Talen靶序列或重组酶介导的盒交换系统。在任何方面的一些实施方式中,细胞进一步包含编码TdT的外源核酸序列。在任何方面的一些实施方式中,启动子可操作地连接至编码TdT的序列。

在任何实施方式的一方面,本文描述的是包含本文描述的细胞的经遗传工程化的哺乳动物。在任何实施方式的一个方面,本文描述的是经遗传工程化的哺乳动物,所述哺乳动物基本上由本文所述的细胞组成。在任何实施方式的一个方面,本文描述的是由本文描述的细胞组成的经遗传工程化的哺乳动物。在任何实施方式的一个方面,本文描述的是包含如下两个细胞群的嵌合的经遗传工程化的哺乳动物,

包含V(D)J重组缺陷的细胞的第一群;以及

包含本文所述的经工程化的细胞的第二群。

在任何方面的一些实施方式中,V(D)J重组缺陷的细胞是RAG2

在任何实施方式的一个方面,本文描述的是经遗传工程化的哺乳动物,所述哺乳动物包含细胞群,所述细胞群包含以下中的至少一种:

a.经工程化的IgH基因座,所述经工程化的IgH基因包含以下的至少一种:

i.如下核酸序列内的CBE元件,所述核酸序列将靶V

ii.如下核酸序列内的IgH基因座中的经工程化的非功能性IGCR1序列,所述核酸序列将IgH基因座的最为3'的V

b.经工程化的IgL基因座,所述经工程化的IgL基因座包含以下的至少一种:

i.如下核酸序列内的非功能性Cer/Sis序列,所述核酸序列将最为3'的V

ii.如下核酸序列内的CBE元件,所述核酸序列将靶V

藉此哺乳动物中的V(D)J重组主要利用靶V

在任何方面的一些实施方式中,靶V

在任一方面的一些实施方式中,哺乳动物是小鼠,或者细胞是小鼠细胞。

在任何实施方式的一个方面,本文描述的是至少两种哺乳动物的组,其中每种哺乳动物均是本文描述的哺乳动物,所述第一哺乳动物包含第一靶V

在任何实施方式的一个方面,本文描述的是一种制备抗体的方法,所述方法包括以下步骤:向小鼠胚泡注射本文描述的细胞,其中所述细胞是小鼠胚胎干细胞;在适于使胚泡成熟为经遗传工程化的小鼠的条件下,将小鼠胚泡植入雌性小鼠中;以及从经遗传工程化的小鼠分离

1)抗体;或

2)产生抗体的细胞。

在任何方面的一些实施方式中,该方法还包括在分离步骤之前用期望的靶抗原对经遗传工程化的小鼠进行免疫的步骤。在任何方面的一些实施方式中,该方法进一步包括从经遗传工程化的小鼠的至少一个细胞产生单克隆抗体的步骤。在任何一个方面的一些实施方式中,一个或多个靶区段包括非天然的V

在任何实施方式的一个方面,本文描述的是一种制备抗体的方法,该方法包括以下步骤:从本文描述的哺乳动物或哺乳动物的组分离包含一个或多个靶区段的抗体,或从本文所述的哺乳动物或哺乳动物的组分离表达包含一个或多个靶区段的抗体的细胞。在任何方面的一些实施方式中,该方法还包括在分离步骤之前用期望的靶抗原对经遗传工程化的哺乳动物或哺乳动物的组进行免疫的步骤。

在任何实施方式的一个方面,本文描述的是一种制备对期望的抗原而言特异性的抗体的方法,该方法包括以下步骤:

a)向小鼠胚泡注射本文所述的细胞,其中所述细胞是小鼠胚胎干细胞,并且在适于使所述胚泡成熟为经遗传工程化的小鼠的条件下或通过RDBC进行,将所述小鼠胚泡植入雌性小鼠中;

b)用抗原对经遗传工程化的小鼠进行免疫;以及

c)从经遗传工程化的小鼠分离

1)对抗原而言特异性的抗体;或

2)产生对抗原而言特异性的抗体的细胞。

在任何实施方式的一个方面,本文描述的是一种制备对抗原而言特异性的抗体的方法,该方法包括以下步骤:

a)用抗原对本文所述的哺乳动物或哺乳动物的组进行免疫;以及

b)从该一个或多个哺乳动物分离

1)对抗原而言特异性的抗体;或

2)产生对抗原而言特异性的抗体的细胞

在任何方面的一些实施方式中,该方法进一步包括从经遗传工程化的小鼠或哺乳动物的至少一个细胞产生单克隆抗体的步骤。

在任何实施方式的一方面,本文描述的是通过本文描述的任何一个方法产生的抗体。

在任何方面的一些实施方式中,抗体是经优化的抗体。在任何方面的一些实施方式中,抗体是人源化抗体。

在任何实施方式的一个方面,本文描述的是一种将候选抗原鉴别为激活包含感兴趣的V

附图说明

图1A-图1D证明了VH81X-CBE在原代Pro-B细胞中极大地提高了VH81X的利用。图1A描绘了鼠Igh基因座的示意图,显示了近端VH、D、JH、CH外显子和调节元件(未按比例)。浅灰色和深灰色条分别表示IGHV5(VH7183)和IGHV2(VHQ52)家族的成员。三角形代表CTCF结合元件(CBE)的位置和取向。箭头表示用于产生HTGTS-Rep-Seq文库的JH4编码末端诱饵引物(bait primer)的位置。图1B描绘了VH81X-RSS(粗体),随后是WT(虚线框)或杂乱的(scrambled)(实线框)VH81X-CBE的序列。图1B按出现顺序分别公开了SEQ ID NO:51-SEQID NO:52。图1C描绘了来自WT(顶部)或VH81X-CBEscr/scr(底部)小鼠的BM pro-B细胞中的相对的VH利用±SD标准偏差(SD)。图1D描绘了所指示的近端VH区段的平均利用频率(左轴)和使用%(右轴)±SD。为了进行分析,将各个文库归一化至10,000个VDJH连接物。p值使用未配对的双尾学生t检验计算,ns表示p>0.05,*p≤0.05,**p≤0.01和***p≤0.001。为了进行分析,将各个文库归一化至10,000个VDJH连接物。

图2A-图2G证明了VH81X-CBE在DJH重排的v-Abl Pro-B系中增强了VH81X的利用。图2A描绘了DJH重排的v-Abl pro-B细胞系中的两种鼠Igh等位基因的示意图(未按比例)。一个等位基因(顶部)容纳无效的(non-productive)VDJH重排,所述VDJH重排涉及删除近端VH结构域并且对V(D)J重组呈惰性的远端VHJ558(VH1-2P)。另一等位基因(底部)容纳DHFL16.1至JH4重排(DJH等位基因),所述重排在通过G1停滞的RAG诱导时主动经历VH至DJH重组。该DHFL16.1JH4系充当亲本WT系,并用于所有后续的遗传操作。在图2B中,顶行示出了WT VH81X-CBE的序列,而底行示出了VH81X-CBE的缺失。图2B按出现顺序分别公开了SEQ IDNO:53-SEQ ID NO:54。图2C描绘了WT和VH81X-CBEdel v-Abl pro-B系中的所指示的近端VH的平均利用频率(左轴)或使用%(右轴)±SD;将文库归一化至3500个VDJH连接物。由于用于该实验的WT系是所有后续VH-CBE突变系的亲本,因此对于示出突变体与WT对照的比较的该子图以及后续子图,我们在这些实验过程中在数个点上生成了WT重复,并使用了高度可重现的平均数据(详细内容参见STAR方法)。图2D描绘了101kb基因间缺失的示意图,所述缺失在WT DHFL16.1JH4 v-Abl系及其VH81X-CBEdel衍生物中从VH81X-CBE下游302bp延伸到DHFL16.1JH4 RC上游的约400bp。图2E描绘了Intergenicdel和Intergenicdel VH81X-CBEdel v-Abl系中的所指示的近端VH的平均利用频率(左轴)或使用%(右轴)±SD;将文库归一化至100,000个VDJH连接物。图2F描述了WT和VH81X-CBE倒位突变的序列。图2F按出现顺序分别公开了SEQ ID NO:55-SEQ ID NO:56。图2G描绘了DHFL16.1JH4 WT和VH81X-CBEinv v-Abl系中的所指示的近端VH的平均利用频率(左轴)或使用%(右轴)±SD;将文库归一化至3500个VDJH连接物。如图1A-图1D所示进行统计分析。

图3A-图3C证明VH81X-CBE促进其侧接的VH与DJHRC的相互作用。图3A描绘了用于研究感兴趣的诱饵区域与其余的Igh基因座的染色体环化(looping)相互作用的3C-HTGTS方法的示意图(详细内容参见文本和STAR方法)。图3B描绘了用于图3C中的VH81X诱饵的3C-HTGTS的生物素化的(点形尾部箭头)和巢式(nested)(常规箭头)PCR引物的相对位置以及NlaIII限制性片段(用星号表示)的示意图。在图3C中,顶部子图是含有NlaIII片段的VH81X-CBE与其它Igh部位(locale)的染色体相互作用的示意图。底部两幅子图是对照的Rag2-/-衍生物VH81X-CBEdel和VH81X-CBEinv DHFL16.1JH4 v-Abl系的3C-HTGTS谱,使用VH81X-CBE部位作为诱饵。归因于系中的DHFL16.1至JH4重排,跨越IGCR1、DJH底物和iEμ的区域显示为宽的相互作用峰。由于v-Abl系缺乏基因座收缩,因此我们检测到超出最近端的VH以外的上游Igh基因座几乎没有实质性的相互作用。从归一化至105,638个总的连接物的文库示出了两个独立的数据集。

图4A-图4D证明了VH2-2的V(D)J重组关键取决于其侧接的CBE。图4A描述了WTVH2-2-CBE的序列及其杂乱的突变。图4A按出现顺序分别公开了SEQ ID NO:57-SEQ ID NO:58。图4B描绘了在WT和VH2-2-CBEscr v-Abl系中的所指示的近端VH的平均利用频率(左轴)或使用%(右轴)±SD。每个文库归一化至3500个VDJH连接物。如图1A-图1D所示进行统计分析。图4C描绘了用于图4D中的3C-HTGTS分析的生物素化的(点形尾部箭头)和巢式(常规箭头)引物的相对位置以及NlaIII限制性片段(星号)的图示。由于容纳VH2-2-CBE的限制性片段中的重复序列,下游侧接的限制性片段被用作诱饵。图4D描绘了在Rag2-/-对照和VH2-2-CBEscr v-Abl系中的VH2-2部位(星号)的代表性的3C-HTGTS相互作用谱,从归一化至84,578个总的连接物的文库进行绘制。

图5A-图5D证明了在不存在IGCR1的情况下,主要的VH81X使用需要VH81X-CBE。图5A描述了4.1kb IGCR1缺失的示意图。图5B描绘了IGCR1del和IGCR1del VH81X-CBEdel v-Abl系中的近端VH的平均利用频率(左轴)或使用%(右轴)±SD。将每个文库归一化至100,000个VDJH连接物。如图1A-图1D中所示进行统计分析。图5C描绘了使用图3B中示出的策略实施的,Rag2-/-对照、IGCR1del和IGCR1del VH81X-CBEdel DHFL16.1JH4 v-Abl系中的VH81X诱饵(星号)的代表性的3C-HTGTS相互作用谱,从归一化至106,700个总的连接物的文库进行绘制。底部子图示出了从IGCR1上游延伸到Cδ外显子下游的区域的放大图。标有“Δ”的矩形表示在IGCR1del和IGCR1del VH81X-CBEdel IGCR1del系中缺失的IGCR1区域。图4D描绘了使用图12D中所示出的策略进行NlaIII消化之后,所指示的基因型的Rag2-/-v-AblDJH系中的iEμ诱饵(星号)的代表性的3C-HTGTS相互作用谱。每个库均归一化至273,547个总的连接物。底部子图示出了近端的VH区域的放大图。

图6A-图6D表明CBE的恢复将VH5-1转化为最高度重排的VH。图6A描述了示出VH5-1-RSS及其下游非功能性“残遗的(vestigial)”CBE的序列的示意图。框突出显示了在正常的pro-B细胞中甲基化的CpG岛。底部序列显示突变的四个核苷酸(以实线无阴影框突出显示),以消除CpG岛并恢复共有的CBE序列。两个额外的核苷酸紧邻CBE的下游进行突变,以生成用于筛选的BglII位点。图6A按出现顺序分别公开了SEQ ID NO:59-SEQ ID NO:61。图6B描绘了在WT和VH5-1-CBEins v-Abl系中的所指示的近端VH的平均利用频率(左轴)或使用%(右轴)±SD。将每个文库归一化至3500个VDJH连接物。如图1A-图1D所示地进行统计分析。图6C描绘了用于图6D中的3C-HTGTS分析的生物素化的(带有点形尾部的箭头)和巢式(常规箭头)引物的相对位置以及MseI限制性片段(星号)的图示。图6D描绘了在Rag2-/-对照和VH5-1-CBEins v-Abl系中的VH5-1部位(星号)的代表性的3C-HTGTS相互作用谱,从归一化至37,856个总的连接物的文库进行绘制。

图7A-图7F描绘了用于通过环挤压(loop extrusion)的RAG染色质扫描的模型。所示出的是在染色质的RAG扫描过程中的VH相关CBE的潜在作用的工作模型。可以想到该模型的许多变体。图7A表明,RAG从其在起始RC中的位置开始,线性扫描黏连蛋白介导的穿过D前行的挤压环,以允许其利用;但在更上游很大程度上受IGCR1锚的阻碍。在形成DJHRC之后,超出IGCR1障碍的上游序列的残留的较低水平扫描使最近端的VH-CBE能够介导与DJHRC的直接关联,增强其关联的VH的利用。更上游的VH很可能通过与近端CBE的扩散而接近DJHRC,也增强了DJHRC的相互作用以及侧接的VH的利用。图7B证明,在不存在IGCR1的情况下,环挤压向上游进行,使RAG能够扫描最近端的VH,其中相关的CBE促进DJHRC相互作用、可及性以及在V(D)J连接物中的主要的过度利用。对近端VH81X而言利用最为稳健,它提供了线性扫描过程中遇到的第一个VH-CBE。由于缺少CBE,VH5-1被绕过。扫描有时可绕过VH81X-CBE,并继续到前几个的上游VH,其CBE相似地提高利用。图7C表明,如果IGCR1和VH81X-CBE均发生突变,则环挤压继续不减弱地至VH2-2-CBE,并以逐渐更小的程度继续至紧邻的上游VH-CBE。(图7D-图7F)不直接侧接远端VH的CBE理论上也可以提高VH利用。图7D证明了远端VH基因座CBE与DJHRC处的染色质或相关因子(例如CTCF/黏连蛋白)强烈相关。在图7E中,黏连蛋白环在该DJHRC相关的远端VH基因座CBE附近加载并起始环挤压。在图7F中,环挤压使RAG能够从DJHRC扫描缺少直接关联的CBE的下游(或上游,未示出)VH,它们所在的活性/转录染色质促进了对V(D)J重组的接近。

图8A-图8E表明绝大多数功能性Igh VH在其附近容纳CBE。图8A表明将约2.4MbC57BL/6小鼠VH区从最为JH近端的到最为JH远端的分为所指示的如下的四个结构域(Choi等,2013):约0.31Mb的近端7183/Q52结构域,容纳IGHV5和IGHV2家族的18个成员;约0.56Mb的结构域,容纳属于10个不同的中间VH家族的31个成员;约0.53Mb的J558结构域,容纳34个IGHV1家族成员、2个IGHV10成员以及IGHV8和IGHV15家族各1个;以及最远端的约1Mb的J558/3609结构域,容纳散布有8个IGHV8家族成员的32个IGHV1成员。这些VH数量仅反映以可检测的频率经历V(D)J重组的VH。图8B-图8E描绘了来自四个相应的VH结构域的VH区段,所述VH区段按照其利用频率从最高(左)到最低(右)的顺序排列。VH使用%根据将每个单独的文库归一化至3,564个框外(out-of-frame)VDJH连接物后,从源自4-6周龄小鼠的B220+CD43highIgM-pro-B细胞获得的总的框架外VDJH连接物计算得出,n=3(数据摘自Lin等,2016)。数据代表平均值±SD。仅对框架外连接物进行分析,以检查主要的重排频率,而使细胞选择对IgH库的影响最小。白色条形表示如下的VH:所述VH于其RSS的10kb之内在Rag2-/-pro-B细胞中显示出CTCF ChIP-seq峰(Choi等,2013),并且在所讨论的CTCF峰和VH之间不存在间插的功能性VH区段。灰色条形表示不符合此标准的VH。白色条形上方的星号表示CTCF峰距VH-RSS的相对距离:*CTCF ChIP-seq峰在VH-RSS的100bp之内,**在5kb之内,***在10kb之内。在其RSS的10kb内未显示CTCF结合但促成所有重排中的≥0.5%的VH区段经常在Rag2-/-pro-B细胞中具有接近的Pax5或YY1 ChIP-seq峰(Revilla-I-Domingo等,2012;Medvedovic等,2013)。在理论上可以为图7A-图7E的模型中的CBE相互作用充当重叠功能的这些位点只要出现均在灰色条形的顶部示出。

图9A-图9F表明了VH81X-CBEscr/scr小鼠的产生。图9A描绘了电泳迁移率凝胶迁移测定法(EMSA),以证实CTCF与杂乱的VH81X-CBE序列的结合的丧失,所述VH81X-CBE序列后续用于产生VH81X-CBEscr/scr小鼠。添加抗CTCF抗体引起超迁移,表明CTCF与WT VH81X-CBE序列结合(上方以红色示出)。加入20倍或甚至200倍摩尔过量的未标记的杂乱的VH81X-CBE寡核苷酸也不能与WT寡核苷酸竞争CTCF结合。图9A按出现顺序分别公开了SEQ ID NO:62-SEQ ID NO:63。图9B描绘了用于产生容纳VH81X-CBEscr突变的129SV ES细胞的靶向策略的示意图。所指示箭头示出了用于确认CBE突变的PCR引物的位置。图9C、图9D和图9F描绘了靶向的ES细胞的Southern印迹确认。图9E表明通过PCR扩增侧接于VH81X-CBE的区域然后用NotI限制性消化,证实了VH81X-CBEscr突变。

图10A-图10C表明了v-Abl DHFL16.1JH4系中的VH的使用。所描绘的是如通过使用JH4编码末端诱饵引物的HTGTS-Rep-Seq所确定的,WT亲本DHFL16.1JH4系及其突变体衍生物中的VH跨过整个Igh基因座的利用频率。用STI-571处理将细胞在G1中停滞4天后进行分析。数据代表在将每个单独的文库归一化至3500个(图10A,图10C)和100,000个(图10B)VDJH连接物后获得的平均重排频率±SD。除了在图10B和图2E中分析的101kb基因间缺失v-Abl DHFL16.1JH4系(图2D)之外,我们还进行了部分缺失,该缺失分别涵盖VH81X-CBEdel和VH81X-CBEdel IGCR1del背景下的DJH近端的50kb区域或DJH远端的54kb区域;它们的重排谱看起来与VH81X-CBEdel IGCR1del系的谱(数据未示出)没有显著区别。我们注意到,对原代的RAG2缺陷型pro-B细胞和v-Abl pro-B系进行的比较性3C-HTGTS研究表明,IGCR1和3'CBE之间的区域中的序列之间具有相似的相互作用,但不同于最近端的VH,缺乏与RAG2缺陷的v-Abl pro-B系中的VH基因座序列的相互作用(Ba,Z.、Lin,S.和Alt,F.W,未公布的数据)。这些发现与该图中示出的缺乏远端的VH V(D)J重组一起表明Igh在v-Abl pro-B系中没有收缩(contract)。

图11A-图11D示出了对照、VH2-2-CBEscr和VH5-1-CBEins v-Abl DHFL16.1JH4系的VH使用和3C-HTGTS谱。图11A和图11C描绘了如通过使用JH4编码末端诱饵引物的HTGTS-Rep-Seq确定的,相对于WT对照的VH2-2scr(图11A)和VH5-1ins(图11C)DHFL16.1JH4 v-Abl系中的跨过整个Igh基因座的VH重排频率。用STI-571处理细胞在G1中停滞4天后进行分析。数据表示将每个单独的文库归一化至3,500个VDJH连接物后获得的平均重排频率±SD。图11B和图11D描绘了额外的3C-HTGTS重复,其分别使用图4C和图6C中示出的诱饵引物示出了在Rag2-/-对照和突变体DHFL16.1JH4 v-Abl pro-B细胞系中的VH2-2(图11B)和VH5-1(图11D)部位(星号)的染色质相互作用谱。在(图11B)和(图11D)中从归一化至84,587个和37,856个总的连接物的库中分别对数据进行绘制。

图12A-图12D描绘了DHFL16.1JH4 v-Abl系中的VH81X和iEμ的相互作用谱。图12A描绘了如在G1停滞四天后使用JH4编码末端诱饵引物通过HTGTS-Rep-Seq所确定的,WT和IGCR1del DHFL16.1JH4v-Abl系中的近端VH利用的平均频率。数据代表将每个单独的文库归一化至120,000个经比对的读长(reads)(包括所有的DHFL16.1JH4读长以及VH至DHFL16.1JH4连接物)后获得的平均利用频率(左轴)或使用%(右轴)±SD。p值使用未配对的双尾学生t检验计算,ns表示p>0.05,*p≤0.05,**p≤0.01和***p≤0.001。图12B描绘了如在G1停滞四天后使用JH4编码末端诱饵引物通过HTGTS-Rep-Seq所确定的,在IGCR1del(顶部)和IGCR1del VH81X-CBEdel(底部)DHFL16.1JH4 v-Abl系中的跨过整个Igh基因座的VH的重排频率。数据表示将每个单独的文库归一化至100,000个VDJH连接物后获得的平均重排频率±SD。图12C描绘了额外的3C-HTGTS重复,其示出了使用图3B所示的诱饵策略进行的Rag2-/-对照、IGCR1del和IGCR1del VH81X-CBEdel DHFL16.1JH4 v-Abl系中的VH81X部位(星号)的染色质相互作用谱。从归一化至106,700个总的连接物的文库对数据进行绘制。底部子图示出了从IGCR1上游延伸到Cδ下游的区域的放大图。图12D描绘了额外的3C-HTGTS重复,其示出了使用右侧所示的诱饵策略的Rag2-/-对照、IGCR1del和IGCR1del VH81X-CBEdel DHFL16.1JH4 v-Abl系中的iEμ部位(星号)的染色质相互作用谱。从归一化至273,547个总的连接物的文库对数据进行绘制。底部子图示出了近端VH区域的放大图。

图13A-图13B描绘了在未重排的v-Abl pro-B系中的iEμ和DHQ52-JH1部位的染色体相互作用谱。图13A描绘了使用图12D中所示的诱饵策略的未重排的WT、IGCR1del/del和IGCR1del/del VH81X-CBEscr/scr IGCR1del/del v-Abl系的Rag2-/-衍生物中的iEμ片段(星号)的代表性的3C-HTGTS相互作用谱。从归一化至215,280个总的连接物的文库对数据进行绘制。底部子图示出了近端VH区域的放大图。图13B描绘了来自RC内的iEμ和DHQ52-JH1诱饵的Rag2-/-IGCR1del/del v-Abl系中的3C-HTGTS相互作用谱的比较,从归一化至215,280个总的连接物的文库进行绘制。示出了来自AJ851868/mm9杂交基因组的114,400,000-114,893,000核苷酸之间的chr12上的Igh部位。在右侧示出了用于DHQ52-JH1诱饵的诱饵策略。iEμ和DHQ52-JH1诱饵均在这些容纳未重排(生殖系构型)的Igh基因座的v-Abl系中揭示出额外的DHST4.1相互作用峰。

图14A-图14C描绘了IGCR1del和IGCR1del VH5-1-CBEins v-Abl DHFL16.1JH4系的VH使用和3C-HTGTS谱。图14A描绘了如在G1停滞四天后使用JH4编码末端诱饵引物通过HTGTS-Rep-Seq所确定的,IGCR1del(顶部)和IGCR1del VH5-1-CBEins(底部)DHFL16.1JH4v-Abl系中的跨过整个Igh基因座的VH的利用频率。顶部和底部子图中的VH81X和VH5-1利用的条形以箭头突出显示。数据表示将每个单独的文库归一化至100,000个VDJH连接物后获得的平均利用频率±SD。由于IGCR1del、IGCR1del VH81X-CBEdel和IGCR1del VH5-1-CBEins系均源自同一祖先DHFL16.1JH4系,因此在与IGCR1del VH81X-CBEdel或IGCR1delVH5-1-CBEins系的比较分析期间,我们在多个点生成了IGCR1del重复,并在此处以及图6B、图5B、图12A和图12B中示出了平均IGCR1del数据。图14B描绘了所指示的近端VH(在图14A中框出)的平均利用频率(左轴)或使用%(右轴)±SD。图14C描绘了使用图12D所示的诱饵策略进行的Rag2-/-对照、IGCR1del和IGCR1del VH5-1-CBEins DHFL16.1JH4 v-Abl系中的iEμ部位(星号)的代表性的3C-HTGTS相互作用谱。从归一化至197,174个总的连接物的文库对数据进行绘制。底部子图示出了近端VH区域的放大图。显示了Rag2-/-IGCR1del VH5-1-CBEins背景的两个独立重复。

图15A-图15B表明在Cer/Sis缺失的情况下近端Vk区段的利用增加。图15A是示出小鼠Igk基因座的图。较深的灰色矩形代表可以通过缺失重组连接至Jk区段的Vk区段,而较浅的灰色矩形代表可以通过倒位重组连接至Jk区段的Vk区段。图下方的绘图示出了通过我们的HTGTS方法测得的Vk利用。每个条形的高度表示所指示的Vk区段的重排频率。分析表明,Cer/Sis的缺失极大增加了Jk近端的Vk区段的重排频率(在灰色阴影区域比较Cer-/-Sis-/-与Cer+/+Sis+/+)。图15B描绘了在对从Jk到近端Vk区段的区域放大的示意子图。直方图显示了对应于单独的Vk区段的重排的序列读长的数量。数据显示出,在不存在Cer/Sis元件的情况(深灰色条)与存在Cer/Sis元件的情况(浅灰色条)相比,Jk近端的Vk区段的重排频率显著增加。该图中的发现与在不存在Cer/Sis的情况下近端Vκ的上游的RAG染色质扫描一致,这通过扩展到上方示出的我们的IgH VH CBE数据表明,向近端Vκ(缺乏内源性CBE)添加CBE应该会极大增加其在Cer/Sis中的利用。

图16-图19描绘了实施例5中描述的模型的示意图。图18描绘了在成熟B细胞中表达抗体的条件性表达策略的图。图19描绘了在GC B细胞中表达抗体的条件性表达的图。

图20描绘了使用小鼠或人Jk1诱饵引物的WT小鼠IgM+脾B细胞或人PBMC的HTGTS-Rep-seq的图。将包含与生殖系Vic序列的完美排齐的总的框内(in-frame)VJκ外显子用于分析。对于小鼠和人样品,N=1。所示出的是在小鼠(左)或人(右)样品中的VκJκ连接物处观察到的P/N核苷酸的数量,这表明5%的小鼠无效的VJκ外显子包含P/N核苷酸,而近50%的人VJκ外显子包含P/N核苷酸。

图21A-图21C。图21A表明了用于条件性表达或组成性表达的VRC26UCA重链表达盒被整合在F1 ES细胞系的IgH

具体实施方式

本文提供了允许使用者指导V(D)J重组以利用Ig基因座的特定V区段的方法和组合物。此类方法可与野生型V区段一起使用以生成更频繁地使用特定V区段的抗体库,和/或与Ig基因座的额外的修饰结合以指导使用非天然V区段的抗体库的开发。本文描述了三种不同类型的Ig基因座修饰,并且每种类型可以独立利用或与其它修饰类型组合利用。另外,本文描述的技术可以与美国专利公开2016/0374320(以引用的方式将其整体并入本文)中描述的IgH基因座修饰组合。

在任何实施方式的一个方面,本文描述的是包含以下中的至少一种的细胞:a)经工程化的IgH基因座,所述IgH基因座包含如下核酸序列内的CBE元件,所述核酸序列将靶V

在任何实施方式的一个方面,本文描述的是包含经工程化的IgH基因座的细胞,所述经工程化的IgH基因座包含如下核酸序列内的CBE元件,所述核酸序列将靶V

在任何实施方式的一个方面,本文描述的是包含经工程化的IgL基因座的细胞,所述经工程化的IgL基因座包含在如下核酸序列内的非功能性Cer/Sis序列,所述核酸序列将最为3'的V

在任何实施方式的一个方面,本文描述的是包含如下的细胞:a)经工程化的IgH基因座,所述经工程化的IgH基因座包含如下核酸序列内的CBE元件,所述核酸序列将靶V

在任何实施方式的一个方面,本文描述的是包含如下细胞:a)经工程化的IgH基因座,所述经工程化的IgH基因座包含如下核酸序列内的CBE元件,所述核酸序列将靶V

在任一方面的一些实施方式中,CBE元件可以位于RSS的下游,所述RSS侧接于靶V

本文所使用的术语“Ig基因座”是指编码或可以重组以编码免疫球蛋白分子(例如,BCR或抗体)的多肽链的基因座。Ig基因座可以是IgH基因座(编码免疫球蛋白分子的重链)或IgL基因座(编码免疫球蛋白分子的轻链)。IgL基因座可以是Igκ或Igλ基因座。在VDJ重组之前,IgH基因座从5'至3'包含一个或多个V

本文所使用的术语“V区段”是指Ig基因座的可变区段。本文所使用的术语“D区段”是指Ig基因座的多样性区域区段。本文所使用的术语“J区段”是指Ig基因座的连接区域区段。区段可进一步被指定为重链或轻链的区段,例如分别为V

在B细胞发育过程中,IgH D

Ig基因的区段(例如V区段)可以是例如生殖系V区段、亲和力成熟中间体或成熟V区段。在任何一个方面的一些实施方式中,生殖系区段可以是在生殖系细胞的基因组中(例如在任何V(D)J重组事件之前)发现的区段。在任何方面的一些实施方式中,成熟中间体可以是至少一个V(D)J重组事件之后但在GC反应和/或SHM完成之前的区段。在任何方面的一些实施方式中,成熟区段可以是在成熟B细胞中发现的区段。由成熟中间体或成熟区段组成的区段作为VDJ重排存在于细胞中,并已与至少一个其它区段重组。

某些区段(例如V区段)在本文中被称为“靶区段”。靶区段是具有期望Ig基因座将用于V(D)J重组的类型的区段(例如,V

本文所使用的术语“天然的”是指在未工程化的细胞和/或动物的基因组中的特定位置发现的序列。本文所使用的术语“非天然的”是指与在未工程化的细胞和/或动物的基因组中的特定位置发现的序列不同的序列。非天然序列可以是例如来自不同物种的序列或已移动至基因组中的非天然位置的来自相同物种的序列。因此,尽管序列对于未工程化的细胞的基因组中的特定基因而言可能是“天然的”序列,但是如果该序列已在经工程化的细胞中的基因内移动,则不再将其视为天然的。在任何方面的一些实施方式中,非天然的序列与天然的序列相差至少5%,例如至少5%、至少10%、至少20%、至少30%、至少40%、至少50%或更多。

在任何方面的一些实施方式中,Ig基因座是小鼠基因座,并且Ig基因座的靶V区段已经工程化以包含不同于原始的小鼠V区段的任何V区段。在任何方面的一些实施方式中,非天然的V区段是人V区段。在任何方面的一些实施方式中,非天然的V区段是来自需要改善亲和力、特异性或广度的已知抗体的V区段,期望对这些性质中的任一种或全部的改善。在任何方面的一些实施方式中,非天然的V区段是来自需要改善亲和力或特异性或广度的已知抗体的人V区段,期望对这些或其它性质中的任一种或全部的改善。在任何方面的一些实施方式中,非天然的V区段是来自已知抗体的V区段。在任何方面的一些实施方式中,非天然的V区段是来自已知抗体的人V区段。在任何方面的一些实施方式中,V区段可以是常用的人VH或VL区段。

尽管本文描述的方法和组合物适合与任何V区段一起使用,但是由于某些特定的V区段的已知的抗原特异性,特别考虑将其用于本文所述的组合物和方法中,所述V区段可能来自生殖系或先前的亲和力成熟的抗体并因此容纳SHM。由于其对未选择的抗体库的贡献的高频率,可以选择其它V区段,例如但不限于IGHV1-2*02、IGHV1-69、VH3-30和VH4-59。这些V

在任一方面的一些实施方式中,V区段可以是2G12 bnAb或VRC42 bnAb的V区段。2G12 bnAb的V区段为:VH3-21、Vk1-5,而VRC42 bnAb的V区段为:VH1-69、Vk3-20。

本文所使用的“Cer/Sis序列”统指Ig基因座的Cer和/或Sis元件。Cer(用于重组的收缩元件)和Sis(间插序列中的沉默子)元件是Ig基因的已知元件。本文所使用的“用于重组的收缩元件”或“Cer”是指位于IgL基因座中最为3'的天然VL区段的3'和最为5'的天然JL区段的5'端的区域,并控制VJ重组。Cer的长度为约650bp。Cer可以结合CTCF,并且对DNaseI高敏感。本文所使用的“间插序列中的沉默子”或“Sis”是指位于IgL基因座中最为3'的天然的VL区段的3'和最为5'的天然的JL区段的5'端的区域,并控制VJ重组。Sis的长度为约1,500bp。Sis可以结合CTCF和Ikaros,并且也对DNaseI高敏感。Cer和Sis的结构在例如以下中详细地解释:Xiang等,J Immunol 190:1819-1826(2013);Liu等,J Biol Chem 277:32640-32649(2002);以及Liue等,Immunity.24:405-415(2006);以引用的方式将其整体各自并入本文。

示例性的Cer和Sis序列在以下中提供:Xiang等,J.Immunol.190,1819-1826(2013)以及Xiang等,J.Immunol.186,5356-5366(2011),以引用的方式将其整体并入本文。在任何方面的一些实施方式中,Cer/Sis序列可以是与SEQ ID NO:13的~6.7kb Cer/Sis序列具有至少80%序列同一性的序列,例如与SEQ ID NO:13具有80%的序列同一性、85%的序列同一性、90%的序列同一性、95%的序列同一性、98%的序列同一性或更高的序列同一性。在任何方面的一些实施方式中,Cer/Sis序列可以是与SEQ ID NO:13具有至少95%同一性并且具有相同活性(例如CTCF结合活性)的序列。

在任何方面的一些实施方式中,Cer/Sis序列可以是与SEQ ID NO:13的bp 860-7288具有至少80%序列同一性的序列,例如与SEQ ID NO:13的bp 860-7288具有80%的序列同一性、85%序列的同一性、90%的序列同一性、95%的序列同一性、98%的序列同一性或更高的序列同一性。在任何方面的一些实施方式中,Cer/Sis序列可以是与SEQ ID NO:13的bp 860-7288具有至少95%同一性并且具有相同活性(例如CTCF结合活性)的序列。

在任何方面的一些实施方式中,Cer序列可以是与SEQ ID NO:13的bp 860-1529具有至少80%的序列同一性的序列,例如与SEQ ID NO:13的bp 860-1529具有80%的序列同一性、85%的序列同一性、90%的序列同一性、95%的序列同一性、98%的序列同一性或更高的序列同一性。在任何方面的一些实施方式中,Cer/Sis序列可以是与SEQ ID NO:13的bp860-1529具有至少95%同一性并且具有相同活性(例如CTCF结合活性)的序列。

在任一方面的一些实施方式中,Sis序列可以是与SEQ ID NO:13的bp 3562-7288具有至少80%序列同一性的序列,例如与SEQ ID NO:13的bp 3562-7288具有80%的序列同一性、85%的序列同一性、90%的序列同一性、95%的序列同一性、98%的序列同一性或更高的序列同一性。在任何方面的一些实施方式中,Cer/Sis序列可以是与SEQ ID NO:13的bp3562-7288具有至少95%同一性并且具有相同活性(例如CTCF结合活性)的序列。

Cer和Sis各自包含两个CBE。作为本文的实施例4提供了描述Cer、Sis和CBE元件的示例性鼠野生型序列。实施例4进一步表明了使用CRISPR/Cas9技术来同时删除Cer和Sis元件两者(总共~6.7kb的缺失)的缺失策略的示例性实施方式。这种缺失因此使Cer和Sis都成为非功能的,如实施例3中详述。本文进一步考虑的是,Cer和Sis阻断从JκRC进入近端Vκ结构域的RAG扫描。

使Igκ基因座中的Cer/Sis序列成为非功能的引起最为3'的V

在任何一个方面的一些实施方式中,非功能性Cer或Sis序列是其中至少一个CBE序列已缺失的序列。在任何方面的一些实施方式中,非功能性Cer或Sis序列是两个CBE序列都已缺失的序列。在任何方面的一些实施方式中,非功能性Cer/Sis序列是其中所有四个CBE序列均已缺失的序列。在任何方面的一些实施方式中,非功能性Cer/Sis序列是其中Cer/Sis序列已缺失的序列。在任何方面的一些实施方式中,非功能性Cer/Sis序列是其中Cer和/或Sis序列已缺失的序列。在任何方面的一些实施方式中,非功能性Cer/Sis序列是其中Cer/Sis序列已缺失的序列,例如对应于SEQ ID NO:13、SEQ ID NO:13的bp 860-7288、SEQ ID NO:13的bp 860-1592和/或SEQ ID NO:13的bp 3562-7288的序列已缺失。

在任何方面的一些实施方式中,非功能性Cer/Sis序列是其中一个或多个CBE序列已缺失的序列,例如,包含所有四个CBE序列的连续序列已缺失,或包含至少一个CBE序列的Cer/Sis的任何部分已缺失。在任何方面的一些实施方式中,非功能性Cer/Sis序列是其中一个或多个CBE序列已突变的序列。

本文所使用的“CTCF结合元件”或“CBE”是指被CTCF结合的核苷酸序列。已知在Ig基因座中存在多个CBE,并且CBE结构的进一步细节提供于例如Guo等,Nature 2011 477-424-431;以引用的方式将其整体并入本文。在任何方面的一些实施方式中,CBE可以包含SEQ ID No:3-SEQ ID No:12中的任何一个或由SEQ ID No:3-SEQ ID No:12中的任何一个组成。

进一步的示例性CBE序列描述于Xiang等,J.Immunol.190,1819-1826(2013),以引用的方式将其整体并入本文,其中Cer和Sis元件二者中的两个CBE序列中的每一个(在此分别称为HS1-2和HS3-6)均在图1C中突出显示。在任何方面的一些实施方式中,CBE可以是天然存在的鼠或人CBE序列。

可以通过例如使CBE突变或使CBE缺失来使CBE成为非功能的。将CBE序列的序列突变,使得CTCF结合减少至少25%(例如减少25%以上、50%以上、或75%以上)可使CBE成为非功能的。可以容易地测量CTCF与给定的突变的CBE的结合,例如EMSA或ChIP。此类突变的非限制性实例描述于Guo等,Nature 2011 477-424-431以及Jain等,Cell(2018);以引用的方式将其整体并入本文。

在任何方面的一些实施方式中,CBE元件位于基因座中至少一个V区段的5',例如,靶V区段不是最为3'的V区段。考虑将CBE元件以相对于靶区段的任一取向布置,例如,CBE元件可以相对于靶区段处于相同取向或倒位的。

在任何方面的一些实施方式中,CBE元件可以与靶V区段邻接。在任何方面的一些实施方式中,CBE元件可以为靶V区段的重组信号序列的3'。在任何方面的一些实施方式中,CBE元件可以为靶V区段的重组信号序列的3'的1bp以上,例如靶V区段的重组信号序列的3'的1bp、3bp、5bp、10bp、15bp或更多。在任何方面的一些实施方式中,CBE元件可以是靶V区段的重组信号序列的3'的15bp以上。在任何方面的一些实施方式中,CBE元件可以是靶V区段的重组信号序列的3'的约15bp。

在任何方面的一些实施方式中,细胞可以进一步包含如下核酸序列内的IgH中的经工程化的非功能性IGCR1序列,所述核酸序列将IgH基因座的最为3'的V

在任何方面的一些实施方式中,非功能性IGCR1序列是其中至少一个CBE序列已缺失的序列。在任何方面的一些实施方式中,非功能性IGCR1序列是其中两个CBE序列均已缺失的序列。在任何方面的一些实施方式中,非功能性IGCR1序列是其中IGCR1序列已缺失的序列,例如,包含IGCR1的4.1kb已缺失。在任何方面的一些实施方式中,非功能性IGCR1序列是其中一个或多个CBE序列已缺失的序列,例如,包含两个CBE序列的2.6kb序列已缺失,包含至少一个CBE序列的该2.6kb序列的任何部分已缺失。在任何方面的一些实施方式中,非功能性IGCR1序列是其中一个或多个CBE序列已突变的序列。对CBE序列的序列进行突变,使得CTCF结合减少至少25%(例如减少25%以上、50%以上、或75%以上),可以使IGCR1成为非功能的。CTCF结合至给定的突变CBE可以容易地测量,例如EMSA或ChIP。此类突变的非限制性实例描述于例如Guo等,Nature 2011 477-424-431;以及Jain等,Cell(2018),以引用的方式将其整体并入本文。

如果期望特定的V

在任何方面的一些实施方式中,J

在任何方面的一些实施方式中,IgL基因座包含一个或多个非天然的J

在任何方面的一些实施方式中,可以将IgL基因座工程化以包含人序列、成为人源化IgL基因座或成为人IgL基因座。在任何方面的一些实施方式中,可以将IgH基因座工程化以包含人序列、成为人源化IgH基因座或成为人IgH基因座。

在任何方面的一些实施方式中,本文所述的细胞可包含具有一个V

在任何方面的一些实施方式中,本文所述的细胞可包含具有一个V

本文所述的方法和组合物可涉及以利用通过例如GC应答和SHM产生的变体的方式来产生抗体。在任何方面的一些实施方式中,本文所述的细胞可进一步包含能够激活基因、使基因失活或修饰基因的突变,所述基因以淋巴细胞固有方式引起增加的GC抗体成熟应答。此类突变是本领域已知的,并且可以包括作为非限制性实例的PTEN

在任何方面的一些实施方式中,Ig基因座和/或靶区段可进一步包含盒靶向序列,例如,以允许在Ig基因座和/或靶区段中插入和/或替换序列。本文所使用的术语“盒靶向序列”是指使得感兴趣的序列(例如,包含感兴趣的V区段的序列)能够通过靶向盒靶向序列的至少一种酶作用而在盒靶向序列位置处插入基因组中的序列。盒靶向序列的非限制性实例是I-SceI大范围核酸酶位点;Cas9/CRISPR靶序列;Talen靶序列;锌指核酸酶(ZFN)和重组酶介导的盒交换系统。此类盒靶向系统在本领域是已知的,参见例如,Clark和Whitelaw,Nature Reviews Genetics 2003 4:825-833,以引用的方式将其整体并入本文。在任何方面的一些实施方式中,盒靶向序列使得能够替换最为3’的V

I-SceI、锌指核酸酶(ZFN)、Cas9/CRISPR系统和转录激活因子样效应物核酸酶(TALEN)是核酸酶。核酸酶常见于微生物物种中,并且具有拥有非常长的识别序列(>14bp)的独特的特性,因此使其天然地对于在期望的位置进行切割而言是非常特异性的。可以利用这点来在例如基因组中制造位点特异性的双链断裂。这些核酸酶可以在基因组中的期望的位置切割并产生特定的双链断裂,然后通过细胞内源性过程(例如同源重组(HR)、同源介导的修复(HDR)和非同源末端连接(NHEJ))修复所述双链断裂。NHEJ直接连接双链断裂中的DNA末端,而HDR利用同源序列作为模板以在断裂点处再生缺失的DNA序列。因此,通过向细胞中引入对盒靶向序列而言特异性的例如ZFN、CRISPR和/或TALEN,可以在基因组中产生至少一个双链断裂,使得模板序列(例如包含感兴趣的区段的序列)被用于修复断裂,从而将模板序列引入基因组和期望的位置(参见例如Gaj等,Trends in Biotechnology 2013 31:397-405;Carlson等,PNAS 2012 109:17382-7;以及Wang等,Cell 2013 153:910-8;以引用的方式各自将其整体并入本文)。

诱变和高通量筛选方法已经用于产生识别独特序列的核酸酶和/或大范围核酸酶变体。例如,已经融合了各种核酸酶以产生识别新序列的杂合酶。或者,可以改变核酸酶的DNA相互作用氨基酸以设计序列特异性核酸酶(参见例如美国专利8,021,867)。可以使用例如在以下中描述的方法设计核酸酶:Certo,MT等,Nature Methods(2012)9:073-975;美国专利号8,304,222;8,021,867;8,119,381;8,124,369;8,129,134;8,133,697;8,143,015;8,143,016;8,148,098;或8,163,514,以引用的方式将各自的内容以其整体并入本文。或者,可以使用可商购获得的技术(例如Precision BioSciences的Directed NucleaseEditor

ZFN和TALEN限制性核酸内切酶技术利用非特异性DNA切割酶,所述酶与识别特定DNA序列的肽(例如锌指和转录激活因子样效应物(TALE))相连。通常,选择DNA识别位点和切割位点彼此分开的核酸内切酶,并且将其切割部分分离开并随后与序列识别肽连接,从而产生对期望的序列具有相当高的特异性的核酸内切酶。具有此类性质的示例性限制酶是FokI。此外,FokI具有如下的优势,其需要二聚化以具有核酸酶活性,并且这意味着由于各核酸酶伴侣识别独特的DNA序列,特异性显著提高。为了增强这种效果,已经对FokI核酸酶进行工程化,使其只能作为异二聚体发挥功能并具有增强的催化活性。异二聚体功能性核酸酶避免了不期望的同二聚体活性的可能性,并因此增加了双链断裂的特异性。

在任何方面的一些实施方式中,Cas9/CRISPR系统可用于在本文所述的盒靶向序列处引入序列。成簇的规律间隔的短回文重复序列(CRISPR)/CRISPR相关(Cas)系统用于例如RNA可编程的基因组编辑(参见例如Marraffini和Sontheimer,Nature ReviewsGenetics 2010 11:181-190;Sorek等,Nature Reviews Microbiology 2008 6:181-6;Karginov和Hannon,Mol Cell 2010 1:7-19;Hale等,Mol Cell 2010:45:292-302;Jinek等,Science 2012 337:815-820;Bikard和Marraffini,Curr Opin Immunol 2012 24:15-20;Bikard等,Cell Host&Microbe 2012 12:177-186;均以引用的方式将其整体并入本文)。使用CRISPR向导RNA可以将Cas酶靶向至基因组中期望的位置,并在所述位置产生双链断裂。该技术是本领域中已知的,并且描述于例如Mali等,Science 2013 339:823-6;以引用的方式将其整体并入本文,并且用于设计和使用CRISPR介导的基因组编辑的试剂盒可商购获得,例如,来自System Biosciences,Mountain View,CA的PRECISION X CAS9 SMARTNUCLEASE

在任何方面的一些实施方式中,可以将CRISPR、TALEN或ZFN分子(例如,肽和/或肽/核酸复合物)引入细胞(例如经培养的ES细胞),使得CRISPR、TALEN或ZFN分子的存在是瞬时的,并且在该细胞的后代或由该细胞衍生而来的动物中无法检测到。在任何方面的一些实施方式中,可以将编码CRISPR、TALEN或ZFN分子(例如,编码肽/核酸复合物的部分的多个核酸和/或肽)的核酸引入细胞(例如经培养的ES细胞),使得该核酸瞬时存在于细胞中,并且编码CRISPR、TALEN或ZFN分子的核酸以及CRISPR、TALEN或ZFN分子本身在该细胞的子代或由该细胞衍生而来的动物中不可检测。在任何方面的一些实施方式中,可以将编码CRISPR、TALEN或ZFN分子(例如,编码肽/核酸复合物的部分的多个核酸和/或肽)的核酸引入细胞(例如经培养的ES细胞),使得核酸保留在细胞中(例如并入基因组中),并且编码CRISPR、TALEN或ZFN分子的核酸和/或CRISPR、TALEN或ZFN分子将在该细胞的后代或由该细胞衍生而来的动物中可检测到。

重组酶介导的盒交换系统(RMCE)利用重组酶(例如Flp)和由重组酶识别的序列(例如FRT靶位点)以将来自基因组的序列(由FRT靶位点标示)换成盒中同样侧接有FRT靶位点的序列。RMCE是本领域已知的,例如Cesari等,Genesis 2004 38:87-92以及Roebroek等,Mol Cell Biol 2006 26:605-616;以引用的方式将其整体各自并入本文。

分离和/或产生包含特定区段(例如,V区段)的抗体可能是困难的,因为该区段不被选择(selected against),例如,如果该区段特别地可能识别自身抗原,则具有该区段的B细胞更可能不被选择。此类区段在本文中被称为“成熟不相容的”。该术语并不意味着表达BCR和/或包含此类区段的抗体的B细胞总是遭受克隆缺失和/或无能的(anergy)。本文提供了用于如下的方法和组合物:避免在B细胞发育过程中的克隆缺失和/或无能的,以及引起B细胞在发育中的期望时间点(例如在克隆缺失和/或无能很可能发生之后)表达成熟不相容的区段。这些方法和组合物涉及将乘客V(D)J外显子以如下方式插入Ig基因座中:当所述乘客V(D)J外显子存在于基因座中时,它不会被正常的Ig V(D)J重组表达或去除。包含乘客V(D)J外显子的B细胞将表达第二个成熟相容的V(D)J外显子(例如,通过Ig V(D)J重组产生的V(D)J外显子),并在期望的时间,可以操纵基因座的序列来引起乘客V(D)J外显子而不是成熟相容的外显子表达。本文所使用的“乘客”外显子是存在于生殖系和成熟的B细胞基因组中、但在基因组经受诱导的重组事件(例如Cre介导的重组事件)之前不表达的外显子。

在第一种方式中,将成熟不相容的区段(例如作为乘客V(D)J外显子的部分)以相对于Ig基因座的从3'至5'的构象插入Ig基因座并位于成熟相容的V(D)J外显子(或将重组以形成成熟相容的V(D)J外显子的序列)的5'。乘客V(D)J外显子的表达是通过使用一对倒位重组酶位点诱导的,这会使乘客V(D)J外显子“翻转”,使其相对于Ig基因座的剩余部分处于5'至3'的取向。在第二种方式中,将成熟不相容的区段(例如作为乘客V(D)J外显子的部分)相对于Ig基因座5'至3'插入,并且V(D)J重组发生在乘客外显子下游以生成成熟相容的V(D)J外显子。然后,可以通过在期望时在一对重组酶位点处诱导重组(例如,Cre介导的重组)来切除成熟相容的V(D)J外显子,从而使细胞表达乘客外显子。作为说明性实例,已知的功能性驱动子V(D)J外显子可用于允许B细胞发育,其中乘客外显子紧邻上游且由于转录终止子或其它阻断物而未表达。驱动子和转录阻断物侧接有loxP元件,并通过周围的CD21cre表达而删除,以允许乘客表达。此方法已成功用于表达数种HIV bnAB V(D)J中间体(否则无法在外周中表达)。

用于在这些位点处诱导重组的重组位点和系统是本领域已知的,例如cre-Lox系统或Flp重组酶。loxP-Cre系统利用PI噬菌体Cre重组酶的表达来催化位于侧接的lox位点之间的DNA的切除或倒位。通过使用基因靶向技术来生产具有可被在组织特异性启动子控制下表达的Cre或Flp重组酶作用的经修饰的内源基因的二元转基因动物,可以采用位点特异性重组以空间上或时间上受控的方式切除或倒位序列。参见例如,美国专利号6,080,576、5,434,066和4,959,317;以及Joyner,A.L.等,Laboratory Protocols forConditional Gene Targeting,Oxford University Press,New York(1997);Orban等,(1992)PNAS 89:6861-6865;Aguzzi A,Brandner S,Isenmann S,Steinbach JP,SureU.Glia.1995Nov;15(3):348-64.Review;以引用的方式将其整体各自并入本文。

在任何一个方面的一些实施方式中,细胞进一步包含编码将在重组酶位点处诱导重组的重组酶的基因。在任何方面的一些实施方式中,重组酶位点是LoxP位点。在任何方面的一些实施方式中,细胞进一步包含编码cre重组酶的基因。编码重组酶的基因可以在例如诱导型启动子或细胞特异性启动子的控制下。用于控制重组酶的诱导型启动子、时间特异性和组织特异性启动子是本领域已知的。在任何方面的一些实施方式中,编码重组酶的基因在启动子的控制下,所述启动子在不成熟的B细胞中不活跃,而在外周B细胞中活跃(例如,CD21启动子、CD84启动子)。在任何方面的一些实施方式中,编码重组酶的基因不在所有成熟的B细胞中活跃,但是优先在生发中心B细胞中表达。生发中心特异性(或至少偏向性)表达的示例性启动子包括但不限于Iγ1或AID启动子。

在任何方面的一些实施方式中,细胞对于如本文所述的经工程化的Ig基因座而言是杂合的,并且其它Ig基因座已被工程化至失活,其中细胞将仅从本文所述的经工程化的Ig基因座表达Ig链。作为非限制性实例,可以将失活的Ig基因座删除、部分删除和/或突变(例如,使V(D)J重组所必需的失活序列突变和/或删除(例如删除基因座的J

为了进一步解决与小鼠VkJk库相比,人VκJκ库是否可能显示增加的连接多样性,使用小鼠或人Jκ1诱饵作为引物,对来自WT小鼠IgM+脾B细胞和人外周血单核细胞(PBMC)的DNA进行了HTGTS-Rep-seq分析。为了消除影响细胞选择的可能性,所呈现的是框外的(无效的)VκJκ连接的结果。该分析表明,与小鼠的VκJκ连接物相比,P和/或N连接元件向人VκJκ连接物中的并入明显更高(图20)。这些发现支持将增强的TdT表达并入本文所述的经工程化的细胞和/或哺乳动物中,以允许产生更类人的Igκ库。此外,本文考虑的是,通过增加TdT的表达可以增加IgL库多样性,特别是在鼠细胞中。TdT(末端脱氧核苷酸转移酶)或DNA核苷酸外转移酶是如下多肽,所述多肽在V(D)J重组过程中将非模板核苷酸引入V、D和J外显子中以使抗体库极大地多样化(Alt和Baltimore,1982)。因此,在本文描述的任何方面的一些实施方式中,细胞可以进一步包含编码TdT的外源和/或非天然核酸序列。编码多种物种的TdT的核酸序列是本领域已知的,例如人TdT(NCBI基因ID:1791;例如NM_001017520.1和NM_004088.3)和鼠TdT(NCBI基因ID:21673;例如,NM_001043228.1和NM_009345.2)。TdT可以是人TdT或鼠TdT。TdT可以是前述参考序列或其变体、同源物、直系同源物或等位基因之一。

在任何方面的一些实施方式中,TdT序列可以可操作地连接至启动子(例如在B细胞中有活性的启动子)。在任何方面的一些实施方式中,启动子是强启动子、组成性活性启动子和/或合成启动子。示例性但非限制性的启动子是“CAG”启动子(巨细胞病毒(CMV)早期增强子元件(“C”)、鸡β-肌动蛋白基因的启动子、第一外显子和第一内含子(“A”),以及兔β-珠蛋白基因的剪接受体(“G”)的组合序列)、Eμ-N-myc启动子(Bentolila等,JI 158(2):715-723(1997)或在发育出pro B淋巴细胞和pre B淋巴细胞中增强TDT表达的其它启动子。在任何方面的一些实施方式中,编码TdT的序列可以存在于载体中和/或稳定地整合到细胞的基因组中(例如,在Rosa26基因座处),其稳定地整合到组成性表达的小鼠Rosa26基因座中。

在任何方面的一些实施方式中,载体包含编码本文所述的多肽(例如,TdT多肽)的核酸。在本文所述的一些方面,将编码本文所述的给定多肽的核酸序列或其任何模块可操作地连接至载体。本文所使用的术语“载体”是指被设计用于递送至宿主细胞或用于在不同宿主细胞之间转移的核酸构建体。本文所使用的载体可以是病毒的或非病毒的。术语“载体”涵盖了当与合适的控制元件相关联时能够复制并且可将基因序列转移至细胞的任何遗传元件。载体可包括但不限于克隆载体、表达载体、质粒、噬菌体、转座子、粘粒、染色体、病毒、病毒粒等。

本文所使用的术语“表达载体”是指对来自连接至载体上的转录调控序列的序列的RNA或多肽的表达进行指导的载体。所表达的序列通常但不必须对于细胞而言是异源的。表达载体可包含额外的元件,例如表达载体可具有两种复制系统,从而允许其保持在两种生物体中,例如在人细胞中用于表达并在原核宿主中用于克隆和扩增。术语“表达”是指参与产生RNA和蛋白质以及适当时分泌蛋白质的细胞过程,包括(如果适用的话)但不限于例如转录、转录物加工、翻译和蛋白质折叠、修饰和加工。“表达产物”包括转录自基因的RNA以及通过转录自基因的mRNA的翻译而获得的多肽。术语“基因”意为当可操作地连接至合适的调控序列时,在体外或体内转录(DNA)成RNA的核酸序列。基因可包括或可不包括编码区域之前和之后的区域,例如,5’未翻译(5’UTR)或“前导”序列以及3’UTR或“尾随”序列、以及单独的编码区段(外显子)之间的间插序列(内含子)。

本文所使用的术语“病毒载体”是指包含病毒来源的至少一种元件并且具有被包装到病毒载体颗粒中的能力的核酸载体构建体。病毒载体可包含编码本文所述的多肽的核酸,以代替非必需的病毒基因。可出于在体外或体内将任何核酸转移到细胞中的目的来使用载体和/或颗粒。许多形式的病毒载体是本领域已知的。

“重组载体”意为包含异源核酸序列或能够在体内表达的“转移基因”的载体。应当理解的是,在任何方面的一些实施方式中,本文所述的载体可与其它合适的组合物和治疗剂组合。在任何方面的一些实施方式中,载体是附加型的。合适的附加型载体的使用提供了将感兴趣的核苷酸在受试者中维持高拷贝数的染色体外DNA的手段,从而消除了染色体整合的潜在影响。

在任何方面的一些实施方式中,本文描述的是如下细胞,所述细胞包含:a)经工程化的IgH基因座,所述经工程化的IgH基因座包含以下中的至少一种:

i.如下核酸序列内的CBE元件,所述核酸序列将靶V

ii.如下核酸序列内的IgH基因座中的经工程化的非功能性IGCR1序列,所述核酸序列将IgH基因座的最为3'的V

b)经工程化的IgL基因座,所述经工程化的IgL基因座包含以下中的至少一种:

iii.如下核酸序列内的非功能性Cer/Sis序列,所述核酸序列将最为3'的V

iv.如下核酸序列内的CBE元件,所述核酸序列将靶V

在任何方面的一些实施方式中,本文描述的是包含至少一种细胞或细胞群的哺乳动物,所述细胞或细胞群包含:a)经工程化的IgH基因座,所述经工程化的IgH基因座包含以下的至少一种:

i.如下核酸序列内的CBE元件,所述核酸序列将靶V

ii.如下核酸序列内的IgH基因座中的经工程化的非功能性IGCR1序列,所述核酸序列将IgH基因座的最为3'的V

b)经工程化的IgL基因座,所述经工程化的IgL基因座包含以下中的至少一种:

iii.如下核酸序列内的非功能性Cer/Sis序列,所述核酸序列将最为3'的V

iv.如下核酸序列内的CBE元件,所述核酸序列将靶V

籍此哺乳动物中的V(D)J重组主要利用靶V

作为非限制性实例,本文所述的细胞可以是干细胞、胚胎干细胞、B细胞、成熟B细胞、不成熟B细胞和/或杂交瘤细胞。作为非限制性实例,本文所述的细胞可以是哺乳动物细胞、人细胞和/或小鼠细胞。在任何方面的一些实施方式中,本文所述的细胞可以是小鼠胚胎干细胞。

一方面,本文描述的是包含本文所述的经工程化的细胞的经遗传工程化的哺乳动物。在任何方面的一些实施方式中,哺乳动物可以是小鼠。在任何方面的一些实施方式中,本文所述的方法(例如产生抗体和/或测试抗原的方法)仅需要经遗传工程化的哺乳动物的B细胞如本文所述地进行工程化。因此,在任何方面的一些实施方式中,经遗传工程化的哺乳动物可以是嵌合体,例如,它可以包含两个遗传学上不同的细胞群。嵌合体的使用可以加速获得用于本文所述方法中的经遗传工程化的哺乳动物的过程。一方面,本文描述的是嵌合的经遗传工程化的哺乳动物(例如小鼠),所述哺乳动物包含两个细胞群:包含V(D)J重组缺陷的细胞的第一群;以及包含本文所述的经工程化的细胞的第二群体。小鼠的V(D)J重组缺陷的细胞是本领域已知的,例如RAG2

在任何方面的一些实施方式中,哺乳动物(例如本文所述的经遗传工程化的哺乳动物)是小鼠。

在任何实施方式的一个方面,本文提供的是至少两种哺乳动物的组,其中每种哺乳动物均是包含如本文所述的经工程化的Ig基因座的哺乳动物,第一哺乳动物包含第一靶V

例如,可以将具有经工程化的IgH基因座的哺乳动物与具有经工程化的IgL基因座的哺乳动物交配繁殖,以形成其中衍生的哺乳动物具有IgH和Igk重排基因座两者的系统。此类动物可用于免疫以发现和/或优化新的人源化抗体。可以为经常使用的人VH和VL中的每个提供此类哺乳动物的组,以便在该组可获得多种组合。在一些实施方式中,小鼠对于IgH而言可具有IGCR1缺失,伴随着用人VH代替VH 81X(具有其自己的CBE)或更近端的VH5-1(具有添加的CBE),并且对于Igκ基因座而言具有Cer/Sis缺失,并用人Vκ或Vλ替换近端的Vκ(例如,用Vκ12RSS代替Vλ23RSS,以保持与Jκ23RSS的配对)。还可以通过在单个ES细胞中工程化所有突变以及经由RAG胚泡互补法在用于免疫的RAG缺陷嵌合体中重构B细胞(和T细胞)来生产此类哺乳动物(例如参见Tian等,2016,以引用的方式将其整体并入本文)。

本文所述的细胞和哺乳动物使得已知抗体能够优化、改善或修饰。通过工程化细胞和/或哺乳动物以表达抗体(经受V(D)J重组、GC反应和/或SHM),所述抗体包含已知识别特定抗原的区段(例如来自识别特定抗原的已知抗体的区段),可以产生与该已知抗体的区段有关和/或衍生自该已知抗体的区段的大量前体抗体。相对于已知抗体,可以在体外和/或体内对这些抗体筛选和/或选择最佳特性。优化可以增加例如亲和力、广度和/或特异性或其它期望的特性。

一方面,本文描述的是由已知抗体制备经优化的抗体的方法,该方法包括以下步骤:向小鼠胚泡注射本文所述的细胞,其中,所述细胞是小鼠胚胎干细胞,并且其中,靶区段包含已知抗体的V

在任何方面的一些实施方式中,该方法可以进一步包括:在分离步骤之前,用期望的靶抗原对经遗传工程化的小鼠进行免疫的步骤。在任何一个方面的一些实施方式中,该方法可以进一步包括从经遗传工程化的小鼠的至少一个细胞产生单克隆抗体的步骤。

一旦通过本文所述的方法产生了本文所述的细胞,就可以通过干细胞技术或克隆技术从该细胞产生动物。例如,如果转染了核酸的细胞是生物体的干细胞(例如,胚胎干细胞),那么在转染和培养后,该细胞可用于生产在生殖系细胞中包含经工程化方面的生物体,然后可以反过来用所述生物体来生产在其所有细胞中都具有经工程化方面的另一动物。在产生包含经工程化方面的动物的其它方法中,可以使用克隆技术。这些技术通常取出经工程化细胞的核,并通过融合或置换使经工程化的核与卵母细胞融合,然后可以对所述卵母细胞进行操纵以产生动物。使用克隆代替ES技术的程序的优势在于,可以转染ES细胞以外的其它细胞。例如,可以将非常易于培养的成纤维细胞用作进行工程化的细胞,然后可以将衍生于该细胞的细胞用于克隆完整的动物。

在一些实施方式中,本文描述的经工程化的动物的生产也可以利用RAG2缺陷的胚泡互补(RDBC)技术,所述技术是本领域已知的,并且描述于例如Chen等,PNAS 90:4528-4532(1993);Tian等,Cell166:1471-1484(2016);以引用的方式将其整体并入本文。

本文所述的经工程化的动物也可以通过合子(zygote)显微注射/电穿孔来生产。此类方法是本领域已知的,并描述于例如Wang等,Cell.2013;153(4):910-8;Yang等,Cell.2013;154(6):1370-9;Yasue等,Scientific reports.2014;4:5705;Hashimoto等,Developmental biology.2016;418(1):1-9;以及Wang等,BioTechniques.2015;59(4):201-2,4,6-8;以引用的方式将其整体各自并入本文。

通常,用于产生经工程化的动物的细胞(例如ES细胞)将具有与要产生的动物相同的物种。因此,例如,小鼠胚胎干细胞通常将用于产生经工程化的小鼠。分离、培养和操纵各种细胞类型的方法是本领域已知的。作为非限制性实例,使用本领域技术人员公知的方法(例如由Doetschman等描述的方法)来产生和维持胚胎干细胞。(Doetschman等,(1985)J.Embryol.Exp.Mol.Biol.87:27-45)。使用熟练的技术人员公知的方法培养细胞并制备用于遗传工程化,所述方法例如由Robertson在以下中所示的方法:Teratocarcinomas andEmbryonic Stem Cells:A Practical Approach,E.J.Robertson编,IRI.Press,Washington,D.C.[1987];Bradley等,(1986)Current Topics in Devel.Biol.20:357-371);以及Hogan等,Manipulating the Mouse Embryo:A Laboratory Manual,ColdSpring Harbor Laboratory Press,Cold Spring Harbor,N.Y.(1986)。

在任何方面的一些实施方式中,在已经生成并且任选地选择了包含经工程化方面的细胞之后,可以将该细胞插入胚胎或胚泡中,例如用以产生嵌合体。插入可以通过技术人员已知的多种方式来完成,但是典型的方法是通过显微注射。对于显微注射,将约10-30个细胞收集到微量吸管中,并注射入处于发育的适当阶段的胚胎中,以使经工程化的ES细胞整合到发育中的胚胎或胚泡中。例如,可以将ES细胞显微注射到胚泡中。用于插入ES细胞的胚胎的合适发育阶段非常依赖于物种,但是对于小鼠而言,所述阶段为约3.5天。胚胎通过灌注怀孕雌性的子宫而获得。实现这一点的合适方法是技术人员已知的。

分离抗体和/或产生抗体的细胞的方法在本领域中是已知的,并且作为非限制性实例,可以包括例如通过产生杂交瘤或噬菌体展示来产生单克隆抗体。参见例如,Little等,Immunology Today 2000 21:364-370;Pasqualini等,PNAS 2004 101:257-259;Reichert等,Nature Reviews Drug Discovery 2007 6:349-356;以及Wang等,AntibodyTechnology Journal2011 1:1-4;以引用的方式将它们各自整体并入本文。

一方面,本文描述的是通过本文上文所述方法产生的经优化的抗体。

某些疫苗开发策略依赖于鉴别一种或多种中间抗原,使得用该一种或多种中间抗原进行的免疫将触发B细胞激活和抗体的多样化,从而产生识别最终靶抗原(例如HIV抗原)的抗体。因此,本文描述的是允许体内评价此类中间抗原的方法和组合物。在任何方面的一些实施方式中,关于将识别最终靶抗原的抗体的结构信息是已知的,例如,在具有抵御HIV的天然抗体的罕见的受试者中针对HIV抗原的抗体包含何种V

在一个方面,本文描述的是将候选抗原鉴别为激活包含感兴趣的V区段的B细胞群的抗原的方法,该方法包括:用该抗原对本文所述的经工程化的哺乳动物进行免疫,所述哺乳动物经工程化使得大多数的哺乳动物的外周B细胞表达感兴趣的V区段;测量哺乳动物中的B细胞激活;如果哺乳动物中的B细胞激活相对于参考水平增加,则将候选抗原鉴别为包含感兴趣的V区段的B细胞群的激活物。B细胞激活可以是例如Ig可变区的体细胞超突变状态的增加、成熟抗体对抗原的亲和力的增加和/或成熟抗体对抗原的特异性的增加。本文所使用的术语“激活物”,如用于提及B细胞的激活,是指增加B细胞激活(例如增加B细胞增殖、SHM和/或GC反应)的抗原。

为了方便起见,在说明书、实施例和附加的权利要求书中使用的一些术语和短语的含义在如下提供。除非另有说明或从上下文中暗示得到,下列术语和短语包含下面所提供的含义。提供这些定义以帮助描述特定的实施方式,而并不打算限制所要求保护的发明,因为本发明的范围仅通过权利要求书加以限定。除非另有定义,本文所使用的所有技术术语和科学术语具有与本发明所属技术领域中的普通技术人员通常理解的含义相同的含义。如果在本领域中的术语的使用与本文所提供的定义之间存在明显的差异,则以本说明书中提供的定义为准。

为了方便起见,本文在说明书、实施例和附加的权利要求书中使用的一些术语汇集在此处。

本文所使用的术语“减少”、“降低的”、“降低”或“抑制”都是指降低统计学上显著的量。在任何方面的一些实施方式中,“下降”、“降低”、“减少”或“抑制”通常是指与参考水平(例如,缺少给定的治疗或试剂)相比减少至少10%,并且可以包括例如减少至少约10%、至少约20%、至少约25%、至少约30%、至少约35%、至少约40%、至少约45%、至少约50%、至少约55%、至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约98%、至少约99%或更多。如本文所使用的“降低”或“抑制”并未涵盖与参考水平相比的完全抑制或降低。“完全抑制”是与参考水平相比的100%的抑制。减少可以优选下降至在没有给定的紊乱的个体的正常范围内接受的水平。

本文所使用的术语“增加的/增高的”、“增加/增高”、“增强”或“激活/活化”都是指增加统计学上显著的量。在任何方面的一些实施方式中,术语“增加的/增高的”、“增加/增高”、“增强”或“激活/活化”可意味着与参考水平相比增加至少10%,例如增加至少约20%、或至少约30%、或至少约40%、或至少约50%、或至少约60%、或至少约70%、或至少约80%、或至少约90%或上至并包括100%的增加、或与参考水平相比的10%-100%之间的任意增加、或者至少约2倍、或至少约3倍、或至少约4倍、或至少约5倍或至少约10倍的增加、或与参考水平相比的2倍至10倍或更多之间的任意增加。在标志物或症状的语境下,“增加/增高”是以此类水平的统计学上的显著增加/增高。

本文所使用的“高度利用的”区段是见于野生型动物的天然产生的抗体库的平均至少3%中的区段。在任何方面的一些实施方式中,抗体库可以是未选择的库。对于人物种而言,高度利用的区段是本领域已知的。例如,高度利用的区段的非限制性实例可以包括IGHV1-2*02、IGHV1-69、VH3-30、VH4-59、Vκ1-5、Vκ3-20、Vκ4-1、Vλ1-51、Vλ3-1和Vλ2-14。

如本文所使用的,术语“蛋白/蛋白质”和“多肽”在本文中可互换使用,用来指定通过相邻残基的α-氨基基团和羧基基团之间的肽键彼此连接的一系列氨基酸残基。术语“蛋白/蛋白质”和“多肽”是指氨基酸(包括修饰的氨基酸(例如磷酸化、糖化、糖基化等)和氨基酸类似物)的聚合物,而不考虑其大小或功能。“蛋白/蛋白质”和“多肽”通常用来指相对较大的多肽,而术语“肽”通常用于指代小的多肽,但是这些术语在本领域中的使用是重叠的。当提及基因产物及其片段时,术语“蛋白/蛋白质”和“多肽”在本文中可互换使用。因此,示例性的多肽或蛋白包括基因产物、天然存在的蛋白质、同源物、直系同源物、旁系同源物、片段,以及上述的其它等同物、变体、片段和类似物。

在本文所述的多种实施方式中,在进一步考虑之列的是涵盖所描述的任何具体多肽的变体(天然存在的或其它的)、等位基因、同源物、保守修饰变体和/或保守置换变体。对于氨基酸序列,本领域技术人员将认识到,当改变引起将氨基酸置换为化学上类似的氨基酸并保留了多肽的期望活性时,对经编码的序列中的单个氨基酸或少部分的氨基酸进行改变的核酸、肽、多肽或蛋白序列的各个置换、缺失或添加是“保守修饰变体”。此类保守修饰变体在与本公开相一致的多态变体、种间同源物和等位基因的基础之上另外存在,并且不排除与本公开相一致的多态变体、种间同源物和等位基因。

给定的氨基酸可以被具有相似的理化特性的残基替代,例如,用一个脂肪族残基置换另一残基(例如用Ile、Val、Leu或Ala互相置换),或用一个极性残基置换另一残基(例如Lys和Arg之间;Glu和Asp之间;或Gln和Asn之间)。其它这样的保守置换(例如置换具有类似疏水性特征的整个区域)是公知的。能够以本文所述的任何一种测定对包含保守氨基酸置换的多肽进行测试,以确认保留了期望的活性(例如天然或参考多肽的活性和特异性)。

氨基酸可以根据其侧链的性质方面的相似性进行分组(在A.L.Lehninger,在Biochemistry,第二版,pp.73-75,Worth Publishers,New York(1975)中):(1)非极性:Ala(A)、Val(V)、Leu(L)、Ile(I)、Pro(P)、Phe(F)、Trp(W)、Met(M);(2)不带电的极性:Gly(G)、Ser(S)、Thr(T)、Cys(C)、Tyr(Y)、Asn(N)、Gln(Q);(3)酸性:Asp(D)、Glu(E);(4)碱性:Lys(K)、Arg(R)、His(H)。或者,可基于共同的侧链特性将天然存在的残基分为如下的组:(1)疏水的:正亮氨酸、Met、Ala、Val、Leu、Ile;(2)中性亲水的:Cys、Ser、Thr、Asn、Gln;(3)酸性的:Asp、Glu;(4)碱性的:His、Lys、Arg;(5)影响链取向的残基:Gly、Pro;(6)芳香的:Trp、Tyr、Phe。非保守置换牵涉到用这些类别之一的一个成员更换另一类别。特定的保守置换包括例如:将Ala置换为Gly或置换为Ser;将Arg置换为Lys;将Asn置换为Gln或置换为His;将Asp置换为Glu;将Cys置换为Ser;将Gln置换为Asn;将Glu置换为Asp;将Gly置换为Ala或置换为Pro;将His置换为Asn或置换为Gln;将Ile置换为Leu或置换为Val;将Leu置换为Ile或置换为Val;将Lys置换为Arg、置换为Gln或置换为Glu;将Met置换为Leu、置换为Tyr或置换为Ile;将Phe置换为Met、置换为Leu或置换为Tyr;将Ser置换为Thr;将Thr置换为Ser;将Trp置换为Tyr;将Tyr置换为Trp;和/或将Phe置换为Val、置换为Ile或置换为Leu。

在任何方面的一些实施方式中,本文所述的多肽(或编码这一多肽的核酸)可以是本文所述的氨基酸序列之一的功能片段。本文所使用的“功能片段”是根据本文下文所述的测定保留至少50%的野生型参考多肽的活性的肽的片段或区段。功能片段可包含本文公开的序列的保守置换。

在任何方面的一些实施方式中,本文所述的多肽可以是本文所述的序列的变体。在任何方面的一些实施方式中,变体是经保守修饰的变体。保守置换变体可以通过例如天然核苷酸序列的突变获得。本文所指的“变体”是与天然多肽或参考多肽实质上同源的多肽,但是该多肽由于一个或多个缺失、插入或置换而具有与天然或参考多肽的氨基酸序列不同的氨基酸序列。编码变体多肽的DNA序列涵盖如下序列:当与天然DNA序列或参考DNA序列相比时,所述序列包含一个或多个核苷酸的添加、缺失或置换,但是编码保留活性的变体蛋白或其片段。多种基于PCR的位点特异性诱变方法在本领域中是已知的,并且可以被普通技术人员应用。

变体氨基酸或DNA序列可与天然或参考序列具有至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97、至少98%、至少99%或更多的一致性。天然序列和突变序列之间的同源性程度(同一性百分比)可以通过例如使用万维网上通常用于此目的的免费可用的计算机程序(例如具有默认设置的BLASTp或BLASTn)对两个序列进行比较来确定。

天然氨基酸序列的改变可通过本领域技术人员已知的多种技术的任一种来完成。例如,可通过合成含有突变序列的寡核苷酸而在特定基因座引入突变,所述寡核苷酸侧接有允许与天然序列的片段连接的限制性位点。连接后,所得到的重构序列编码具有期望的氨基酸插入、置换或缺失的类似物。或者,可使用寡核苷酸指导的位点特异性的突变发生程序来提供具有特定密码子的改变的核苷酸序列,所述特定密码子根据所需的置换、缺失或插入而改变。用于制造此类改变的技术已良好建立,并且包括例如Walder等,(Gene 42:133,1986);Bauer等,(Gene 37:73,1985);Craik(BioTechniques,January 1985,12-19);Smith等,(Genetic Engineering:Principles and Methods,Plenum Press,1981);以及U.S.Pat.Nos.4,518,584和4,737,462所公开的技术,以引用的方式将其整体并入本文。通常,还可用丝氨酸对不参与维持多肽的适当构象的任何半胱氨酸残基进行置换,以改进分子的氧化稳定性并防止异常交联。相反,可将半胱氨酸键添加至多肽,以改进多肽的稳定性或促进寡聚化。

如本文所使用的,术语“核酸”或“核酸序列”是指掺入核糖核酸、脱氧核糖核酸或它们的类似物的单元的任何分子,优选聚合物分子。核酸可为单链或双链的。单链核酸可为变性双链DNA的一条核酸链。或者,单链核酸可为不源自任何双链DNA的单链核酸。在一方面,核酸可为DNA。在另一方面,核酸可为RNA。合适的DNA可包括例如基因组DNA或cDNA。合适的RNA可包括例如mRNA。

无论是衍生自天然产生抗体的任何物种,还是通过重组DNA技术创建,无论是否分离自血清、B细胞、杂交瘤、转染瘤、酵母或细菌,本文所使用的“抗体”是指IgG、IgM、IgA、IgD或IgE分子或它们的抗原特异性抗体片段(包括但不限于Fab、F(ab’)

在另一个实例中,抗体包括两个重(H)链可变区和两个轻(L)链可变区。应当注意的是,VH区(例如,免疫球蛋白多肽的部分)与V

术语“单特异性抗体”是指对特定靶标(例如表位)表现出单一结合特异性和亲和力的抗体。该术语包括“单克隆抗体”或“单克隆抗体组合物”,如本文所用,是指具有单分子组成的抗体或其片段的制剂,而与该抗体如何产生无关。

本文所述的“抗原”是由抗体上的结合位点结合的分子。一般,抗原由抗体配基结合并能够引发体内的抗体应答。抗原可以是多肽、蛋白、核酸或其它分子或它们的部分。术语“抗原决定簇”是指由抗原结合分子、并且特别是由所述分子的抗原结合位点识别的抗原上的表位。

本文所使用的术语“亲和力”是指相互作用(例如,抗体对抗原的结合)的强度,并可以定量表示为解离常数(K

本文所使用的术语“特异性结合”或“特异性”是指两个分子、化合物、细胞和/或颗粒之间的化学相互作用,其中,与第一实体结合至非靶标的第三实体相比,第一实体以更高的特异性和亲和力与第二靶实体结合。在任何方面的一些实施方式中,特异性结合可以指与第一实体对第三非靶标实体的亲和力相比,第一实体对第二靶实体的亲和力为至少10倍、至少50倍、至少100倍、至少500倍、至少1000倍或者更高。因此,本文所使用的“选择性结合”或“特异性结合”是指本文所述的试剂(例如抗体试剂)以10

如本文所使用的,在抗体或编码抗体的序列的上下文中使用的术语“嵌合体”是指特征在于源自不同动物物种的两个或更多个区段或部分的免疫球蛋白分子。例如,嵌合抗体的可变区源自非人哺乳动物抗体(例如鼠单克隆抗体),而免疫球蛋白恒定区则源自人免疫球蛋白分子。嵌合抗体的可变区段通常连接至至少部分的免疫球蛋白恒定区(Fc),通常是人免疫球蛋白的恒定区。人恒定区DNA序列可以按照公知的程序从各种人细胞(如永生化B细胞)中分离(WO 87/02671;以引用的方式将整体并入本文)。抗体可包含轻链和重链恒定区二者。重链恒定区可包括CH1、铰链、CH2、CH3,并且有时还包括CH4区。为了治疗目的,可以删除或省略CH2结构域。开发用于产生“嵌合抗体”的技术是本领域已知的(参见Morrison等,Proc.Natl.Acad.Sci.81:851-855(1984);Neuberger等,Nature 312:604-608(1984);Takeda等,Nature 314:452-454(1985);通过引用将其整体并入本文),例如,通过剪接来自小鼠或其它物种的具有适当抗原特异性的抗体分子的基因,以及来自具有适当生物学活性的人抗体分子的基因

本文所使用的术语“人源化”是指抗体(或其片段,例如轻链或重链)中的CDR不起源于人,但是Ig蛋白的其余序列的序列(例如,框架区域和恒定区域)起源于人。本领域技术人员知晓如何使给定抗体人源化,参见例如,美国专利No.5,585,089;No.6,835,823;No.6,824,989。

本文所使用的术语“经工程化的”是指已经由人工操纵的方面。例如,当两个或更多个序列(在基因座中天然未按该顺序连接在一起)被人工操纵以在经工程化的基因座中彼此直接连接时,则认为该基因座是经“工程化的”。例如,在本发明的一些实施方式中,经工程化的基因座包含具有非天然V区段的各种Ig序列,所有这些非天然V区段均在自然中发现,但在自然中并未在同一基因座中发现或不以该顺序发现。如通常的实践并为本领域技术人员所理解的,经工程化的多核苷酸(和/或包含此类多核苷酸的细胞或动物)的后代和拷贝通常仍被称为经“工程化的”,即使实际操纵是在先前实体上执行的。

本文所使用的术语“重组缺陷的”是指其中不能发生重组(特别是在IgH和IgL基因座处的V(D)J重组)的细胞(或动物)。通常,V(D)J重组缺陷的细胞是在编码发生V(D)J重组所必需的蛋白质的基因中包含突变的细胞。会导致细胞和/或动物的V(D)J重组缺陷的突变是本领域已知的,例如,RAG2

本文所使用的术语“盒”是指可以引入宿主细胞且并入宿主细胞的基因组中(例如,使用如本文其它地方所述的盒靶向序列)的核酸分子或其片段。盒可包含基因(例如IgH基因)或其片段(例如V

本文所使用的术语“B细胞”是指在体液免疫应答中起作用并且是适应性免疫系统的组成部分的淋巴细胞。在本申请中,表述“B细胞”、“B-细胞”和“B淋巴细胞”是指同一细胞。

在大多数的哺乳动物的骨髓中产生不成熟的B细胞。在骨髓中达到IgM+不成熟阶段后,这些不成熟的B细胞迁移到淋巴样器官,在这里它们被称为过渡性B细胞,所述过渡性B细胞中的一些随后分化为成熟B淋巴细胞。B细胞发育在数个阶段中进行,每个阶段的特征在于抗体基因座处的基因组内容物的变化。

每个B细胞在其表面上具有能够结合至独特的抗原的独特的受体蛋白(称为B细胞受体(BCR))。BCR是结合膜的免疫球蛋白,并且正是这种分子使B细胞能够与其它类型的淋巴细胞区别开来,并在体内的B细胞激活中起中心作用。一旦B细胞遇到其同源抗原并从辅助性T细胞接收到额外的信号,它便可以进一步分化为两种类型的B细胞(血浆B细胞和记忆B细胞)中的一种。B细胞可能直接变成这些细胞类型中的一种,或者也可能经历中间分化步骤(生发中心反应),在此过程中,B细胞对其免疫球蛋白基因的可变区进行超突变(“体细胞超突变”),并可能经历类别转换。

血浆B细胞(也称为浆细胞)是已经暴露于抗原并产生和分泌大量抗体的大的B细胞。这些是短寿命的细胞,并通常在消除诱导免疫应答的物质后经历凋亡。记忆B细胞由对初次免疫应答中遇到的抗原具有特异性的激活的B细胞形成。这些细胞能够存活很长时间,并且在再次暴露于相同抗原后可以快速应答。

本文所使用的术语“GC反应”是指发生在生发中心中的过程,在此过程中,B细胞经历SHM、记忆生成和/或类别/同种型转换。生发中心(GC)反应是针对外源病原体的T依赖型体液免疫的基础,并且是适应性免疫应答的最终表现。GC代表增殖性抗原特异性B细胞、滤泡辅助性T细胞和组成性地占据次级淋巴器官的中央滤泡区的特化的滤泡树突状细胞之间的独特协作。

本文所使用的术语“体细胞超突变”或“SHM”是指在Ig基因座处的多核苷酸序列的突变,所述突变由AID(激活诱导的胞苷脱氨酶)对该多核苷酸序列的作用引发或与其相关。SHM发生在B细胞增殖过程中,并以比基因组中的正常突变率至少高10

本文所使用的术语“干细胞”是指处于未分化或部分分化状态的细胞,其具有自我更新的性质,并且具有自然分化为更高分化的细胞类型的发育潜力,而没有关于发育潜力的具体隐含含义(即全能、多潜能(pluripotent)、多能(multipotent)等)。自我更新是指干细胞能够增殖并产生更多此类干细胞,同时保持其发育潜力。因此,术语“干细胞”是指在特定情况下具有分化为更特化或分化的表型的发育潜能、并且在某些情况下保留了增殖而基本不分化的能力的细胞的任何亚群。本文所用的术语“体干细胞”是指源自非胚胎组织(包括胎儿、少年和成年组织)的任何干细胞。天然的体干细胞已经从各种广泛的成年组织中分离出来,所述组织包括血液、骨髓、脑、嗅觉上皮、皮肤、胰腺、骨骼肌和心肌。示例性的天然存在的体干细胞包括但不限于间充质干细胞和造血干细胞。在任何方面的一些实施方式中,干细胞或祖细胞可以是胚胎干细胞。本文所使用的“胚胎干细胞”是指由源自受精后但在妊娠结束前形成的组织的干细胞,所述组织包括在妊娠期间的任何时间(通常但不一定在约10-12周的妊娠之前)采集的胎儿组织、胚胎前组织(例如胚泡)或胚胎组织。最常见地,胚胎干细胞是源自早期胚胎或胚泡的全能细胞。胚胎干细胞可以直接从合适的组织(包括但不限于人组织)获得,或从已建立的胚胎细胞系获得。在一个实施方式中,如Thomson等所述地获得胚胎干细胞(美国专利号5,843,780和6,200,806;Science282:1145,1998;Curr.Top.Dev.Biol.38:133ff,1998;Proc.Natl.Acad.Sci.U.S.A.92:7844,1995,以引用的方式将其整体并入本文)。

示例性干细胞包括胚胎干细胞、成体干细胞、多潜能干细胞、骨髓干细胞、造血干细胞等。关于干细胞的描述(包括分离和培养它们的方法)除了在其它地方外还可以见于如下中:Embryonic Stem Cells,Methods and Protocols,Turksen编,Humana Press,2002;Weisman等,Annu.Rev.Cell.Dev.Biol.17:387 403;Pittinger等,Science,284:143 47,1999;Animal Cell Culture,Masters编,Oxford University Press,2000;Jackson等,PNAS96(25):14482 86,1999;Zuk等,Tissue Engineering,7:211 228,2001(“Zuk等”);Atala等,特别是第33 41章;以及美国专利号5,559,022、5,672,346和5,827,735。基质细胞的描述(包括分离它们的方法)除了在其它地方外还可以见于如下中:Prockop,Science,276:71 74,1997;Theise等,Hepatology,31:235 40,2000;Current Protocols in CellBiology,Bonifacino等编,John Wiley&Sons,2000(包括到2002年3月的更新);以及美国专利号4,963,489。

本文所使用的术语“对应于”是指在第一多肽或核酸中的列举位置处的氨基酸或核苷酸,或与第二多肽或核酸中所列举的氨基酸或核苷酸等同的氨基酸或核苷酸。可以使用本领域已知的同源性程度程序(例如BLAST)通过比对候选序列来确定等同的所列举的氨基酸或核苷酸。

术语“统计学上显著”或“显著地”是指统计显著性,并且通常是指2个标准差(2SD)或更大的差异。

除了在操作实施例中或另有指示以外,本文所使用的表示成分的量或反应条件的所有数字均应理解为在所有情况下均由术语“约”加以修饰。术语“约”在与百分比连接使用时可以表示±1%。

本文所使用的术语“包含/包括/含有(comprising)”表示除了所存在的限定的要素之外,其它要素也可存在。“包含/包括/含有”的使用表明包括而非限制。

术语“由……组成”是指本文所述的组合物、方法及其各自的成分,排除了在实施方式的描述中未列举的任何要素。

本文所使用的术语“基本上由……组成”是指对于给定的实施方式而言所需的要素。该术语允许存在不会实质性地影响本发明实施方式的基本和新颖的或功能性的特性的额外要素。

本文所使用的术语“特异性结合”是指两个分子、化合物、细胞和/或颗粒之间的化学相互作用,其中第一实体以比其结合至非靶标的第三实体更大的特异性和亲和力结合至第二靶实体。在任何方面的一些实施方式中,特异性结合可以指第一实体与第二靶实体的亲和力比对第三非靶标实体的亲和力高至少10倍、至少50倍、至少100倍、至少500倍、至少1000倍或更高。对给定靶标而言特异性的试剂是在所使用的测定条件下对该靶标表现出特异性结合的试剂。

除非上下文另有明确指示,单数术语“一/该/所述(a/an/the)”包括复数的指示对象。类似地,除非上下文另有明确指示,词语“或”意在包括“和”。尽管与本文描述的相似或相当的方法和材料可用于本公开的实践或试验中,在下文中对合适的方法和材料进行了描述。缩写“例如(e.g.)”源自拉丁文的例如(exempli gratia),并且在本文中用于表示非限制性的实例。因此,缩写“e.g.”与术语“例如(for example)”同义。

本文公开的本发明的替代性要素或实施方式的分组不应解释为限制。各组成员可单独地提及和请求保护或者以与该组的其它成员或本文出现的其它要素的任意组合提及和请求保护。出于方便和/或专利性的原因,组的一个或多个成员可被包含在组中或从组中删除。当任何此类包含或删除发生时,本文认为本申请文件包含经修饰的组,从而实现所附权利要求中使用的所有马库什组的书面描述。

除非本文另有定义,否则与本申请结合使用的科学术语和技术术语应具有与本公开所属领域的普通技术人员通常理解的含义。应当理解的是,本发明不限于在本文中描述的特定的方法学、方案和试剂等,而是可由此进行变化。本文中使用的术语仅用于描述特定实施方式的目的,并不旨在对本公开的范围进行限制,而本公开的范围仅仅由权利要求来限定。免疫学和分子生物学中的常见术语的定义可见于:The Merck Manual of Diagnosisand Therapy,第19版,由Merck Sharp&Dohme Corp.出版,2011(ISBN 978-0-911910-19-3);Robert S.Porter等(编);The Encyclopedia of Molecular Cell Biology andMolecular Medicine,Blackwell Science Ltd.出版,1999-2012(ISBN 9783527600908);以及Robert A.Meyers(编),Molecular Biology and Biotechnology:a ComprehensiveDesk Reference,由VCH Publishers,Inc.出版,1995(ISBN 1-56081-569-8);Immunologyby Werner Luttmann,由Elsevier出版,2006;Janeway's Immunobiology,KennethMurphy,Allan Mowat,Casey Weaver(编),Taylor&Francis Limited,2014(ISBN0815345305,9780815345305);Lewin's Genes XI,由Jones&Bartlett Publishers出版,2014(ISBN-1449659055);Michael Richard Green and Joseph Sambrook,MolecularCloning:A Laboratory Manual,第4版,Cold Spring Harbor Laboratory出版社,ColdSpring Harbor,N.Y.,USA(2012)(ISBN 1936113414);Davis等,Basic Methods inMolecular Biology,Elsevier Science Publishing Inc.,New York,USA(2012)(ISBN044460149X);Laboratory Methods in Enzymology:DNA,Jon Lorsch(编),Elsevier,2013(ISBN 0124199542);Current Protocols in Molecular Biology(CPMB),FrederickM.Ausubel(编),John Wiley and Sons,2014(ISBN 047150338X,9780471503385);CurrentProtocols in Protein Science(CPPS),John E.Coligan(编),John Wiley and Sons,Inc.,2005;以及Current Protocols in Immunology(CPI)(John E.Coligan,ADA MKruisbeek,David H Margulies,Ethan M Shevach,Warren Strobe,(编)John Wiley andSons,Inc.,2003(ISBN 0471142735,9780471142737);以引用的方式将它们的内容以其整体全部并入本文。

在任何方面的一些实施方式中,本文所述的公开内容并不关注克隆人的方法、改变人类生殖系遗传同一性的方法、人胚胎的工业或商业目的的应用或者可能导致动物痛苦而对人或动物的医疗没有实质性益处的改变动物的遗传同一性的方法、以及由这些方法产生的动物。

本文在对本发明各个方面的描述中对其它术语进行定义。

出于描述和公开的目的,将本申请全文中引用的所有专利和其它出版物(包括文字出版物、授予的专利、公开的专利申请和同时待决的专利申请)以引用的方式明确地并入本文,例如,在此类出版物中描述的可与本文描述的技术关联使用的方法学。这些出版物仅由于它们的公开早于本申请的申请日而提供。在这一方面,不应当视作承认了本发明人没有权利借助于先前的发明或因为任何其它原因而将此类公开内容提前。所有关于这些文件的日期的声明或关于这些文件的内容的表述是基于申请人可获得的信息,并不构成关于这些文件的日期或内容的正确性的任何承认。

对本公开的实施方式的描述并非旨在进行穷举或将本公开限制为所公开的明确的形式。尽管本文中出于说明性目的描述了本公开的具体实施方式和实施例,然而正如相关领域的技术人员将了解的,可在本公开的范围内进行各种等同修改。例如,当以给定的顺序给出方法步骤或功能时,替代的实施方式能够以不同的顺序执行功能、或可以实质上同时执行功能。本文所提供的本公开的教导可以施用至其它适当的程序或方法。本文所述的各种实施方式可以组合以提供进一步的实施方式。如果需要的话,可对本公开的方面进行修改,以采用上述参考文献和应用的组合、功能和构思,从而提供本公开的进一步的实施方式。此外,由于生物功能等效性的考虑,可以在种类或量上对蛋白结构进行不影响生物或化学作用的一些改变。鉴于详细的描述,可以对本公开作出这些改变和其它改变。所有这些修饰都旨在包含于所附的权利要求的范围之内。

可将任何上述实施方式中的特定要素与其它实施方式中的要素进行组合或置换。此外,尽管在这些实施方式的上下文中已经描述了与本公开的一些实施方式相关的优点,然而其它实施方式也可以表现出此类优点,并且,并非所有的实施方式都必须表现出这样的优点才能落入本公开的范围之内。

本文所述的技术通过以下实施例进行进一步说明,而不应以任何方式将其解释为进行了进一步的限定。

本文所述的技术的一些实施方式可以根据下列编号段落的任何一段进行定义:

1.一种细胞,所述细胞包含以下中的至少一种:

a.经工程化的IgH基因座,所述经工程化的IgH基因座包含如下核酸序列内的CBE元件,该核酸序列将靶V

b.经工程化的IgL基因座,所述经工程化的IgL基因座包含以下中的至少一种:

i.如下核酸序列内的非功能性Cer/Sis序列,所述核酸序列将最为3'的V

ii.如下核酸序列内的CBE元件,所述核酸序列将靶V

2.如段落1所述的细胞,其中,所述CBE元件位于所述基因座中的至少一个V区段的5'。

3.如段落1-2中任一段所述的细胞,其中,所述CBE元件与所述靶区段处于相同取向。

4.如段落1-2中任一段所述的细胞,其中,所述CBE元件相对于所述靶区段处于倒位取向。

5.如段落1-4中任一段所述的细胞,其中,所述CBE元件位于所述靶V区段的VH重组信号序列的3'。

6.如段落1-5中任一段所述的细胞,其中,所述靶V

7.如段落6所述的细胞,其中,所述细胞是小鼠细胞,并且所述靶V

8.如段落1-7中任一段所述的细胞,所述细胞进一步包含非天然D

9.如段落8所述的细胞,其中,所述非天然D

10.如段落7-9中任一段所述的细胞,其中,所述人区段来自需要改善亲和力或特异性的已知抗体。

11.如段落1-10中任一段所述的细胞,其中,所述细胞是干细胞或胚胎干细胞。

12.如段落1-10中任一段所述的细胞,其中,所述细胞是鼠细胞,任选地为鼠干细胞或鼠胚胎干细胞。

13.如段落1-12中任一段所述的细胞,其中,所述细胞对于所述经工程化的IgH基因座和/或IgL基因座而言是杂合的,并且其它IgH基因座和/或IgL基因座已经工程化至失活,其中,所述细胞将仅从所述经工程化的IgH基因座和/或IgL基因座表达IgH链和/或IgL链。

14.如段落1-13中任一段所述的细胞,所述细胞进一步包含:

如下核酸序列内的所述IgH基因座中的经工程化的非功能性IGCR1序列,所述核酸序列将所述IgH基因座的最为3'的V

15.如段落14所述的细胞,其中,所述非功能性IGCR1序列包含突变的CBE序列;所述IGCR1序列的所述CBE序列已被删除;或所述IGCR1序列已从所述IgH基因座中删除。

16.如段落1-15中任一段所述的细胞,所述细胞进一步包含以下中的至少一种:

a.具有人序列的IgL基因座;

b.人源化的IgL基因座;

c.人IgL基因座;

d.具有人序列的IgH基因座;

e.人源化的IgH基因座;以及

f.人IgH基因座。

17.如段落1-16中任一段所述的细胞,所述细胞进一步包含以下中的至少一种:

a.经工程化以包含一个J

b.经工程化以包含一个J

c.经工程化以包含一个D

18.如段落1-17中任一段所述的细胞,所述细胞进一步包含能够激活基因、使基因失活或修饰基因的突变,所述基因引起增加的GC抗体成熟应答。

19.如段落1-18中任一段所述的细胞,所述细胞进一步包含在所述靶区段中的盒靶向序列,这使得能够替换所述靶区段。

20.如段落19所述的细胞,其中,所述盒靶向序列选自于由如下所组成的组:

I-SceI大范围核酸酶位点;Cas9/CRISPR靶序列;Talen靶序列或重组酶介导的盒交换系统。

21.如段落1-20中任一段所述的细胞,其中,所述细胞进一步包含编码TdT的外源核酸序列。

22.如段落21所述的细胞,所述细胞进一步包含可操作地连接至编码TdT的所述序列的启动子。

23.一种经遗传工程化的哺乳动物,所述哺乳动物包含段落1-22中任一段所述的细胞。

24.一种嵌合的经遗传工程化的哺乳动物,所述哺乳动物包含两个细胞群:

包含V(D)J重组缺陷的细胞的第一群;以及

包含段落1-22中任一段所述的细胞的第二群。

25.如段落24所述的哺乳动物,其中,所述V(D)J重组缺陷的细胞是RAG2

26.如段落23-25中任一段所述的哺乳动物,其中,所述哺乳动物是小鼠。

27.一种制备抗体的方法,所述方法包括以下步骤:

用段落1-22中任一段所述的细胞注射小鼠胚泡,其中,所述细胞是小鼠胚胎干细胞;

在适于使所述胚泡能够成熟为经遗传工程化的小鼠的条件下,将所述小鼠胚泡植入雌性小鼠中;

从所述经遗传工程化的小鼠分离

3)抗体;或

4)产生抗体的细胞。

28.如段落27所述的方法,所述方法进一步包括:在所述分离的步骤之前,用期望的靶抗原对所述经遗传工程化的小鼠进行免疫的步骤。

29.如段落27-28中任一段所述的方法,所述方法进一步包括从所述经遗传工程化的小鼠的至少一个细胞产生单克隆抗体的步骤。

30.如段落27-29中任一段所述的方法,其中,一个或多个靶区段包括非天然的V

31.如段落27-29中任一段所述的方法,其中,一个或多个靶区段包括已知抗体的非天然的V

32.通过段落27-31所述的方法的任一种产生的抗体。

33.一种将候选抗原鉴别为激活包含感兴趣的V

用所述抗原对如段落23-26所述的哺乳动物进行免疫,所述哺乳动物经工程化使得大多数的哺乳动物的外周B细胞表达感兴趣的V

测量所述哺乳动物中的B细胞激活;以及

如果所述哺乳动物中的B细胞激活相对于参考水平增加,则将所述候选抗原鉴别为包含感兴趣的V

34.如段落33所述的方法,其中,B细胞激活的增加是所述Ig可变区的体细胞超突变状态的增加;成熟抗体对抗原的亲和力的增加;或成熟抗体对抗原的特异性的增加。

35.一种经遗传工程化的哺乳动物,所述哺乳动物包含细胞群,所述细胞群包含以下中的至少一种:

a.经工程化的IgH基因座,所述IgH基因座包含以下中的至少一种:

i.如下核酸序列内的CBE元件,所述核酸序列将靶V

ii.如下核酸序列内的所述IgH基因座中的经工程化的非功能性IGCR1序列,所述核酸序列将所述IgH基因座的最为3'的V

b.经工程化的IgL基因座,所述IgL基因座包含以下中的至少一种:

i.如下核酸序列内的非功能性Cer/Sis序列,所述核酸序列将最为3'的V

ii.如下核酸序列内的CBE元件,所述核酸序列将靶V

藉此哺乳动物中的V(D)J重组主要利用所述靶V

36.如段落35所述的哺乳动物,其中,所述靶V

37.如段落35-36中任一段所述的哺乳动物,其中,所述IgH基因座进一步经工程化以包含一个靶D区段和/或一个靶J

38.如段落35-37中任一段所述的哺乳动物,其中,所述IgL基因座进一步经工程化以包含一个靶J

39.如段落35-38中任一段所述的哺乳动物,其中,所述D区段、J

40.如段落35-39中任一段所述的哺乳动物,其中,所述人区段来自需要改善亲和力或特异性的已知抗体。

41.如段落35-40中任一段所述的哺乳动物,其中,所述人区段是高度利用的人区段。

42.如段落35-41中任一段所述的哺乳动物,其中,所述哺乳动物对于所述经工程化的IgH基因座和/或IgL基因座而言是杂合的,并且其它IgH基因座和/或IgL基因座已经工程化至失活,其中,所述细胞将仅从所述经工程化的IgH基因座和/或IgL基因座表达IgH链和/或IgL链。

43.如段落35-42中任一段所述的哺乳动物,其中,所述CBE元件位于所述基因座中的至少一个V区段的5'。

44.如段落35-43中任一段所述的哺乳动物,其中,所述CBE元件与所述靶区段处于相同取向。

45.如段落35-44中任一段所述的哺乳动物,其中,所述CBE元件相对于所述靶区段处于倒位取向。

46.如段落35-45中任一段所述的哺乳动物,其中所述CBE元件位于所述靶V区段的VH重组信号序列的3'。

47.如段落35-46中任一段所述的哺乳动物,所述哺乳动物进一步包含能够激活基因、使基因失活或修饰基因的突变,所述基因引起增加的GC抗体成熟应答。

48.如段落35-47中任一段所述的哺乳动物,其中,所述细胞进一步包含编码TdT的外源核酸序列。

49.如段落48所述的哺乳动物,所述哺乳动物进一步包含可操作地连接至编码TdT的所述序列的启动子。

50.如段落35-49中任一段所述的哺乳动物,其中,所述哺乳动物是小鼠。

51.至少两种哺乳动物的组,其中,每种哺乳动物是段落35-50中任一段所述的哺乳动物,所述第一哺乳动物包含第一靶V

52.如段落51所述的组,其中,每种哺乳动物包含人靶V

53.一种制备抗体的方法,所述方法包括以下步骤:

从段落35-51中任一段所述的哺乳动物或段落51-52所述的哺乳动物的组中分离包含一个或多个靶区段的抗体,或从段落35-51中任一段所述的哺乳动物或段落51-52所述的哺乳动物的组中分离表达包含所述一个或多个靶区段的抗体的细胞。

54.如段落53所述的方法,所述方法进一步包括:在分离的步骤之前,用期望的靶抗原对经遗传工程化的哺乳动物进行免疫的步骤。

55.通过段落53-54所述的方法的任一种产生的抗体。

56.一种制备对所期望的抗原而言特异性的抗体的方法,所述方法包括以下步骤:

d)向小鼠胚泡注射段落1-22中任一段所述的细胞,其中,所述细胞是小鼠胚胎干细胞,并且在适于使所述胚泡能够成熟为经遗传工程化的小鼠的条件下或通过RDBC进行,将所述小鼠胚泡植入雌性小鼠中;

e)用所述抗原对经遗传工程化的小鼠进行免疫;以及

f)从所述经遗传工程化的小鼠分离

3)对所述抗原而言特异性的抗体;或

4)产生对所述抗原而言特异性的抗体的细胞。

57.一种制备对抗原而言特异性的抗体的方法,所述方法包括以下步骤:

c)用所述抗原对段落35-50中任一段所述的哺乳动物或段落51-52中任一段所述的哺乳动物的组进行免疫;以及

d)从一个或多个所述哺乳动物分离

3)对所述抗原而言特异性的抗体;或

4)产生对所述抗原而言特异性的抗体的细胞。

58.如段落56-57中任一段所述的方法,所述方法进一步包括从所述经遗传工程化的小鼠或哺乳动物的至少一个细胞产生单克隆抗体的步骤。

59.如段落56-58中任一段所述的方法,其中,所述抗体是人源化的。

60.通过段落56-59所述的方法的任一种产生的抗体。

本文所述的技术的一些实施方式可以根据下列编号段落的任何一段进行定义:

1.一种细胞,所述细胞包含以下中的至少一种:

a.经工程化的IgH基因座,所述经工程化的IgH基因座包含如下核酸序列内的CBE元件,所述核酸序列将靶V

b.经工程化的IgL基因座,所述经工程化的IgL基因座包含以下中的至少一种:

i.如下核酸序列内的非功能性Cer/Sis序列,所述核酸序列将最为3'的V

ii.如下核酸序列内的CBE元件,所述核酸序列将靶V

2.如段落1所述的细胞,其中,所述CBE元件位于所述基因座中的至少一个V区段的5'。

3.如段落1-2中任一段所述的细胞,其中,所述CBE元件与所述靶区段处于相同取向。

4.如段落1-2中任一段所述的细胞,其中,所述CBE元件相对于所述靶区段处于倒位取向。

5.如段落1-4中任一段所述的细胞,其中,所述CBE元件位于所述靶V区段的VH重组信号序列的3'。

6.如段落1-5中任一段所述的细胞,其中,所述靶V

7.如段落6所述的细胞,其中,所述细胞是小鼠细胞,并且所述靶V

8.如段落1-7中任一段所述的细胞,所述细胞进一步包含非天然D

9.如段落8所述的细胞,其中,所述非天然D

10.如段落7-9中任一段所述的细胞,其中,所述人区段来自需要改善亲和力或特异性的已知抗体。

11.如段落1-10中任一段所述的细胞,其中,所述细胞是干细胞或胚胎干细胞。

12.如段落1-10中任一段所述的细胞,其中,所述细胞是鼠细胞,任选地为鼠干细胞或鼠胚胎干细胞。

13.如段落1-12中任一段所述的细胞,其中,所述细胞对于所述经工程化的IgH基因座和/或IgL基因座而言是杂合的,并且其它IgH基因座和/或IgL基因座已经工程化至失活,其中,所述细胞将仅从所述经工程化的IgH基因座和/或IgL基因座表达IgH链和/或IgL链。

14.如段落1-13中任一段所述的细胞,所述细胞进一步包含:

如下核酸序列内的所述IgH基因座中的经工程化的非功能性IGCR1序列,所述核酸序列将所述IgH基因座的最为3'的V

15.如段落14所述的细胞,其中,所述非功能性IGCR1序列包含突变的CBE序列;所述IGCR1序列的所述CBE序列已被删除;或所述IGCR1序列已从所述IgH基因座中删除。

16.如段落1-15中任一段所述的细胞,所述细胞进一步包含以下中的至少一种:

a.具有人序列的IgL基因座;

b.人源化的IgL基因座;

c.人IgL基因座;

d.具有人序列的IgH基因座;

e.人源化的IgH基因座;以及

f.人IgH基因座。

17.如段落1-16中任一段所述的细胞,所述细胞进一步包含以下中的至少一种:

a.进一步经工程化以包含仅一个V

b.进一步经工程化以包含仅一个V

c.经工程化以包含一个J

d.经工程化以包含一个J

e.经工程化以包含一个D

18.如段落1-17中任一段所述的细胞,所述细胞进一步包含能够激活基因、使基因失活或修饰基因的突变,所述基因引起增加的GC抗体成熟应答。

19.如段落1-18中任一段所述的细胞,所述细胞进一步包含在所述靶区段中的盒靶向序列,这使得能够替换所述靶区段。

20.如段落19所述的细胞,其中,所述盒靶向序列选自于由如下所组成的组:

I-SceI大范围核酸酶位点;Cas9/CRISPR靶序列;Talen靶序列或重组酶介导的盒交换系统。

21.如段落1-20中任一段所述的细胞,其中,所述细胞进一步包含编码TdT的外源核酸序列。

22.如段落21所述的细胞,所述细胞进一步包含可操作地连接至编码TdT的所述序列的启动子。

23.一种经遗传工程化的哺乳动物,所述哺乳动物包含段落1-22中任一段所述的细胞。

24.一种嵌合的经遗传工程化的哺乳动物,所述哺乳动物包含两个细胞群:

包含V(D)J重组缺陷的细胞的第一群;以及

包含段落1-22中任一段所述的细胞的第二群。

25.如段落24所述的哺乳动物,其中,所述V(D)J重组缺陷的细胞是RAG2

26.如段落23-25中任一段所述的哺乳动物,其中,所述哺乳动物是小鼠。

27.一种制备抗体的方法,所述方法包括以下步骤:

用段落1-22中任一段所述的细胞注射小鼠胚泡,其中,所述细胞是小鼠胚胎干细胞;

在适于使所述胚泡能够成熟为经遗传工程化的小鼠的条件下,将所述小鼠胚泡植入雌性小鼠中;

从所述经遗传工程化的小鼠分离

5)抗体;或

6)产生抗体的细胞。

28.如段落27所述的方法,所述方法进一步包括:在分离的步骤之前,用期望的靶抗原对所述经遗传工程化的小鼠进行免疫的步骤。

29.如段落27-28中任一段所述的方法,所述方法进一步包括从所述经遗传工程化的小鼠的至少一个细胞产生单克隆抗体的步骤。

30.如段落27-29中任一段所述的方法,其中,一个或多个靶区段包括非天然的V

31.如段落27-29中任一段所述的方法,其中,一个或多个靶区段包括已知抗体的非天然的V

32.通过段落27-31所述的方法的任一种产生的抗体。

33.一种将候选抗原鉴别为激活包含感兴趣的V

用所述抗原对如段落23-26所述的哺乳动物进行免疫,所述哺乳动物经工程化使得大多数的哺乳动物的外周B细胞表达感兴趣的V

测量所述哺乳动物中的B细胞激活;以及

如果所述哺乳动物中的B细胞激活相对于参考水平增加,则将所述候选抗原鉴别为包含感兴趣的V

34.如段落33所述的方法,其中,B细胞激活的增加是所述Ig可变区的体细胞超突变状态的增加;成熟抗体对抗原的亲和力的增加;或成熟抗体对抗原的特异性的增加。

35.一种经遗传工程化的哺乳动物,所述哺乳动物包含细胞群,所述细胞群包含以下中的至少一种:

a.经工程化的IgH基因座,所述IgH基因座包含以下中的至少一种:

i.如下核酸序列内的CBE元件,所述核酸序列将靶V

ii.如下核酸序列内的所述IgH基因座中的经工程化的非功能性IGCR1序列,所述核酸序列将所述IgH基因座的最为3'的V

b.经工程化的IgL基因座,所述IgL基因座包含以下中的至少一种:

i.如下核酸序列内的非功能性Cer/Sis序列,所述核酸序列将最为3'的V

ii.如下核酸序列内的CBE元件,所述核酸序列将靶V

藉此哺乳动物中的V(D)J重组主要利用所述靶V

36.如段落35所述的哺乳动物,其中,所述靶V

37.如段落35-36中任一段所述的哺乳动物,其中,所述IgH基因座进一步经工程化以包含一个靶D区段和/或一个靶J

38.如段落35-37中任一段所述的哺乳动物,其中,所述IgL基因座进一步经工程化以包含一个靶J

39.如段落35-38中任一段所述的哺乳动物,其中,所述D区段、J

40.如段落35-39中任一段所述的哺乳动物,其中,所述人区段来自需要改善亲和力或特异性的已知抗体。

41.如段落35-40中任一段所述的哺乳动物,其中,所述人区段是高度利用的人区段。

42.如段落35-41中任一段所述的哺乳动物,其中,所述哺乳动物对于所述经工程化的IgH基因座和/或IgL基因座而言是杂合的,并且其它IgH基因座和/或IgL基因座已经工程化至失活,其中,所述细胞将仅从所述经工程化的IgH基因座和/或IgL基因座表达IgH链和/或IgL链。

43.如段落35-42中任一段所述的哺乳动物,其中,所述CBE元件位于所述基因座中的至少一个V区段的5'。

44.如段落35-43中任一段所述的哺乳动物,其中,所述CBE元件与所述靶区段处于相同取向。

45.如段落35-44中任一段所述的哺乳动物,其中,所述CBE元件相对于所述靶区段处于倒位取向。

46.如段落35-45中任一段所述的哺乳动物,其中所述CBE元件位于所述靶V区段的VH重组信号序列的3'。

47.如段落35-46中任一段所述的哺乳动物,所述哺乳动物进一步包含能够激活基因、使基因失活或修饰基因的突变,所述基因引起增加的GC抗体成熟应答。

48.如段落35-47中任一段所述的哺乳动物,其中,所述细胞进一步包含编码TdT的外源核酸序列。

49.如段落48所述的哺乳动物,所述哺乳动物进一步包含可操作地连接至编码TdT的所述序列的启动子。

50.如段落35-49中任一段所述的哺乳动物,其中,所述哺乳动物是小鼠。

51.至少两种哺乳动物的组,其中,每种哺乳动物是段落35-50中任一段所述的哺乳动物,所述第一哺乳动物包含第一靶V

52.如段落51所述的组,其中,每种哺乳动物包含人靶V

53.一种制备抗体的方法,所述方法包括以下步骤:

从段落35-51中任一段所述的哺乳动物或段落51-52所述的哺乳动物的组中分离包含一个或多个靶区段的抗体,或从段落35-51中任一段所述的哺乳动物或段落51-52所述的哺乳动物的组中分离表达包含所述一个或多个靶区段的抗体的细胞。

54.如段落53所述的方法,所述方法进一步包括:在分离的步骤之前,用期望的靶抗原对经遗传工程化的哺乳动物进行免疫的步骤。

55.通过段落53-54所述的方法的任一种产生的抗体。

56.一种制备对所期望的抗原而言特异性的抗体的方法,所述方法包括以下步骤:

a)向小鼠胚泡注射段落1-22中任一段所述的细胞,其中,所述细胞是小鼠胚胎干细胞,并且在适于使所述胚泡能够成熟为经遗传工程化的小鼠的条件下或通过RDBC进行,将所述小鼠胚泡植入雌性小鼠中;

b)用所述抗原对经遗传工程化的小鼠进行免疫;以及

c)从所述经遗传工程化的小鼠分离

1)对所述抗原而言特异性的抗体;或

2)产生对所述抗原而言特异性的抗体的细胞。

57.一种制备对抗原而言特异性的抗体的方法,所述方法包括以下步骤:

a)用所述抗原对段落35-50中任一段所述的哺乳动物或段落51-52中任一段所述的哺乳动物的组进行免疫;以及

b)从一个或多个所述哺乳动物分离

1)对所述抗原而言特异性的抗体;或

2)产生对所述抗原而言特异性的抗体的细胞。

58.如段落56-57中任一段所述的方法,所述方法进一步包括从所述经遗传工程化的小鼠或哺乳动物的至少一个细胞产生单克隆抗体的步骤。

59.如段落56-58中任一段所述的方法,其中,所述抗体是人源化的。

60.通过段落56-59所述的方法的任一种产生的抗体。

实施例

实施例1重排个体的人V

我们先前已经描述了小鼠模型,其中在缺失IGCR1调节元件的情况下,将最近端的小鼠V

我们已经采用了这种方式来分解由BMS(Korman等,US8,008,449B2)描述的现有的抗PD1抗体的V

对BCR库的多样性的最大影响源自CDR3,尤其是Ig重链。存在大量的可以在人和小鼠中产生的潜在的CDR3序列,数量大大超过小鼠或人中的淋巴细胞的数量。因此,抗体库的总多样性在很大程度上受到B细胞数量的限制。人的B细胞比小鼠多数个数量级。因为该原因,对于幼稚B细胞中的给定的抗体前体,小鼠只能表达小部分的人CDR3库。因此,相对于现有的人源化抗体小鼠模型而言,上述模型的成功很大程度上基于使小鼠能够针对一个给定组的人抗体IgH和IgL链(相比从数百个IgH和IgL V(D)J组合制备抗体)表达更大的、更类人的CDR3库。根据我们新的Ig库测序方法,发现人倾向于在其幼稚库(

为了补充上述的Ig重链多样化,本文还描述了如下的小鼠,该小鼠基于名为Cer/Sis的元件的缺失引起近端Vκ轻链利用增加的发现(与IgH中IGCR1缺失的作用相似),显著地对特定的IgL链V区段进行重排。但是,这种作用并不像在IgH中那样为主,这可能是因为IgH近端V

还可以将TdT异位表达引入这些小鼠中,因为库的测序观察结果证实了较早的推测(Alt和Baltimore,1982),小鼠中的小鼠IgL库的多样性远比人少,这是由于经历IgL重排的小鼠pro-B细胞中缺乏TdT表达。这些修饰将产生可以表达所选定的人IgL VJ外显子的更类人的多样化的库的小鼠模型。

这些IgH和IgL重排的小鼠可以进行交配繁殖以制备重排模型,与目前用于人源化抗体发现的具有完整的Ig基因座的常规的人源化小鼠相比,该模型将各自表达重排的IgH和IgL链的给定对的大的、更类人的库。对这组小鼠的免疫使得能够发现更优异的新的人源化治疗性抗体,如果需要,可以通过我们当前的抗体优化小鼠模型对所述抗体进行进一步改进。

本文特别考虑的是用PD-1对该新发现模型的原型进行免疫。在高亲和力人源化抗PD1抗体的分离和表征之前,可以进行多种额外的加强。

本文进一步考虑的是基于上述的原始抗PD-1模型的第二种模型。该模型包括例如通过现行标准的Cas-9gRNA合子注射/电穿孔方法学来替换其V

参考文献

Alt,F.W.,and Baltimore,D.(1982).Joining of immunoglobulin heavy chaingene segments:implications from a chromosome with evidence of three D-JHfusions.Proceedings of the National Academy of Sciences of the United Statesof America 79,4118-4122.

Tian,M.,Cheng,C.,Chen,X.,Duan,H.,Cheng,H.L.,Dao,M.,Sheng,Z.,Kimble,M.,Wang,L.,Lin,S.,et al.(2016).Induction of HIV Neutralizing AntibodyLineages in Mice with Diverse Precursor Repertoires.Cell 166,1471-1484.e1418.

实施例2

简要而言,本发明发现邻近抗体可变区基因区段插入CTCF结合元件(CBE)可以大大增加其重排频率。本发明使得能够产生聚焦于特定IgH和IgL的重排的小鼠模型,以制成更类人的抗体前体的库,从中选择性地产生高亲和力的人源化抗体。

通过V(D)J重组过程从生殖系V、D和J基因区段组装抗体分子的抗原结合可变区外显子。该过程由染色体V(D)J重组中心(RC)中的RAG核酸内切酶通过在成对的基因区段和侧接的重组信号序列(RSS)之间切割而启动。小鼠重链基因座(Igh)容纳结合遍在表达的称为CTCF的架构蛋白的高密度的位点,所述CTCF促进染色体环化,并在将基因组组织成调节各种生理过程的拓扑相关结构域中发挥重要作用。在Igh基因座中,这些CTCF结合元件(CBE)绝大多数遍布在VH结构域中。CBE组织在VH结构域的DH近端部分尤为突出,其中CBE紧靠功能性VH区段的RSS的下游。

已经发现,在位于最为DH近端的功能性VH区段VH81X(也是小鼠祖细胞中的最高度重排的VH区段)旁的CBE的突变引起VH81X利用降低50倍-100倍,同时增加了一些紧邻的上游VH的重排。类似地,侧接于下一个上游VH区段的CBE的突变引起其相关VH区段的利用降低100倍,而一些紧邻的上游VH的重排增加。

尽管VH81X是祖B细胞中最高度利用的VH区段,但最为DH近端的VH区段是称为VH5-1的不经常使用的假基因,其侧接有非功能性残遗的CBE。对此CBE的恢复将VH5-1转换为最高度利用的VH,同时VH81X和其它频繁地重排的上游VH的重排显著降低。因此,CBE的存在通过使相关VH可被线性扫描染色质的底物的RAG接近,极大地增强了相关VH的重组潜力。此扫描过程从下游RC开始,并且可能是由环挤压介导的,在此过程中,VH相关的CBE稳定了RC首先遇到的DH近端VH的相互作用,从而促进了它们的主要的重排。

类似的RAG扫描过程在编码抗体Iκ轻链的小鼠Igκ基因座中进行(参见例如图15A-图15B)。当去除位于Vκ和Jκ区段之间的称为Cer/Sis的元件时,RAG扫描至近端Vκ中,引起Vκ的利用增加(尽管并没有接近在扫描过程中发现的近端IgH VH的主要的水平)。在这方面,大多数Vκ不会侧接有CBE。因此,类似于恢复VH5-1-CBE的效果,在近端Vκ区段下游插入CBE可引起相关Vκ的相似的主要的重排。这种作用使小鼠模型能够主要地重排近端Vκ序列。

可以利用该方法来简单地通过用相应的感兴趣的人V区段替换最近端的VH和/或Vκ区段并在其旁保留或插入CBE而使用任何选择的V区段产生多样的抗体库。本文还考虑了该模型与现有IgH模型的组合,以制备完全的VH和Vκ重排模型,所述模型可用于优化现有的人源化治疗性抗体的亲和力,并还可用于基于例如对抗原与SHM的结合起主要作用的V(D)J连接区以及随后的使完整的V(D)J外显子(CDR 1、CDR 2和CDR 3)成熟的筛选来发现新的抗体。

实施例3CTCF结合元件在染色质扫描期间介导RAG底物的可及性。

RAG核酸内切酶通过在成对的基因区段和侧接的重组信号序列(RSS)之间切割,从染色体V(D)J重组中心(RC)内的V、D和J区段起始抗体重链可变区外显子装配。IGCR1控制区通过从由CTCF结合元件(“CBE”)锚定的染色质环中的上游VH中分离D、JH和RC来促进DJH中间体的形成。先前未知VH如何接近DJHRC以进行VH至DJH重排。本文描述的是紧接在频繁重排的VH-RSS下游的CBE增加了其相关VH的重组潜力,远超出单独的RSS所提供的重组潜力。当IGCR1失活时,这种CBE活性变得尤为突出,这使RAG(可能通过环挤压)线性地扫描远上游染色质。VH相关的CBE稳定了在线性RAG扫描过程中DJHRC首先遇到的D近端VH的相互作用,并由此通过未预期到的染色质可及性增强的CBE功能促进了这些VH的主要的重排。

在B淋巴细胞和T淋巴细胞发育过程中,从V、D和J基因区段组装成编码免疫球蛋白(Ig)或T细胞受体可变区的外显子。V(D)J重组由RAG1/RAG2内切核酸酶(RAG)启动,所述RAG1/RAG2内切核酸酶(RAG)在一对V、D和J编码区段与侧接的重组信号序列(RSS)之间引入DNA双链断裂(DSB)(Teng和Schatz,2015年)。RSS由保守的七聚体(与经典的5'-CACAGTG-3'序列密切相关)、以及保守性较低的九聚体(由12个(12RSS)或23个(23RSS)碱基对(bp)间隔区分隔)组成。生理性RAG切割需要RSS,并且被限制至分别侧接有12RSS和23RSS的配对的编码区段(Teng和Schatz,2015年)。RAG将配对的RSS结合为Y形异二聚体(Kim等,2015;Ru等,2015),切割邻近七聚体CAC发生。在通过非同源DSB末端连接分别融合RSS末端和编码末端之前,经切割的编码末端和RSS末端位于RAG裂解后突触复合物中(Alt等,2013)。

小鼠Ig重链基因座(Igh)跨越2.7兆碱基(Mb),具有嵌入2.4Mb远端部分中的侧接有23RSS的超过100个VH;位于起始于D近端VH(VH5-2;通常称为“VH81X”)下游100kb的区域中的各侧侧接有12RSS的13个D,以及紧邻于D下游的侧接有23RSS的4个JH(Alt等,2013;图1A和图8A)。Igh V(D)J重组是有序的,D在其下游侧连接至JH,然后VH连接到DJH中间体的上游侧(Alt等,2013)。在RAG被招募到新生的V(D)J重组中心(“nRC”),以围绕Igh内含子增强子(iEμ)、JH和近端DHQ52形成活跃的V(D)J重组中心(RC)之后,D到JH的连接开始(Teng和Schatz,2015)。当形成DJH中间体时,VH必须进入新建立的DJHRC以用于连接。在这方面,Igh基因座的收缩使VH在物理上更接近DJHRC,从而可以利用来自整个VH结构域中的VH(Bossen等,2012;Ebert等,2015;Proudhon等,2015)。在基因座收缩后,与扩散相关的机制有助于将VH并入DJHRC中(Lucas等,2014)。然而,单独的扩散途径可能无法解释单个VH的相对利用中的可再现变化(Lin等,2016;Bolland等,2016)。

通过调节用于V(D)J重组的特定的Ig或TCR基因座或这些基因座区域的染色质可及性,调节V(D)J重组以维持抗原受体库的特异性和多样性(Yancopoulos等,1986;Alt等,2013)。基于重排前的远端VH的强健转录,提出了可及性调节(Yancopoulos和Alt,1985),并与各种表观遗传修饰相关(Alt等,2013)。在这方面,nRC中的生殖系转录和活性染色质修饰募集RAG1和RAG2以形成活性RC(Teng和Schatz,2015)。基因组组织的变化还通过Igh基因座收缩使远端VH物理上更靠近DJHRC从而对VH“可及性”产生积极影响(Bossen等,2012)。相反,VH到D间隔的基因间控制区1(IGCR1)对近端VH的可及性起着消极的绝缘作用(Guo等,2011)。IGCR1功能依赖于两个CTCF环化因子结合元件(“CBE”),它们有助于在不包括近端VH的染色质结构域中隔开D、JH和RC;由此,介导有序的D到JH重组并防止近端VH过度利用(Guo等,2011;Lin等;2015;Hu等,2015)。

真核基因组被组织成Mb或亚Mb拓扑相关结构域(TAD)(Dixon等,2012;Nora等,2012),所述结构域通常包括由CTCF以及黏连蛋白结合的会聚的(convergent)CBE对锚定的接触环(Phillips-Cremins等,2013;Rao等,2014)。在这方面,CTCF以依赖于取向的方式结合CBE。识别广泛分离的会聚的CBE的能力可能涉及黏连蛋白或其它因子,所述因子逐渐挤压逐渐生长中的染色质环,所述染色质环在到达会聚的CTCF结合的环锚时固定至结构域中(Sanborn等,2015;Nichols和Corces,2015;Fudenberg等,2016;Dekker和Mirny,2016)。在哺乳动物细胞中,CBE、TAD和/或环结构域参与了各种生理过程的调控(Dekker和Mirny,2016;Merkenschlager和Nora,2016;Hnisz等,2016),在一些情况下,基于会聚的CBE的环组织的参与对于此类调控至关重要(Sanborn等,2015;Guo等,2015;de Wit等,2015;Ruiz-Velasco等,2017)。

RAG可以从起始的生理学RC或异位引入的RC对全基因组的基于会聚的CBE的接触染色质环结构域内的Mb距离定向地进行探索(Hu等,2015)。在此探索过程中,RAG使用了会聚取向的RSS(包括像CAC一样简单的隐式RSS)以在RC中切割并连接至经典的RSS(Hu等,2015;Zhao等,2016)。当遇到黏连蛋白结合的会聚的CBE对时,这种远程定向RAG活性会受到阻碍,并且潜在地受到在环中产生染色质亚结构域的其它阻滞作用的阻碍(Hu等,2015;Zhao等,2016)。跨过这些结构域的RAG活动的方向性和线性涉及一维RAG跟踪(Hu等,2015)。定向RAG跟踪也发生在DJHRC到IGCR1的上游(Hu等,2015)。IGCR1缺失将该重组跟踪结构域从DJHRC定向地向上游延伸到近端VH,伴随着近端VH到DJH的连接显著增加(VH81X最主要)(Hu等,2015)。但是,被跟踪底物的性质和驱动RAG跟踪的因子仍然是推测性的。

小鼠Igh容纳高密度的CBE(Degner等,2011)。十个成簇的CBE(“3’CBE”)位于朝向遍布VH结构域嵌入的100多个CBE的会聚取向的下游Igh边界(Proudhon等,2015)。VH CBE遍布整个VH结构域,尤其是对于更近端的VH,通常在紧邻VH RSS的下游发现(Choi等,2013;Bolland等,2016)。值得注意的是,VH CBE和3'CBE相互处于会聚取向,并且分别与上游和下游IGCR1 CBE处于会聚取向(Guo等,2011)。Igh的VH部分中的CBE的惊人的数量和组织引起对Igh V(D)J重组中的潜在的积极或消极的VH CBE作用的推测(Bossen等,2012;Guo等,2011;Benner等,2015;Degner等,2011;Lin等,2015)。我们目前的研究揭示了近端VH CBE的功能,并为RAG跟踪机制提供了新的洞察。

结果

VH81X-CBE大大增高了原代Pro-B细胞中的VH81X利用

为了检查紧邻VH81X下游的CBE的潜在功能,产生了129SV ES细胞,其中18bpVH81X-CBE序列被不结合CTCF的杂乱的序列取代(图1A、图1B和图9A-图9F)。将该突变(称为“VH81X-CBEscr”)引入129SV小鼠生殖系中。VH到DJH重组发生在骨髓(BM)中的祖(pro)B细胞中,其中,总体的VH利用频率提供了相对的重排频率的指标(Lin等,2016;Bolland等,2016)。为了量化B220+CD43highIgM–BM pro-B细胞中的129SV小鼠Igh基因座中的数百个不同VH的利用,使用编码JH4的末端引物作为诱饵,利用了基于高灵敏性高通量全基因组易位测序(HTGTS)的V(D)J库测序(“HTGTS-Rep-Seq”;Hu等,2015;Lin等,2016)。对于这些分析,针对四只独立的VH81X-CBEscr纯合突变小鼠(VH81X-CBEscr/scr小鼠)和三只野生型(WT)对照进行测定。为了进行统计分析,将来自每个库的数据归一化至10,000个总的VDJH连接物,并对来自其它实验的类似地归一化的数据在下文描述(请参阅STAR方法)。

VH81X是WT 129SV小鼠pro-B细胞中的最高度利用的VH,在总的VDJH连接物的约10%中使用,以及位于紧邻的上游约10kb处的VH2-2在6%的连接物中成为第二高度利用的(图1C和图1D;表1)。紧接于VH2-2上游的三个近端VH也分别以3%、2.2%和1.6%的频率高度利用(图1C和图1D;表1)。即使WT pro-B细胞经历了基因座收缩(Medvedovic等,2013),但只有更上游的几个最高度使用的VH达到2%-3%的利用范围,而且许多VH以远远更低的频率利用(图1C)。如先前所注意到的(Yancopoulos等,1984),VH81X下游5kb的VH5-1假基因很少使用(约0.4%),而无关其经典的RSS(图1C和图1D;表S1)。令人惊讶的是,在VH81X-CBEscr/scr突变小鼠中,VH81X的利用降低了约50倍,至0.2%的连接物,同时伴随着VH2-2和接下来的三个上游VH利用的提高(图1C和图1D;表1)。但是,对进一步的上游VH或下游VH5-1的利用没有显著影响(图1C和图1D;表1)。因此,需要VH81X-CBE来促进小鼠pro-B细胞中的VH81X的重排,并且在缺乏它的情况下,上游VH2-2的利用翻倍,使其成为利用最高的VH。

VH81X-CBE在v-Abl Pro-B细胞系中极大地增强VH81X至DJH重排

为了建立细胞培养模型以促进对V(D)J重组中的VH81X-CBE功能的进一步分析,首先在如下中测试了VH81X重排是否需要该元件:通过用STI-571处理而使经v-Abl转化的、表达Eμ-Bcl2的pro B细胞切实可行地停滞在G1细胞周期阶段,以诱导RAG表达和V(D)J重组(Bredemeyer等,2006)。为此,产生了v-Abl pro-B系,所述v-Abl pro-B系容纳删除了一个等位基因上的所有近端VH和D的远端VHJ558的惰性的无效重排、以及在其它等位基因上主动经历VH至DJH重组的DHFL16.1至JH4重排(图2A)。如同ATM缺陷的DJH重排的v-Abl pro-B系(Hu等,2015),DHFL16.1JH4 v-Abl pro-B系主要重排最近端的VH,伴随着由于在v-Abl系中缺乏lgh基因座收缩而仅有低水平的远端VH重排(图10A)。还采用了Cas9/gRNA方法来生成DHFL16.1JH4系的衍生物,其中删除了DJH等位基因上的VH81X-CBE(称为“VH81X-CBEdel”突变)(图2B)。

分析了来自亲本和VH81X-CBEdel DHFL16.1JH4 v-Abl pro-B系两者的三个分开的HTGTS-Rep-Seq文库。这些分析表明,VH81X在亲本系中在约45%的VDJH重排中利用,而在VH81X-CBEdel系中仅在约0.5%的VDJH重排中利用,代表了100倍的降低(图2C和图10A;表1)。同样地,在VH81X-CBEdel DHFL16.1JH4 v-Abl细胞中,观察到VH81X上游四个VH的利用相应增加,其相对利用模式与VH81X-CBEscr/scr BM pro-B细胞中所观察到的相似,并且在下游VH5-1的利用中没有变化(图2C;表1)。基于这些发现推断出,在开发小鼠pro-B细胞和DHFL16.1JH4 v-Abl pro-B细胞系中,VH81X-CBEdel突变对VH81X和上游邻近的近端VH的利用的各种影响基本相同。因此,该v-Abl pro-B系被用于进一步扩展这些研究和解决机制。

VH81X-CBE突变不会损害V(D)J重组的VH RSS功能

对基因组DNA中的VH81X-CBE的杂乱突变和缺失突变进行测序证实二者均保留了VH81X-RSS的完整性。然而,VH81X-CBE突变的影响几乎和对RSS突变所预期的一样深远和特殊。为了确认在CBE删除之后VH81X-RSS基本功能是否完整,使用Cas9/gRNA方法来删除DHFL16.1JH4和VH81X-CBEdel DHFL16.1JH4 v-Abl细胞二者中的VH81X-RSS下游约101kb的序列,从而将VH81X及其经典的RSS定位在这两系中的DJHRC上游约700bp处(图2D)。去除IGCR1和VH5-1的这种大的基因间缺失突变(称为“Intergenicdel”)引起DHFL16.1JH4和VH81X-CBEdel DHFL16.1JH4 v-Abl系二者中的总体的VH至DJH的连接水平增加30倍(表2)。对来自Intergenicdel和Intergenicdel VH81X-CBEdel DHFL16.1JH4 v-Abl系的多个文库进行的比较性HTGTS-Rep-Seq分析表明,这两系的中VDJH连接物的总体增加中的60%涉及VH81X,并且其余部分由就在上游的近端VH贡献(图2E和图10B)。实际上,在容纳大的基因间缺失的VH81X-CBEdel v-Abl系和亲本中,VH至DJH重排水平和模式基本上是无法区分的(图2E和图10B;表1)。因此,当VH81X位于DJHRC附近时,消除VH81X-CBE不会改变VH81X经历稳健的V(D)J重组的能力,这表明VH81X-CBE V(D)J重组功能以与依赖RSS的RAG切割不同的水平体现。

当倒位时,VH81X-CBE介导稳健的VH81X重排

数项研究表明,CBE取向对于其作为环结构域锚的功能(Rao等,2014;Sanborn等,2015)以及介导增强子-启动子相互作用(Guo等,2015;de Wit等,2015)和调控可变剪接(Ruiz-Velasco等,2017)而言是至关重要的。相对于IGCR1-CBE1和3'CBEs的会聚的VH-CBE取向表明,此类组织可能对于V(D)J重组调控而言是重要的(Guo等,2011;Lin等,2015;Benner等,2015;Aiden和Casellas,2015;Proudhon等,2015)。为了验证该观念,使用了Cas9/gRNA方法将DHFL16.1JH4 v-Abl系中的涵盖VH81X-CBE的40bp序列倒位,以生成“VH81X-CBEinv”系(图2F)。对来自亲本和VH81X-CBEinv系的多个文库进行的比较性HTGTS-Rep-Seq分析表明,VH81X-CBE的倒位仅引起VH81X利用降低约2倍(图2G和图10C;表1),相比于VH81X-CBE缺失时观察到的100倍降低(图2C;表1)。因此,处于倒位取向的VH81X-CBE支持降低的、但仍然稳健的VH81X利用。

VH81X-CBE促进与DJHnRC的相互作用

为了检查VH81X-CBE与其它Igh区域的相互作用,开发了基于HTGTS的方法,所述方法提供感兴趣的诱饵部位的高分辨率和可重现的相互作用谱,所述诱饵部位具有跨过Igh的未知(猎物)的相互作用序列(图3A)。对于这种称为3C-HTGTS的方法,用4bp切割限制性核酸内切酶制备3C文库(Dekker等,2002),并在超声步骤后使用线性扩增介导的HTGTS(Frock等,2015;Hu等,2016)以完成和分析文库(参见STAR方法)。就目前的目的而言,3C-HTGTS很好地替代了之前的4C相关方法(Denker和de Laat,2016)。在这方面,使用线性扩增来富集连接产物使3C-HTGTS能够产生对于分开甚远的诱饵和猎物序列而言的高度敏感且特异性的相互作用谱(图3C)。由于所有的pro-B系Igh染色质相互作用实验都必须在RAG缺乏的情况下进行,以避免正在进行的V(D)J重组的混杂效应,因此使用Cas9/gRNA方法来衍生各种v-Abl系的RAG2缺陷的衍生物。

为了鉴别VH81X的相互作用伴侣,使用VH81X作为诱饵,针对对照、VH81X-CBEdel和VH81X-CBEinv DHFL16.1JH4 v-Abl系的RAG2缺陷的衍生物进行3C-HTGTS(图3B)。在对照RAG2缺陷的DHFL16.1JH4 v-Abl细胞中,VH81X可重现地与如下特异性地相互作用:跨越IGCR1和紧密相连(下游3kb)的DJHnRC部位的下游100kb区域、以及包含3'Igh CBE的下游的300kb区域(图3C)。这两种相互作用均依赖于VH81X-CBE,因为它们在VH81X-CBEdel RAG2缺陷的DHFL16.1JH4 v-Abl细胞中基本不存在(图3C)。但是,对VH81X-CBEinv RAG2缺陷的DHFL16.1JH4 v-Abl细胞的3C-HTGTS分析显示了显著的VH81X与IGCR1/DJHnRC和3'CBEs的相互作用,尽管与RAG2缺陷的DHFL16.1JH4对照v-Abl细胞的相互作用相比处于适度降低的水平(图3C)。因此,VH81X-CBE倒位和缺失突变体中的VH81X与IGCR1/DJHnRC部位和3'CBEs的相互作用水平反映了相对于亲代DHFL16.1JH4 v-Abl系的这些突变体中的VH81X利用,暗示了这些相互作用与VH81X利用之间的潜在的机理关系。

VH2-2的V(D)J重组关键取决于其侧接的CBE

为了测试额外的VH相关的CBE的功能,产生了“VH2-2-CBEscr”DHFL16.1JH4 v-Abl系,其中将紧邻VH2-2下游的CBE替换为不结合CTCF的杂乱的序列(图4A)。对来自亲本和VH2-2-CBEscr突变体DHFL16.1JH4系的多个HTGTS-Rep-Seq文库的比较分析表明,在VH2-2CBEscr系中,VH2-2-CBE-杂乱的突变使VH2-2的利用降低近100倍(图4B和图11A;表1)。此外,VH2-2-CBEscr突变引起紧邻VH2-2上游的三个VH利用提高,但对下游VH81X和VH5-1假VH的利用没有影响(图4B)。对RAG2缺陷的亲本和VH2-2-CBEscr RAG2缺陷的DHFL16.1JH4 v-Abl系进行的3C-HTGTS测定显示出,如同VH81X,VH2-2以VH2-2-CBE依赖的方式与IGCR1/DJHnRC部位和3'CBE显著地进行相互作用(图4C、图4D和图11B)。因此,VH2-2-CBEscr突变对VH2-2利用、相邻的VH利用、以及与下游Igh IGCR1/DJHnRC部位的远程相互作用的各种影响和VH81X-CBE的缺失相关联的影响很好地对应。

无IGCR1的CBE依赖的VH81X主导性涉及RAG染色质跟踪

IGCR1缺失引起与通过一些形式的跟踪进行的IGCR1上游的序列的RAG线性探索有关的、近端VH的极大的过度利用(最显著的是VH81X)(Hu等,2015)。为了测试在IGCR1缺失和RAG跟踪的情况下VH81X-CBE是否有助于VH81X的巨大的过度利用,在具有或不具有VH81X-CBEdel突变的情况下生成了IGCR1缺失的(“IGCR1del”)DHFL16.1JH4 v-Abl细胞(图5A)。如所预期的,与DHFL16.1JH4亲本系的水平相比,IGCR1缺失引起总体的VH至DJH的连接水平增加30倍,涉及最主要的VH81X,以及程度较低的近端的上游VH和下游的VH5-1(表1和表2;图12A)。对来自IGCR1del和IGCR1del VH81X-CBEdel DHFL16.1JH4系的多个HTGTS-Rep-Seq文库进行的比较性分析显示出,与IGCR1del系相比,IGCR1del VH81X-CBEdel系中的VH81X利用下降大于100倍(图5B和图11B;表1)。再次,VH81X利用的这种急剧下降伴随着紧邻于VH81X上游的四个VH利用的提高(图5B;表1)。

为了在IGCR1缺乏的情况下鉴别VH81X-CBE相互作用伴侣,使用VH81X诱饵对RAG2缺陷的DHFL16.1JH4 v-Abl细胞进行3C-HTGTS,该细胞也容纳有IGCR1del或IGCR1delVH81X-CBEdel突变(图5C)。如上所述(图3C),在RAG2缺陷的DHFL16.1JH4 v-Abl细胞中,VH81X与lGCR1/DJHnRC部位和3'CBE具有显著的VH81X-CBE依赖的相互作用。但是,在RAG2缺陷的IGCR1del系中,VH81X与DJHnRC部位的相互作用(我们现在可以在不存在IGCR1的情况下查明该相互作用)以远高于其在RAG2缺陷的DHFL16.1JH4 v-Abl亲本系中与lGCR1/DJHnRC部位的相互作用的水平发生,即使与3'CBE的相互作用保持相同或略有降低(图5C和图12C;顶部和底部放大的子图)。令人惊讶的是,在RAG2缺陷的IGCR1del VH81X-CBEdel系中,VH81X与DJHnRC和3'CBE的相互作用基本消除(图5C和图12C;顶部和底部放大的子图)。

我们还使用DJHnRC中的iEμ作为诱饵来检查与RAG2缺陷的对照、IGCR1del和IGCR1del VH81X-CBEdel DHFL16.1JH4 v-Abl系的这一相同的组中的其它Igh序列的相互作用。在所有三种基因型中,iEμ与3’CBE相互作用,并与Cγ1和Cγ2b之间的区域相互作用(Medvedovic等,2013)。在RAG2缺陷的DHFL16.1JH4对照系中,iEμ与近端VH的相互作用几乎不可检测(图5D和图12D;顶部子图)。然而,在RAG2缺陷的IGCR1del细胞系中,iEμ稳健地与VH81X相互作用、以及以降低的水平与上游VH2-2和VH5-4相互作用。在RAG2缺陷的IGCR1delVH81X-CBEdel系中,iEμ和VH81X之间的相互作用显著下降,而与紧邻的上游VH2-2的相互作用增加(图5D和图12D;顶部和底部放大的子图)。iEμ和另一DHQ52-JH1部位诱饵也被用作RAG2缺陷的对照和IGCR1del/del v-Abl系(具有未重排的Igh基因座)中的3C-HTGTS测定的独特的nRC诱饵,并且发现基本相同的相互作用谱(图13A-图13B)。总之,这些3C-HTGTS研究表明,IGCR1缺失对RAG2充足的WT和突变系中的近端VH的显著增加的CBE依赖性利用的影响与它们在RAG2缺陷的对应物中与DJHnRC的相互作用直接相关。

恢复残遗的CBE将VH5-1转换为最高度重排的VH

尽管保留了它们的正常RSS,VH81X或VH2-2 CBE的突变显著降低了这些VH用于V(D)J重组的能力。在这方面,最为D近端的VH5-1具有经典的RSS(图6A),但在WT pro-B细胞或v-Abl pro-B系中重排不频繁(Hu等,2015;图1C和图2C;表1)。通过使用基于JASPAR序列的预测,发现VH5-1在其RSS的下游侧接有CBE相关序列(图6A),其位点在pro-B细胞中不结合CTCF并且是CpG甲基化的(Benner等,2015)。为了测试缺乏功能性CBE是否会引起VH5-1的不频繁利用,生成了DHFL16.1JH4 v-Abl系(称为“VH5-1-CBEins”),其中推定的残遗CBE中的4bps突变,以消除CpG岛并生成共有的CTCF结合元件(图6A)。对来自亲本和VH5-1-CBEinsDHFL16.1JH4系的多个HTGTS-Rep-Seq文库的比较性分析表明,VH5-1-CBE的生成引起VH5-1利用提高超过20倍,并将其转化为最高度利用的VH(图6B和图S4C;表1)。值得注意的是,功能性VH5-1-CBEins突变的这一获得还降低了紧邻的上游VH81X和接下来的四个上游VH的利用,其利用降低的水平与增加距离的上游线性相关(图6B)。令人惊讶的是,对RAG2缺陷的VH5-1-CBEins系的3C-HTGTS研究表明,VH5-1-CBE的还原还促进了VH5-1与IGCR1/DJHnRC部位和3'CBE的功能的相互作用的显著获得(图6C,图6D和图11D),进一步支持VH重组潜力与这些相互作用之间的直接联系。最后,在VH5-1-CBEins系中删除了IGCR1,这引起VH5-1利用增加约60倍,而VH81X和其它上游近端VH的利用显著降低(图14A和图14B)。同样,在3C-HTGTS实验中,从iEμ诱饵观察到,VH5-1获得与DJHnRC的显著增加的相互作用(图14C)。

讨论

近端VH-CBE增强相关的VH的V(D)J重组潜力

本文描述的是VH相关的CBE在V(D)J重组中的主要作用。因此,VH81X的V(D)J重组潜力通过其关联的CBE在小鼠原代pro-B细胞和v-Abl pro-B系中均显著增强。同样,上游VH2-2的V(D)J重组潜力也通过与其关联的CBE相似地增强。几十年前,我们假设一维“重组酶扫描”为优先的近端VH利用的可能机制,但注意到尽管VH5-1假VH位于VH81X和共有RSS下游的最近端,但基于其低水平的利用,必然存在额外的决定因素(Yancopoulos等,1984)。通过将VH5-1下游的“残遗的”CBE转换为功能性CBE,并从而使其成为最频繁地重排的VH,本文描述了CBE为这种额外的决定因素。但是,当VH81X-CBE与DJHRC线性相邻放置时,VH81X-CBE对于稳健的VH81X重排来说不必要,这表明VH-CBE的功能与RSS的功能不同。为了进一步评价近端VH-CBE增强V(D)J重组潜力的机制,开发了高度敏感的3C-HTGTS染色质相互作用方法。各种经测试的功能性CBE突变的丧失和获得对3个近端VH的V(D)J重组潜力的影响通过对它们与DJHnRC相互作用的影响而反映。在IGCR1缺失的情况下,这种关系最为突出,其引起VH81X利用急剧增加、以及VH81X与DJHnRC的相互作用急剧增加,而两者的增加均依赖于VH81X-CBE。因此,近端VH-CBE通过增加其相关的VH与DJHRC相互作用的频率来增加V(D)J重组潜力。

VH-CBE在RAG染色质扫描期间介导RSS可及性

在不存在IGCR1的情况下,RAG跟踪向上游进行至最近端的VH,引起其向DJH中间体的重排增加(Hu等,2015)。在不存在IGCR1情况下的跟踪期间的VH81X重排的这一主要的增加是VH81X-CBE依赖性的,并且与CBE介导的DJHRC相互作用相关。在不存在IGCR1的情况下,线性跟踪对近端VH利用的影响超过VH81X。因此,在不存在基因座收缩的情况下跟踪效应更加明显的v-Abl pro-B系中,就在VH81X上游的三个VH也显示出明显提高的利用,相对利用随上游距离而降低。同样,尽管在缺少IGCR1的VH81X-CBEdel v-Abl细胞中VH81X的利用骤然下降,上游VH2-2的利用成为主导,并且三个上游VH的利用以与上游距离成反比的水平再次升高。同样与线性跟踪相一致,带有恢复的CBE的最下游的无CBE的VH5-1的利用在不存在IGCR1的情况下实质地提高,甚至比VH81X更为主导。在不存在IGCR1的情况下,RAG上游跟踪期间的相对的VH利用模式与近端VH与DJHnRC的相互作用密切相关。总之,这些发现表明,RAG扫描染色质,而不是DNA本身,从而使该过程可以更好地描述为线性RAG染色质扫描。并且它们进一步表明,近端VH-CBE通过染色质可及性增强功能促进关联的VH的过度利用。这种可及性功能的机制可能涉及CBE介导的VH与DJHRC的长期的相互作用。本文描述了对RAG染色质扫描而言关键的远程相互作用不需要功能性RAG复合物。因此,结合至DJHRC的RAG可以利用在Igh基因座内运行的更普遍的细胞机制(例如黏连蛋白介导的染色质环挤压)来扫描远端序列。

RAG染色质扫描与染色质环挤压共享特征

在各种随机基因组位点中插入RSS对以产生异位“RC”显示出在由会聚的CBE锚结合的染色体环结构域内的取向特异性线性RAG染色质扫描,表明黏连蛋白的参与(Hu等,2015)。RAG扫描的特征与黏连蛋白介导的环挤压的特征重叠(Dixon等,2016;Dekker和Mirny,2016)。黏连蛋白环挤压的染色质环逐渐变大,使远端染色体区域以线性方式物理接近,并具有增加环锚与挤压结构域中的序列之间的接触频率的潜力(Fudenberg等,2016;Rao等,2017;Sanborn等,2015;Schwarzer等,2017)。在这方面,由CTCF结合的CBE充当强的环锚并阻碍挤压(Nichols和Corces,2015;Fudenberg等,2016;Nora等,2017)。环挤压和RAG扫描之间的重叠表明,可以通过染色质挤压驱动扫描经过包含RAG的“RC锚”(图7)。虽然会聚的CBE锚实质上阻断挤压,但其它染色质结构(例如增强子)可能会阻碍挤压(Dekker和Mirny,2016)。因此,基于pro-B细胞中的相互作用(Guo等,2011;Medvedovic等,2013;本研究),IGCR1和JHRC可能在D到JH重组期间充当环挤压介导的RAG扫描的上游和下游屏障。IGCR1的缺失将消除上游障碍,并将挤压延伸至近端VH,从而使与VH CTCF/黏连蛋白结合的CBE能够与下游RC挤压锚相互作用,从而增加关联的VH的可及性。尽管VH-CBE增加了RC相互作用频率,但它们并没有建立绝对边界,因为RAG扫描可以以降低的水平越过它们延伸到紧邻的上游VH。与某些CBE介导的环化和调控过程相反(Sanborn等,2015;Guo等,2015;de Wit等,2015),RAG扫描过程中的VH81X-CBE功能通过会聚取向而适度增强,但不严格取决于会聚取向,这可能是由于会聚取向更强的相互作用。最后,近端VH-CBE、DJHRC和3'CBE都相互作用,表明3'CBE有助于VH-DJHRC相互作用。因此,本文考虑的是删除所有3'CBE比删除子集对Igh V(D)J重组的影响更大(Volpi等,2012)。

在IGCR1存在下RAG扫描对近端VH使用的贡献

在Igh基因座收缩使远端VH更接近DJHRC之后,它们通过随后的扩散相关机制与RC直接关联(Lucas等,2014)。但是,值得注意的是,对最近端的VH的利用不需要基因座收缩(Fuxa等,2004)。在这方面,原代基因座收缩的pro-B细胞比更远端的VH更频繁地利用VH81X和VH2-2。同样,在VH81X-CBE突变体原代pro-B细胞中,紧邻的上游VH2-2的利用显著增加,其后两个上游VH的利用提高到比更远端的VH的利用更高。在缺乏Igh收缩但具有完整的IGCR1的v-Abl pro-B细胞中,VH81X和四个紧邻的上游VH的过度利用具有依赖于距离的利用模式,这联想到IGCR1失活时的利用模式。同样,VH2-2-CBE的缺失增加上游VH的相对利用,再次具有与距离相关的模式,但对下游VH81X的利用没有影响。最后,紧邻的下游CBE的异位引入使近端VH5-1成为最高度利用的VH,因此,相应地大大抑制了上游VH的利用。总之,这些发现表明,即使在正常的、基因座收缩的pro-B细胞中,存在IGCR1 CBE的情况下,从DJHRC到近端VH结构域的低水平RAG染色质扫描产生了最近端功能性VH的相对高的重组潜力。除了这些近端VH,即使在不存在IGCR1的情况下,从DJHRC上游的RAG线性扫描看起来具有极小的影响(如果有任何影响的话);可能是因为首先遇到的近端VH的主导利用消除了大部分的RAG扫描上游。

CBE和RAG扫描在远端VH重组中的潜在作用

几乎所有功能性小鼠VH具有直接相邻的CBE或在数个kb内具有CBE(图8A-图8E)。在这方面,更远端的VH-CBE可能具有与本文中针对最近端的VH的CBE所阐明的功能相关的V(D)J重组功能。Igh的VH部分包括具有不同染色质和转录特性的近端区、中间区、J558区和远端J558/3609VH区(Choi等,2013;Bolland等,2016;图8A)。与活跃的染色质标记相反,近端和中间区域在很大程度上具有抑制性;并且其中的VH(包括VH81X)显示出极少的或没有生殖系转录。相应地,除了对RAG线性扫描的少量的可接近性外,大多数近端/中间VH具有与其RSS相邻的CBE,可稳定扩散介导的与DJHRC的相互作用,以促进可及性(图8B,图8C和图7A)。值得注意的是,J558,特别是远端J558/3609区具有可接近的染色质标记和转录区域。与近端VH相比,很少有远端VH与CBE直接相关,但大多数都在10kb以内具有CBE,并且通常更接近(图8D和图8E)。远端结构域中的此类CBE仍可直接或与其它相互作用序列(如IGCR1或3′CBE)关联来增强与DJHRC的扩散介导的相互作用。与不直接与VH相关的CBE的相互作用也可以为局部可接近的远端VH通过RC的环挤压提供锚(图7D-图7F)。因此,可以利用远端VH而无需紧邻的CBE。小鼠和人中的其它抗原受体基因座也具有大量的CBE(Proudhon等,2015;Bolland等,2016),包括Igκ和Tcrα/δ中的发挥IGCR1样功能的一些(Xiang等,2014;Chen等,2015)。TCRδ中的RAG扫描也受限于CBE锚定的环结构域(Zhao等,2016)。类似于近端和远端Igh,抗原受体基因座之间的不同的V结构域CBE组织也可能在RAG扫描/环挤压的背景下起作用。

参考文献

Aiden,E.L.,and Casellas,R.(2015).Somatic Rearrangement in B Cells:It′s(Mostly)Nuclear Physics.Cell 162,708-711.

Alt,F.W.,Rosenberg,N.,Lewis,S.,Thomas,E.,and Baltimore,D.(1981).Organization and reorganization of immunoglobulin genes in A-MuLV-transformed cells:rearrangement of heavy but not light chain genes.Cell 27,381-390.

Alt,F.E.,Zhang,Y.,Meng,F.-L.,Guo,C.,and Schwer,B.(2013).Mechanisms ofprogrammed DNA lesions and genomic instability in the immune system.Cell 152,417-429.

Benner,C.,Isoda,T.,and Murre,C.(2015).New roles for DNA cytosinemodification,eRNA,anchors,and superanchors in developing B cell progenitors.Proc.Natl.Acad.Sci.U.S.A.112,12776-12781.

Bolland,D.J.,Koohy,H.,Wood,A.L.,Matheson,L.S.,Krueger,F.,Stubbington,M.J.T.,Baizan-Edge,A.,Chovanec,P.,Stubbs,B.A.,Tabbada,K.,et al.(2016).TwoMutually Exclusive Local Chromatin States Drive Efficient V(D)JRecombination.Cell Rep 15,2475-2487.

Bossen,C.,Mansson,R.,and Murre,C.(2012).Chromatin topologyand theregulation of antigen receptor assembly.Annu.Rev.Immunol.30,337-356.

Bredemeyer,A.L.,Sharma,G.G.,Huang,C.-Y.,Helmink,B.A.,Walker,L.M.,Khor,K.C.,Nuskey,B.,Sullivan,K.E.,Pandita,T.K.,Bassing,C.H.,et al.(2006).ATMstabilizes DNA double-strand-break complexes during V(D)Jreeombination.Nature442,466-470.

Chen,L.,Carico,Z.,Shih,H.-Y.,and Krangel,M.S.(2015).A discretechromatin loop in the mouse Tcra-Tcrd locus shapes the TCRδ and TCRαrepertoires.Nat.Immunol.16,1085-1093.

Choi,N.M.,Loguercio,S.,Verma-Gaur,J.,Degner,S.C.,Torkamani,A.,Su,A.I.,Oltz,E.M.,Artyomov,M.,and Feeney,A.J.(2013).Deep sequencing of themurine IgH repertoire reveals complex regulation of nonrandom V generearrangement frequencies.J.Immunol.191,2393-2402.

Cong,L.,Ran,F.A.,Cox,D.,Lin,S.,Barretto,R.,Habib,N.,Hsu,P.D.,Wu,X.,Jiang,W.,Marraffini,L.A.,et al.(2013).Multiplex genome engineeriag usingCRISPR/Cas systems.Science 339,819-823.de Wit,E.,Vos,E.S.M.,Holwerda,S.J.B.,Valdes-Quezada,C.,Verstegen,M.J.A.M.,Teunissen,H.,Splinter,E.,Wijchers,P.J.,Krijger,P.H.L.,and de Laat,W.(2015).CTCF Binding Polarity DeterminesChromatin Looping.Molecular Cell 60,676-684.

Degner,S.C.,Verma-Gaur,J.,Wong,T.P.,Bossen,C.,Iverson,G.M.,Torkamani,A.,Vettermann,C.,Lin,Y.C.,Ju,Z.,Schulz,D.,et al.(2011).CCCTC-binding factor(CTCF)and cohesin influence the genomic architecture of the Igh locus andantisense transcription in pro-B cells.Proc.Natl.Acad.Sci.U.S.a.108,9566-9571.

Dekker,J.,and Mirny,L.(2016).The 3D Genome as Moderator ofChromosomal Communication.Cell 164,1110-1121.

Dekker,J.,Rippe,K.,Dekker,M.,and Kleckner,N.(2002).Capturingchromosome conformation.Science 295,1306-1311.

Denker,A.,and de Laat,W.(2016).The second decade of 3C technologies:detailed insights into nuclear organization.Genes Dev.30,1357-1382.

Dixon,J.R.,Gorkin,D.U.,and Ren,B.(2016).Chromatin Domains:The Unit ofChromosome Organization.Molecular Cell 62,668-680.

Dixon,J.R.,Selvaraj,S.,Yue,F.,Kim,A.,Li,Y.,Shen,Y.,Hu,M.,Liu,J.S.,andRen,B.(2012).

Topological domains in mammalian genomes identified by analysis ofchromatin interactions.Nature485,376-380.

Ebert,A.,Hill,L.,and Busslinger,M.(2015).Spatial Regulation of V-(D)JRecombination at Antigen Receptor Loci.Adv.Immunol.128,93-121.

Frock,R.L.,Hu,J.,Meyers,R.M.,Ho,Y.-J.,Kii,E.,and Alt,F.W.(2015).Genome-wide detection of DNA double-stranded breaks induced by engineerednucleases.Nat.Biotechnol.33,179-186.

Fudenberg,G.,Imakaev,M.,Lu,C.,Goloborodko,A.,Abdennur,N.,and Mirny,L.A.(2016).Formation of Chromosomal Domaius by Loop Extrusion.Cell Rep 15,2038-2049.

Fuxa,M.,Skok,J.,Souabni,A.,Salvagiotto,G.,Roldan,E.,and Busslinger,M.(2004).Pax5 induces V-to-DJ rearrangements and locus contraction of theimmunoglobulin heavy-chain gene.Genes Dev.18,411-422.

Guo,C.,Yoon,H.S.,Franklin,A.,Jain,S.,Ebert,A.,Cheng,H.-L.,Hansen,E.,Despo,O.,Bossen,C.,Vettermann,C.,et al.(2011).CTCF-binding elements mediatecontrol of V(D)J recombination.Nature 477,424-430.

Guo,Y.,Xu,Q.,Canzio,D.,Shou,J.,Li,J.,Gorkin,D.U.,Jung,I.,Wu,H.,Zhai,Y.,Tang,Y.,et al.(2015).CRISPR Inversion of CTCF Sites Alters Genome Topologyand Enhancer/Promoter Function.Cell 162,900-910.

Hnisz,D.,Day,D.S.,and Young,R.A.(2016).Insulated Neighborhoods:Structural and Functional Units of Mammalian Gene Control.Cell 167,1188-1200.

Hu,J.,Meyers,R.M.,Dong,J.,Panchakshari,R.A.,Alt,F.W.,and Frock,R.L.(2016).Detecting DNA double-stranded breaks in mammalian genomes by linearamplification-mediated high-throughput genome-wide translocationsequencing.Nat Protoc 11,853-871.

Hu,J.,Zhang,Y.,Zhao,L.,Ffock,R.L.,Du,Z.,Meyers,R.M.,Meng,F.-L.,Schatz,D.G.,and Alt,F.W.(2015).Chromosomal Loop Domains Direct theRecombination of Antigen Receptor Genes.Cell 163,947-959.

Kim,M.-S.,Lapkouski,M.,Yang,W.,and Gellert,M.(2015).Crystal structureof the V(D)J recombinase RAG1-RAG2.Nature 518,507-511.

Langmead,B.,and Salzberg,S.L.(2012).Fast gapped-read alignment withBowtie 2.Nat.Methods 9,357-359.

Lin,S.G.,Ba,Z.,Du,Z.,Zhang,Y.,Hu,J.,and Alt,F.W.(2016).Highlysensitive and unbiased approach for elucidating antibody repertoires.Proc.Natl.Acad.Sci.U.S.a.113,7846-7851.

Lin,S.G.,Gao,C.,Su,A.,Zhang,Y.,and Alt,F.W.(2015).CTCF-bindingelements l and 2in the Igh intergenic control region cooperatively regulate V(D)J recombination.Proc.Natl.Acad.Sci.U.S.a.112,1815-1820.

Lucas,J.S.,Zhang,Y.,Dudko,O.K.,and Murre,C.(2014).3D trajectoriesadopted by coding and regulatory DNA elements:first-passage times for genomicinteractions.Cell 158,339-352.

Medvedovic,J.,Ebert,A.,Tagoh,H.,Tamir,I.M.,Schwickert,T.A.,Novatchkova,M.,Sun,Q.,Huis In′t Veld,P.J.,Guo,C.,Yoon,H.S.,et al.(2013).Flexible long-range loops in the VH gene region of the Igh locus facilitatethe generation of a diverse antibody repertoire.Immunity 39,229-244.

Merkenschlager,M.,and Nora,E.P.(2016).CTCF and Cohesin in GenomeFolding and Transcriptional Gene Regulation.Annu Re vGenomics Hum Genet 17,17-43.

Nichols,M.H.,and Corces,V.G.(2015).A CTCF Code for 3D GenomeArchitecture.Cell 162,703-705.Nora,E.P.,Goloborodko,A.,Valton,A.-L.,Gibcus,J.H.,Uebersohn,A.,Abdennur,N.,Dekker,J.,Mirny,L.A.,and Bruneau,B.G.(2017).Targeted Degradation of CTCF Decouples Local Insulation of ChromosomeDomains from Genomic Compartmentalization.Cell 169,930-944.e22.

Nora,E.P.,Lajoie,B.R.,Schulz,E.G.,Giorgetti,L.,Okamoto,I.,Servant,N.,Piolot,T.,van Berkum,N.L.,Meisig,J.,Sedat,J.,et al.(2012).Spatialpartitioning of the regulatory landscape of the X-inactivation centre.Nature485,381-385.

Phillips-Cremins,J.E.,Sauria,M.E.G.,Sanyal,A.,Gerasimova,T.I.,Lajoie,B.R.,Bell,J.S.K.,Ong,C.-T.,Hookway,T.A.,Guo,C.,Sun,Y.,et al.(2013).Architectural Protein Subclasses Shape 3D Organization of Genomes duringLineage Commitment.Cell 153,1281-1295.

Proudhon,C.,Hao,B.,Raviram,R.,Chaumeil,J.,and Skok,J.A.(2015).Long-Range Regulation of V(D)J Recombination.Adv.Immunol.128,123-182.

Ran,F.A.,Hsu,P.D.,Wright,J.,Agarwala,V.,Scott,D.A.,and Zhang,F.(2013)Genome engineering using the CRISPR-Cas9 system.Nat Protoc 8,2281-2308.

Rao,S.S.P.,Huang,S.-C.,Glenn St Hilaire,B.,Engreitz,J.M.,Perez,E.M.,Kieffer-Kwon,K.-R.,Sanborn,A.L.,Johnstone,S.E.,Bascom,G.D.,Bochkov,I.D.,etal.(2017).Cohesin Loss Eliminates All Loop Domains.Cell 171,305-320.e324.

Rao,S.S.P.,Huntley,M.H.,Durand,N.C.,Stamenova,E.K.,Bochkov,I.D.,Robinson,J.T.,Sanborn,A.L.,Machol,I.,Omer,A.D.,Lander,E.S.,et al.(2014).A 3Dmap of the human genome at kilobase resolution reveals principles ofchromatin looping.Cell 159,1665-1680.

Revilla-I-Domingo,R.,Bilic,I.,Vilagos,B.,Tagoh,H.,Ebert.A.,Tamir,I.M.,Smeenk,L.,Trupke,J.,Sommer,A.,Jaritz,M.,et al.(2012).The B-cell identityfactor Pax5 regulates distinct transcriptional programmes in early and late Blymphopoiesis.Embo J.31,3130-3146.

Ru,H.,Chambers,M.G.,Fu,T.-M.,Tong,A.B.,Liao,M.,and Wu,H.(2015).Molecular Mechanism of V(D)J Recombination from Synaptic RAG1-RAG2 ComplexStructures.Cell 163,1138-1152.

Ruiz-Velasco,M.,Kumar,M.,Lai,M.C.,Bhat,P.,Solis-Pinson,A.B.,Reyes,A.,Kleinsorg,S.,Noh,K.-M.,Gibson,T.J.,and Zaugg,J.B.(2017).CTCF-MediatedChromatin Loops between Promoter and Gene Body Regulate Alternative Splicingacross Individuals.Cell Syst 5,628-637.e6.

Sanborn,A.L.,Rao,S.S.P.,Huang,S.-C.,Durand,N.C.,Huntley,M.H.,Jewett,A.I.,Bochkov,I.D.,Chinnappan,D.,Cutkosky,A.,Li,J.,et al,(2015),Chromatinextrusion explains key features of loop and domain formation in wild-type andengineered genomes.Proc.Natl.Acad.Sci.U.S.a.112,E6456-E6465.

Schwarzer,W.,Abdennur,N.,Goloborodko,A.,Pekowska,A.,Fudenberg,G.,Loe-Mie,Y.,Fonseca,N.A.,Huber,W.,H Haering,C.,Mirny,L.,et al.(2017).Twoindependent modes ofchromatin organization revealed by cohesinremoval.Nature 551,51-56.

Splinter,E.,de Wit,E.,van de Werken,H.J.G.,Klous,P.,and de Laat,W.(2012).Determining long-range chromatin interactions for selected genomicsites using 4C-seq technology:from fixation to computation.Methods 58,221-230.

Stadhouders,R.,Kolovos,P.,Brouwer,R.,Zuin,J.,van den Heuvel,A.,Kockx,C.,Palstra,R.-J.,Wendt,K.S.,Grosveld,F.,van Ijcken,W.,et al.(2013).Multiplexed chromosome conformation capture sequencing for rapid genome-scale high-resolution detection of long-range chromatin interactions.NatProtoc 8,509-524.

Teng,G.,and Schatz,D.G.(2015).Regulation and Evolution of the RAGRecombinase.Adv.Immunol.128,1-39.

Volpi,S.A.,Verma-Gaur,J.,Hassan,R.,Ju,Z.,Roa,S.,Chatterjee,S.,Werling,U.,Hou,H.,Will,B.,Steidl,U.,et al.(2012).Germline deletion of Igh 3′regulatory region elements hs 5,6,7(hs5-7)affects B cell-specific regulation,rearrangement,and insulation of the Igh locus.J.Immunol.188,2556-2566.Xiang,Y.,Park,S.-K.,and Garrard,W.T.(2014).A major deletion in the Vκ-Jκintervening region results in hyperelevated transcription of proximal Vκgenes and a severely restricted repertoire.J.Immunol.193,3746-3754.

Xiang,Y.,Park,S.-K.,and Garrard,W.T.(2013).Vκ gene repertoire andlocus contraction are specified by critical DNase I hypersensitive siteswithin the Vκ-Jκ intervening region.J.Immunol.190,1819-1826.Xiang,Y.,Zhou,X.,Hewitt,S.L.,Skok,J.A.,and Garrard,W.T.(2011).A multifunctional element in themouse Igκ locus that specifies repertoire and Ig loci subnuclearlocation.J.Immunol.186,5356-5366.

Yancopoulos,G.D.,and Alt,F.W.(1985).Developmentally controlled andtissue-specific expression of unrearranged VH gene segments.Cell 40,271-281.

Yancopoulos,G.D.,Blackwell,T.K.,Suh,H.,Hood,L.,and Alt,F.W.(1986).Introduced T cell receptor variable region gene segments recombine in pre-Bcells:evidence that B and T cells use a common recombinase.Cell 44,251-259.

Yancopoulos,G.D.,Desiderio,S.V.,Paskind,M.,Kearney,J.F.,Baltimore,D.,and Alt,F.W.(1984).Preferential utilization of the most JH-proximal VH genesegments in pre-B-cell lines.Nature 311,727-733.

Zhang,Y.,Liu,T.,Meyer,C.A.,Eeckhoute,J.,Johnson,D.S.,Bernstein,B.E.,Nusbaum,C.,Myers,R.M.,Brown,M.,Li,W.,et al.(2008).Model-based analysis ofChIP-Seq(MACS).Genome Biol.9,R137.

Zhao,L.,Frock,R.L.,Du,Z.,Hu,J.,Chen,L.,Krangel,M.S.,and Alt,F.W.(2016).Orientation-specific RAG activity in chromosomal loop domainscontributes to Tcrd V(D)J recombination during T celldevelopment.J.Exp.Med.213,1921-1936.

STAR方法

实验模型和主题详情

小鼠。将涵盖VH81X基因区段序列并包含废止CTCF结合的VH81X-CBE的18bp的杂乱的突变的2.2-kb的5′同源臂(图9A)、以及包含VH81X-CBE下游序列的5kb的3′同源臂克隆到含有pGK-NeoR盒的pLNTK靶向载体中(图9B)。用该靶向构建体电穿孔129SV TC1胚胎干(ES)细胞,并通过Southern印迹筛选ES克隆的正确的靶向突变体,并使用图9C-图9F中详细描述的策略通过PCR消化加以确认。在Cre-loxP介导的NeoR基因缺失之后,注射了两个正确靶向的ES克隆以进行生殖系传递,其中一个有助于产生VH81X-CBEwt/scr 129SV小鼠的生殖系,并交配繁殖产生了用于分析的VH81X-CBEscr/scr小鼠及其WT同窝仔畜。由于我们的生成VH81X-CBEscr等位基因的靶向策略还在VH81X-CBEscr突变的下游642bD放置了loxP序列,我们生成了只容纳有loxP插入而没有VH81X-CBE杂乱突变的对照小鼠,并发现它们的BMpro-B细胞的VH利用模式与WT的模式没有显著差异(Jain S.和Alt F.W.,未发表的数据)。表3列出了用于构建靶向载体、Southern探针和PCR筛选的引物。所有动物实验均在波士顿儿童医院机构动物护理和使用委员会批准的规程下进行。

细胞系,如先前所述(Bredemeyer等,2006),通过用pMSCV-v-Abl逆转录病毒对来自4-6周龄小鼠的骨髓细胞进行逆转录病毒感染,衍生得到经v-Abl激酶转化的pro-B细胞系。将经转染的细胞在含有15%(v/v)FBS的RPMI培养基中培养两个月,以回收稳定转化的v-Abl pro-B细胞系。“DHFL16.1JH4”系通过用3μM STI-571进行处理将源自Eμ-Bcl2转基因小鼠的v-Abl pro-B细胞系在G1中停滞4天来瞬时诱导它们中的RAG表达而产生(Hu等,2015)。首先使用简并的VH和D引物以及JH4引物通过PCR对单细胞克隆筛选VHDJH和DJH重排(Guo等,2011),然后通过Southern印迹进行确认以分离亲代DHFL16.1JH4系(DHFL16.1JH4系中DJH和无效的VDJH等位基因的示意图见图2A)。

在该研究中分析的所有突变系(图13A-图13B中所示的那些突变系除外)均通过Cas9/gRNA方法源自该DHFL16.1JH4亲本系或其直接衍生物(Cong等,2013)。VH81X-CBEdel突变体由靶向VH81X-CBE的gRNA诱导的DSB不精确重新连接而产生。VH81X-CBEinv、VH2-2-CBEscr和VH5-1-CBEins系通过以单链DNA寡核苷酸(ssODN)为模板的Cas9/gRNA引入的靶DNA断裂的同源重组介导的修复来获得(Ran等,2013)。亲本、VH81X-CBEdel和VH5-1-CBEinsDHFL16.1JH4系的IGCR1缺失突变体是通过Cas9/gRNA靶向方法衍生而来的,所述Cas9/gRNA靶向方法基于使对侧接于意向的IGCR1缺失的位点而言特异性的两个gRNA。使用靶向侧接于意向的缺失的位点的gRNA,使101kb的基因间缺失源自亲本和VH81X-CBEdelDHFL16.1JH4系。除VH81X-CBEdel外,对于所研究的每个突变,衍生出至少两个独立的系并进行分析。但是,我们从相同的DHFL16.1JH4亲本系中生成了另一系,其中VH81X-CBE被随机13bp插入破坏(未示出),并发现其具有与VH81X-CBEdel系的利用模式基本上相同的VH利用模式。通过上述Cas9/gRNA方法,从由3C-HTGTS分析的所有系中删除Rag2,以研究染色质的相互作用。图13A-图13B中示出的v-Abl系通过来自Rag2-/-和Rag2-/-VH81Xscr/scr小鼠的骨髓细胞的逆转录病毒感染而衍生(见上文),并随后通过Cas9/gRNA方法靶向IGCR1缺失。表3列出了所有gRNA和ssODN的序列。

方法详细内容

骨髓pro-B细胞纯化。单细胞悬浮液源自4-6周龄小鼠的骨髓,并在红细胞裂解缓冲液(Sigma-Aldrich,#R7757)中孵育以耗尽红细胞。剩余的细胞用抗B220-APC抗体(eBioscience,#1817-0452-83)、抗CD43-PE抗体(BD Pharmingen,#553271)和抗IgM-FITC抗体(eBioscience,#11-5790-81)抗体在4℃下染色30分钟。冲洗掉多余的抗体,并使用BDFACSARIA

用以确定VH利用频率的HTGTS-Rep-Seq。进行了HTGTS-Rep-Seq并如先前所述地(Hu等,2016)分析了数据,所有重复的连接包含在分析中。简而言之,通过用3μM STI-571处理在G1停滞4天后,将来自经分选的小鼠原代B细胞的2μg基因组DNA或从v-Abl系分离的50μg基因组DNA在Diagenode Bioruptor

由于我们的实验是在G1停滞的细胞中完成的,因此所有从头重排都应代表独特的事件。然而,在低且可变水平的重排可能发生在循环的v-Abl系中,并且在某些亚克隆中可能远高于背景(例如Alt等,1981)。因此,在每个HTGTS实验之后,对数据分析表明预先重排的V(D)J重排的高水平的重复出现的Igh V(D)J连接序列,所述重排可能发生在培养期间的循环细胞中。然后,如有必要,对于缺少明显的预重排证据的额外的亚克隆重复实验。

对于统计分析,通过随机选择回收自比较组的最小的文库的连接物的数量,将在子图中绘制用于比较的每个HTGTS文库进行归一化。虽然进行了归一化以进行统计比较,但我们注意到在归一化和未归一化的文库中,相对的VH利用模式基本上相同。用于IGCR1del或101kb基因间缺失实验的归一化的连接物的数量远高于比较WT和其它突变背景的子图示出的数量,这是因为IGCR1缺失或101kb基因间缺失时回收的VH至DJH连接物的水平大大增加,如正文所述并在图12A和表2中示出的。每个重复实验中回收的连接物的数量列于表5。数据图显示平均利用频率±SD。

对于v-Abl系,图2C、图2G、图4B、图6B中示出了相同的WT数据,所有突变系均源自单个WT DHFL16.1JH4亲本系。因此,在任何给定的实验中,与WT对照一起分析了数种不同的突变体,并且WT对照与每个突变体同时分析至少一次,以确保WT系在整个研究过程中给出相同的重排模式。从本研究过程中收集的数据计算出最终的WT平均值。我们还分别在图5B、图12B、图14A和图14B中示出了相同的IGCR1del DHFL16.1JH4对照数据,因为我们分别使用了相同的gRNA策略来从相同的共同的DHFL16.1JH4祖先系(如上文所述)生成IGCR1del、IGCR1del VH81X-CBEdel和IGCR1del VH5-1-CBEins系。将IGCR1del数据绘制为与IGCR1delVH81X-CBEdel或IGCR1del VH5-1-CBEins系一起进行的实验平均值。

从图8A-图8E中所示的C57BL/6pro-B细胞获得的VHDJH读长的无效的片段提取自先前出版物中的数据(Lin等,2016)。

3C-HTGTC

如先前所述(Splinter等,2012;Stadhouders等,2013)产生3C文库。简而言之,在室温下将1000万个细胞与2%(v/v)甲醛交联10',然后用甘氨酸以终浓度125mM淬灭。将细胞在含有150mM NaCl、5mM EDTA、0.5%NP-40、1%TritonX-100和蛋白酶抑制剂(Roche,#11836153001)的50mM Tris-HCl(pH 7.5)中裂解。将核用700单位的NlaIII(NEB,#R0125)或MseI(NEB,#R0525)限制酶在37℃下消化过夜,然后在稀释条件下在16℃下连接过夜。将交联取消,并在DNA沉淀之前用蛋白酶K(Roche,#03115852001)和RNase A(Invitrogen,#8003089)处理样品。在Diagenode Bioruptor

电泳迁移率迁移测定法(EMSA)。根据制造商的规范,使用来自Thermo FisherScientific的LightShift

ChIP-seq,CTCF和Rad21 ChIP-seq数据提取自Choi等,2013(GEO:GSE47766)。Pax5和YY1 ChIP-seq数据分别提取自Revilla-I-Domingo等,2012(GEO:GSE38046)和Medvedovic等,2013(GEO:GSE43008)。通过与mm9的比对重新分析ChIP-seq数据,并使用具有默认参数的MACS调用ChIP-seq峰(Zhang等,2008)。

量化和统计分析

未配对的双尾学生t检验用于确定样品之间差异的统计显著性,ns表示p>0.05,*p≤0.05,**p≤0.01和***p≤0.001。

数据和软件可用性

本文报道的数据集的Gene Expression Omnibus(GEO)登录号是GEO:GSE113023。具体来说,本文报道的pro-B-HTGTS-Rep-Seq、DHFL16.1JH4-HTGTS-Rep-Seq和3C-HTGTS数据集的登录号分别为GEO:GSE112781、GEO:GSE112822和GEO:GSE113022,GSExxxxx。

表1.WT和突变的原代pro-B细胞和经v-Abl转化的D

这些平均值源自从至少两个独立衍生的突变体克隆(除了V

表2.从D

表3.用于在小鼠ES细胞和D

表4.用于HTGTS-Rep-Seq和3C-HTGTS分析的引物列表

表5.从各复制的HTGTS-Rep-Seq文库中回收的VDJ

实施例4

SEQ ID NO:13。小鼠Cer/Sis元件(小鼠chr6上的~6.7kb区域)的序列和缺失策略:CRISPR/Cas9-sgRNA1(

实施例5

当前的引发针对HIV-1的最有效的广泛中和抗体(bnAb)的疫苗策略是基于用靶向表达bnAb的前体和中间形式的B细胞的单独免疫原进行的序贯免疫。表达人bnAb前体的小鼠已用于评价候选免疫原的临床前功效。通过常规生殖系人IgH和IgL可变区外显子敲入技术生成的常用的小鼠模型具有与原代B细胞的单克隆的组的产生有关的公知的局限性。为了避免这个问题,最近的研究利用了经工程化以包含完整的人免疫球蛋白(Ig)可变区基因座的小鼠,其可以通过V(D)J重组产生复杂的原代B细胞受体(BCR)库。然而,由于小鼠B细胞区室尺寸的相对较小,此类小鼠的BCR库远远小于人的库,相应地,产生表达合适的bnAb前体的B细胞的机会远低于在人中的机会。为了规避这些小鼠疫苗模型的缺点,我们描述了基于如下策略的用于有效的VRCO1类HIV-1bnAb的新型小鼠疫苗模型:所述策略允许该bnAb的前体人免疫球蛋白重链(IgH)可变区外显子通过V(D)J重组发育性地组装并主导小鼠的IgH库。在这个VRC01重排模型中,多数单个B细胞表达潜在的VRCO1前体IgH链的众多不同变体之一,从而提供更类人的前体VRC01库。确实,尽管未实现完全成熟的VRC01类bnAb,但序贯免疫在VRC01重排小鼠模型中诱导了VRC01型HIV-1中和抗体的亲和力成熟(Tian等,Cell,2016)。

本文描述的是甚至更生理学上相关的小鼠模型,例如用于测试候选HIV-1疫苗策略和用于发现/优化人源化抗体。与VRCO1 IgH链重排模型的策略有关的策略用于对小鼠模型进行工程化,所述小鼠模型生成潜在的VRC0101前体的高度多样的IgL链库。当与VRCO1IgH重排模型结合时,IgL重排模型在小鼠中生成VRCO1前体的极为多样的原代BCR库,用于测试引发VRC01类bnAb的免疫策略。本文提供了一种模型,其中bnAb亲和力成熟中间体的表达特异性地靶向至小鼠生发中心B细胞。这种方法在生理学上相关的阶段表达bnAb中间体,同时避免了潜在的中枢或外周耐受性检查点,对于在序贯疫苗接种策略中测试加强的免疫原特别重要。

因为可以通过快速的RAG-2缺陷的胚泡互补(RDBC)技术产生这些模型,所以与常规生殖系育种相比,可以更快地产生小鼠同生群。

表达bnAb或其前体的小鼠模型通常用作在临床前阶段测试和优化免疫原的测定系统(1)。为了产生此类小鼠模型,一种方法是将编码bnAb的推定的未突变共同祖先(UCA)的IgH或IgL可变区的预先重排的V(D)J外显子整合到内源小鼠JH或Jκ基因座中。通过这种常规的“敲入”方法制作的模型具有多个限制,包括:

1)由于等位基因排斥,bnAb UCA的预先重排的V(D)J外显子抑制内源性小鼠IgH和IgL基因座的重排(2)。结果,独特的人Ig重链或轻链主导模型小鼠抗体库(3-6)。因此,此类模型无法评价免疫原靶向复杂抗体库中的相关表位的抗体应答的能力。这个问题与引发HIV-1bnAb的发展特别相关。许多最有效的HIV-1bnAb表现出一种或多种不同寻常的特征(7),并且表达相应前体抗体的B细胞可能以非常低的频率出现在人B细胞区室中。因此,在这此类模型中的有效的引发抗原必须能够选择性地在绝大多数其它B细胞中吸引表达bnAb前体抗体的非常罕见的B细胞。

2)通常无法精确定义bnAb UCA的CDR3序列,因为CDR3包括在V(D)J重组过程中通过末端脱氧核酸转移酶(TdT)引入的非模板核苷酸(2),并且还可以在抗体亲和力成熟期间通过激活所诱导的胞苷脱氨酶(AID)进一步突变(8)。由于这种不清楚性,敲入小鼠模型通常表达由生殖系V和J区段组成的bnAb的生殖系倒位版本,但具有可能不代表实际UCA的CDR3(3-6)。

3)某些bnAb及其前体是多反应性或自反应性的,并且表达它们的B细胞通常通过在转基因小鼠模型的骨髓或外周或两者中的耐受控制机制被消除或变得无反应性的(9-11)。

4)由于完整的Ig基因表达早期地起始于敲入转基因小鼠模型中的pro-B细胞阶段,因此该方法可能不适用于表达亲和力成熟中间体,所述亲和力成熟中间体在外周淋巴组织的生发中心反应期间产生(12)。

作为敲入小鼠模型方法的替代方式,最近的研究使用具有完全的人Ig可变区基因座的小鼠,例如Kymab小鼠(13),其可以产生更复杂的原代抗体库。但是,由于小鼠具有的B细胞比人少得多,因此在此人源化小鼠中的实际抗体库远远小于典型的人对应物。因此,在此类Ig人源化小鼠中发现特定bnAb前体的机会实质上低于在人中。因此,当在这些小鼠中测试候选免疫原时,很难解释阴性结果,所述阴性结果可能归因于无效的免疫原或在进行免疫之时缺乏表达相关抗体的B细胞。

为了解决上文讨论的小鼠HIV-1疫苗模型的局限性,本文描述的是基于如下策略的有效的VRCO1类HIV-1bnAb的新型小鼠疫苗模型:该策略允许该bnAb的前体人免疫球蛋白重(IgH)链可变区外显子通过V(D)J重组发育性地组装并主导小鼠的IgH库(6)。在这个VRC01重排模型中,大多数单个B细胞表达潜在的VRCO1前体IgH链的众多不同变体之一,比上述其它类型的小鼠模型提供更类人的前体VRCO1库。的确,尽管没有实现完全成熟的VRC01类bnAbs,但在VRC01重排小鼠模型中,序贯免疫诱导了VRC01型HIV-1中和抗体的亲和力成熟(6)。本文描述了用于测试候选HIV-1疫苗策略的更加生理学上相关的小鼠模型的开发。

一种模型基于用于VRCO1 IgH链重排模型的一般策略,以工程化小鼠模型,所述小鼠模型产生VRCO1前体抗体的高度多样的IgL库。当与VRCO1 IgH重排模型结合时,IgL重排模型将在小鼠中生成VRCO1前体的极为多样的原代人BCR库,用于测试引发VRC01类bnAb的免疫策略。

第二种模型涉及将人bnAb亲和力成熟中间体特异性地靶向小鼠生发中心B细胞。这种方法将在生理学上相关的阶段表达bnAb中间体,同时避免潜在的中央或外周耐受性检查点,对于在序贯的疫苗接种策略中测试加强的免疫原而言重要。

最后,可以用RAG-2缺陷的胚泡互补技术(14)产生这些模型,其消除了生殖系繁育的冗长且昂贵的过程,并允许及时提供小鼠模型。

参考文献

1.L.Verkoczy,F.W.Alt,M.Tian,Human Ig knockin mice to study thedevelopment and regulation of HIV1 broadly neutralizingantibodies.Immunological reviews 275,89-107(2017).

2.F.W.Alt,Y.Zhang,F.L.Meng,C.Guo,B.Schwer,Mechanisms of programmedDNA lesions and genomic instability in the immune system.Cell 152,417-429(2013).

3.J.G.Jardine et al.,HIV-1 VACCINES.Priming a broadly neutralizingantibody response to HIV-1 using a germline-targeting immunogen.Science(NewYork,N.Y.)349,156-161(2015).

4.P.Dosenovic et al.,Immunization for HIV-1 Broadly NeutralizingAntibodies in Human Ig Knockin Mice.Cell 161,1505-1515(2015).

5.A.T.McGuire et al.,Specifically modified Env immunogens activate B-cell precursors of broadly neutralizing HIV-1 antibodies in transgenicmice.Nat Commun 7,10618(2016).

6.M.Tian et al.,Induction of HIV Neutralizing Antibody Lineages inMice with Diverse Precursor Repertoires.Cell 166,1471-1484.e1418(2016).

7.D.R.Burton,L.Hangartner,Broadly Neutralizing Antibodies to HIV andTheir Role in Vaccine Design.Annu Rev lmmunol 34,635-659(2016).

8.J.M.Di Noia,M.S.Neuberger,Molecular mechanisms of antibody somatichypermutation.Annu Rev Biochem 76,1-22(2007).

9.L.Verkoczy et al.,Autoreactivity in an HIV-1 broadly reactiveneutralizing antibody variable region heavy chain induces immunologictolerance.Proceedings of the National Academy of Sciences of the UnitedStates of America 107,181-186(2010).

10.C.Doyle-Cooper et al.,Immune tolerance negatively regulates Bcells in knock-in mice expressing broadly neutralizing HIV antibody4E10.Journal of immunology(Baltimore,Md.:1950)191,3186-3191(2013).

11.Y.Chen et al.,Common tolerance mechanisms,but distinct cross-reactivities associated with gp41 and lipids,limit production of HIV-1 broadneutralizing antibodies 2F5 and 4E10.Journal of immunology (Baltimore,Md.:1950)191,1260-1275(2013).

12,G.D.Victora,M.C.Nussenzweig,Germinal centers.Annu Rev lmmunol 30,429-457(2012).

13.D.Sok et al.,Priming HIV-1 broadly neutralizing antibodyprecursors in human Ig loci transgenic mice.Science(New York,N.Y.)353,1557-1560(2016).

14.J.Chen,R.Lansford,V.Stewart,F.Young,F.W.Alt,RAG-2-deficientblastocyst complementation:an assay of gene function in lymphocytedevelopment.Proceedings of the National Academy of Sciences of the UnitedStates of Ameriea 90,4528-4532(1993).

实施例6

当前引发针对HIV-1的广泛中和抗体(bnAb)的疫苗策略基于用分别靶向表达bnAb的前体和中间体的B细胞的单独的免疫原进行的序贯免疫(1-5)。本文描述了新的有效的小鼠模型,以测试和优化用以引发有效的VRCO-1类HIV-1 bnAb的此类序贯免疫方案(6-9)。

每个免疫球蛋白重链(IgH)或轻链(IgL)可变区均包含三个互补决定区(CDR),所述互补决定区对于抗原接触特别重要(10)。CDR1和CDR2在每个生殖系可变区区段(V)中编码,并且对于多个生殖系IgH和IgL V区段的每个区段都是独特的。CDR3在IgH V区段、D区段和J区段或IgL V和J区段的连接处组装,并与非模板化的从头连接多样化机制(例如通过TdT添加N区域)相关联(11、12)。由于这个原因,CDR3代表了抗体中最多样的部分。

VRC01类bnAb靶向HIV-1包膜(Env)蛋白的CD4结合位点,并排他性地使用人IgHVH1-2区段(6-9)。在这方面,生殖系VH1-2编码序列,使其能够模仿CD4与gp120的相互作用。在这种不寻常的抗原相互作用模式中,VH1-2占VRCO1 bnAbs与gp120的交界面的近60%(7)。相反,大多数其它类型的HIV-1bnAb与Env表位的相互作用在很大程度上依赖于独特的(并且在许多情况下异常长的)IgH链CDR3(CDR H3)(13)。

在这方面,尽管基于VH1-2的Ig重链在人抗体中相当常见(14、15),但只有少数个体可能容纳有在这些其它类型的HIV-1bnAb中发现的具有不寻常的从头产生的CDR H3的抗体。因此,在人群中引发VRCO1类抗体的可能性要比引发其它类型的bnAb的可能性更大。但是,VRCO1抗体还需要带有异常短的5个氨基酸的CDR L3的Ig K轻链(6-9)。此外,三个VK区段(VK3-20、Vk3-11和Vk1-33)主要参与VRCO1 Ig轻链的编码,这显然是因为这些Vk区段的短CDR L1可以更容易地接纳遮蔽CD4结合位点的聚糖。CDR H3虽然不是严格保守的,但也会影响VRCO1抗体的功能(16)。

上文概述的各种限制将潜在的VRC01样前体的池减少至使用VH1-2的全部人抗体的小的亚群。实际上,表达VRC01样前体抗体的人B细胞的频率估计约为240万分之一(17)。增加了其通过免疫策略进行引发的难度的是,成熟的VRC01类bnAb表现出高水平(高达40%的核苷酸)的体细胞超突变,一些所述体细胞超突变是中和广度和效力所必需的(6-9、18)。为了通过序贯免疫引发VRC01类bnAb,已设计了引发免疫原,以选择性激活表达潜在VRC01样前体抗体的稀有B细胞(3、4、19)。引发后,已设计了一系列加强的免疫原,以通过中间阶段逐渐使前体抗体成熟,并朝着高突变的成熟VRC01类bnAbs前进(20、21)。为了促进对此类复杂免疫策略的测试,我们最近基于如下策略开发了新型的VRC01类bnAb小鼠疫苗模型,所述策略使该bnAb的前体人IgH可变区外显子能够通过V(D)J重组发育性地组装,并主导小鼠IgH库(21)。在这种“VRC01-IgH重排”模型中,由于从头CDR H3多样化,多数单个B细胞表达潜在的VRCO1前体IgH链的许多不同变体之一,提供比表达预先重排的生殖系倒位的VRCO1IgH链的常规转基因小鼠更类人的前体VRCO1库。确实,尽管没有实现完全成熟的VRC01类bnAb,这种VRCO1 IgH重排小鼠模型的序贯免疫诱导了VRC01型HIV-1中和抗体的亲和力成熟(21)。

本文描述了关注开发两种更加生理学上相关的小鼠模型的两个目标,用以测试候选HIV-1疫苗策略以引发VRC01类bnAb。在第三个目标中,描述了使用RAG-2缺陷的胚泡互补(RDBC)方法(22)来快速生成现有的VRCO1模型和新模型的同生群。

目标1.具有多样化的bnAb IgH和IgL前体库的VCR01小鼠模型的产生

我们对先前的VRC01疫苗小鼠模型的设计主要基于以下发现:最为D近端的小鼠VH基因区段(CH81x)的重排受在本文中称为基因间控制区1(IGCR1)的调控元件的控制(23)。当IGCR1失活时,无关剩余的IgH基因座的完整性,在大多数的VH至DJH连接事件中使用VH81X(23、24)。因此,当用人VH1-2替代小鼠VH81X并在小鼠的同一IgH等位基因上删除IGCRI时(图16),VH1-2在成熟B细胞的原代IgH库中被高度示出(21)。此外,由于VH1-2经历V(D)J重组,并且经受正常的连接多样化机制,因此VH1-2与极广范围的CDR H3相关联地表达(21)。

在用VH1-2重排模型进行的免疫实验中,关注基于VH1-2的Ig重链的亲和力成熟,这占抗原接触的大部分。由于这个原因,本文描述了如下模型,所述模型表达在94%的成熟B细胞中表达的生殖系倒位的VRCO1 Ig Vκ3-20轻链的预先重排形式(图16)(21)。本文描述了小鼠VRC01重排模型的产生,该模型表达针对Ig轻链和重链二者的多种VRCO1前体。例如,VRCO1抗体中两个最常用的Ig轻链区段人Vx3-20和Vx1-33(6、8、9)可以用于在小鼠中发育出前体B细胞的从头重排中。实现这一目标的策略是基于以下发现:抑制近端IgL Vκ区段的主导的V(D)J重组也受称为Sis/Cer的V(D)J重组调控元件介导,所述调控元件以类似于IgH基因座中的IGCR1发挥功能(图17)(25)。因此,当在Igk基因座中缺失Sis/Cer元件时,数个最近端的Vk基因区段主导VK至JK的重排过程。基于这一发现,在Cer/Sis缺失的情况下,人Vk3-20/Vk1-33区段可以相对于Jκ区段位于在Vκ簇的近端(图17)。这种VRC01轻链重排系统可与VH1-2重排模型结合,以生成产生多种VH1-2重链和多种Vk3-20/Vk1-33 Igk轻链的小鼠模型。与我们先前的VRCO1模型相比,这种小鼠模型可充当更加生理学上相关的系统来测试候选疫苗策略。通过在模型中保留IGCR1和/或Cis/Ser来以更严格的方式测试免疫方案,该模型还可以降低VH1-2重链和/或Vk3-20/Vk1-33轻链的频率。

与IgH相比,小鼠Igκ库显示出相对有限的连接多样性(例如N区),这可能是由于在发生Igk重排的小鼠pre-B细胞中缺乏TdT表达(26,27)。在这方面,还显示出在不存在TdT的情况下发育的某些树突状T细胞亚群形成由局部微同源性介导的重复的(“经典的”)V(D)J连接物(28)。相反,本文(及其它地方)提供的数据表明,人Igk库在CDR3中表现出实质的连接多样化证据,这证实了先前使用更有限的数据集所进行的观察(29)。

在本文中考虑的是,人pre-B细胞中的TdT的表达可能引起人Ig轻链库的CDR3连接多样化比起小鼠对应物的CDR3连接多样化的增加。与此假设相一致,在转基因小鼠的整个B细胞发育过程中,TdT的组成性表达引起小鼠Ig轻链的CDR3中的明显的N核苷酸添加(30)。为了进一步使VRCO1小鼠模型中的Ig轻链库人源化,可以将CD19启动子驱动的TdT转基因引入VRCO1 Igk重排小鼠模型中。HTGTS-rep-seq测定可以评价具有或不具有增强的TdT表达的Igx重排模型中的Igk CDR3连接物,以及评价与人Igx库中所发现的连接多样化相比的连接多样化的水平和类型。如果加强的TdT表达确实产生了更类人的多样化Igk库,则将内置此组件作为人源化Igk重排VRCO1模型的特征,以使小鼠模型能够生成更加代表人B细胞的Igk库。

先前的VRCO1模型重排小鼠IgL链、或具有敲入的预先重排的人生殖系倒位的(gl)VRCO1轻链。经固定的gl-VRCO1轻链有助于免疫策略的初始测试,但不代表生理设置。另一方面,不具有gl-VRCO1轻链的模型依赖于小鼠Ig轻链以及人VH1-2重链来重构VRC01样抗体。尽管小鼠Ig轻链重排也可以产生标志性(signature)5-氨基酸CDR L3,但人Ig轻链的其它方面也可能对于VRC01类抗体的功能而言是重要的。推测由于这个原因,大多数VRC01类bnAb使用人Vk3-20和Vk1-33,它们缺乏相近的小鼠同源物。

本文中通过表达VH1-2重链以及Vk3-20和Vk1-33 Ig轻链二者的多样化的库来解决这些问题。因此,新模型代表了对先前模型的实质改进。如上文所讨论的,这种新模型还应该优于Kymice或类似的Ig人源化小鼠,因为期望包含更高频率的表达相关的IgH和IgL链的B细胞,因此包含更“类人”的VRCO1谱系的原代库。还并入了加强的TdT表达,以产生更类人的多样化的IgL链CDR3原代库

在这种新的IgH和IgL重排VRCO1小鼠模型的设计中,采用了内源性小鼠D区段和J区段。在这方面,小鼠JH与人JH非常同源。对于抗体的VRCO1谱系,人JH2为CDR H3提供了关键的色氨酸残基(16,31)。小鼠JH1与人JH2同源,并包含类似的色氨酸残基。确实,当使用所设计的用以引发VRC01样抗体的免疫原对具有小鼠JH的VRCO1小鼠模型进行免疫时,所有的HIV-1中和抗体利用小鼠JH1,并在CDR H3中包含标志性的色氨酸残基(21)。这个结果表明,带有小鼠JH的模型将我们带往正确的道路。

为了在模型中进一步增加VRC01样的前体的频率,本文提供了并入人JH2和VH1-2二者的小鼠品系(Alt实验室,未发表的结果)。

很难确定VRC01类抗体中的生殖系D区段的身份,因为CDR H3区经受了连接多样化和广泛的体细胞超突变二者。除了上述的色氨酸残基外,VRCO1家族成员的CDR H3区中没有可辨别的其它的保守的特征。具有多种CDR H3的前体抗体可能潜在地演变成VRC01样抗体。连同连接多样化,期望小鼠D对CDR H3区贡献与人的D相似的多样性水平,并应当产生大的VRC01样前体的库,所述前体将作为免疫原的相关靶标。在VRCO1谱系抗体之间,JK的使用没有强的保守性。此外,小鼠Jk与人Jk几乎相同。但是,如果期望,可以容易地将人Jk添加至模型。

目标2.在生发中心B细胞中直接表达bnAb中间体的小鼠模型

表达某些bnAb或其前体的B细胞在小鼠中的B细胞成熟期间趋于缺失(32)。为了克服这一障碍,我们开发了条件性表达方法,所述方法将bnAb表达限制至成熟的B细胞,从而规避了骨髓中的耐受控制的障碍。在这种方法中,B细胞成熟是由无害的Ig重链和Ig轻链可变区外显子驱动的,所述外显子被称为“驱动子(driver)Ig基因”(图18)。驱动子Ig基因侧接有loxP位点并通过CD21-cre删除,所述CD21-cre在成熟B细胞阶段特异性地表达(33)。bnAb IgH V(D)J外显子位于驱动子Ig V(D)J外显子的上游,并在通过CD21-cre使驱动子IgV(D)J外显子缺失后在成熟的B细胞中表达。这种条件性表达策略可以绕过阻止VRC26前体(具有超长CDR H3的抗体)表达的耐受性控制机制(34)。我们还建立了bnAb Ig轻链的条件性表达的类似系统,并为DH270 bnAb的UCA实现了Ig重链和Ig轻链两者的条件性表达(35)(数据未示出)。

本文考虑的是,通过使用条件表达盒,该条件性表达技术可适于表达bnAb的亲和力成熟的中间体的Ig重链和Ig轻链二者,其中,在生发中心特异性启动子的控制下驱动cre表达(图19)。为了优化此方法,可以将由S1pr2启动子驱动的cre转基因的有效性与Cγ1启动子进行比较,因为这两个启动子均已用于增强cre的生发中心B细胞特异性表达(36、37)。可以使用替代的GC特异性或GC偏倚性的启动子。对于这种条件性方法,驱动子V外显子不仅必须支持骨髓中的B细胞的发育,而且还必须在生发中心反应的情况下促进B细胞的激活。因此,驱动子V外显子必须编码具有已知的抗原结合特异性的抗体,以使得用该靶抗原进行的免疫将促进生发中心反应。我们目前测试的条件表达盒中的驱动子IgH V外显子编码识别流感的HA抗原的抗体(38)。

因此,用HA抗原进行免疫应诱导生发中心反应,在此过程中驱动子V基因的缺失将引起编码VRCO1中间体靶抗体的V(D)J外显子的表达。表达bnAb中间体的新生的生发中心B细胞的存活和成熟将取决于可以与其BCR相互作用的抗原。因此,在一些实施方式中,可以将加强的免疫原与HA抗原一起进行给予,以使其能够用于刺激生发中心B细胞中的亲和力成熟,所述B细胞已打开给定的bnAb中间靶抗体的表达。除HA外,还可以使用针对NP(B1-8)的抗体作为驱动子,在这种情况下,用NP进行的免疫将诱导GC反应以及靶抗体在GC B细胞中的表达。

使用生殖系VRCO1抗体作为驱动子V基因将成为替代的可能性,在这种情况下,将用初免(prime)免疫原和加强免疫原的混合物对小鼠进行免疫。初免免疫原将启动生发反应并激活中间抗体的表达。然后,将设置用于测试加强的免疫原的阶段。在这一轮加强免疫之后,来自生发中心反应的记忆B细胞将用作进一步加强免疫的靶标。

生发中心特异性表达模型允许在数个方面评价加强免疫原。例如,可以测试免疫原是否可以有效地促进bnAb中间体的体细胞超突变,是否将滤泡辅助性T细胞(Tfh)募集到生发中心反应,以及是否在终末分化为浆细胞时有利于记忆B细胞发育。如果bnAb成熟伴随着多反应性或自反应性的获得,则该模型还将为研究生发中心中的这种亲和力成熟中间体的命运提供机会。UCA向成熟bnAb的演化将涉及许多中间体。对于初始研究,从我们先前的免疫实验(21)中分离出的最有效的VRC01样中和抗体可以用作系统中的中间抗体。可以如期望的并入进一步的感兴趣的中间抗体。

已经存在耐受性控制机制阻碍bnAb或其前体的表达的数个实例,如在2F5、4E10(MPER bnAb)(39-41)或3BNC60(CD4结合位点bnAb)的小鼠模型(42)以及我们自己的关于DH270(V3glycan bnAb)(35)和VRC26(V1V2 bnAb)(34)的小鼠模型的未发表数据中所示出的。鉴于这些先例,表达亲和力成熟的VRC01bnAB谱系中间体或我们希望通过常规的转基因敲入方法寻求优化的其它期望的抗体可能会遇到类似的障碍。此外,中央和外周耐受控制机制通常分别靶向前体和幼稚B细胞。由于亲和力成熟中间体由GC反应产生,因此它们在生理条件下不会经受这些检查点。因此,用常规的敲除策略表达中间体实质上对这些抗体施加了非生理限制。当前的GC特异性表达策略是为解决此问题而特别设计的。使用常规的敲入方法,中间抗体在幼稚B细胞中表达。相反,在正常的免疫设置中,表达中间抗体的记忆B细胞是加强免疫的生理学靶标。由于幼稚B细胞和记忆B细胞在其免疫应答方面可能不同,因此中间抗体的组成性表达模型可能无法提供加强免疫原的准确评价。通过在生发中心B细胞中表达中间抗体,其中的一部分可以分化成记忆B细胞,重新建立了加强免疫的最相关的设置。

目标3.提供VRCO1小鼠模型的同生群

为了确保向这些免疫实验有效提供现有和新的小鼠模型,Rag2缺陷的补体(RDBC)系统可用于在嵌合小鼠的背景下产生小鼠模型(22)。在这种方法中,将遗传修饰引入ES细胞中,将所述ES细胞注射至Rag2缺陷的胚泡中以产生嵌合小鼠。因为Rag2对于V(D)J重组而言是关键的,所以RDBC嵌合体中的所有B细胞和T细胞均源自经注射的ES细胞。如已经示出的,此类嵌合小鼠可以直接用于免疫实验(21)。RDBC方法消除了常规的生殖系传递中涉及的冗长且昂贵的繁育需求;在消除多年的育种以产生涉及多种遗传修饰的小鼠模型的背景下,这种方法的优势尤其明显,例如本文提出的那些方法。与初始VRC01模型一样,嵌合体也将交配繁殖以用于生殖系传递。

总结与讨论

本文描述了两种类型的小鼠模型,其促进了用于产生HIV-1疫苗的序贯免疫方法的发展。目标1中所述的重排模型可用于测试免疫方案的初免步骤和加强步骤,而目标2中的生发中心特异性模型将特别有助于研究加强免疫,包括测试策略以规避可能发生的潜在障碍。

相对于Kymab小鼠,我们提出的通过重排表达VH1-2和Vk3-20、Vk1-33的小鼠目标1小鼠模型被设计为具有更高频率的VRC01样前体。我们可以使用适当的探针(例如eOD-GT8)来评价VRC01样前体的频率(17)。如果小鼠含有容易检测到的前体,但对测试免疫原无应答,则结果表明该免疫原不能作为靶B细胞的有效激活物。这些提出的方法(特别是在生发中心阶段特异性地表达中间抗体的方案)的优势将对测试加强免疫原而言是重要的。在常规的小鼠模型中,加强免疫中的阴性结果可能具有至少两种潜在的解释。一种可能是先前的免疫(例如初免步骤)未能引出由加强免疫原靶向的相关中间抗体。或者,表达中间抗体的B细胞可能已经产生,但是没有对加强免疫原应答。这两种潜在的可能性将为下一步指明不同的方向。

目标2模型可以通过产生表达所限定的亲和力成熟中间体的生发中心B细胞群来消除这些潜在的混淆不确定性。在这种模型中,加强免疫中缺乏应答可以明确地归因于无效的加强免疫。如果新的初免免疫原最终在Kymab小鼠或类似小鼠模型中比eOD-GT8更有效,则如上所讨论的,这些小鼠中的VRC01样前体的贫乏可能仍会在加强步骤中构成严峻挑战。

这些模型具有较高的相关疫苗靶标的频率和/或更合适的表达模式,为免疫研究提供了更易处理的系统。如果在临床试验中用eOD-GT8进行初免免疫确实引发了人中的VRC01样抗体,则下一个主要挑战是制定加强免疫策略,以使中间抗体进一步朝向bnAb成熟。如同初免免疫原(例如eOD-GT8)的开发,加强免疫原的优化也需要在动物模型中进行迭代实验,并且所提出的小鼠模型将良好地适合此目的。所提出的策略,无论是重排模型还是GC特异性表达模型,都允许表达在临床试验中鉴别出的中间VRC01样抗体的小鼠模型,并且这些小鼠模型可用于测试下一步的加强免疫原。

参考文献

1.D.S.Dimitrov,Therapeutic antibodies,vaccines and antibodyomes.MAbs2,347-356(2010).

2.B.F.Haynes,G.Kelsoe,S.C.Harrison,T.B.Kepler,B-cell-lineageimmunogen design in vaccine development with HIV-1 as a case study.NatBiotechnol 30,423-433(2012).

3.J.Jardine et al.,Rational HIV immunogen design to target specificgermline Bcell receptors.Science(New York,N.Y.)340,711-716(2013).

4.A.T.McGuire et aL,Engineering HIV envelope protein to activategermline B cell receptors of broadly neutralizing anti-CD4 binding siteantibodies.The Journal of experimental medicine 210,655-663(2013).

5.X.Xiao et al.,Germline-like predecessors of broadly neutralizingantibodies lack measurable binding to HIV-1 envelope glycoproteins:implications for evasion of immune responses and design of vaccineimmunogens.Biochem Biophys Res Commun 390,404-409(2009).

6.X.Wu et al.,Rational design of envelope identifies broadlyneutralizing human monoclonal antibodies to HIV-1.Science(New York,N.Y.)329,856-861(2010).

7.T.Zhou et al.,Structural basis for broad and potent neutralizationof HIV-1 by antibody VRC01.Science(New York,N.Y.)329,811-817(2010).

8.J.F.Scheid etal.,Sequence and structural convergence of broad andpotent HIV antibodies that mimic CD4 binding..Science(New York,N.Y.)333,1633-1637(2011).

9.X.Wu et al.,Focused evolution ofHIV-1 neutralizing antibodiesrevealed by structures and deep sequencing.Science(New York,N.Y.)333,1593-1602(2011).

10.F.W.Alt,Y.Zhang,F.L.Meng,C.Guo,B.Schwer,Mechanisms of programmedDNA lesions and genomic instability in the immune system.Ce//152,417-429(2013).

11.F.W.Alt,D.Baltimore,Joining of immunoglobulin heavy chain genesegments:implications from a chromosome with evidence of three D-JHfusions.Proceedings of the National Academy of Sciences of the United Statesof America 79,4118-4122(1982).

12.T.Komori,A.Okada,V.Stewart,F.W.Alt,Lack of N regions in antigenreceptor variable region genes of TdT-deficient lymphocytes.Science(New York,N.Y.)261,1171-1175(1993).

13.D.R.Burton,L.Hangartner,Broadly Neutralizing Antibodies to HIV andTheir Role in Vaccine Design.Annu Rev Immunol 34,635-659(2016).

14.B.J.DeKosky et al.,High-throughput sequencing of the paired humanimmunoglobulin heavy and light chain repertoire.Nat Biotechnol 31,166-169(2013).

15.S.G.Lin et al.,Highly sensitive and unbiased approach forelucidating antibody repertoires.Proceedings of the National Academy ofSciences of the United States of America,(2016).

16.C.Yacoob et al.,Differences in Allelic Frequency and CDRH3 RegionLimit the Engagement of HIV Env Immunogens by Putative VRCO1 NeutralizingAntibody Precursors.Cell reports 17,1560-1570(2016).

17.J.G.Jardine et al.,HIV-1 broadly neutralizing antibody precursor Bcells revealed by germline-targeting immunogen.Science(New York,N.Y.)351,1458-1463(2016).

18.F.Klein et al.,Somatic mutations of the immunoglobulin frameworkare generally required for broad and potent HIV-1 neutralization.Cell 153,126-138(2013).

19.L.Stamatatos,M.Pancera,A.T.McGuire,Germline-targetingimmunogens.Immunological reviews 275,203-216(2017).

20.B.Briney et al,,Tailored Immunogens Direct Affinity Maturationtoward HIV Neutralizing Antibodies.Cell 166,1459-1470.e1411(2016).

21.M.Tian et al.,Induction of HIV Neutralizing Antibody Lineages inMice with Diverse Precursor Repertoires.Cell 166,1471-1484.e1418(2016).

22.J.Chen,R.Lansford,V.Stewart,F.Young,F.W.Alt,RAG-2-deficientblastocyst complementation:an assay of gene function in lymphocytedevelopment.Proceedings or the National Academy of Sciences of the UnitedStates of America 90,4528-4532(1993).

23.C.Guo et al.,CTCF-binding elements mediate control of V(D)Jrecombination.Nature 477,424-430(2011).

24.J.Hu et aL,Chromosomal Loop Domains Direct the Recombination ofAntigen Receptor Genes.Cell 163,947-959(2015).

25.Y.Xiang,S.K.Park,W.T.Garrard,A major deletion in the Vkappa-Jkappaintervening region results in hyperelevated transcription of proximal Vkappagenes and a severely restricted repertoire.Journal of immunology(Baltimore,Md.·1950)193,3746-3754(2014).

26.Y.S.Li,K.Hayakawa,R.R.Hardy,The regulated expression of B lineageassociated genes during B cell differentiation in bone marrow and fetalliver.The Journal of experimental medicine 178,951-960(1993).

27.K.D.Victor,K.Vu,A.J.Feeney,Limited junctional diversity in kappalight chains.Junctional sequences from CD43+B220+early B cell progenitorsresemble those from peripheral B cells.Journal of immunology(Baltimore,Md.:1950)152,3467-3475(1994).

28.Y.Zhang et al.,The role of short homology repeats and TdT ingeneration of the invariant gamma delta antigen receptor repertoire in thefetal thymus.Immunity 3,439-447(1995).

29.H.J.Girschick,P.E.Lipsky,The kappa gene repertoire of humanneonatal B cells.Molecular immunology 38,1113-1127(2002).

30.L.A.Bentolila et al.,Constitutive expression of terminaldeoxynucleotidyl transferase in transgenic mice is sufficient for N regiondiversity to occur at any Ig locusthroughout B cell differentiation.Journalof immunology(Baltimore,Md.:1950)158,715-723(1997).

31.A.P.West,Jr.,R.Diskin,M.C.Nussenzweig,P.J.Bjorkman,Structuralbasis for germ-line gene usage of a potent class of antibodies targeting theCD4-binding site of HIV-l gp120.Proceedings of the National Academy ofSciences of the United States of America 109,E2083-2090(2012).

32.L.Verkoczy,F.W.Alt,M.Tian,Human Ig knockin mice to study thedevelopment and regulation of HIV1 broadly neutralizingantibodies.Immunological reviews 275,89-107(2017).

33.M.Kraus,M.B.Alimzhanov,N.Rajewsky,K.Rajewsky,Survival of restingmature B lymphocytes depends on BCR signaling via the lgalpha/betaheterodimer.Cell 117,787-800(2004).

34.N.A.Doria-Rose et al.,Developmental pathway for potent VIV2-directed HIV-neutralizing antibodies.Nature 509,55-62(2014).

35.M.Bonsignori et aL,Staged induction of HIV-1 glycan-dependentbroadly neutralizing antibodies.Science translational medicine 9,(2017).

36.R.Shinnakasu et aL,Regulated selection of germinal-center cellsinto the memory B cell compartment.Nature immunology 17,861-869(2016).

37.S.Sander et al.,Synergy between PI3K signaling and MYC in Burkittlymphomagenesis.Cancer cell 22,167-179(2012).

38.J.Kavaler,A.J.Caton,L.M.Staudt,D.Schwartz,W.Gerhard,A set ofclosely related antibodies dominates the primary antibody response to theantigenic site CB of the A/PR/8/34 influenza virus hemagglutinin.Journal ofimmunology(Baltimore,Md.:1950)145,2312-2321(1990).

39.L.Verkoczy et al.,Autoreactivity in an HIV-1 broadly reactiveneutralizing antibody variable region heavy chain induces immunologictolerance.Proceedings of the National Academy of Sciences of the UnitedStates of America 107,181-186(2010).

40.Y.Chen et al.,Common tolerance mechanisms,but distinct cross-teactivities associated with gp41 and lipids,limit production of HIV-1 broadneutralizing antibodies 2F5 and 4E 10.Journal of immunology(Baltimore,Md,:1950)191,1260-1275(2013).

41.C.Doyle-Cooper et al.,Immune tolerance negatively regulates Bcells in knock-in mice expressing broadly neutralizing HIV antibody4E10.Journal of immunology(Baltimore,Md,,.1950)191,3186-3191(2013).

42.A.T.McGuire et al.,Specifically modified Env immunogens activateB-cell precursors of broadly neutralizing HIV-1 antibodies in transgenicmice.Nat Commun7,10618(2016).

43.R.W.Sanders,J.P.Moore,Native-like Env trimers as a platform forHIV-1 vaccine design.Immunological reviews 275,161-182(2017).

目标1

我们已经采用基于Cas9-gRNA的方法来删除小鼠v-Abl pre-B细胞系中的Igk基因座的Sis/Cer元件,我们可以在体外诱导所述细胞系进行Igx V(D)J重组。诱导对照和缺失Sis/Cer的v-Abl pre-B细胞以经历其内源性Igκ基因座的V(D)J重组后,使用基于HTGTS的高通量V(D)J重组测定法(3,4)来分析不同的内源性VK区段重排至Jk4诱饵序列的频率。这项研究清楚地表明,Sis/Cer元件的缺失实质上增加近端Vx3-1、Vx3-2和Vx3-3区段的重排频率(图15A-图15V)。鉴于这些观察,预期在Sis/Cer缺失的情况下,当将人VK3-20和Vk1-33区段置于代替近端小鼠VK区段的位置时,在V(D)J重组过程中也将优先利用它们。由于连接多样化,预期该模型中的B细胞群将表达VK3-20和Vk1-33轻链的多样化的库;并且如上所述,可以通过在基于ES细胞的模型中并入组成性TdT表达来测试这种多样性是否可被处理的更类人。

为了进一步解决人VKJK库是否可能表现出比起小鼠VkJk库增高的连接多样性,使用小鼠或人JK1诱饵作为引物,对来自WT小鼠IgM+脾B细胞和人外周血单核细胞(PBMC)的DNA进行了HTGTS-Rep-seq分析(4)。为了消除细胞选择的影响的可能性,所呈现的是框外(无效的)WJK连接的结果。这种初步分析虽然限于仅一个的人样品,但与小鼠VKJK连接相比,显示出P和/或N连接元件向人VKJK连接中的明显更高的并入(图20)。这些发现将通过对额外的人样品的分析得到证实和扩展,为将增强的TdT表达并入新的Igx重排的VRCO1模型中以使其能够生成更类人的IgK库的目标提供了有力支持。

目标2

已经采用条件性表达策略来生成VRC26UCA小鼠模型,所述模型激活VRC26UCA在外周B细胞中的表达(图21A;Tian和Alt,未发表)。当VRC26UCA重链在B细胞成熟期间组成性表达时,大多数表达VRC26UCA重链的B细胞在骨髓中缺失,并且基于表面IgM表达,在外周B细胞区室中未出现(图21B,图21C,右子图)。相反,当VRC26UCA重链在成熟B细胞中条件性表达时,约50%的B脾B细胞在其表面表达敲入的VRC26UCA重链(图21B,图21C,左子图)。

除了上述的VRCO1和VRC26小鼠模型外,我们还生成了、或正在生成针对HIV-1和流感病毒的其它类型的bnAb的多种小鼠模型。例如,我们已经生成了表达针对DH270的两种类型UCA的小鼠模型,其靶向HIV-1Env的V3聚糖表位(5)。我们还生成了表达DH511UCA的Ig重链的小鼠模型,其识别膜外部近端区域(MPER)(6),并且我们正通过并入DH511UCA轻链来完善该模型。此外,我们正在建立CH235UCA的小鼠模型,所述CH235UCA以与VRC01类似的方式靶向CD4结合位点,但利用VH1-46基因区段代替VH1-2(7)。我们正在生产针对靶向流感HA抗原的干区(stem region)的56.a.09 bnAb小鼠模型(8)。

参考文献

1.M.Tian et al.,Induction ofHIV Neutralizing Antibody Lineages inMice with Diverse Precursor Repertoires.Cell 166,1471-1484.e1418(2016).

2.Y.Xiang,S.K.Park,W.T.Garrard,A major deletion in the Vkappa-Jkappaintervening region results in hyperelevated transcription of proximal Vkappagenes and a severely restricted repertoire.Journal of immunology(Baltimore,Md.:1950)193,3746-3754(2014).

3.J.Hu et al.,Chromosomal Loop Domains Direct the Recombination ofAntigen Receptor Genes.Cell 163,947-959(2015).

4.S.G.Lin et al.,Highly sensitive and unbiased approach forelucidating antibody repertoires.Proceedings of the National Academy ofSciences of the United States of America,(2016).

5.M.Bonsignori et al.,Staged induction of HIV-1 glycan-dependentbroadly neutralizing antibodies.Science translational medicine 9,(2017).

6.LaTonya D.Williams et al.,Potent and broad HIV-neutralizingantibodies in memory B cells and plasma.Sci.Immunol 2,(2017).

7.M.Bonsignori et aL,Maturation Pathway from Germline to Broad HIV-1Neutralizer of a CD4-Mimic Antibody.Cell 165,449-463(2016).

8.M.G.Joyce et al.,Vaccine-Induced Antibodies that Neutralize Group 1and Group 2 Influenza A Viruses.Cell 166,609-623(2016).

序列表

<110> 儿童医疗中心有限公司(THE CHILDREN'S MEDICAL CENTER CORPORATION)

<120> 涉及用于抗体发现和/或优化的高通量模型的方法和组合物

<130> 701039-092250WOPT

<140>

<141>

<150> 62/684,367

<151> 2018-06-13

<160> 63

<170> PatentIn version 3.5

<210> 1

<211> 317

<212> DNA

<213> 智人(Homo sapiens)

<400> 1

aggtgaagaa ggccggggcc tcagtgaagg tctcctgcga ggcttctgga tacagtttca 60

ccggccacta tatacactgg gtgcgacagg cccctggtca agggcttgag tggatgggat 120

ggatcaagcc ttccagtggt gacacaaact ttgcagagaa gtttcagggc agggtcacct 180

tgaccaggga cacgtccaag agcacagcct acatggagtt gatcaggctg agacctgacg 240

acacggccgt gtattactgt gcgaggatac acggatacag taatggctgg ttccctcttg 300

atgcttttga tatctgg 317

<210> 2

<211> 328

<212> DNA

<213> 智人(Homo sapiens)

<400> 2

caggtgcagt tggtgcagtc tggggctgag gtgaagaggc ctggggcctc agtgaaggtt 60

tcctgcaaga catctggata caccttcacc agctattctt tacactgggt gcgacaggcc 120

cctggacaag gacttgagtg gatgggaata atcaacccta gtgatggtag cacaaattac 180

gcacagaagt tccagggcag agtcattatg accagggaca cgtccacgag cacagtctac 240

atggagctga ggagcctgag atctgaggac acggcccttt attactgtgc gagagcctat 300

aggacctatg atccttttga tatgtggg 328

<210> 3

<211> 19

<212> DNA

<213> 未知

<220>

<223> 未知的描述:

CTCF结合元件序列

<400> 3

gtatcagcag atggcagtg 19

<210> 4

<211> 19

<212> DNA

<213> 未知

<220>

<223> 未知的描述:

CTCF结合元件序列

<400> 4

gtgtcagcag atggcagag 19

<210> 5

<211> 19

<212> DNA

<213> 未知

<220>

<223> 未知的描述:

CTCF结合元件序列

<400> 5

tggccacttg agggagcta 19

<210> 6

<211> 19

<212> DNA

<213> 未知

<220>

<223> 未知的描述:

CTCF结合元件序列

<400> 6

tggccagcag aggccccta 19

<210> 7

<211> 14

<212> DNA

<213> 未知

<220>

<223> 未知的描述:

CTCF结合元件序列

<220>

<221> 经修饰的碱基

<222> (6)..(6)

<223> a、c、t、g、未知或其它

<220>

<221> 经修饰的碱基

<222> (9)..(9)

<223> a、c、t、g、未知或其它

<400> 7

ccgcgnggng gcag 14

<210> 8

<211> 14

<212> DNA

<213> 未知

<220>

<223> 未知的描述:

CTCF结合元件序列

<220>

<221> 经修饰的碱基

<222> (5)..(5)

<223> a、c、t、g、未知或其它

<400> 8

ccacnaggtg gcag 14

<210> 9

<211> 19

<212> DNA

<213> 未知

<220>

<223> 未知的描述:

CTCF结合元件序列

<400> 9

atggccacaa gggggaagc 19

<210> 10

<211> 19

<212> DNA

<213> 未知

<220>

<223> 未知的描述:

CTCF结合元件序列

<400> 10

tctccacaag agggcagaa 19

<210> 11

<211> 20

<212> DNA

<213> 未知

<220>

<223> 未知的描述:

CTCF结合元件序列

<400> 11

aggaccagca gggggcgcgg 20

<210> 12

<211> 20

<212> DNA

<213> 未知

<220>

<223> 未知的描述:

CTCF结合元件序列

<400> 12

ggaccagcag ggggcagtga 20

<210> 13

<211> 7280

<212> DNA

<213> 小鼠(Mus sp.)

<400> 13

gaataaaagc agaaactaat gaaaaatgtg gttataaagt gaataaaact gtgattgaaa 60

tatctttctc ttgaaaagga tcattaaaac agatgaatat tgagctattt aaaggtaaaa 120

catgccaaaa atcatgttat gaaggagcaa agagaaaaca actgtatcta tagctcctga 180

agagcttaag tttggaggag tgtgtcctgc ttttaaagag gtagaaccat gctgtagatg 240

aagcccatga tgttctgtga aaagagaagt aaccctgact ccagaagatg tgttcaactg 300

gaaaagatca ataatcaaag atcgtaaaac aattgggaga gacccaccat cccctcctct 360

gtgggaaagt tcaaggtcat tttcttgaaa agttctagca tatgtttttg gagtagtagt 420

agttgttgct gttgttgttg ttgatgatga tgatgatgat gttgttgttg ttgttgttgt 480

tatataaacc ttctttggag catagaaaac tacaaaaaca gaaacaaaaa acaaaaaaaa 540

atatctattt cagataacct atattcaata cagctgcatt aatgaggcaa tttatcatca 600

atgaagcatc acctattgtt gatttgttaa agattattta tcttcaatat aagtaaaagc 660

ctgataactg gccctgttga ctgtggcttt tactgctgtt tctctgtgct gaaactatcc 720

atacaaaata gaaataaagt ctgaaaagtc aaaaaaaaca caatgttctg atagttggaa 780

accgtgtgta tatgtggggt gggggagggg gtaatgctca taaatgtgtg acagagagat 840

aggggaagag gagaaagaca gatcttctaa aaacaacagt ctggtcccat tatgggggtg 900

gagacctggc caaattgaga tctctgcttt tgtttgcagg acagttctgt gacccatgac 960

tgggcctctg tagacttgcc gcttatacaa cactgccatc tgctgataca gcattagcac 1020

cctgacttgc tctggtgata aactggaggc actgtgagat catttccttg tcactgtttc 1080

ctgtgccaca cccattcata tgtactagaa atagtctgag aagaaaaaga cgttcagata 1140

ggaagggagc atgtaatgta cctatatatc tacatagata cttactcaag gggagggagg 1200

gtttggtgtg tgtgtgtgtg tatctcccgt gcacacacac acacacgaaa aagttggaga 1260

ggaaagattt tttttttaaa caacagtctg atcccattat agaggtggag acctgacaag 1320

attcagatca ctggctttgt ttgcaggcca gctcagtgac ccatgatcgg gcctccgtag 1380

gctcactgct tatacagcac tgccatctgc tgacacagct tctctgttga cacagcttct 1440

gccccctgcc atgctcagat aatgagctgt tcattggctc tgtgagatcg attccttttc 1500

attgctttca tttttgatat ctaaacaatg tttctacaat tcagagacac aaacaaattg 1560

tataaataac ttcaatttta caagttaaca ttttccacct tttactggta tcaaacggct 1620

tgccgtggtt ctgacctgcc aagataggga gtaaagctct ctttggtctc tagtcccagg 1680

ccttggagtt ccaaaagcct gggtttggag ggagtcccag aagtttacag ctccaagccc 1740

tgagagctag aggcctactg ttccaggttt tgaaatccaa caggatgact agggagaggt 1800

ggctcagtgg ttaagatgtg ccctgctttt tcagaggatg taagttcagt tcctagcacc 1860

catatcaggc agctcacatg cagttacata taacagcctg taatttcatc tccaaggatc 1920

tgaacatctc ttctggcctc ctcaagcact gtgttcacat gcatgcacag tgtgtgtgtg 1980

tgtgtgtgtg tgtgtgtgtg tgtgtgtgtg tgtgtgtact atatatacac acatatatag 2040

tagagtgagt tgagctggta gcctggggtg tctgacacct tggccctttg acagttcctt 2100

agaaatctcc cagtaccagg gccagaagtt tcttgtcttc agcagctgtc tctattgcct 2160

ctgctcctcc tcatctctac cacagccttt tgatgtcact gccgatgtca ccaaggacac 2220

ttccttcacc actgacattg ccttcattgt ccctgcttcc ttcctttcct catgttacca 2280

gctcaactca ctctactaat gataaaacgc aaaaataggc aagaccgggc cttttattgc 2340

aacttaatgc ttcagcttca acaccagaga gcaacatcta gctggtatct ccaggttaac 2400

ttgcagagtg aaccaagcag agcacttata tagccagagt gggagtgtgt ccagtgtgtg 2460

tgcacgtggc agtacatcac accaatgaag aacagtattc tcaccaagca tgaagggctg 2520

cacctgtccc aatcacagca gtccctcaga cactcagaat gaagtcacac accttcagac 2580

tgccttcttg actgatattc cttcattcaa ggccatacat agctccatag gatgaagcag 2640

tcttaattta ccattcaaat catccaagct atcaggaaaa ttgacattaa gaaacacatc 2700

tacaataaag ttgtcattca cagtgattta acaataggtt aagaatgcat agctcctgcc 2760

tcagtgatcc catgagtaat gggcctccta atatgactgt tttacttatc ccaccatcca 2820

accacccttg gcaaccacca cacacatctc tttgacatgt gtgtatgaga tattttaatc 2880

atattcaagg ctgattacct tctcttatct ccctcacatt ctaactacat ccctgctaac 2940

tttgtgtccg tttttaaggt ttatttttat ttatgtgtat gtgtgtgtgt ctgttatgga 3000

ccatgagaat gtgtccaatc gcctggacct ggagttacaa acagttgtga attgcctgct 3060

gtgggtgctg ggaatcaaat tcaggccctc tgcaggagcg tcaagtgttc ttggccgcta 3120

agccaccttc ccacaacccc acacactttt tgataacccg ttagctgagg taacttacat 3180

aaactcgggt taggggttat ttaacaaagc atgatcaact tagcagtggg tatatcactg 3240

aagaaacttt tgttccctcc cctagcaact attaacagcc aaaagctgtt tagaaaaggg 3300

taggggcctt aaaagcccca attaacctaa ttagaagtcc ttaactgact ataaatctta 3360

aaggaaaaga agagcctcat aagcccctgc cctgcccgtg atggaatatt ggcaggccag 3420

atcttctggt tgtgagaaag taatcaagct gctctgagtc cgtgagtgca acagccatgt 3480

ctgattccca aggatggtgc acaaagcccc tttccttcca ccaactctgt gttctttcta 3540

ccccttctcc tgcagtgtac tctgaacctt gtatggtgat gacataaacg aaccattgat 3600

gactgagcac tcaatcatcc cttattttca gcgctttgac ccgttataag tctctgcata 3660

aaacacacac acacacacac acaagggagg agggtctgag caacactaat ctataggttt 3720

tcaacctagc aatatttaca aggccattca aaaaacaaac catgtccatt tagtgaaaca 3780

acagcagtaa gtttcccact agggccttta accacacccc cataagcctt taaccaggtt 3840

tacagtagca ggaatgaata ctgtggagtg gacctcaaac ccaatcagaa aatggttggt 3900

tacccccatt ctagccatac cactattgct ccagtgggca tatcttacct gccgtggggt 3960

cgatccaata gggcacaggg tctatagcta aatgcaactg ctgactagct ccttcaccca 4020

gaagactgtg caccatcgtc tggcactgtg aaatccaccc agctgaaagg aagcctccaa 4080

tcggctccat ctgggctttt ccatggtcta caaccaggag catggtgtat ccagcaatag 4140

ggtcttagca tctagaaatt agctatggta attgcctata ttgtttgaag gaccttaagg 4200

acctcaatga ccaacatata gcatggaatc tcacccctgg caccaggatt tttatttaat 4260

aacctatggc ttccgggagc agctttatcc tcccatgcag ggtacctcac accaactcct 4320

ttttattaat tgtacgttaa atcacttgca aagtagtatt cttccttacg gctttttcat 4380

gcaccctcac gcagctttga atggccatct ctcccccctc tcctctttcc catttttctg 4440

cactacattc ctacttccta caaaatttgt cctaaacagt ttttcctttc tctccaccat 4500

tgtcccttcc aagattccta gattttggtt accttaaatg ccaacaaggt acaattttca 4560

gaggctttac agtaacagaa aaaaaagagg ttacaaggta cttttcaaat ttattgatgg 4620

gcacaggagt gcaggttaaa gcaaagtggg gaacctctgc tacagacctc ggatgctatc 4680

tgacggtccc agtgtttgcc gtgaggatgc tgctcggcca acaactcaag tcaggatgag 4740

ttgggatctg ttcttgtatt ccaaaggatt tacctaacag tcacaaagat gataggtcac 4800

agacggcagt aaatggcctc aagtagcagt taatggccac ttgagggagc taaagataac 4860

ttgtctctgg gcctgcacag attccacccc tccacagtca ctgaagttct ttattatcat 4920

tattgttgtt gctgctgttg ttgttgttgt tttatatcca taaatgttgc cgcccccgcc 4980

cccagcctcc ctttgcagat ttcttcccca acaccccctt agcttctaag agggtacccc 5040

caccccagtc atcccgcttc cctcaggcat caagtcttta caggattagc tcatgctctc 5100

ccactgaagc caaacaaata tgtctgctac atatgtgcgg gggaggacgg gggggggggg 5160

ggggactcgg accagcccat atatgctctt tggttgctgg atttctctct gggagctctc 5220

aggggtctgg gttagatgac actcttcatc ttcctataga gttgccatcc cttcctttcc 5280

ttcagtcctt cccctaagtc cttcccctaa ctctcccata ggggtccccg acttcagttc 5340

aatggttggc agtaaatatc tgtctcagtc aagggctggt agagcctctc agaggacagt 5400

catccaggct cctgtctgca agcacaacgt agcatcaata atggcgtcag ggttctaatc 5460

ggtgattcag cctttgtaaa gtggtcaacg taaggtgcag gttcttgggg agggacttga 5520

aggggacacg aggactttaa ttcacatgga taaaatagaa gactgcctct atgagaaagg 5580

tgagtctgtg gactaaatgg attctttccc gcagagagaa atagaggaag aatttcagat 5640

gctcatttta aagataaaag aatacttgaa aagaaggggg ggtgggagga aagtatgaca 5700

gagaaatcag ctaaatgctg cccccagctt acacttcctt agaagggaaa gggaagggaa 5760

agctactcct gaaagaaaag ctaaccgaag cagagcagtc ccaccctcaa gacaggcaca 5820

gagctagctc tcacatgcta aagtacagat gcagaaacct cttgcattgg gatcagcctt 5880

ggataaaaat aagtcggtga aagacagact gcaaagctca atgtggccag cagaggcccc 5940

tagtcagcaa caaggaaaac tctcacgcta accagacaaa caatacagac tcagcaaaaa 6000

cataaacgga aggatgtgcc cacaagttca cctgaccctc ttcctccgtg agtgtgcttt 6060

tctgaagagg cagctccaac actgcctcac atcttcctct ctattgtttt ctttgtgtat 6120

tcccccacaa tactcgctta gcaggatttt tactgtatgt atttggggtg gatatatgtg 6180

tgtgtgtgtg tgtgtgtgtg tgtgtgtgtg tgtgtgtgtg tgtgcatgtg tgtgtgtgtg 6240

tgtgtgtgtg tgtattgtta tctcttttca tacaatcatt taattttgtt cgtgcgtttt 6300

ttcagtttag agcaggtttt tttccttagt ttctttcttt tttccttgtt tactcctgtg 6360

tcccttacac atacacacac gcacacacac acacacacac acgtattcat acttctaatt 6420

gttttatact tttcttaagt tttacctttt tctcttctag tttttggttg tcaacgcttt 6480

cattattgtt aagtcttttt tttccctact tttccttttt cccaagtcta gaaaaagaaa 6540

cagacagtga aataaaaaag gaattgagaa ctctaaacag acttcacaag agaaaatcct 6600

cttcactcca ttttataatc agaaaattaa aaaaaaaaaa tgttaagcaa agaacaaatg 6660

ttaggaaccg tagggggaca ccagctcatg cacgggacac aaattccaga gcacacaaat 6720

cctcccctct gcggtcctaa aagccaggaa agtacgaaat gatgcccttc aattcggaaa 6780

gtaaatacca tctaaccacg ctttaaattg atagcaaagc tactcgtgta acaagcaatc 6840

tataagtgag ttcgtgactg ccaagactac actacaagat agtttttaaa attctttaca 6900

gaaaaggaag aatgacaccg gccatcacag aggcacagga aagactgggt ttcatgagag 6960

gaatctatgt cctggattgg gagaaataac gtgtgaaatg ttgtactaaa aaacacaatc 7020

ttcagattta atgctatcac catcatggtt ctagtgacat tctttacaga actagaaaga 7080

taatactaag cttgtatgga aacacaaaag accatgagta ggctaagcag gacaaaccct 7140

acatcacatc acatcacatc acatcactga aactcacatt atcccacata agtgtaatga 7200

caaagagagt aaggtgcatc cacaaaagca gacagagaac aatgaactgg aagagggccc 7260

ataacctgca cttctgtgga 7280

<210> 14

<211> 33

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述:合成的

寡核苷酸

<400> 14

tataactcga gaacaggaac cctaaaacgg aac 33

<210> 15

<211> 33

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述:合成的

寡核苷酸

<400> 15

ttaaactcga gaaaccaggc aagaggagtc cat 33

<210> 16

<211> 38

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述:合成的

寡核苷酸

<400> 16

acaacgtcga cagctctata gagattctct ctaaaagt 38

<210> 17

<211> 31

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述:合成的

寡核苷酸

<400> 17

taatagtcga cagaatgagt ccagcactct c 31

<210> 18

<211> 26

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述:合成的

寡核苷酸

<400> 18

tttgaattag cattcaccat acttaa 26

<210> 19

<211> 26

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述:合成的

寡核苷酸

<400> 19

gtgtttcagt catatgcaga acattc 26

<210> 20

<211> 25

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述:合成的

寡核苷酸

<400> 20

agtatccatc atggctgatg caatg 25

<210> 21

<211> 24

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述:合成的

寡核苷酸

<400> 21

ctcagaagaa ctcgtcaaga aggc 24

<210> 22

<211> 27

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述:合成的

寡核苷酸

<400> 22

cctgtgaatc caatgaatac gaattcc 27

<210> 23

<211> 22

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述:合成的

寡核苷酸

<400> 23

aaaccaggca agaggagtcc at 22

<210> 24

<211> 25

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述:合成的

寡核苷酸

<400> 24

caccgtccag gaccagcagg gggcg 25

<210> 25

<211> 25

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述:合成的

寡核苷酸

<400> 25

caccgaaacc tcctgcagag catcc 25

<210> 26

<211> 160

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述:合成的

多核苷酸

<400> 26

tgaaggtggg ttggaggttg gagacaattt tacaggctgt aactctgtat ttcacaactc 60

cagagcatcc aggaccagca gggggcgcgg agagcacaca caggaggttt tagtttgagc 120

tcacagtaac ttttgctcat tgtgtgtctt gcacagtaat 160

<210> 27

<211> 24

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述:合成的

寡核苷酸

<400> 27

caccgaccct gggatgtcat ggtt 24

<210> 28

<211> 144

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述:合成的

多核苷酸

<400> 28

aaacacagtg agggaagtcc attatgaact tgaacaaaaa tttcactaga aagatgatca 60

cgcgacgaga aggctagcag gcggcaacca tgacatccca gggtcactgc agaatctagg 120

tcagctggct ccattttttg ttta 144

<210> 29

<211> 24

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述:合成的

寡核苷酸

<400> 29

caccgtgttc tcttcgcctc cttc 24

<210> 30

<211> 146

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述:合成的

多核苷酸

<400> 30

cagcactctc tttcctccag gtcttcctga atgggctgta acactcagta actattagat 60

ttgagagatc tcactgcccc cttctggtca gggggtcctt ataggaggtt tgtgtttgag 120

ctcacagtaa cattcactca ctgtgt 146

<210> 31

<211> 25

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述:合成的

寡核苷酸

<400> 31

caccgtgtca actaacctgt acacc 25

<210> 32

<211> 25

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述:合成的

寡核苷酸

<400> 32

aaacggtgta caggttagtt gacac 25

<210> 33

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述:合成的

寡核苷酸

<400> 33

ggaaaactct gtaggactac 20

<210> 34

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述:合成的

寡核苷酸

<400> 34

tgggacatgt aaactgtaac 20

<210> 35

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述:合成的

寡核苷酸

<400> 35

gaataggtct tttatctgaa 20

<210> 36

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述:合成的

寡核苷酸

<400> 36

gagcaatata cctgagtctg 20

<210> 37

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述:合成的

寡核苷酸

<400> 37

ccctcaggga caaatatcca 20

<210> 38

<211> 21

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述:合成的

寡核苷酸

<400> 38

ctgcaatgct cagaaaactc c 21

<210> 39

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述:合成的

寡核苷酸

<400> 39

aaatagaaga tgaaatggaa gatttgaagg 30

<210> 40

<211> 28

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述:合成的

寡核苷酸

<400> 40

tgagaaacac caatattgtc aactaacc 28

<210> 41

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述:合成的

寡核苷酸

<400> 41

aagaggaggg ggagaggatg 20

<210> 42

<211> 23

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述:合成的

寡核苷酸

<400> 42

ttgtaaggta aacgaggaat ggg 23

<210> 43

<211> 25

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述:合成的

寡核苷酸

<400> 43

aggaaagaga gtgctggact cattc 25

<210> 44

<211> 28

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述:合成的

寡核苷酸

<400> 44

gcctctctac agatgttatc tttacaag 28

<210> 45

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述:合成的

寡核苷酸

<400> 45

ggttatgtaa gaaattgaag gactttagtg 30

<210> 46

<211> 28

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述:合成的

寡核苷酸

<400> 46

ctctattatt cttccctctg attattgg 28

<210> 47

<211> 25

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述:合成的

寡核苷酸

<400> 47

ctcaaaacag tcgctaaagt tctcg 25

<210> 48

<211> 25

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述:合成的

寡核苷酸

<400> 48

gaggtccatc tgtcattcac ttgtg 25

<210> 49

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述:合成的

寡核苷酸

<400> 49

gctcctgaag agcttaagtt 20

<210> 50

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述:合成的

寡核苷酸

<400> 50

gaggaatcta tgtcctggat 20

<210> 51

<211> 83

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述:合成的

寡核苷酸

<400> 51

cacaatgagc aaaagttact gtgagctcaa actaaaacct cctgcagagc atccaggacc 60

agcagggggc gcggagagca cac 83

<210> 52

<211> 83

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述:合成的

寡核苷酸

<400> 52

cacaatgagc aaaagttact gtgagctcaa actaaaacct cctgcagagc atccgaggcg 60

agcggccgca gaggagagca cac 83

<210> 53

<211> 49

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述:合成的

寡核苷酸

<400> 53

tcctgcagag catccaggac cagcaggggg cgcggagagc acacagagt 49

<210> 54

<211> 24

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述:合成的

寡核苷酸

<400> 54

tcctgcagag caagcacaca gagt 24

<210> 55

<211> 49

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述:合成的

寡核苷酸

<400> 55

tcctgcagag catccaggac cagcaggggg cgcggagagc acacagagt 49

<210> 56

<211> 49

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述:合成的

寡核苷酸

<400> 56

tcctgtgtgt gctctccgcg ccccctgctg gtcctggatg ctctggagt 49

<210> 57

<211> 54

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述:合成的

寡核苷酸

<400> 57

acaaaaattt ccactagaaa gatgatcagg accagcaggg ggcagtgaag ccca 54

<210> 58

<211> 54

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述:合成的

寡核苷酸

<400> 58

acaaaaattt ccactagaaa gatgatcacg cgacgagaag gctagcaggc ggca 54

<210> 59

<211> 39

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述:合成的

寡核苷酸

<400> 59

cacagtgagt gaatgttact gtgagctcaa acacaaacc 39

<210> 60

<211> 55

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述:合成的

寡核苷酸

<400> 60

acacaaacct cctataagga ccccctgacc agaaggaggc gaagagaaca ctcaa 55

<210> 61

<211> 55

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述:合成的

寡核苷酸

<400> 61

acacaaacct cctataagga ccccctgacc agaagggggc agtgagatct ctcaa 55

<210> 62

<211> 60

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述:合成的

寡核苷酸

<400> 62

aaacctcctg cagagcatcc aggaccagca gggggcgcgg agagcacaca gagttgtgaa 60

<210> 63

<211> 60

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述:合成的

寡核苷酸

<400> 63

aaacctcctg cagagcatcc gaggcgagcg gccgcagagg agagcacaca gagttgtgaa 60

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号