首页> 中国专利> 生物活性核酸酶的快速体内鉴定

生物活性核酸酶的快速体内鉴定

摘要

本文公开了用于对特异性裂解靶序列的核酸酶进行快速鉴定和评级的方法和组合物。

著录项

  • 公开/公告号CN101883863A

    专利类型发明专利

  • 公开/公告日2010-11-10

    原文格式PDF

  • 申请/专利权人 桑格摩生物科学股份有限公司;

    申请/专利号CN200880115941.2

  • 发明设计人 Y·多恩;F·诺弗;

    申请日2008-09-25

  • 分类号C12Q1/34;G01N33/573;

  • 代理机构上海专利商标事务所有限公司;

  • 代理人韦东

  • 地址 美国加利福尼亚州

  • 入库时间 2023-12-18 01:00:57

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2018-01-23

    授权

    授权

  • 2010-12-22

    实质审查的生效 IPC(主分类):C12Q1/34 申请日:20080925

    实质审查的生效

  • 2010-11-10

    公开

    公开

说明书

在联邦资助研究下的发明权利声明

不适用。

技术领域

本发明属于基因组工程和核酸酶鉴定的领域。背景技术

据显示被工程化以特异性结合靶位点的核酸酶可用于基因组工程中,所述核酸酶包括锌指核酸酶和归巢核酸内切酶,如SceI。例如,锌指核酸酶(ZFN)是包含融合至核酸酶结构域的工程化位点特异性锌指的蛋白。这种ZFN已成功用于多种不同物种中的基因组修饰。参见,例如美国专利公开20030232410;20050208489;20050026157;20050064474;20060188987;20060063231;以及国际公布WO 07/014275,其公开内容为所有目的通过引用全文并入本文。这些ZFN可用于在靶核苷酸序列中产生双链断裂(DSB),这使靶基因座同源重组的频率增加了1000多倍。此外,通过非同源末端连接(NHEJ)进行的位点特异性DSB的不准确修复也可能导致基因中断。这两类DSB的产生导致了任意大的区域的缺失。

目前一般使用用于鉴定工程化锌指蛋白的体外测定来鉴定对于特定的靶特异性的ZNF。参见,例如美国专利公开第20050064474号。然而这些体外测定是耗时且费力的。此外,尽管体外方法准确鉴定了具有所需结合活性的ZFP,但是ZFN的结构和活细胞中靶基因座的染色质基本结构在一些情况下可能会干扰这些体外测定准确预测体内ZFN活性的能力。

已经使用体内筛选测定,尤其是在酵母宿主细胞中,来选择与靶位点结合而不与它们的同源结合位点结合的归巢核酸内切酶。参见,例如Chames等人(2005)Nucleic Acids Res 33(20):e178;Arnould等人(2006)J.Mol.Biol.355:443-458;和美国专利公开第20070117128;20060206949;20060153826;20060078552;以及20040002092号。然而,这些方法没有广泛应用于任一核酸酶,包括锌指核酸酶。此外,之前所描述的体内方法不能从已知结合特定靶位点的一组核酸酶中,或从已知结合特定基因组区域内的一组位点的一组核酸酶中鉴定生物活性核酸酶。相反,这些之前所描述的体内筛选测定使用随机产生的突变归巢核酸内切酶的文库来鉴定与具体的特定靶位点结合的蛋白。因此,之前所述的分析不能由已知结合特定靶的一批核酸酶,或由已知结合更宽的基因组区域内的一组不同靶的一批核酸酶来预测体内功能。这些分析也不能准确确定对宿主细胞毒性最小的核酸酶。

因此,仍需要鉴定特定核酸酶的其他分析,尤其是鉴定有功能的特异性靶向的核酸酶的高通量体内分析。

发明概述

本发明涉及核酸酶例如工程化大范围核酸酶和锌指核酸酶(ZFN)的开发。具体地,本文所描述的是用于对生物活性的工程化核酸酶进行有效筛选、鉴定和评级的组合物和方法。此外,本文所描述的测定系统使得能够快速进行这些核酸酶的毒性筛选。

本文所描述的用于特定靶基因的高活性和特异性的铅核酸酶的快速鉴定显著降低了关于通常在多种细胞类型和有机体中进行的重复和耗时的实验相关的缺点。

在一个方面,本文描述的是通过一种或多种核酸酶检测靶序列的双链裂解的报道构建体。报道构建体包含由核酸酶识别的靶序列隔开的报道基因的重叠序列和非功能性报道序列。报道基因的5’区域可以可操作地连接至组成型或诱导型启动子。报道基因可以编码酶蛋白,例如Mell。宿主细胞中报道构建体的表达产生了可通过适当测定例如通过对完整或裂解的细胞进行的比色或酶测定来测量的信号。在某些实施方式中,报道基因的活性通过测定分泌蛋白(例如,报道基因的产物本身或活性报道基因产物直接或间接产生的产物)的水平来测定。在某些实施方式中,报道构建体还包含在离散型报道基因序列旁侧的同源区和/或选择标记物。同源区可以是宿主细胞基因组任何区域,如酵母中的HO基因座。任选地,还可以包含第二报道基因,例如仅在存在双链断裂的条件下转录的报道基因。在某些实施方式中,报道构建体包含图2或图9中所示的构建体。

在另一方面,本文所描述的是包含本文所描述的任何报道构建体的宿主细胞(或宿主细胞群)宿主细胞通常包含加工双链断裂产生重叠单链序列的细胞机制(内源或外源),所述重叠单链序列经由单链退火修复而被修复。在某些实施方式中,宿主细胞为酵母细胞,例如酿酒酵母(S.cerevisiae)。报道构建体可以在宿主细胞内瞬时表达。或者,报道构建体可以稳定整合到宿主细胞基因组中。

在又一方面,提供了鉴定在特定靶位点诱导裂解的核酸酶的方法。在某些实施方式中,所述方法包括:将一种或多种核酸酶和/或编码核酸酶或核酸酶对的一种或多种核酸酶表达构建体引入包含本文所描述的报道构建体的宿主细胞中,所述报道构建体包含核酸酶所识别的靶序列;在使核酸酶表达的条件下孵育细胞;测量细胞内报道基因表达的水平,其中报道基因表达水平的增加与靶序列的增加的核酸酶诱导裂解相关。核酸酶可以包含,例如非天然存在的DNA结合结构域(例如,工程化锌指蛋白或来自归巢核酸内切酶的工程化DNA结合结构域)。在某些实施方式中,核酸酶为锌指核酸酶(ZFN)或ZFN对。

在又一方面,提供了评定一组核酸酶在特异性靶位点诱导裂解的活性的方法。所述方法包括:将该组核酸酶和/或编码该组核酸酶的表达构建体引入不同的宿主细胞,所述宿主细胞每个都包含本文所描述的报道构建体,所述报道构建体包含核酸酶识别的靶序列;在使核酸酶表达的条件下孵育细胞;测量细胞中报道基因表达的水平;以及根据宿主细胞中诱导的报道基因活性水平对核酸酶进行评级。在某些实施方式中,所述核酸酶包含ZFN或ZFN对。在其他实施方式中,所述核酸酶包含具有工程化DNA结合结构域的归巢核酸内切酶和/或归巢核酸酶的DNA结合结构域与异源核酸酶裂解结构域的融合体。

在另一方面,提供预测核酸酶体内裂解活性的方法。所述方法包括:将核酸酶和或编码核酸酶的表达构建体引入包含本文所述的报道构建体的宿主细胞中,所述报道构建体包含核酸酶识别的靶序列;在使核酸酶表达的条件下孵育细胞;测量细胞中报道基因表达的水平;其中较高的报道基因表达水平预示着核酸酶在体内有活性。在某些实施方式中,所述核酸酶包含ZFN或ZFN对。在其他实施方式中,所述核酸酶包含具有工程化DNA结合结构域的归巢核酸内切酶和/或归巢核酸酶的DNA结合结构域与异源核酸酶裂解结构域的融合体。

在又一方面,提供测定核酸酶引起的对宿主细胞的毒性作用的方法。所述方法包括:将核酸酶和/或编码一种或多种核酸酶的一种或多种表达构建体引入宿主细胞;在使核酸酶表达的条件下孵育细胞;培养细胞一段时间;在不同时间间隔测量培养物中细胞的生长。在某些实施方式中,细胞生长通过分光光度法测定,例如通过在适当波长(例如,OD600nm)下测定培养细胞的光密度(OD)来测定。测定细胞生长的时间间隔可以为:例如将核酸酶表达框引入(或诱导)后数小时或数天(例如,2天、3天、4天、5天、6天、7天、8天、9天、10天或甚至更长时间)。核酸酶可以包含ZFN、ZFN对、具有工程DNA结合结构域的大范围核酸酶、或天然存在的或工程化的大范围核酸酶DNA结合结构域与异源裂解结构域的融合体。此外,所述方法可以在包含核酸酶所识别的靶序列(例如,本文所描述的报道构建体)的宿主细胞中进行。可选择地,所述方法可以在不含核酸酶所识别的靶序列的宿主细胞中进行,因为在存在或不存在其靶序列的情况下毒性核酸酶会使酵母生长延缓。

在另一方面,提供选择生物活性核酸酶(例如ZFN、ZFN对或归巢核酸酶)的方法。所述方法包括:通过本文所描述的任何方法测定核酸酶或在所选靶位点裂解的核酸酶;并使用本文所描述的任何方法测定核酸酶的毒性,其中选择显示裂解活性和低毒性的生物活性核酸酶。

在本文所描述的任何方法中,报道基因活性水平可以直接测量,例如通过直接测定报道基因产物(例如,GFP荧光)的水平来测量。可选择地,报道基因水平可以通过测量需要报道基因所编码的蛋白的功能的反应的下游产物(例如,酶产物)水平来测定。此外,在这些方法的任何一种中,核酸酶的表达可以由组成型或诱导型启动子启动。另外,例如来自获得自体外测定实验的结果,在本文所描述的方法的任何一种中,可能已知核酸酶(例如,ZFN、ZFN对、工程化归巢核酸内切酶和/或天然存在或工程化归巢核酸内切酶DNA结合结构域和异源裂解结构域的融合体)识别靶序列。

附图说明

图1是描绘使用基于单链退火(SSA)的报道系统检测ZFN活性的示意图。“PGAL1”是指启动锌指核酸酶(ZFN1或ZFN2)表达的GAL1启动子;“CYC1t”是指CYC1转录终止子;“HIS3”是指补充酵母中特定营养缺陷型突变(His表型)的野生型酵母基因HIS3;“LEU2”是指补充酵母中特定营养缺陷型突变(Leu表型)的野生型酵母基因LEU2;“HO-L”是指将报道基因靶向HO基因座的报道构建体的左侧同源臂;“HO-R”是指将报道基因靶向HO位点的报道构建体的右侧同源臂;“PPGK1”是指PGK1启动子的一部分;“MEL”和“EL1”是指当可操作地连接时编码功能性Mell酶的序列;“靶”是指含有ZFN的靶位点的序列;“KanMX”是指编码卡那霉素抗性的序列;“ChrIV”是指染色体IV;“DSB”是指双链断裂加工;“SSA”是指单链退火。

图2是描述示例性SSA MEL1报道构建体的示意图。

图3显示由靶向NME1基因座的各种ZFN所获得的体外结合数据。

图4,图A和B,是显示对NME-ZFN的SSA退火测定和毒性研究的结果的图。图4A显示了含有MEL1报道构建体的酵母细胞中x轴上所示的ZFN对的MEL1活性,该MEL1报道构建体具有插入的NME1靶序列。最左侧的柱显示在用半乳糖诱导具有所示ZFN对的ZFN表达之前酵母细胞中的MEL1活性;左侧第2列柱显示诱导所示ZFN对表达后2小时酵母细胞中的MEL1活性;右侧第2列柱显示诱导所示ZFN对表达后4小时酵母细胞中的MEL1活性;最右侧柱显示在诱导所示ZFN对表达后6小时酵母细胞中的MEL1活性。

图4B描述在引入x轴上所示的靶向NME1的ZFN对后的不同时间通过在OD600处的分光光度法测量的含有MEL1报道构建体的酵母宿主细胞的生长,该MEL1报道构建体含有NME1靶序列。最左侧柱显示用所示ZFN对转染之前酵母细胞的OD600;左侧第2列柱显示引入所示ZFN对后23小时酵母细胞的OD600;右侧第2列柱显示引入所示ZFN对后27小时酵母细胞的OD600;最右侧柱显示引入所示ZFN对后30小时酵母细胞的OD600

图5是显示所选的靶向NME1的ZFN对在人类K562细胞中的活性的印迹图。非同源末端连接(NHEJ)的百分比显示在每个泳道下面。

图6是显示靶向NME1的ZFN对13674和13677在人类K562细胞中活性的印迹图。“GFP”是指绿色荧光蛋白阴性对照;“D2”是指引入ZFN对后2天的活性;“D9”是指引入ZFN对后9天的活性;并且“+”是指阳性对照。信号百分比显示在每个泳道下面。

图7,图A和B,是显示对PD1-ZFN的SSA退火测定和毒性研究的结果的图。图7A显示含有MEL1报道构建体的酵母细胞中x轴所示的ZFN对的MEL1活性,该MEL1报道构建体具有插入的PD1靶序列。左侧柱显示在诱导所示ZFN对表达之前酵母细胞中的MEL1活性,右侧柱显示诱导所示ZFN对表达后6小时酵母细胞中的MEL1活性。

图7B描述在引入x轴上所示的靶向NME1的ZFN对后的不同时间通过在OD600处的分光光度法测量的含有MEL1报道构建体的酵母宿主细胞的生长,该MEL1报道构建体含有PD1靶序列。左侧柱显示用所示的ZFN对转染之前酵母细胞的OD600,右侧柱显示引入所示ZFN对后30小时酵母细胞的OD600

图8是描述示例性SSA MEL1逆选择SSA报道构建体的示意图。

图9,图A和B,是显示靶向斑马鱼golden基因的ZFN的SSA退火测定和毒性研究的结果的图。图9A显示了含有MEL1报道构建体的酵母细胞中x轴上所示的ZFN对的MEL1活性,该MEL1报道构建体具有插入的golden靶序列。最左侧柱显示在用半乳糖诱导所示ZFN对的ZFN表达之前酵母细胞中的MEL1活性;左侧第2列柱显示诱导所示ZFN对表达后2小时酵母细胞中的MEL1活性;右侧第2列柱显示诱导所示ZFN对表达后4小时酵母细胞中的MEL1活性;最右侧柱显示在诱导所示ZFN对表达后6小时酵母细胞中的MEL1活性。

图9B描述在引入x轴上所示的靶向golden的ZFN对后的不同时间通过在OD600处的分光光度法测量的含有MEL1报道构建体的酵母宿主细胞的生长,该MEL1报道构建体含有斑马鱼golden靶序列。最左侧柱显示用所示ZFN对转染之前酵母细胞的OD600;左侧第2列柱显示引入所示ZFN对后23小时酵母细胞的OD600;右侧第2列柱显示引入所示ZFN对后27小时酵母细胞的OD600;最右侧柱显示引入所示ZFN对后30小时酵母细胞的OD600

图10,图A和B,是显示靶向的斑马鱼notail基因的ZFN的SSA退火测定和毒性研究的结果的图。图10A显示了含有MEL1报道构建体的酵母细胞中x轴上所示的ZFN对的MEL1活性,该MEL1报道构建体具有插入的notail靶序列。最左侧柱显示在用半乳糖诱导所示ZFN对的ZFN表达之前酵母细胞中的MEL1活性;左侧第2列柱子显示诱导所示ZFN对表达后2小时酵母细胞中的MEL1活性;右侧第2列柱子显示诱导所示ZFN对表达后4小时酵母细胞中的MEL1活性;最右侧柱子显示在诱导所示ZFN对表达后6小时酵母细胞中的MEL1活性。

图10B描述在引入x轴上所示的靶向notail的ZFN对后的各时间通过在OD600处的分光光度法测量的含有MEL1报道构建体的酵母宿主细胞的生长,该MEL1报道构建体含有斑马鱼notail靶序列。最左侧柱子显示用所示ZFN对转染之前酵母细胞的OD600;左侧第2列柱子显示引入所示ZFN对后23小时酵母细胞的OD600;右侧第2列柱子显示引入所示ZFN对后27小时酵母细胞的OD600;最右侧柱子显示引入所示ZFN对后30小时酵母细胞的OD600

图11显示golden基因中断后斑马鱼胚胎的着色。顶部的图显示野生型生物。顶部第二张图显示当golden基因如Lamason等人(2005)Science310(5755):1782-6中所述突变时的斑马鱼胚胎。底部最左侧图显示golb1+/-背景的斑马鱼的眼睛着色。底部右侧三张图显示用5ng针对golden基因的ZFN mRNA注射的golb1+/-斑马鱼中的眼睛着色。

图12,图A至D,显示在notail/Brachyury(ntl)基因中断时斑马鱼胚胎的尾巴形成。图12A显示野生型斑马鱼胚胎。图12B显示当notail基因如Amacher等人(2002)Development 129(14):3311-23中所述突变时的斑马鱼胚胎。图12C显示ntl+/-基因型的斑马鱼胚胎,图12D显示用5ng针对notail基因的ZFN mRNA注射的ntl+/-基因型的斑马鱼胚胎。

图13是显示在逆选择培养基(5-FOA)中选择和在ura-培养基中阴性选择之后表达各种ZFN构建体的酵母报道菌株生长测定结果的图。用空表达载体(“载体”)、ZFN(“8266”)或具有5个不同连接子序列的相同ZFN的库(“库”)转化酵母细胞。图的左侧部分显示在存在5-FOA的条件下的生长。图的右侧部分显示在不存在尿嘧啶的条件下的酵母细胞生长。各标记的柱显示在ZFN诱导所指示的时间后的生长。左侧柱(t=0)显示没有ZFN诱导的生长;中间的柱子显示在诱导ZFN 6小时(t=6)时的生长,右侧柱显示在诱导ZFN 24小时(t=24)时的生长。

发明详述

本文描述了用于鉴定功能性核酸酶的高通量体内筛选系统的组合物和方法。具体地,该测定使用报道系统来监控核酸酶在它们的靶位点诱导双链断裂的能力。此外,该测定可用于测定核酸酶对细胞生长的影响(毒性)。

工程化核酸酶技术基于天然存在的DNA结合蛋白的工程化。例如,已经描述了具有特定的DNA结合特异性的归巢核酸内切酶的工程化。Chames等人(2005)Nucleic Acids Res 33(20):e178;Arnould等人(2006)J.Mol.Biol.355:443-458。此外也描述了ZFP的工程化。参见,例如美国专利第6,534,261;6,607,882;6,824,978;6,979,539;6,933,113;7,163,824;以及7,013,219号。

此外,将ZFP连接到核酸酶结构域以产生ZFN-能够通过其功能化(ZFP)DNA结合结构域识别其预期基因靶的功能性实体,并且核酸酶导致基因在ZFP结合位点附近被切断。参见,例如Kim等人(1996)Proc NatlAcad Sci USA 93(3):1156-1160。最近,ZFN在多种生物中被用于基因组修饰。参见,例如美国专利公开20030232410;20050208489;20050026157;20050064474;20060188987;20060063231;以及国际公布WO 07/014275。

尽管已很好地表征了容许结合特定DNA序列的ZFP工程化的规则并准确鉴定了特异性ZFP,但这些相同的ZFP在整合到一个ZFN中时可能不以相等的亲和力和/或特异性结合。例如,可能染色体基质可以影响活细胞中核酸酶结构域的精确二聚化,从而消除裂解的可能,并且给定基因组基因座的精确染色质结构会不同地影响ZFN结合和裂解它们的预期靶序列的能力。此外,即便不是不可能,体外分析也很难模拟所设计的DNA结合结构域在与染色质形式的细胞基因组一起存在时服从的检索参数。结果,需要在相关生物或细胞系中测量大量变体以鉴定显示基因修饰的最佳表征的ZFN。

此外,由于每个体内系统具有其自身的特性,所以需要开发测定ZFN作用的特异性检测测定。因此,与之前所描述的筛选结合特异性与天然存在的归巢核酸内切酶不同的归巢核酸内切酶的体内筛选方法不同,本文所描述的方法提供对已知结合特定靶位点的核酸酶分级的快速且有效的方法,其通过预测它们的体内功能以及核酸酶对宿主细胞的毒性而进行。

因此,本文所描述的方法和组合物提供了鉴定在体内具有生物活性的核酸酶的高效且快速的方法。除了准确预测体内核酸酶的功能外,本文所描述的分析还可以用于测定核酸酶的毒性,从而使得能够鉴定最安全且功能活性最强的蛋白。

概述

除非另外指明,否则本文所公开的方法以及组合物的制备和用途的实行采用了分子生物学、生物化学、染色质结构和分析、计算化学、细胞培养、重组DNA和本领域的技术人员已知的相关领域内的常规技术。这些技术已在文献中完整地说明。参见,例如Sambrook等人MOLECULARCLONING:A LABORATORY MANUAL(分子克隆:实验手册),第二版,Cold Spring Harbor Laboratory Press,1989以及第三版,2001;Ausubel等人,CURRENT PROTOCOLS IN MOLECULAR BIOLOGY(现代分子生物学实验技术),John Wiley&Sons,New York,1987并且定期更新;METHODS INENZYMOLOGY(酶学方法)丛书,Academic Press,San Diego;Wolffe,CHROMATIN STRUCTURE AND FUNCTION(染色质结构及功能),第三版,Academic Press,San Diego,1998;METHODS IN ENZYMOLOGY(酶学方法),第304卷,“Chromatin(染色质)”(P.M.Wassarman和A.P.Wolffe编辑),Academic Press,San Diego,1999;以及METHODS INMOLECULAR BIOLOGY(分子生物学方法),第119卷,“ChromatinProtocols(染色质流程)”(P.B.Becker,ed.)Humana Press,Totowa,1999。

定义

术语“核酸”、“多核苷酸”和“寡核苷酸”可互换使用,是指线性或环形构象的单链或双链形式的脱氧核糖核酸聚合物或核糖核酸聚合物。为了本发明的目的,这些术语不应理解为限制了聚合物的长度。这些术语可以涵盖天然核苷酸的类似物以及在碱基、糖和/或磷酸部分(例如,硫代磷酸骨架)被修饰的核苷酸。一般而言,特定核苷酸的类似物具有相同的碱基配对特异性;即,A的类似物将与T碱基配对。

术语“多肽”、“肽”和“蛋白”可互换使用,是指氨基酸残基的聚合物。这些术语还应用于其中一个或多个氨基酸是相应的天然存在的氨基酸的化学类似物或修饰衍生物的氨基酸聚合物。

“结合”是指大分子之间(例如,蛋白与核酸之间)的序列特异性的非共价相互作用。并非结合相互作用的所有组分都需要是序列特异性的(例如,在DNA骨架中与磷酸残基的接触),只要相互作用作为整体是序列特异性的即可。此类相互作用一般由10-6M-1或更低的解离常数(Kd)来表征。“亲和力”是指结合的强度:较高的结合亲和力与较低的Kd相关。

“结合蛋白”是能够非共价地结合另一分子的蛋白。结合蛋白可以结合例如DNA分子(DNA结合蛋白)、RNA分子(RNA结合蛋白)和/或蛋白分子(蛋白结合蛋白)。在蛋白结合蛋白的情况下,它可以自身相结合(形成同源二聚体、同源三聚体等)和/或它可以结合不同的一种或多种蛋白的一个或多个分子。结合蛋白可以具有大于一种的结合活性形式。例如,锌指蛋白具有DNA-结合活性、RNA结合活性和蛋白结合活性。

“锌指DNA结合蛋白”(或结合结构域)为蛋白或较大蛋白内的结构域,其通过一个或多个锌指以序列特异性方式结合DNA,锌指为其结构通过锌离子配位而稳定的结合结构域内的氨基酸序列区域。术语锌指DNA结合蛋白通常缩写为锌指蛋白或ZFP。

锌指结合结构域可以为“工程化的”以结合预定的核苷酸序列。用于工程化锌指蛋白的方法的非限制性实例为设计和选择。设计的锌指蛋白是其设计/组成主要由合理的标准得到的非天然存在的蛋白。设计的合理标准包括取代规则和储存现有ZFP设计和结合数据的信息的数据库中信息加工的计算算法的应用。参见,例如美国专利6,140,081;6,453,242;和6,534,261;还参见WO 98/53058;WO 98/53059;WO 98/53060;WO 02/016536和WO 03/016496。

“选择的”锌指蛋白是自然界中未发现的蛋白,其产生主要来自于实验过程(如噬菌体展示、相互作用陷阱(interaction trap)或杂交选择)。参见,例如US 5,789,538;US 5,925,523;US 6,007,988;US 6,013,453;US6,200,759;WO 95/19431;WO 96/06166;WO 98/53057;WO 98/54311;WO 00/27878;WO 01/60970WO 01/88197和WO 02/099084。

“裂解”是指DNA分子共价骨架的断裂。裂解可以由多种方法启动,包括但不限于磷酸二酯键的酶或化学水解。单链裂解和双链裂解都是可能的,双链裂解可能是作为两个不同的单链裂解事件的结果而发生。DNA裂解可能导致平末端或交错末端的产生。在某些实施方式中,融合多肽用于靶向的双链DNA裂解。

“裂解半结构域(half-domain)”是与第二多肽(相同或不同的)轭合形成具有裂解活性(优选双链裂解活性)的复合体的多肽序列。术语“第一和第二裂解半结构域”;“+和-裂解半结构域”和“右和左裂解半结构域”可以互换使用,指二聚体化的裂解半结构域对。

“工程化裂解半结构域”为经修饰以与另一裂解半结构域(例如,另一工程化裂解半结构域)形成专性异源二聚体的裂解半结构域。还参见,美国专利第10/912,932和11/304,981号和美国临时专利申请第60/808,486号(2006年5月25日提交),其通过引用全文并入本文。

“染色质”是包含细胞基因组的核蛋白结构。细胞染色质包含核酸(主要是DNA)和蛋白(包括组蛋白和非组蛋白染色体蛋白)。大部分的真核细胞染色质以核小体形式存在,其中核小体核心包含与八聚体结合的约150个碱基对的DNA,该八聚体含有组蛋白H2A、H2B、H3和H4各两个;并且连接子DNA(长度取决于生物而变化)在核小体核心之间延伸。组蛋白H1分子通常与连接子DNA结合。为了本发明的目的,术语“染色质”意指涵盖原核和真核的所有类型的细胞核蛋白。细胞染色质包括染色体染色质和附加体染色质。

“染色体”是包含细胞基因组的全部或部分的染色质复合体。细胞基因组通常由其核型来表征,核型为包含细胞基因组的所有染色体的集合。细胞基因组可以包含一个或多个染色体。

“附加体”是包含不是细胞染色体核型的一部分的核酸的复制核酸、核蛋白复合体或其他结构。附加体的实例包括质粒和某些病毒基因组。

“靶位点”或“靶序列”是界定在足以结合的条件存在时结合分子所结合的核酸部分的核酸序列。例如,序列5’-GAATTC-3’是Eco RI限制性核酸内切酶的靶位点。

“外源”分子是非正常存在于细胞中,但是可以通过一种或多种遗传、生物化学或其他方法引入细胞的分子。“正常存在于细胞中”的确定与细胞的特定发育阶段和环境条件相关。因此,例如仅在肌肉胚胎发育阶段存在的分子对于成人肌肉细胞来说是外源分子。类似地,热休克诱导的分子对于非热休克细胞来说是外源分子。外源分子可以包括:例如功能障碍性内源分子的功能性形式或正常功能性内源分子的功能障碍性形式。

除了其他的以外,外源分子可以是:小分子,如由组合化学工艺产生的;或大分子,如蛋白、核酸、碳水化合物、脂、糖蛋白、脂蛋白、多糖、上述分子的任何修饰衍生物或包含上述分子中的一种或多种的任何络合物。核酸包括DNA和RNA,它可以是单链或双链的;可以是直链、支链或环形的;并且可以为任何长度。核酸包括能够形成二倍体的那些以及形成三倍体的核酸。参见,例如美国专利第5,176,996和5,422,251号。蛋白包括但不限于:DNA结合蛋白、转录因子、染色质重构因子、甲基化DNA结合蛋白、聚合酶、甲基酶、脱甲基酶、乙酰基转移酶、脱乙酰基酶、激酶、磷酸酶、整合酶、重组酶、连接酶、拓扑异构酶、促旋酶和解旋酶。

外源分子可以为与内源分子相同类型的分子,例如,外源蛋白或核酸。例如,外源核酸可以包括:感染的病毒基因组、引入细胞的质粒或附加体、非正常存在于细胞中的染色体。将外源分子引入细胞中的方法是本领域的那些技术人员所已知的,包括但不限于脂质介导的转移(即,脂质体,包括中性和阳离子脂质)、电穿孔、直接注射、细胞融合、粒子轰击、磷酸钙共沉淀、DEAE-葡聚糖介导的转移和病毒载体介导的转移。

相反,“内源”分子是在特定环境条件下正常存在于特定发育阶段的特定细胞中的分子。例如,内源核酸可以包含染色体,线粒体、叶绿体或其他细胞器的基因组或天然存在的附加体核酸。其他的内源分子可包括蛋白,例如转录因子和酶。

“融合”分子是其中两个或更多个亚基分子相连接,优选共价连接的分子。亚基分子可以是相同化学类型的分子,或者可以是不同化学类型的分子。第一类型的融合分子的实例包括但不限于:融合蛋白(例如,ZFPDNA结合结构域与裂解结构域之间的融合体)和融合核酸(例如,编码上文所描述的融合蛋白的核酸)。第二类型融合分子的实例包括但不限于:形成三倍体的核酸与多肽之间的融合体、以及小沟结合物与核酸之间的融合体。

细胞中融合蛋白的表达可以如下列所得到:将融合蛋白递送到细胞或将编码融合蛋白的多核苷酸递送到细胞中,多核苷酸在该细胞中转录,转录物被翻译产生融合蛋白。细胞中蛋白的表达也可以包括反式剪接、多肽裂解和多肽连接。将多核苷酸和多肽递送到细胞中的方法在本发明的其他地方。

“真核”细胞包括但不限于:真菌细胞(例如酵母)、植物细胞、动物细胞、哺乳动物细胞和人类细胞(例如T细胞)。

术语“操作性连接”和“操作性地连接”(或“可操作地连接”)就两种或更多种组分(例如序列元件)并置而言可互换使用,其中所述组分排列成使两种组分均能正常发挥功能并且允许至少一种组分能介导施加给至少一种其他组分的功能的可能性。例如,如果转录调节序列(如启动子)响应于一种或多种转录调节因子的存在或不存在而控制编码序列的转录水平,则转录调节序列与编码序列操作性连接。转录调节序列通常与编码序列操作性地顺式连接,但是不需要直接与其邻近。例如,增强子是与编码序列操作性连接的转录调节序列,但是它们并不紧接。

对于融合多肽,术语“操作性地连接”可以指每个组分在与其他组分连接时执行与其没有如此连接时其将执行的功能相同的功能的情况。例如,对于其中ZFP DNA结合结构域与裂解结构域融合的融合多肽,如果在融合多肽中ZFP DNA结合结构域部分能够结合其靶位点和/或其结合位点,同时列裂解结构域能够裂解靶位点邻近的DNA,则ZFP DNA结合结构域和裂解结构域是操作性连接的。

“载体”能够将基因序列转移到靶细胞中。通常,“载体构建体”、“表达载体”和“基因转移载体”是指能够指导所感兴趣的基因表达并且可以将基因序列转移到靶细胞中去的任何核酸构建体。因此,该术语包括克隆和表达载体,以及整合载体。

“报道基因”或“报道序列”是指产生可以容易地测量(优选以常规测定测量)的蛋白产物的任何序列。适合的报道基因包括但不限于:Mell、氯霉素乙酰转移酶(CAT)、发光蛋白、以及β-半乳糖苷酶。

总述

本文描述了鉴定高效裂解其靶位点并且对宿主细胞无毒性的核酸酶的组合物和方法。描述了包含有待检测的核酸酶的靶位点的报道构建体以及包含这些报道构建体的宿主细胞。在本文所描述的方法中,将包含核酸酶的靶位点的报道构建体引入宿主细胞(例如酵母细胞)以产生报道菌株。当核酸酶在细胞中表达并且在它们的靶位点诱导双链断裂(DSB)(例如,诱导双链断裂)时,报道基因由宿主细胞的单链退火(SSA)机制重构。报道基因的表达由标准技术容易地测定,报道基因表达的水平反应了核酸酶在靶位点裂解的能力。此外,可以容易地测定宿主细胞以测定核酸酶表达对细胞生长的影响。

因此,本文所描述的是从已知结合特定靶位点的核酸组中测定最具活性且毒性最低的核酸酶的快速有效的高通量筛选方法。除了能够根据核酸酶在靶基因座的活性而将其分级外,本发明还能够测定表现出基因组非特异性剪切的核酸酶。

本文所描述的能够用于体内核酸酶活性表征的试剂和方法可以在芽殖酵母中实施。酵母的快速和通用的遗传性使得能够在简单的测定中以高通量形式大量测试核酸酶组。所述试剂和系统可用于筛选针对来自任何生物的任何基因设计的核酸酶,经验证本发明能使用低等脊椎动物、植物和人类细胞培养物正确鉴定最佳活性的核酸酶对。

报道构建体

本文所述的方法和系统使用包含含有待测的核酸酶的靶序列的序列的报道构建体。报道构建体被设计成使报道基因仅在靶序列被裂解并且报道基因由报道基因序列单链退火(SSA)而重构时有功能。通常,产生的报道构建体使得任何核酸酶靶序列可以容易地插入报道基因序列中间,例如经由多连接子(参见,图1和2)。

可以通过任何适当的方法将待筛选的核酸酶的一个或多个靶位点插入到报道构建体中,包括PCR或商业上可获得的克隆系统,如和/或克隆系统。在某些实施方式中,靶位点包括连环体靶位点。还参见实施例1。靶位点可以来自原核或真核基因,例如,哺乳动物(如人类)、酵母或植物细胞。

可以使用提供可检测信号的任何报道基因,包括但不限于催化可检测产物产生的酶(如,蛋白酶、核酸酶、脂肪酶、磷酸酶、糖水解酶和酯酶)。编码酶的适当报道基因的非限制性实例包括:例如MEL1、CAT(氯霉素乙酰转移酶;Alton和Vapnek(1979)Nature 282:864869)、荧光素酶;β-半乳糖苷酶、β-葡糖醛酸糖苷酶,β-内酰胺酶、辣根过氧化物酶以及碱性磷酸酶(例如,Toh等人(1980)Eur.J.Biochem.182:231238;和Hall等人(1983)J.Mol.Appl.Gen.2:101)。还可以采用直接提供可检测信号的报道基因,例如荧光蛋白,诸如例如GFP(绿色荧光蛋白)。荧光使用各种商业上可获得的荧光检测系统,包括例如荧光激活细胞分选(FACS)系统来检测。

在某些实施方式中,报道基因编码酶,例如MEL1。分泌的MEL1报道基因的使用使得能够方便地直接由生长培养基检测重组事件而不需要细胞裂解,这与经典的β-半乳糖苷酶酵母报道基因形成了对比(Aho等人(1997)Anal Biochem 253:270-272)。

如图1和2所示,报道构建体通常还包含报道基因-靶-报道基因序列旁侧与宿主细胞基因组DNA区域同源的序列。这些“同源臂”使得报道构建体靶向整合到宿主细胞中产生稳定的报道宿主细胞系。同源臂可以是宿主细胞的任何基因组序列。优选地,同源臂将报道构建体直接插入到宿主细胞基因组的非必需位点,例如酵母中的HO位点。适合的插入位点的其他非限制性实例包括营养缺陷型标记物,如URA3、LYS2和TRP1。优选地,报道构建体插入到其突变(或敲除)不会在数量上影响宿主细胞生长的基因座。可以使用标准技术将报道构建体整合到宿主细胞基因组中。参见,例如Chames等人,如上所述和Arnould等人,如上所述。可选择地,报道构建体可以保持为附加体。

报道构建体还可以包含一个或多个可选择的标记物。阳性选择标记物是编码能够使仅携带和表达该基因的细胞在某些条件下存活和/或生长的产物的那些多核苷酸。例如,表达抗生素抗性基因(如Kanr或Neor基因)的细胞对抗生素或其类似物(如G418)有抗性,而不表达这些抗性基因的细胞在存在抗生素的条件下会被杀死。阳性选择标记物的其他实例包括潮霉素抗性、ZeocinTM抗性以及本领域的那些技术人员所已知的类似抗性(参见,Golstein和McCusker(1999)Yeast 15:1541-1553)。阴性选择标记物是编码能够使仅携带和表达该基因的细胞在某些条件下被杀死的产物的那些多核苷酸。例如,表达胸苷激酶(例如单纯疱疹病毒(herpes simplex virus)胸苷激酶,HSV-TK)的细胞在添加更昔洛韦(gancyclovir)时被杀死。其他阴性选择标记物是本领域的那些技术人员已知的。可选择的标记物并不需要是转基因,另外,报道基因和可选择的标记物可以多种组合使用。

报道构建体还可以包括额外的报道基因,例如通过表明细胞在进行DNA损伤响应而反映脱靶核酸酶活性的基因。这种适当的额外脱靶报道基因的非限制性实例包括已知通过甚至单DSB的诱导而被上调的基因,例如RNR2、RNR4、DIN7、PCL5、DUN1。还参见Lee等人(2000)Cold SpringHarb Symp Quant Biol.65:303:314。另外的报道基因可以独立引入并可以瞬时表达或稳定整合到宿主细胞中。

宿主细胞

在靶序列被核酸酶裂解后重构功能报道基因的任何宿主细胞都可用于实行本发明。细胞类型可以是细胞系或天然(例如分离的)细胞,诸如例如原代细胞。细胞系可得自例如美国标准培养物收集中心(AmericanType Culture Collection,ATCC)或者可以通过本领域内已知的方法产生,如例如Freshney等人,Culture of Animal Cells,A Manual of Basic Technique(动物细胞培养,基本技术手册),第三版,1994;以及其中所引用的参考文献中所述的。类似地,细胞可以通过本领域内已知的方法分离。细胞类型的其他非限制性实例包括具有病理或经历病理的细胞(如癌细胞和转化的细胞)、致病性感染的细胞、干细胞、完全分化的细胞、部分分化的细胞、永生化细胞以及类似细胞。可以使用原核(如细菌)或真核(如酵母;植物;真菌;鱼和哺乳动物细胞,如猫科动物、犬科动物、鼠科动物、牛科动物、猪和人类)细胞,其中优选的是真核细胞。适当的哺乳动物细胞系包括CHO(中国仓鼠卵巢)细胞、HEP-G2细胞、BaF-3细胞、Schneider细胞、COS细胞(表达SV40T抗原的猴肾细胞)、CV-1细胞、HuTu80细胞、NTERA2细胞、NB4细胞、HL-60细胞和HeLa细胞、293细胞(参见例如Graham等人(1977)J.Gen.Virol.36:59)、和如SP2或NS0的骨髓瘤细胞(参见,例如Galfre和Milstein(1981)Meth.Enzymol.73(B):346)。其他真核细胞包括:例如昆虫(如草地夜蛾(sp.frugiperda);真菌细胞,包括酵母(如酿酒酵母、裂殖酵母(S.pombe)、巴斯德毕赤酵母(P.pastoris)、乳酸克鲁维酵母(K.lactis)、汉森酵母(H.polymorpha))以及植物细胞(Fleer,R.(1992)Current Opinion in Biotechnology 3:486496)。

在优选的实施方式中,宿主细胞为酵母细胞。采用酵母细胞是有利的是因为报道基因重构所需要的间隔序列缺失在这些细胞中是有效过程并且容许大基因组靶的扫描。酵母细胞在引入DSB后可以存活,即使靶高达25kb(Vaze等人(2002)Mol Cell 10:373-385)。此外,只要在报道构建体内提供400个碱基对的同源区,则100%的酵母细胞在断裂后会使用SSA修复途径存活下来(Sugawara等人(2000)Mol Cell 10:373-5309)。可以使用酵母细胞的任何菌株,例如69-1B或BY4741。

核酸酶

本文所描述的方法和组合物可以广泛应用并且可以包括所感兴趣的任何核酸酶。核酸酶的非限制性实例包括大范围核酸酶和锌指核酸酶。核酸酶可以包含异源DNA结合和裂解结构域(例如,锌指核酸酶;具有异源裂解结构域的大范围核酸酶DNA结合结构域);或可选择地,可以改变天然存在的核酸酶的DNA结合结构域以结合所选的靶位点(例如,经工程化以结合与同源结合位点不同的位点的大范围核酸酶)。

在某些实施方式中,核酸酶为大范围核酸酶(归巢核酸内切酶)。天然存在的大范围核酸酶识别15-40个碱基对的裂解位点,并且通常被分为4个家族:LAGLIDADG家族、GIY-YIG家族、His-Cyst box家族以及HNH家族。示例性的归巢核酸内切酶包括:I-SceI、I-CeuI、PI-PspI、PI-Sce、I-SceIV、I-CsmI、I-PanI、I-SceII、I-PpoI、I-SceIII、I-CreI、I-TevI、I-TevII和I-TevIII。它们的识别序列是已知的。还参见美国专利第5,420,032号;美国专利第6,833,252号;Belfort等人(1997)Nucleic Acids Res.25:3379-3388;Dujon 等人(1989)Gene 82:115-118;Perler 等人(1994)Nucleic Acids Res.22,1125-1127;Jasin(1996)Trends Genet.12:224-228;Gimble等人(1996)J.Mol.Biol.263:163-180;Argast等人(1998)J.Mol.Biol.280:345-353以及New England Biolabs的目录。

来自天然存在的大范围核酸酶(主要来自LAGLIDADG家族)的DNA结合结构域已被用于在植物、酵母、果蝇、哺乳动物细胞和小鼠中促进位点特异性基因组修饰,但是这种方法只限于保存了大范围核酸酶识别序列的同源基因的修饰(Monet等人(1999),Biochem.Biophysics.Res.Common.255:88-93)或只限于已引入识别序列的预工程化基因组的修饰(Route等人(1994),Mol.Cell.Biol.14:8096-106;Chilton等人(2003),Plant Physiology.133:956-65;Puchta等人(1996),Proc.Natl.Acad.Sci.USA 93:5055-60;Rong等人(2002),Genes Dev.16:1568-81;Gouble等人(2006),J.GeneMed.8(5):616-622)。因此,进行了将大范围核酸酶工程化以在医药或生物技术上相关的位点显示新结合特异性的努力(Porteus等人(2005),Nat.Biotechnol.23:967-73;Sussman等人(2004),J.Mol.Biol.342:31-41;Epinat等人(2003),Nucleic Acids Res.31:2952-62;Chevalier等人(2002)Molec.Cell 10:895-905;Epinat等人(2003)Nucleic Acids Res.31:2952-2962;Ashworth 等人(2006)Nature 441:656-659;Paques等人(2007)Current Gene Therapy 7:49-66;美国专利公开第20070117128;20060206949;20060153826;20060078552;和20040002092号)。此外,还已将来自大范围核酸酶的天然存在的或工程化的DNA结合结构域与来自异源核酸酶(例如,FokI)的裂解结构域可操作性地连接。

在其他实施方式中,核酸酶为锌指核酸酶(ZFN)。ZFN包含经工程化以结合所选基因中的靶位点的锌指蛋白和裂解结构域或裂解半结构域。

锌指结合结构域可以经工程化的以结合所选的序列。参见,例如Beerli等人(2002)Nature Biotechnol.20:135-141;Pabo等人(2001)Ann.Rev.Biochem.70:313-340;Isalan等人(2001)Nature Biotechnol.19:656-660;Segal等人(2001)Curr.Opin.Biotechnol.12:632-637;Choo等人(2000)Curr.Opin.Struct.Biol.10:411-416。与天然存在的锌指蛋白相比,工程化锌指结合结构域可以具有新的结合特异性。工程化方法包括但不限于合理设计和各种类型的选择。合理设计包括:例如,使用包括三联体(或四联体)核苷酸序列和单个锌指氨基酸序列的数据库,其中各三联体或四联体核苷酸序列与结合特定三联体或四联体序列的一个或多个锌指氨基酸序列相关。参见,例如共同拥有的美国专利6,453,242和6,534,261,其通过引用全文并入本文。

示例性选择方法,包括噬菌体展示和双杂交系统,公开在美国专利5,789,538;5,925,523;6,007,988;6,013,453;6,410,248;6,140,466;6,200,759;和6,242,568;以及WO 98/37186;WO 98/53057;WO 00/27878;WO 01/88197和GB 2,338,237中。此外,还描述了锌指结合结构域结合特异性的增强,例如在共同拥有的WO 02/077227中。

靶位点的选择;用于设计和构建融合蛋白(和编码其的多核苷酸)的ZFN和方法是本领域的那些技术人员已知的,详细描述于美国专利申请公开第20050064474和20060188987号中,其通过引用全文并入本文。

此外,如在这些和其他参考文献中所公开的,可以使用任何适当的连接体序列(包括,例如长度为5个或更多氨基酸的连接体)将锌指结构域和/或多指的锌指蛋白连接在一起。对于长度为6或更多个氨基酸的示例性连接体序列参见,例如美国专利第6,479,626;6,903,185;和7,153,949号。本文所述的蛋白可以包括蛋白单个锌指之间的适合连接体的任何组合。

诸如ZFN和/或大范围核酸酶等核酸酶还可以包括核酸酶(裂解结构域、裂解半结构域)。如上文所指出的,裂解结构域可以与DNA结合结构域是异源的,例如锌指DNA结合结构域和来自核酸酶的裂解结构域或大范围核酸酶DNA结合结构域和来自不同核酸酶的裂解结构域。异源裂解结构域可以自任何核酸内切酶或核酸外切酶获得。可从其获得裂解结构域的示例性核酸内切酶包括但不限于限制性核酸内切酶和归巢核酸内切酶。参见,例如2002-2003 Catalogue(2002-2003目录),New England Biolabs,Beverly,MA;和Belfort 等人(1997)Nucleic Acids Res.25:3379-3388。裂解DNA的其他酶是已知的(例如S1核酸酶;绿豆核酸酶;胰腺Dnase I;微球菌核酸酶;酵母HO核酸内切酶;还参见Linn等人(编辑)Nucleases,ColdSpring Harbor Laboratory Press,1993)。这些酶(或其功能片段)中的一种或多种可以用作裂解结构域和裂解半结构域的来源。

类似地,裂解半结构域可以源自如上文所说明的其裂解活性需要二聚化作用的任何核酸酶或其部分。一般来说,如果融合蛋白包含裂解半结构域则裂解需要两种融合蛋白。可选择地,可以使用包含两个裂解半结构域的单个蛋白。两个裂解半结构域可以源自相同的核酸内切酶(或其功能片段);或各裂解半结构域可以源自不同的核酸内切酶(或其功能片段)。此外,两种融合蛋白的靶位点相互之间优选就彼此而言设置成两种融合蛋白与其各自靶位点的结合将裂解半结构域置于能使裂解半结构域形成功能裂解结构域(例如通过二聚体化)的相互空间定位上。因此,在某些实施方式中,靶位点的近边缘被5-8个核苷酸或被15-18个核苷酸隔开。然而两个靶位点之间可以间隔任何整数个数的核苷酸或核苷酸对(例如2至50个核苷酸对或更多)。一般地,裂解位点位于靶位点之间。

限制性核酸内切酶(限制性酶)存在于许多物种中并且能够序列特异性地结合DNA(在识别位点)并在结合位点或结合位点附近裂解DNA。某些限制性酶(例如IIS型)在远离识别位点的位点裂解DNA并且具有可分离的结合和裂解结构域。例如,IIS型酶Fok I在一条链上距其识别位点9个核苷酸以及另一条链上距其识别位点13个核苷酸处催化DNA双链裂解。参见,例如美国专利5,356,802;5,436,150和5,487,994;以及Li等人(1992)Proc.Naal.Acad.Sci.USA 89:4275-4279;Li等人(1993)Proc.Natl.Acad.Sci.USA 90:2764-2768;Kim等人(1994a)Proc.Natl.Acad.Sci.USA91:883-887;Kim等人(1994b)J Biol.Chem.269:31,978-31,982。因此,在一个实施方式中,融合蛋白包含来自至少一个IIS型限制性酶的裂解结构域(或裂解半结构域)和一个或多个锌指结合结构域,它们可以经或未经工程化。

裂解结构域与结合结构域可分离的示例性IIS型限制性酶为Fok I。这个具体的酶以二聚体形式起作用。Bitinaite等人(1998)Proc.Natl.Acad.Sci.USA 95:10,570-10,575。因此,为了本发明的目的,认为用于本文所公开的融合蛋白的Fok I酶的一部分是裂解半结构域。因此,对于使用锌指-FokI融合体的细胞序列的靶向双链裂解和/或靶向取代,可以使用各含有FokI裂解半结构域的两个融合蛋白来重构催化活性的裂解结构域。可选择地,也可以使用含有锌指结合结构域和两个Fok I裂解半结构域的单个多肽分子。使用锌指-Fok I融合体的靶向裂解和靶向序列改变的参数在本发明的别处提供。

裂解结构域或裂解半结构域可以是保持裂解活性的蛋白的任何部分;或者是保持多聚体化(例如,二聚体化)以形成功能裂解结构域的能力的蛋白的任何部分。

示例性的IIS型限制性酶描述于国际公布WO 07/014275中,其通过引用全文并入本文。其他限制性酶也含有可分离的结合和裂解结构域,这些涵盖在本发明公开内容里。参见,例如Roberts等人(2003)Nucleic AcidsRes.31:418-420。

在某些实施方式中,裂解结构域包含将同源二聚体化作用最小化或阻止同源二聚体化作用的一个或多个工程化裂解半结构域(也称为二聚体结构域突变体),如美国专利公开第20050064474和20060188987号以及美国申请第11/805,850号(2007年5月3日提交)中所述,其公开内容均通过引用全文并入本文。FokI的位点446、447、479、483、484、486、487、490、491、496、498、499、500、531、534、537和538的氨基酸残基均为影响Fok I裂解半结构域二聚体化作用的靶。

形成专性异源二聚体的Fok I的示例性工程化裂解半结构域包括这样的一对:其中第一裂解半结构域包括在Fok I的位点490和538处的氨基酸残基突变并且第二裂解半结构域包括在氨基酸残基486和499处的突变。

因此,在一个实施方式中,在490处的突变用Lys(K)取代Glu(E);在538处的突变用Lys(K)取代Iso(I);在486处的突变用Glu(E)取代Gln(Q);以及在位置499处的突变用Lys(K)取代Iso(I)。具体地,本文所描述的工程裂解半结构域如下来制备:突变一个裂解半结构域的位点490(E→K)和538(I→K)以产生称为“E490K:I538K”的工程化裂解半结构域,并突变另一裂解半结构域的位点486(Q→E)和499(I→L)以产生称为“Q486E:I499L”的工程化裂解半结构域。本文所描述的工程化裂解半结构域为其中异常裂解最小化或消失的专性异源二聚体突变体。参见,例如,美国临时申请第60/808,486号(2006年5月25日提交)的实施例1,其公开内容为所有的目的通过引用全文并入本文。

本文所述的工程化裂解半结构域可以使用任何适当方法来制备,例如通过如美国专利公开第20050064474号的实施例5和美国专利临时申请系列第60/721,054号的实施例38所描述的野生型裂解半结构域(Fok I)的定点突变。

核酸酶表达构建体可以使用本领域内已知的方法容易地设计。参见,例如美国专利公开20030232410;20050208489;20050026157;20050064474;20060188987;20060063231;和国际公布WO 07/014275。在某些实施方式中,核酸酶的表达受诱导型启动子例如在棉子糖和/或半乳糖的存在下激活(去抑制)并且在葡萄糖的存在下受抑制的半乳糖激酶启动子的控制。特别地,碳源连续变化(例如由葡萄糖变为棉子糖再变为半乳糖)后,半乳糖激酶启动子被诱导并且表达核酸酶。诱导型启动子的其他非限制性实例包括CUP1、MET15、PHO5和tet反应性启动子。

生物活性核酸酶的鉴别

含有本文所描述的SSA报道构建体的宿主细胞可以用于从一组经工程化以结合特定靶位点的核酸酶中鉴定最具活性且毒性最低的核酸酶。本发明的系统利用了称为单链退火(SSA)的特定同源指导修复(HDR)的特定途径。如果双链断裂(DSB)在两侧同源区域之间发生,则断裂染色体的修复会导致包含单拷贝重复序列的缺失(Paques和Haber(1999)MicrobiolMol Biol Rev 63:349-404)。含有被靶序列隔开的报道基因的两个重叠和非功能部分的报道构建体的工程化使得能够容易地检测核酸酶诱导的DSB。

如图1中所示,由报道构建体引入来开始具有最高体内裂解活性的核酸酶的鉴定。报道构建体可以为附加体型,例如使用附加体,如使用酵母中心粒质粒(YCp)。优选地,报道构建体被整合到宿主细胞(如酵母)的基因组中,例如通过同源重组。

在正确整合报道子的菌株分型后,用核酸酶表达载体转化宿主菌株。优选地,核酸酶表达是诱导型的(例如,半乳糖诱导的)以便可以通过改变培养基中的碳源来诱导核酸酶表达一段所选的时间。在细胞机制修复诱导的DSB所需的一段恢复期之后,使用适当的(例如比色法)测定由培养基的等分试样测定重构的报道基因(例如Mell酶)的活性。

从各酶得到的活性从数量上反映了其在染色体靶序列内诱导DSB的能力。通常将活性标准化为培养物中细胞的密度。

本文所描述的体内筛选系统还具有附随检测整个酵母基因组经由核酸酶的脱靶裂解的附加的有益效果。宿主细胞还含有第二条DSB修复途径的机制,称为非同源末端连接(NHEJ)。在单倍体的情况下,酵母细胞对由核酸内切酶的持续存在所诱导的持久DSB的不能有效反应。仅0.1%的细胞可以在这种类型的DSB下存活,这导致了群体生长的严重延迟(Moore和Haber,1996)。这种脱靶活性将杀死大部分的细胞,由于细胞生长可以容易地由培养物中细胞密度的分光光度法测定来监控,可以容易地鉴定出对细胞毒性最小的核酸酶(推测是因为它们的特异性和脱靶裂解的缺乏)。

此外,脱靶作用还可以通过利用DNA损伤响应(DDR)途径的“信号获得”测定来监控。已知几种由甚至单DSB诱导上调的基因(Lee等人(2000)Cold Spring Harb Symp Quant Biol 65:303-314)。因此,本文所述的任何组合物或方法还可以包括受启动子控制的第二报道基因,该启动子仅存在DSB的条件下转录。第二报道基因的活性可以用于广泛地检测非特异性核酸酶。

还可以插入逆选择基因,例如在中断的MEL1基因之间插入。这使得能够从突变的ZFN群中选择活性变体。可以使用任何逆选择基因,包括但不限于URA3(图8)。可以基于特异性抑制剂5-氟乳清酸(FOA)对此基因进行阴性选择,5-氟乳清酸阻止原养型菌株生长但是容许ura3突变体生长。可以在含有FOA的培养基上选择Ura3-细胞(由SSA产生)。由于FOA在脱羧酶的作用下转化成了毒性化合物5-氟尿嘧啶,不合有活性ZFN的URA3+细胞会被杀死,而ura3-细胞是抗性的。在FOA培养基上的阴性选择具有高度识别力,通常少于10-2 FOA抗性菌落的是Ura+。

因此,使用含有这种类型的逆选择标记基因的报道菌株来排除无活性变体,而无活性变体通常组成了在这种基因筛选中所产生的大部分变体。含有活性变体的细胞对FOA是抗性的,因为URA3基因在经由SSA的DSB修复期间会被去除。由于筛选排除了大部分的非功能菌落/变体,所以这种选择显著减少了工作量。

下面的实施例涉及本发明的示例性实施方式,其中核酸酶包含ZFN。应了解的是这仅是为示例的目的并还可以使用其他的核酸酶,例如具有工程化DNA结合结构域的归巢核酸内切酶(大范围核酸酶)和/或天然存在的工程化归巢核酸内切酶(大范围核酸酶)DNA结合结构域和异源裂解结构域的融合体。

实施例

实施例1:酵母报道构建体的工程化

如下使用酵母整合质粒(Yip)HO-poly-KanMX-HO(Voth等人(2001)Nucleic Acids Res 29:E59-59)来制备靶向HOS基因座的SSA报道构建体(参见,图2)。使用下列引物将对应于MEL1基因(Liljestrom(1985)NucleicAcids Res 13:7257-7268)的核苷酸1至750的片段(相对于ATG)克隆到HO-poly-KanMX-HO 的SalI 和BamHI 位点:5’-aattgtcgacatgtttgctttctactttctcaccgc-3’(SEQ ID NO:1)和5’-aattggatccccccattggagctgcc-3’(SEQ ID NO:2)。随后,使用下列寡核苷酸将来自核苷酸299至2100的片段克隆到SacI和EcoRI位点:5’-aattgagctcagaccacctgcataataacagc-3’(SEQ ID NO:3)和5’-aattgaattcgggcaaaaattggtaccaatgc-3’(SEQ ID NO:4)。最后,使用下列寡核苷酸将1489个碱基对的PGK1启动子片段克隆到BsiWI和SalI位点中:5’-Aattcgtacgtctaactgatctatccaaaactg-3’(SEQ ID NO:5)和5’-Aattgtcgacttgatcttttggttttatatttgttg-3’(SEQ ID NO:6)。

根据制造商的说明书,进一步修饰上文所描述的MEL1报道构建体使其包含框(Invitrogen)。此外,制备包含缩短型PGK1启动子的报道构建体。还制备缺乏氨苄西林抗性基因的构建体。

还制备包含各种ZFN靶位点的报道构建体。简言之,通过PCR或通过连环化(concatamerization)制备一个或多个拷贝的靶位点,并使用标准分子生物学技术将其插入MEL1报道构建体中。使用DNAworks(可从互联网上获得)电子地构建连环体,该DNAwork设计平铺整个靶位点连环体的重叠寡核苷酸。使用寡核苷酸来合成合成型靶位点连环体,并且用两步克隆工艺来将连环体引入报道构建体。首先,将连环体克隆到入门载体(Invitrogen,CA)中。在第二步中,使用LRClonaseTM系统(Invitrogen)基本按照制造商所描述的将连环体从入门载体转移到MEL1报道基因中。产生含有CCR5-、IPP2K-以及靶向POU5F1/Oct34的ZFN的靶位点的报道构建体,并将其用于标准化。

实施例2:将报道构建体整合到酵母中

如所描述的(Voth等人(2001)Nucleic Acids Res 29:E59-59)将报道构建体整合至69-1B菌株(S288C背景;MATα his3Δ200 lys2-128δleu2Δ)中。正确的整合通过使用下列寡核苷酸的菌落PCR来确定:HO-L:5’-TATTAGGTGTGAAACCACGAAAAGT-3’(SEQ ID NO:7);5’-ACTGTCATTGGGAATGTCTTATGAT-3’(SEQ ID NO:8);HO-R:5’-attacgctcgtcatcaaaatca-3’(SEQ ID NO:9);和5’-CATGTCTTCTCGTTAAGACTGCAT-3’(SEQ ID NO:10)。

实施例3:ZFN活性分析

为了证明在报道构建体靶位点的裂解修复了MEL1活性,进行了下列实验。如上所述将SSA报道构建体工程化使其包含HO核酸内切酶的识别位点,并如上所述将其整合到宿主细胞。然后用编码HO核酸内切酶的表达载体转染细胞并在存在或不存在半乳糖的条件下培养细胞。

结果总结于表1中。

表1:在报道构建体靶位点的裂解修复了MEL1活性

  宿主细胞  表达构建体  半乳糖  MEL1活性  报道基因-无HO靶位  点  空载体  -  -  报道基因-无HO靶位  点  空载体  +  -  报道基因-无HO靶位  点  pGAL HO  -  -  报道基因-无HO靶位  点  pGAL HO  +  -

  宿主细胞  表达构建体  半乳糖  MEL1活性  具有HO靶位点的报道  基因  空载体  -  -  具有HO靶位点的报道  基因  空载体  +  -  具有HO靶位点的报道  基因  pGALHO  -  -/+  具有HO靶位点的报道  基因  pGALHO  +  +++

如表1中所示,仅在存在HO核酸内切酶和其在报道基因基因座中的靶的条件下观察到了MEL1活性。此外,当没有诱导HO表达时,除了极低频率的自发性MEL1恢复事件之外基本上无MEL1基因活性。HO核酸内切酶表达的诱导将样品中基本上100%的细胞转化成了MEL1状态。实施例4:持久生物活性的NME特异性ZFN的鉴定

基本上如Umov等人(2005)Nature 435(7042):646-651中所述将ZFN设计成能识别NME中的序列并且构建包含编码这些设计的NME ZFN的序列的质粒。在体外测定(ELISA)中检测ZFN。图3显示了关于NME结合ZFN的信息以及它们在体外的DNA结合表征。

对于体内筛选来说,使用标准克隆方法将ZFN的编码序列转移到半乳糖诱导的表达载体中(Moehle等人(2007)Proc Natl Acad Sci U S A104:3055-3060;Mumberg等人(1994)Nucleic Acids Res 22:5767-5768;Umov等人(2005)Nature 435:646-651)。

将NME1 cDNA(RZPD IRAUp969A091D6)靶位点亚克隆到报道构建体中并如实施例2中所述将所得报道构建体整合到酵母菌株的基因组中。

A.报道基因活性

如Gietz和Woods,(2006)Methods Mol Biol 313:107-120中所述将编码靶向NME1的ZFN对的表达构建体转化到在深孔板中的报道菌株中。为了减少陪替(Petri)培养皿的繁琐操作,在液体培养基中选择转化体库。简言之,将细胞在1ml SC His-Leu培养基中重悬并在30℃下孵育48小时。为了进一步富集转化体,将1∶10稀释的库在新鲜培养基中再孵育24小时。

为了使GAL1启动子去抑制,将转化体库以1∶10稀释到含有2%棉子糖作为碳源的1ml SC His-Leu培养基中并在30℃下孵育过夜。通过将棉子糖培养物1∶10稀释到含有2%半乳糖的1ml SC His-Leu培养基中来诱导ZFN表达。然后将细胞孵育不同的时间,通常为2至6小时,然后添加2%葡萄糖以终止表达。之后将细胞孵育过夜以容许DSB修复和报道基因表达。

为了将报道信号标准化成培养物中细胞的量,在600nm下对孔板进行分光光度测量读数。然后将深孔板以3000g离心5分钟以使酵母细胞成团,如下列文献中所述分析10μl培养基中的Mell活性:Chen等人(2004)Anal Biochem 335:253-259和Ryan等人(1998)Mol Cell Biol 18:1774-1782。

报道基因表达的结果在图4A中显示。ZFN对在柱下面指示出。对于各对,最左侧柱显示在引入所示ZFN对之前的Mell活性;左侧第2列柱显示将所示ZFN对引入细胞后2小时的Mell活性;左侧第3列柱显示将所示ZFN对引入细胞后4小时的Mell活性;最右侧柱显示将所示ZFN对引入细胞后6小时的Mell活性。如所显示的,在不存在活性ZFN对的条件下没有Mell活性。此外,尽管所有ZFN对在一定程度上都是有活性的,但是该测定提供了对最具活性对的评级。

B.毒性

为了评估各种ZFN的毒性,通过将棉子糖培养物1∶100稀释到含有2%半乳糖的1ml SC His-Leu培养基中来诱导ZFN表达。然后将细胞孵育不同的时间,通常为24至30小时。然后通过在600nm下的分光光度测量读数来测定群生长。

在存在ZFN条件下的酵母细胞生长显示在图4B中。ZFN对在柱下面指示出。对于各对,最左侧柱子显示在引入所示ZFN对之前的OD600;左侧第2列柱显示将所示ZFN对引入细胞后23小时的OD600读数;左侧第3列柱显示将所示ZFN对引入细胞后27小时的OD600;最右侧柱显示将所示ZFN对引入细胞后30小时的OD600。如所显示的,在存在某些ZFN对的条件下酵母细胞正常生长。

C.酵母筛选预测体内活性

如Miller等人(2007)Nat Biotechnol.25(7):778-85中所述,之后将在报道基因活性测定(图4A)中鉴定的各种活性ZFN对转化到人类K562中并检测它们诱导NME1基因座突变的能力。

如图5中所示,在培养的人类细胞系中对NME1最有活性的ZFN对为13674-13677。此外,这个ZFN对在上文被鉴定为不影响酵母细胞生长(图4B)的最具活性蛋白之一(图4A)。

与人类细胞系中基因修饰相关的一个主要问题是修饰的细胞随时间逐渐丢失。对于ZFN,例如,在培养9天后,基因修饰的细胞的百分比通常降低,这可能是部分由于与非特异性ZFN的过表达相关的毒性所致。参见,Miller等人(2007)Nat Biotechnol.25(7):778-85。因此,为了进一步确定从酵母报道基因和毒性筛选鉴定的ZFN对随时间流逝保持着无毒性,测量了在引入ZFN对13674-13677后2天和9天K562细胞中人类染色体的百分比修饰。

如图6中所示,在13674-13677 ZFN对转染后2天(D2)观察到的NME1基因座的百分比修饰保持到了培养9天(D9)后。

这些结果证明本文所描述的酵母系统准确预测了体内ZFN活性,并且除此之外还准确预测了随时间流逝能提供持久信号的ZFN。

实施例5:持久生物活性的PD1特异性ZFN的鉴定

如Miller等人(2007)Nat.Biotechnol.25:778-785和美国专利公开第20050064474号以及国际专利公布WO2005/014791中所描述的,制备针对PD1基因的ZFN,通过ELISA和CEL1测定进行检测。

从这个最初的体外筛选中鉴定了两个先进的ZFN对,将其进行加工以试图改善它们的效率。这些对分别靶向该基因的外显子1和5。基本上如上面实施例4所描述,在时程实验中检测经加工的(改善的)蛋白。结果总结于下表2中。

表2:PD1 NHEJ

如表2中所显示,用针对外显子5的ZFN处理细胞会引起较高比例的基因组编辑变的细胞从细胞群中丢失,而用针对外显子1所设计的ZFN处理的细胞中基因组编辑的信号则稳定得多。

还在酵母系统中检测了这些ZFN的活性和毒性。简言之,将PD1 cDNA(NM_005018)亚克隆到SSA报道构建体中,如实施例3所述进行测定。

如图7中所显示,体内测定系统清楚地确定了PD1 ZFN的活性(图7A)并且还测定了靶向外显子5的所有ZFN的毒性(图7B)。这些结果与人类细胞中检测到的信号丢失相关。此外,针对外显子1所设计的ZFN没有显示出对酵母生长的抑制,并且维持着人类细胞内的信号。

实施例6:生物活性的斑马鱼ZFN的鉴定

制备针对斑马鱼SLC24A5(“golden”)和notail(“NTL”)基因的ZFN组并在包含具有适合的靶序列的SSA报道构建体的酵母宿主细胞中对活性进行筛选。还参见US系列第____________号,“Genomic Editing in ZebrafishUsing Zinc Finger Nucleases(斑马鱼中使用锌指核酸酶的基因组编辑),”与本文同日提交。

酵母活性和毒性筛选的结果在图9A(golden ZFN活性);图9B(goldenZFN毒性);图10A(notail ZFN活性);图10B(notail ZFN毒性)中显示。

然后将通过酵母筛选鉴定的ZFN注入斑马鱼胚胎。仅表达golden-ZFN的胚胎显示出了的体细胞镶嵌性着色(图11)。类似地,仅表达NTL-ZFN的胚胎显示了叉形尾巴表型(图12)。

因此,本文所述的体内测定系统鉴定了在斑马鱼中具有生物活性的ZFN。

实施例7:使用基于选择的筛选的活性ZFN变体鉴定

如下使用阳性和阴性选择报道酵母菌株来选择活性ZFN变体。制备报道构建体(图8),其含有已良好表征的ZFN(8266)的同源二聚体识别位点。对于8266的识别螺旋和靶序列,参见美国专利公布第20080159996号的表1。还如实施例4中所述,构建体在中断的MEL1基因之间含有逆选择基因(URA3)。在含有这种报道子的酵母细胞中,在存在5-FOA的条件下含有非活性ZFN的细胞将被杀死,而容许细胞群中含有活性ZFN变体的细胞选择性扩增。类似地,含有活性ZFN的细胞不能在不存在尿嘧啶的条件下生长。

制备在ZFP与FokI裂解结构域之间含有5种不同连接体序列(长度和/或氨基酸残基不同)的ZFN,并在上述酵母筛选测定中检测。具有野生型连接体序列的ZFN(8266)是有活性的。此外,鉴定了两种中等活性的变体和两种无活性的变体。制备含有8266以及两种中等活性的变体和两种无活性的变体的ZFN库,并如下在酵母逆选择测定中检测。

将ZFN变体以等摩尔比率混合并如实施例4所述将报道菌株转化。按照实施例4进行ZFN诱导6小时和24小时。在16小时的恢复期后,将细胞在含有逆选择剂5-FOA的培养基中稀释100倍,保持20小时。作为活性ZFN裂解了URA3基因的验证,以类似方式将细胞稀释到缺乏所添加的尿嘧啶的培养基中。如可以从图13的右侧部分所看到的,含有活性ZFN的细胞(SBS 8266)不能在不存在尿嘧啶的情况下生长。如图13所显示,仅在使用活性ZFN转化报道菌株时观察到了酵母生长。

然后收集细胞,从酵母群中提取总DNA,通过再次转化到大肠杆菌中而获得各自的质粒。随机挑取12个菌落,并进行测序。其中,12、9序列与野生型连接子匹配,3序列与中等活性的变体对应,而没有与无活性变体对应的序列。因此,可能在ZFN变体群中特异性地富集最具活性的变体。

这些数据确认了用于从一组生物活性变体中鉴定生物活性ZFN对的酵母系统,并且还证明了毒性测定用于测定它们的相对特异性的用途。

本文所提到的所有专利、专利申请以及出版物均通过引用全文并入本文。

尽管为了清楚地理解的目的以示例性说明和实施例的方式较详细地提供了公开内容,但是对于本领域的那些技术人员来说明显的是可以在不背离本发明的精神或范围的条件下实行各种改变和修改。因此,上述说明书和实施例不应理解为是限制性的。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号