首页> 中国专利> 通过载体构建体与细胞DNA的非同源重组来表达内源基因

通过载体构建体与细胞DNA的非同源重组来表达内源基因

摘要

本发明一般性地涉及通过原位重组法来活化基因表达或导致基因过表达。本发明还一般性地涉及使内源基因在细胞中以高于正常细胞中所见的水平进行表达的方法。在本发明的一个实施方案中,在整合到细胞中后,通过活化基因表达的调控系列的一个能活化内源基因表达的调控序列的非同源或非法重组;来活化或提高该内源基因的表达。在另一个实施方案中,通过共整合一或多个扩增标记并选择位于整合载体上的拷贝数增加的该一或多个扩增标记,从而进一步提高所述内源基因的表达。本发明还提供了鉴定和表达那些用目前技术无法发现的基因的方法,因为整合不需要靶序列。本发明还提供了分离编码跨膜蛋白质的核酸分子(特别是cDNA分子)的方法,以及分离能表达这种可能是其异源跨膜蛋白质的跨膜蛋白的细胞的方法。本发明还涉及分离的基因、基因产物、核酸分子和含有这些基因、基因产物及核酸分子的组合物,所述组合物可用于多种治疗和诊断用途。因此,利用本发明,可以活化和分离内源基因,包括那些与人类疾病和发育相关的基因,而不需要预先知道这些基因的序列、结构、功能或表达特性。

著录项

  • 公开/公告号CN1280615A

    专利类型发明专利

  • 公开/公告日2001-01-17

    原文格式PDF

  • 申请/专利权人 阿瑟西斯公司;

    申请/专利号CN98811571.9

  • 发明设计人 约翰·J·哈林顿;

    申请日1998-09-25

  • 分类号C12N15/11;C12N15/63;C12N15/85;C12N15/86;C12N15/00;C12P21/00;A61K48/00;

  • 代理机构柳沈知识产权律师事务所;

  • 代理人巫肖南

  • 地址 美国俄亥俄州

  • 入库时间 2023-12-17 13:50:20

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2018-10-23

    专利权有效期届满 IPC(主分类):C12N15/11 授权公告日:20100120 申请日:19980925

    专利权的终止

  • 2010-01-20

    授权

    授权

  • 2001-01-24

    实质审查请求的生效

    实质审查请求的生效

  • 2001-01-17

    公开

    公开

说明书

发明背景

发明领域

本发明的领域是通过原位重组法来活化基因表达或导致基因过表达。本发明涉及使内源基因在细胞中以高于通常可见于细胞中的水平进行表达。在一个活化基因表达的调控序列通过非同源或非法重组整合到细胞后该基因的表达被活化或提高。由于整合不需要导向序列,该方法能够鉴定和表达用目前方法无法发现的基因。因此,可以由那种未被测序和实际上不知道其存在的以及已非常明确的基因获得与人类疾病和发育相关的基因产物。所述方法提供了用于治疗和诊断目的的这些基因的基因产物。

相关现有技术

鉴定和过表达与人类疾病相关的新基因是开发新的治疗药物的一个重要步骤。目前建立用于过表达蛋白质的细胞文库的方法是建立在制备和克隆cDNA的基础上。因此,为了用这种方法鉴定新基因,必须在用于构建文库的细胞中表达该基因。该基因还必须以足以在文库中以足够量出现的水平表达。这其中是有疑问的,因为许多基因仅在少数细胞群中、或者在短暂的发育期间以极低的量表达。

另外,由于某些mRNA的体积太大,很难或不可能制备能表达生物活性蛋白质的全长cDNA分子。对于小mRNA也发现有缺少全长cDNA分子的情况,这被认为是与遗传信息中那些难于通过反转录来制备的序列或者在细菌中的增殖期间不稳定的序列有关。因此,即使最完整的cDNA文库也只能表达全部可能基因组中的一部分。

最后,许多cDNA文库是在细菌载体中制备的,用这些载体来表达生物活性哺乳动物蛋白质有很大的局限性,因为多数哺乳动物蛋白质在细菌中不能正确地折叠和/或不恰当地糖基化。

因此,建立一个更有代表性的表达蛋白质的文库的方法将非常有价值,该文库能便于真实地表达生物活性蛋白质。

目前用于过表达蛋白质的方法包括克隆目的基因,将其转入一个构建体,邻接合适的启动子/增强子、多腺苷酸化信号以及剪接位点,并将该构建体导入适当的宿主细胞。

一种替代方法包括利用同源重组通过将一个强启动子或其他调控序列靶定到预先确定的基因上来活化该基因的表达。

WO90/14092描述了在哺乳动物细胞中,原位修复编码目的蛋白质的基因。该申请描述了用来对编码目的蛋白质的基因进行定点修饰的单链寡核苷酸。也可包括一个标记物。但是,这些方法局限于提供与靶位点有相当同源性的寡核苷酸序列。因此,所述方法需要已知通过定点修饰和同源重组进行活化所需要的位点。用这类方法不能发现新基因。

WO91/06667描述了原位表达哺乳动物基因的方法。利用所述方法,通过同源重组将扩增基因导入目的基因邻位。然后在合适的培养基中培养细胞,扩增基因和目的基因均被扩增,目的基因表达增强。如上,导入扩增基因的方法限于同源重组,不能用来活化未知其序列或(存在)的新基因。

WO91/01140描述了通过同源重组修饰细胞,从而使内源基因失活。通过这些方法,同源重组被用来修饰和失活基因,并能制备可作为基因疗法中的供体的细胞。

WO92/20808描述了原位修饰基因组靶位点的方法。文中描述的是一些小修饰,例如在DNA中改变单个碱基。该方法依赖于利用用于导向的同源DNA进行基因组修饰。

WO92/19255描述了一种通过同源重组来增强目的基因表达的方法,其中将一个DNA序列整合到基因组或大的基因组片段中。然后可以将被修饰的序列转入次级宿主中进行表达。可以在目标基因旁边整合一个扩增基因从而使目标区域可被扩增用于增强表达。同源重组是该定向方法所必须的。

WO93/09222描述了通过活化编码所需产物的内源基因来制备蛋白质的方法。通过同源重组并将通常与希望其表达的基因相联的区域替换或失活来靶定调控区域。这一失活或替换导致基因以高于正常的水平表达。

WO94/12650描述了一种活化内源基因在细胞中原位表达和扩增的方法,其中所述基因在细胞中不表达或不以所需水平表达。用这样的一个外源DNA序列转染细胞,该序列修复、改变、缺失或替换细胞中存在的一段序列或者它是通常不与细胞中的内源基因功能性地连接的调控序列。为了达到这一目的,用与基因组DNA序列在预选位点上同源的DNA序列来靶定内源基因。另外,可以包括编码选择标记的扩增DNA。通过在选择用于扩增的条件下培养同源重组细胞,内源基因和扩增标记共扩增,并使基因表达提高。

WO95/31560描述了用于同源重组的DNA构建体。该构建体包括一个靶定序列,一个调控序列、一个外显子和一个未配对的剪接供体位点。通过构建体与细胞内的基因组序列之间的同源重组实现靶定,使得能在体外或体内制备蛋白质。

WO96/29411描述了利用外源调控序列,通过同源重组将外源外显子(编码或非编码)及剪接供体位点导入基因组中一个预先选定的位点。在此申请中,定位了所导入的DNA,从而使外源调控区域控制下的转录子包括存在于血小板生成素、DnaseⅠ或β-干扰素基因中的外源外显子和内源外显子,从而得到其中外源和外源外显子可操纵地连接在一起的转录子。这些新的转录单位是通过同源重组得到的。

美国专利5272071描述了通过插入一个能增强细胞内常规表达基因的表达水平的DNA调控元件使得该细胞内的转录沉默基因发生转录活化。插入调控元件使得它与正常情况下沉默的基因可操纵地连接在一起。借助同源重组以下述方式来实现插入:用通常情况下沉默的基因的一个片段(靶向DNA)和用来诱导所需转录的DNA调控元件来建立DNA构建体。

美国专利5578461讨论了通过同源重组活化哺乳动物目的基因表达。将一个DNA序列整合到基因组或一个大基因组片段中来增强目的基因的表达。然后可以将该修饰过的构建体转入次级宿主中。可以在目的基因邻近处整合一个扩增基因从而使目的区域发生扩增以实现增强表达。

上述两种方法(通过克隆或通过体内同源重组构建过表达构建体)均要求在其可被过表达之前将基因克隆并测序。另外,利用同源重组,还必须要知道基因组序列和结构。

不幸的是,许多基因还未被鉴定和/或测序。因此,无论目的基因是否以前已被克隆、其序列和结构是否已知,用于过表达该基因的方法将十分有用。

发明简述

因此,本发明一般性地涉及在细胞内过表达内源基因的方法,所述方法包括将含有转录调控序列的载体导入细胞,使载体通过非同源重组整合到该细胞的基因组中,使内源基因在细胞内过表达。该方法不需要预先已知内源基因的序列,甚至不需要知道它的其存在。

本发明还包括用于经非同源重组来活化基因的表达或过表达基因的新载体构建体。该新构建体不含同源导向序列。这就是说,它不含有这样一些核苷酸序列,该序列靶定宿主细胞DNA并促进在靶位点进行内源重组,从而导致细胞基因借助所导入的转录调控序列而过表达。

新载体构建体包括这样的载体,它含有与一个未配对的剪接供体序列可操纵地连接在一起的转录调控序列,并还含有1或多个扩增标记。

新载体构建体包括下列构建体:具有转录调控序列的构建体,该序列与翻译起始密码子、分泌信号序列以及未配对的剪接供体位点可操纵地连接在一起;具有转录调控序列的构建体,该序列与翻译起始密码子、表位标记以及未配对的剪接供体位点可操纵地连接在一起;含有转录调控序列的构建体,该序列与翻译起始密码子、信号序列和表位标记以及未配对的剪接供体位点可操纵地连接在一起;含有转录调控序列的构建体,该序列与翻译起始密码子、分泌信号序列、表位标记以及序列特异的蛋白酶位点和未配对的剪接供体位点可操纵地连接在一起。

载体构建体可以含有1或多个用于挑选重组宿主细胞的选择标记。可选择地,可通过由活化内源基因产物提供的性状的表型选择来实现挑选。

这些载体,和实际上本文公开的任何载体,以及本领域技术人员很容易想到这些载体的变异体可被用于在本文公开的任何方法中配制可由这些方法制备的任何组合物。

用于本发明载体构建体中的转录调控序列包括,但不限于启动子。在优选实施方案中,所述启动子是一个病毒启动子。在更优选的实施方案中,病毒启动子是巨细胞病毒立即早期启动子。在另一个具体实施方案中,启动子是细胞非病毒启动子或诱导型启动子。

用于本发明载体构建体中的转录调控序列也可以包括,但不限于增强子。在优选实施方案中,所述增强子是病毒增强子。在更优选的实施方案中,该病毒增强子是巨细胞病毒立即早期增强子。在另一个具体实施方案中,增强子是细胞非病毒增强子。

在文中公开的方法的优选实施方案中,载体构建体是,或者可以含有线性RNA或DNA。

可以筛选基因表达的含有载体的细胞。

可以于体外在利于由细胞产生预期量内源基因的基因产物(文中又可互换地称为“表达产物”)的条件下,培养过表达所述基因的细胞,其中该内源基因已被活化或其表达已提高。然后可分离并纯化表达产物,用来进行如蛋白质治疗或发现药物。

另一方面,使表达所需基因产物的细胞在体内表达基因产物。在本发明这些具体方面,在利于基因被真核生物体内细胞进行过表达或活化的条件下,可以将含有本发明所述载体构建体(已整合到其基因组中)的细胞导入真核生物(比如脊椎动物,尤其是哺乳动物,更特别是人)。在本发明这些相关方面,可以在将细胞导入真核生物之前将其分离和克隆。

本发明还涉及在细胞内过表达内源基因的方法,包括将含有转录调控序列和1或多个扩增标记的载体导入细胞,使载体通过非同源重组整合到细胞基因组中,使内源基因在细胞内过表达。

可以筛选过表达所述基因的含有载体的细胞。

培养过表达基因的细胞,从而获得内源基因的扩增。然后可以体外培养细胞来制备已发生扩增的内源基因的预期量基因产物,其中所述内源基因已被活化或者其表达已提高。然后可以分离并纯化基因产物。

可选择地,扩增之后,可令细胞在体内表达内源基因并产生预期量基因产物。

但是应当明白,任何用于文中所述方法的载体可以包括1或多个扩增标记。因此,在细胞内,载体和目的DNA(即含有被过表达的基因的DNA)都被扩增,并获得内源基因进一步增强的表达。与此相应,所述方法可以包括一个扩增内源基因的步骤。

本发明还涉及在细胞内过表达内源基因的方法,包括将含有转录调控序列和未配对剪接供体序列的载体导入细胞,使载体经非同源重组整合到细胞基因组中,在细胞中过表达所述内源基因。

可以筛选基因表达的含有载体的细胞。

可以在体外培养过表达基因的细胞以便制备预期量的其表达已被活化或提高的基因的基因产物。然后可以分离并纯化所述基因产物。

可选择地,可令细胞在体内表达所需基因产物。

载体构建体可本质上含有转录调控序列:

载体构建体可本质上含有转录调控序列和1或多个扩增标记。

载体构建体可本质上含有转录调控序列和剪接供体序列。

本发明的任何载体构建体还可以包含分泌信号序列。分泌信号序列被安排在构建体中,这样它将与被活化的内源蛋白可操纵地连接在一起。因此,目的蛋白质会在细胞内发生分泌,方便了该蛋白质的纯化。与此相应,所述方法可以包括一个使蛋白质表达产物从细胞中分泌出来的步骤。

本发明还包括通过任何上述方法制得的细胞。本发明包括含有所述载体构建体的细胞、其中的载体构建体已整合到细胞基因组中的细胞、以及由内源基因在所导入的转录调控序列的引导下过表达所需基因产物的细胞。

可将细胞分离并克隆。

可以在任何真核生物来源(比如真菌、植物或动物)的细胞内实施所述方法。在优选实施方案中,可以在脊椎动物细胞内尤其是哺乳动物细胞(包括但不限于大鼠、小鼠、牛、猪、绵羊、山羊和人细胞,更特别是在人细胞中)中实施本发明的方法。

通过上述方法制得的单个细胞可以过表达单个基因或多个基因。可以通过将单一类型的构建体整合到基因组中的多个位置来活化细胞内的多个基因。类似地,可以通过将多重构建体(即多个类型的构建体)整合到基因组中的多个位置来活化细胞内的多个基因。因此,一个细胞可以只含一类载体构建体或不同类型的载体构建体,每个均能活化一个内源基因。

本发明还涉及通过下列一或多项,制备上述细胞的方法:将本发明的一或多个载体构建体导入细胞;使导入的构建体通过非同源重组整合到细胞基因组中;在细胞内过表达一或多个内源基因;分离和克隆细胞。本发明还涉及由这些方法制得的细胞,其中该细胞可能是分离的细胞。

本发明还包括利用上述细胞来过表达基因(比如内源的细胞基因)的方法,所述基因已被鉴定(例如,已测序)、未鉴定(例如,一个功能已知但未被克隆或测序的基因),或是在过表达之前,不知道其存在的基因。可以用细胞来在体外或体内制备预期量的表达产物。如果必要,可以随后通过例如裂解细胞或从生长培养基中分离(当载体含有分泌信号序列时)来分离并纯化该表达产物。

本发明还包括由上述方法制得的细胞文库。每个文库可以包括得自一次转染实验的所有克隆或得自一次转染实验的一个亚组的克隆。所述亚组可以过表达相同的基因或多个基因,例如,一类基因。转染可以用单个构建体或多个构建体进行。

可以通过将得自两次或多次转染实验的所有重组细胞合并、将得自一次转染实验的1或多个细胞亚组合并、或者将得自不同转染实验的细胞亚组合并从而形成所述文库。所得文库可以表达相同的基因或多个基因,例如一类基因。同样,在每次转染中,可以使用单个构建体或多个构建体。

文库可由相同或不同的细胞类型构成。

本发明还涉及通过从相同或不同转染实验中挑选各种细胞亚组来制备文库的方法。

本发明还涉及利用上述细胞或细胞文库来过表达或活化内源基因的方法,或者获得这些过表达或活化基因的基因表达产物的方法。根据本发明的这一方面,可以筛选细胞或细胞文库来表达某因,并可挑选出能表达所需基因产物的细胞。然后用这些细胞来分离或纯化用于后续用途的基因产物。可以通过下述方式在细胞内进行表达:在有利于由细胞产生内源基因的表达产物的条件下体外培养所述细胞,或者使细胞在体内表达基因。

在本发明的优选实施方案中,所述方法包括一个分离或纯化表达产物的过程。在非常优选的实施方案中,培养能表达内源基因产物的细胞,培养条件为有利于产生足够量的基因产物以便用于商业应用,尤其是诊断、治疗和药物开发等用途。

任何上述方法都可进一步包括在载体整合之前或同时,向细胞的基因组DNA导入双链断裂片段。

根据以下附图和说明书及权利要求,本发明的其它优选实施方案对本领域普通技术人员是显而易见的。

附图简述

图1.本文所述基因活化过程的示意图。将活化构建体转染到细胞内,并使其在DNA断裂处整合到宿主细胞染色体中。如果断裂发生在目的基因的上游(例如Epo),并且合适的活化构建体在断裂处整合,这样调控序列与目的基因可操纵地连接在一起,基因就被活化。转录和剪接产生嵌合RNA分子,该分子含有来自活化构建体和内源基因的外显子序列。随后的翻译将产生目的蛋白质。将重组细胞分离后,可以进一步借助基因扩增来增强基因表达。

图2.非翻译活化构建体的示意图。箭头代表启动子序列。外显子序列表示为开放盒,S/D表示剪接供体序列。与下面说明对应的构建体编号示于左边。选择和扩增标记未示出。

图3.翻译活化构建体的示意图,箭头代表启动子序列。外显子序列表示为开放盒,S/D表示剪接供体序列。翻译的信号肽、表位标记以及蛋白酶切割序列示于构建体下的图标中。与下面说明对应的构建体编号示于左边。选择和扩增标记未示出。

图4.能活化内源基因的活化构建体的示意图。

图5A-5D.pRIG8R1-CD2的核苷酸序列(SEQ IDNO:7)。

图6A-6C.pRIG8R2-CD2的核苷酸序列(SEQ IDNO:8)。

图7A-7C.pRIG8R3-CD2的核苷酸序列(SEQ IDNO:9)。

发明详述

通过非同源重组活化基因大大优于其它基因活化方法。与以前蛋白质过表达不同,本文描述的方法不需克隆(从细胞中分离出来)目的基因。它们也不需了解将要过表达的基因的DNA序列或结构(即ORF、内含子、外显子或上游和下游调控元件的序列)或该基因的表达方式(即组织特异性、发育调控等)。另外,这些方法不需要有关目的基因的基因结构(即内含子和外显子结构)的知识。

因此,本发明的方法涉及载体构建体,其中该载体构建体不含有用于同源重组的靶核苷酸序列。靶序列能使载体DNA与细胞DNA在细胞DNA上的预定位点进行同源重组,所述位点与载体中的序列具有同源性,在预定位点发生的同源重组导致转录调控序列被导入基因组,内源基因随即被活化。

本发明的方法不包括载体在预定位点处整合。相反,本方法涉及本发明的载体构建体通过非同源或“非法重组”整合到细胞DNA(例如,细胞基因组)中。

本文中描述的载体不含靶序列。靶序列是载体上的这样一个序列,它与待活化的基因内部的或者其上游的一或多个序列同源,其中上游区域到达并且包括目的基因相同的编码链上第一个功能剪接受体位点,借助该同源性,将能活化目的基因的转录调控序列整合到含有待活化基因的细胞的基因组中。在用增强子整合载体来活化内源基因的情况中,在增强子能起到作用的距离内,所述载体不与目的基因的基因组的上游或下游(或在目的基因内部)的任何序列有同源性。

因此这些方法能够鉴定到那些已被或可能被常规和现有克隆技术丢失的新基因。利用本文描述的构建体和方法,可以快速鉴定未知和/或未鉴定的基因,并使其过表达以产生蛋白质。这些蛋白质的用途包括人类治疗和诊断,及作为药物开发的靶。

所述方法还能用于已知和/或已鉴定基因的过表达,以便体外或体内制备蛋白质。

“已知基因”涉及基因的鉴定水平。本发明能表达已被鉴定和未被鉴定的基因。不同程度的鉴定都是可能的。这些包括详细的鉴定,比如克隆、DNA、RNA和/或蛋白质测序,以及确定基因的调控和功能与克隆序列的关系(例如,识别启动子和增强子序列、开放读码框的功能,内含子等)。鉴定可以较粗略,比如将基因和相关功能作图,或得到部分氨基酸序列或核苷酸序列,或已将蛋白质纯化并确定了功能。鉴定可能是极基本的,如已知核苷酸或氨基酸序列或者已将蛋白质分离,但功能未知。可选择地,功能可能是已知的,但相关的蛋白质或核苷酸序列未知,或者虽然知道序列但没有与功能建立联系。最后,也可能没有做任何鉴定,因为基因的存在及其功能均是未知的。本发明可以在任何上述或其它具体的鉴定程度的水平上表达任何基因。

利用一个活化构建体并在一组转染中可以活化或过表达许多不同蛋白质(在本文中还可互换地称为“基因产物”或“表达产物”)。因此,在用相同或不同构建体转染之后,一组转染子(文库)中的一个细胞或不同细胞可以过表达多个蛋白质。而以前的活化方法要求给每个待活化基因建立一个独特的构建体。

此外,利用一个构建体可以同时形成和检测一个基因附近的许多不同整合位点。这就使得能快速确定用于蛋白质表达的活化构建体的最佳基因组位置。

利用以前的方法,对于目的基因5’端的序列和结构必须做广泛的鉴定。必须给每个要制备的活化构建体分离一个合适的靶序列。通常,靶序列必须是分离自与待活化细胞相同的人或动物实验株的纯合序列。在某些情下,该DNA可能是来自目的基因的50kb或更长片段。因此,制备每个导向构建体要对内源基因进行大量克隆和测序工作。而因为本发明的方法不需要序列和结构信息,可以活化未知基因和带有未做鉴定的上游区域的基因。

这就有可能利用内源DNA序列与胞内DNA进行的非同源重组做原位基因活化。本发明即提供了利用非同源重组实现的这种原位基因活化所需的方法和组分(例如,载体构建体)。

DNA分子可以通过几种不同的独立机制发生重组从而重新分配其遗传内容,所述机制包括同源重组、位点特异性重组、以及非同源/非法重组。同源重组涉及那些序列极其类似的DNA片段之间的重组、已经证实,同源重组涉及在遗传物重新分配之前,同源序列沿其链形成配对。交叉的确切位点可以是同源片段中的任何位点。重组效率与同源导向序列的长度(Hope,发育113:399(1991);Reddy等,病毒学杂志65:1507(1991))、两个发生重组的序列之间的序列相同程度(Von Melchner等,基因进展6:919(1992))、以及构建体中同源与非同源DNA的比率(Letson,遗传学117:759(1987))成比例。

另一方面,位点特异性重组涉及遗传物质在预定位点(由特异DNA序列决定)的交换。在该反应中,蛋白质重组酶结合到重组信号序列上,形成一个链断裂,并促进DNA链交换。Cre/Lox重组就是位点特异性重组的实例。

非同源/非法重组,比如本发明的方法有利地所采用的,包括没有显著序列同源性的遗传物质的连接(交换或重新分配)并且不是发生在位点特异性重组序列处。非同源重组的例子包括外源DNA在非同源位点整合到染色体中、染色体易位和缺失,DNA末端连接,染色体末端的双链断裂修复,桥裂合以及转染序列的连环化。在多数情况中,认为非同源重组是通过“游离DNA未端”的连接发生的。游离末端是这样的DNA分子,它含有一个能够与第二个DNA末端直接连接、或者在修复或加工后与第二个DNA末端连接的末端。该DNA末端可能含有5′突出端,3′突出端,或者平末端。

在本文中,可以广泛地将逆转录病毒插入和其它转座反应看作是非同源重组。这些反应不涉及利用发生重组的分子间的同源性。而且,与位点特异性重组不同,这些类型的重组反应不是在离散位点之间进行的。相反,仅在重组配偶体(即,逆转录病毒或转座子)之一上需要有特异蛋白质/DNA复合体,而第二个DNA配偶体(即,细胞基因组)通常是相当非特异性的。结果,这些“载体”不是以定向方式整合到细胞基因组,因此可以根据本发明用它们来递送活化构建体。

可用于本文所述方法的载体构建体理想情况下可以含有一个转录调控序列,它与细胞内的基因组序列发生非同源重组从而在该细胞内过表达内源基因。本发明的载体构建体还缺少同源靶序列。即,它们不含有靶定宿主细胞DNA并促进在靶位点处发生同源重组的DNA序列。因此,本发明的载体构建体通过非同源重组整合到细胞基因组中,并借助所导入的包含在整合进来的载体构建体中的转录调控序列来过表达细胞基因。

本发明一般性地涉及用于在细胞内过表达内源基因的方法,包括将含有转录调控序列的载体导入细胞中,使载体通过非同源重组整合到细胞基因组中,使内源基因在细胞内过表达。该方法不需要预先了解内源基因的序列甚至其存在。而在待活化基因序列已知的情况下,可以将构建体改造为含有合适的载体元件构型(例如,起始密码子的位置,内源基因的第一个外显子中存在的附加密码子、以及合适的读框)从而获得最大程度的过表达和/或适当的蛋白质序列。

在本发明的某些实施方案中,可以筛选基因表达的含有载体的细胞。

可以体外培养过表达所述基因的细胞,培养条件为有利于该细胞产生那些已被活化或其表达已提高的内源基因的预期量的基因产物。如果需要,可以随后将基因产物分离或纯化以便用于,例如,蛋白质疗法或药物开发。

可选择地,可以将表达所需基因产物的细胞在体内表达所述基因产物。

载体构建体可本质上含有转录调控序列。

可选择地,所述载体构建体可本质上含有转录调控序列和1或多个扩增标记。

因此,本发明还涉及在细胞内过表达内源基因的方法,包括将含有转录调控序列和扩增标记的载体导入细胞中,使载体通过非同源重组整合到细胞基因组中,使内源基因在细胞内过表达。

筛选过表达所述基因的含有载体的细胞。

培养过表达所述基因的细胞从而使内源基因的扩增。然后将细胞体外培养从而得到扩增后的内源基因的预期量基因产物,该内源基因已被活化,或者其表达已提高,然后可以对基因产物进行分离和纯化。

可选择地,扩增后,使细胞在体内表达内源基因并产生预期量基因产物。

载体构建体可本质上含有转录调控序列和剪接供体序列。

因此,本发明还涉及在细胞内过表达内源基因的方法,包括将含有转录调控序列和未配对的剪接供体序列的载体导入细胞中,使载体通过非同源重组整合到细胞基因组中,使内源基因在细胞内过表达。

筛选表达所述基因的含有载体的细胞。

体外培养过表达基因的细胞从而得到预期量的内源基因的基因产物,该内源基因的表达已被活化,或者其表达已提高,然后可以对基因产物进行分离和纯化。

可选择地,可以使细胞在体内表达所需基因产物。

载体构建体可本质上含有可操纵地连接到未配对剪接供体序列的转录调控序列,并且还含有扩增标记。

其它活化载体包括下列一些构建体:具有转录调控序列和含有起始密码子的外显子序列的构建体;具有转录调控序列和含有翻译起始密码子及分泌信号序列的外显子序列的构建体;具有转录调控序列和含有翻译起始密码子及表位标记的外显子序列的构建体;具有转录调控序列和含有翻译起始密码子、信号序列及表位标记的外显子序列的构建体;包含转录调控序列和含有翻译起始密码子、分泌信号序列、表位标记及序列特异性蛋白酶位点的外显子序列的构建体。在上述每个构建体中,构建体上的外显子紧邻未配对的剪接供体位点的上游。

构建体还可以含有调控序列、缺少polyA信号的选择标记、内部核糖体进入位点(ires)以及未配对的剪接供体位点(图4)。任选在ires和未配对的剪接供体位点之间包括起始密码子、分泌信号序列、表位标记、和/或蛋白酶切割位点。当该构建体整合到基因上游时,由于内源基因可以提供一个polyA位点,选择标记可以被有效地表达。此外,下游基因也被表达,因为ires使得在下游开放读框(即内源基因)处开始进行蛋白质翻译。因此,由该活化构建体产生的信息是多顺反子的。该构建体的优点在于整合事件不在基因附近进行,并且适当取向,不会产生抗药性集落。其原因是没有polyA尾部(内源基因所提供的),新霉素抗性基因不能有效地表达。通过减少无效整合的次数,可以在不影响其覆盖面(被活化的基因的数量)的情况下,降低文库的复杂程度,这能便利筛选过程。

在所述构建体的另一个实施方案中,可以在调控序列和neo起始密码子之间以及ires和未配对的剪接供体位点之间(在ires和起始密码子(如果有)之间)包括上crx-lox重组序列。分离出其目的基因已被活化的细胞后,可以用编码cre重组酶的质粒转染该细胞,从而除去neo基因和ires。这能消除多顺反子信息,使得内源基因直接从被整合上来的活化构建体上的调控序列进行表达。利用Cre重组来协助从哺乳动物染色体上缺失遗传元件已有描述(Gu等,科学265:103(1994);Sauer,酶学方法225:890-900(1993))。

因此,可用于本文描述的方法的构建体包括,但不限于,下列构建体(见图1-4):

1)    具有调控序列和缺少翻译起始密码子的外显子的构建体。

2)    具有调控序列和缺少翻译起始密码子的外显子,其后是剪接供体位点的构建体。

3)    具有调控序列和读码框1(相对剪接供体位点而言)中含有翻译起始密码子的外显子,其后是未配对剪接供体位点的构建体。

4)    具有调控序列和读码框2(相对剪接供体位点而言)中含有翻译起始密码子的外显子,其后是未配对剪接供体位点的构建体。

5)    具有调控序列和读码框3(相对剪接供体位点而言)中含有翻译起始密码子的外显子,其后是未配对剪接供体位点的构建体。

6)    具有调控序列以及读码框1(相对剪接供体位点而言)中含有翻译起始密码子和分泌信号序列的外显子,其后是未配对剪接供体位点的构建体。

7)    具有调控序列以及读码框2(相对剪接供体位点而言)中含有翻译起始密码子和分泌信号序列的外显子,其后是未配对剪接供体位点的构建体。

8)    具有调控序列以及读码框3(相对剪接供体位点而言)中含有翻译起始密码子和分泌信号序列的外显子,其后是未配对剪接供体位点的构建体。

9)    具有调控序列以及读码框1(相对剪接供体位点而言)中含有(从5’到3’)翻译起始密码子和表位标记的外显子,其后是未配对剪接供体位点的构建体。

10)    具有调控序列以及读码框2(相对剪接供体位点而言)中含有(从5’到3’)翻译起始密码子和表位标记的外显子,其后是未配对剪接供体位点的构建体。

11)    具有调控序列以及读码框3(相对剪接供体位点而言)中含有(从5’到3’)翻译起始密码子和表位标记的外显子,其后是未配对剪接供体位点的构建体。

12)    具有调控序列以及读码框1(相对剪接供体位点而言)中含有(从5’到3’)翻译起始密码子、分泌信号序列和表位标记的外显子,其后是未配对剪接供体位点的构建体。

13)    具有调控序列以及读码框2(相对剪接供体位点而言)中含有(从5’到3’)翻译起始密码子、分泌信号序列和表位标记的外显子,其后是未配对剪接供体位点的构建体。

14)    具有调控序列以及读码框3(相对剪接供体位点而言)中含有(从5’到3’)翻译起始密码子、分泌信号序列和表位标记的外显子,其后是未配对剪接供体位点的构建体。

15)    具有调控序列以及读码框1(相对剪接供体位点而言)中含有(从5’到3’)翻译起始密码子、分泌信号序列、表位标记和序列特异的蛋白酶位点的外显子,其后是未配对剪接供体位点的构建体。

16)    具有调控序列以及读码框2(相对剪接供体位点而言)中含有(从5’到3’)翻译起始密码子、分泌信号序列、表位标记和序列特异的蛋白酶位点的外显子,其后是未配对剪接供体位点的构建体。

17)    具有调控序列以及读码框3(相对剪接供体位点而言)中含有(从5’到3’)翻译起始密码子、分泌信号序列、表位标记和序列特异的蛋白酶位点的外显子,其后是未配对剪接供体位点的构建体。

18)    具有与选择标记连接在一起的调控序列,其后是内部核糖体进入位点和未配对剪接供体位点的构建体。

19)    构建体18,其中cre/lox重组信号位于a)调控序列和选择标记的开放读码框之间以及b)ires和未配对剪接供体位点之间。

20)    具有调控序列,该序列与含有缺少终止密码子的绿色荧光蛋白的外显子可操纵地连接在一起,其后是未配对剪接供体位点的构建体。

但是应当明白,任何用于文中所述方法的载体可以包括一或多个(即,1、2、3、4、5或更多,最优选1或2个)扩增标记。与此相应,所述方法可以包括一个扩增内源基因的步骤。在活化构建体上插入一或多个扩增标记使得在被活化细胞中,目的基因与一或多个扩增标记并列。一旦分离出被活化细胞,可以通过挑选这样一些细胞进一步提供表达,所述细胞包含带有目的基因和活化构建体的基因座拷贝数增加。可以通过本领域已知的挑选方染来实现这一目的,例如在含有1或多种选择试剂的选择培养基上培养细胞,其中所述选择试剂对基因构建体或载体上含有的1或多个扩增标记有特异性。

经上述任何载体的非同源整合使内源基因活化后,可以通过挑选位于整合载体中的拷贝数增加的扩增标记来进一步提高内源基因的表达。虽然可以用整合载体上的一个扩增标记来实施该方法,但在本发明的替代实施方案中,提供了这样的方法,其中载体可包含2或多个(即2、3、4、5或更多,最优选2个)扩增标记来协助更有效地挑选出那些载体和旁侧目的基因均被扩增的细胞。这种方案对于某些细胞尤其有用,所述细胞有载体上所含的一或多个扩增标记的一个功能性内源拷贝,因为选择步骤可以分离出那些不正确地扩增了内源扩增标记,而不是载体编码的扩增标记的细胞。该方法也可用于淘汰那些通过不涉及基因扩增的机制对选择试剂产生抗性的细胞。在这些情况下,使用两或多种扩增标记的方法是有益的,因为一个细胞在没有扩增整合载体和旁侧目的基因的情况下,对两或多种选择试剂产生抗性的可能性显著低于细胞对任何一种选择试剂产生抗性的可能性。因此,通过同时或连续选择两或多个载体编码的扩增标记,将有更大百分比的最后分离到的细胞含有被扩增的载体和目的基因。

因此,在另一个实施方案中,本发明的载体可以含有两或多种(即2,3,4,5,或更多,最优选2种)扩增标记,该方法能够在活化表达后更有效地扩增载体序列和邻近的目的基因。

可以用于构建所述载体的扩增标记的例子包括,但不限于二氢叶酸还原酶、腺苷脱氨酶、天冬氨酸转氨甲酰酶、二氢乳清酸酶以及氨甲酰磷酸合成酶。

还应当明白,本文所述的任何构建体可以含有真核生物病毒的复制起点替代扩增标记或与其相连。病毒复制起点的存在使得整合载体和相邻的内源基因作为游离体分离和/或在导入适当的病毒复制蛋白质的情况下,扩增到高拷贝数。有用的病毒起点的例子包括,但不限于SV40 ori和EBV oriP。

本发明还包括一些实施方案,其中本文公开的构建体本质上含有以上具体描述的用于这些构建体的成分。还应当明白,上述构建体是可以用于本文所述方法的构建体的例子,而本发明包括这些构建体的功能等同物。

术语“载体”应理解为一般性地指将核苷酸序列导入细胞中的运载物。它并不试图限定到任何具体序列。载体本身可以是活化内源基因的核苷酸序列或者可以含有活化内源基因的序列。因此,载体可以仅是一个本质上只含有活化所需的序列的线形成环形多核苷酸,或者可以是存在于较大多核苷酸中的这些序列或者其它构建体,比如一个DNA或RNA病毒基因组、完整的毒粒或其它用来将关键核苷酸或其它序列导入细胞中的生物构建体。

载体可以含有天然存在的或者是通过基因工程或合成法制得的DNA序列。

当构建体非同源整合到细胞基因组中时,其能够活化内源基因的表达。内源基因的表达可能产生全长蛋白质,或产生内源蛋白质的截短的生物活性形态,这取决于整合位点(如在上游区域还是内含子2)。被活化的基因可以是已知基因(例如,已被克隆或鉴定的)或未知基因(未被克隆或鉴定的),基因的功能可以是已知或未知的。

活性已知的蛋白质的例子包括,但不限于,细胞因子、生长因子、神经递质、酶、结构蛋白质、细胞表面受体,胞内受体、激素、抗体以及转录因子。可以用本方法制备的已知蛋白质的具体例子包括,但不限于,红细胞生成素、胰岛素、生长激素、葡糖脑苷脂酶,组织纤溶酶原活化物、粒细胞集落刺激因子(G-CSF)、粒细胞/巨噬细胞集落刺激因子(GM-CSF)、干扰素α、干扰素β、干扰素δ,白介素-2、白介素-3、白介素-4、白介素-6、白介素-8、白介素-10、白介素-11、白介素-12、白介素-13、白介素-14、TGF-β,凝血因子Ⅴ,凝血因子-Ⅶ、凝血因子-Ⅷ、凝血因子-Ⅸ、凝血因子-Ⅹ、TSH-β、骨骼生长因子-2、骨骼生长因子-7,肿瘤坏死因子、α-Ⅰ抗胰蛋白酶、抗凝血酶Ⅲ,白血病抑制因子、胰高血糖素、蛋白C、蛋白激酶C、巨噬细胞集落刺激因子(M-CSF)、干细胞因子、促卵泡激素β、尿激酶、神经生长因子、类胰岛素生长因子、促胰岛素、甲状旁腺激素、乳铁蛋白、补体抑制因子、血小板衍生生长因子,角质细胞生长因子、肝细胞生长因子、内皮细胞生长因子、神经营养蛋白-3、血小板生成素、绒膜促性腺激素、凝血调节蛋白、α糖苷、表皮生长因子以及成纤维细胞生长因子。本发明还能活化许多表达跨膜蛋白质的基因,并制备和分离这些蛋白质,它们包括但不限于生长因子的细胞表面受体、激素、神经递质和细胞因子如上面描述的那些、跨膜离子通道、胆固醇受体、脂蛋白(包括LDL和HDL)和其它类脂部分的受体、整合蛋白和其它胞外基质受体、细胞骨架锚蛋白、免疫球蛋白受体、CD抗原(包括CD2、CD3、CD4、CD8和CD34抗原),以及其它本领域已知的细胞表面跨膜的结构和功能蛋白质。正如本领域普遍技术人员能想到的,通过本发明的方法还可以制备其它本领域已知的其它细胞蛋白质和受体。

本文所述方法的一个优点是它实际上能活化任何基因。但是,由于基因有不同的基因组结构,包括不同的内含子/外显子界线和起始密码的位置,为了在一群细胞中活化最大数量的不同基因,要提供许多活化构建体。

可以将这些构建体分别转染到细胞中制备文库,每个文库含有的细胞带有独特的一组活化基因。某些基因被几种不同的活化构建体活化。另外,可以活化基因的某些部分来产生截短的、生物活性蛋白质。截短的蛋白质可以这样制备,例如将活化构建体整合到内源基因中部的内含子或外显子中,而不是整合到第二个外显子的上游。

使用不同构建体还可以使活化了的基因被修饰从而使其含有新的序列。例如,可以在活化构建体上包含分泌信号序列来促进活化基因的分泌。在某些情况中,根据内含子/外显子结构和目的基因的情况,分泌信号序列可以取代内源基因的全部或部分信号序列,在另外一些情况中,信号序列能使通常位于胞内的蛋白质分泌出去。

载体上的调控序列可以是组成型启动子。可选择地,启动子可以是诱导型的,使用诱导型启动子能使细胞在常规培养和扩展过程中只产生低基底水平的活化蛋白质。然后例如在制备或筛选过程中,细胞可以被诱导以产生大量所需蛋白质。诱导型启动子的例子包括,但不限于,四环素诱导型启动子和金属硫蛋白启动子。

在本发明的优选实施方案中,载体上的调控序列可以是组织特异性启动子或增强子。

载体上的调控序列可以分离自细胞或病毒基因组。细胞调控序列的例子包括,但不限于,来自肌动蛋白基因、金属硫蛋白Ⅰ基因、免疫球蛋白基因、酪蛋白Ⅰ基因、血清白蛋白基因、胶原蛋白基因、球蛋白基因、层粘连蛋白基因、血影蛋白基因、锚蛋白基因、Na/KATP酶基因和微管蛋白基因的调控元件。病毒调控序列的例子包括,但不限于,来自巨细胞病毒(CMV)立即早期基因、腺病毒晚期基因、SV40基因、逆转录病毒LTRs和疱疹病毒基因的调控元件。通常,调控序列含有转录因子(比如NF-kB、SP-1、TATA结合蛋白、AP-1、和CAAT结合蛋白)的结合位点。从功能上说,调控序列是由其启动、增强或者改变内源基因转录的能力所定义的。

在优选实施方案中,调控序列是病毒启动子。在极优选的实施方案中,启动子是CMV立即早期基因启动子。在替代实施方案中,增强子是细胞非病毒启动子。

在优选实施方案中,调控元件含有一个增强子。在极优选的实施方案中,增强子是CMV立即早期基因增强子。在替代实施方案中,调控元件是细胞、非病毒增强子。

转录调控序列可以由支架结构结合区或基质结合位点、负调控元件以及转录因子结合位点组成。调控序列还可以包括基因座控制区。

本发明包括逆转录病毒转录调控序列,例如长末端重复的使用。但是当用这些序列时,它们不必与任何逆转录病毒序列相连,后者能极大地影响转录调控序列作为待活化的内源基因(即转录调控序列将要与之重组以便活化的细胞基因)的转录启动子或增强子的功能。

构建体可以含有一个不与载体上的外显子序列可操纵地连接在一起的调控序列。例如,当调控元件是一个增强子,它可以在内源基因附近(例如,上游、下游、或在内含子内部)进行整合并刺激该基因从其内源启动子处开始表达。通过这个活化机制,在被活化基因的转录产物中不存在来自载体的外显子序列。

可选择地,调控元件可以与外显子可操纵地连接在一起,该外显子可以是天然产生的序列或者可以是非天然产生的(例如合成制备的)序列。为了活化在其第一个外显子中缺少起始密码子的内源基因(例如,促卵泡激素β),优选将载体上的外显子的起始密码子缺失。为了活化其第一个外显子中含有起始密码子的内源基因(例如,红细胞生成素和生长激素),优选载体上的外显子含有起始密码子,通常是ATG,优选是一个高效翻译起始位点(kozak,分子生物学杂志196:947(1987))。外显子可以含有跟在起始密码子后面的附加密码子。这些密码子可以来源于天然产生的基因或者是非天然产生的(例如,合成的)。密码子可以与待活化内源基因的第一个外显子中的密码子相同。可选择地,密码子可与内源基因的第一个外显子中的密码子不同。例如,所述密码子可以编码一个表位标记、分泌信号序列、跨膜结构域、选择标记或筛选标记。任选,紧邻外显子序列3’端有一个未配对的剪接供体位点。当待活化的基因的结构已知时,应将剪接供体位点放在紧邻载体外显子的位置,这样在剪接之后,载体中的密码子将与内源基因的第二个外显子的密码子读框一致。当待活化的内源基因的结构未知时,使用分别含有不同读码框的构建体。

可操纵地连接被定义为一个允许通过指定序列进行转录的构型。例如,与外显子序列可操纵地连接的调控序列表明该外显子序列被转录。载体上存在起始密码子时,可操纵地连接还表明载体外显子的开放读码框与内源基因的开放读码框是读框一致的。在非同源整合之后,载体上的调控序列(例如,启动子)变成与内源基因可操纵地连接在一起,并在一个通常称为CAP位点的位点上协助转录起始。转录连续通过载体上的外显子元件(以及如果有的话,通过起始密码子、开放读码框,和/或未配对的剪接供体位点)和通过内源基因。由这个可操纵连接产生的初级转录产物被剪接以产生一个含有来自载体和内源基因两者的外显子序列的嵌合转录产物。翻译后,该转录产物能产生一个内源蛋白质。

外显子或“外显子序列”定义为存在于成熟RNA分子中的任何被转录的序列。载体上的外显子可以含有非翻译序列,例如,5’非翻译区。可选择地,或者与非翻译序列连接在一起,外显子可以含有编码序列,比如起始密码子和开放读码框。开放读码框可以编码天然产生的氨基酸序列或非天然产生的氨基酸序列(例如,合成密码子)。开放读码框还可以编码分泌信号序列、表位标记、外显子、选择标记、筛选标记或者核苷酸,当与内源基因进行剪接时,该核苷酸用于保护该开放读码框。

初级转录产物的剪接(通过该过程去除内含子)由分别位于内含子5’和3’端的剪接供体位点和剪接受体位点引导进行。剪接供体位点的共有序列是(A/C)AG GURAGU(其中R代表嘌呤核苷酸),1-3位的核苷酸位于外显子中,核苷酸GURAGU位于内含子中。

未配对的剪接供体位点在本文中定义为位于活化构建体上的没有下游剪接受体位点的剪接供体位点。当载体通过非同源重组整合到宿主细胞的基因组中时,未配对的剪接供体位点与来自内源基因的剪接受体位点形成配对。来自载体的剪接供体位点,与来自内源基因的剪接受体位点一起,将引导载体剪接受体位点和内源剪接受体位点之间的所有序列的切除。这些间插序列的切除去掉了干扰内源蛋白质翻译的序列。

本文中所用的术语“上游”和“下游”,意指相对编码链,分别是5’或3’方向。术语基因的“上游区域”定义为基因的第二个外显子到达并包括具有相同编码链的第一个相邻基因的最后一个外显子的核苷酸序列5’(相对于编码链)。从功能上来说,上游区域是内源基因第二个外显子5’方向的任何位点,它能使非同源整合的载体与内源基因可操纵地连接在一起。

载体构建体可以含有选择标记以便协助鉴定和分离含有进行了非同源整合的活化构建体的细胞。选择标记的例子包括编码下列物质的基因:新霉素抗性(neo)、次黄嘌呤磷酸核糖转移酶(HPRT)、嘌呤霉素(pac)、二氢乳清酸酶谷氨酰胺合成酶(GS)、组氨酸D(hisD)、氨甲酰磷酸合成酶(CAD)、二氢叶酸还原酶(DHFR)、多抗药性1(mdr 1)、天冬氨酸转氨甲酰酶、黄嘌呤-鸟嘌呤磷酸核糖转移酶(gpt)和腺苷脱氨酶(ada)。

可选择地,载体可以含有一个筛选标记,代替选择标记或除选择标记以外。筛选标记能使含有载体的细胞分离出来,而不需给它们施加药物或其它选择压力。筛选标记的例子包括编码细胞表面蛋白质、荧光蛋白和酶的基因。包含载体的细胞可以通过FACS(荧光激活细胞分选仪)利用细胞表面蛋白的荧光标记的抗体或者用能被载体编码的酶转化为荧光产物的底物来分离。

可选择地,可以通过由内源基因产物提供的性状进行表型选择来挑选。因此,活化构建体可以不含选择标记,而不是由内源基因自身提供的“标记”。在该实施方案中,可以基于活化基因赋予的表型来挑选活化细胞。选择表型的例子包括细胞增殖、生长因子独立型生长、集落形成、细胞分化(例如,分化成神经细胞,肌细胞、上皮细胞等)、不依赖于贴壁的生长、对细胞因子的活化作用(例如,激酶,转录因子,核酸酶等)、细胞表面受体/蛋白的表达、获得或丧失细胞-细胞粘着性、迁移和细胞活化(例如,休眠或活化的T细胞)。

当筛选转染细胞以得到基因活化产物而不是筛选稳定的整合子,可以删除构建体上的选择标记。当稳定整合效率高时,这一点尤其有用。

载体可以含有一或多个(即1、2、3、4、5或更多,最优选1或2个)扩增标记以便挑选出包含拷贝数增加的整合载体和相邻活化内源基因的细胞。扩增标记的例子包括,但不限于二氢叶酸还原酶(DHFR)、腺苷脱氨酶(ada)、二氢乳清酸酶谷氨酰胺合成酶(GS)和氨甲酰磷酸合成酶(CAD)。

载体可以含有用于基因扩增的真核生物病毒复制起点。这些起点可以取代扩增标记或者与扩增标记共存。

载体还可以含有用于构建体在微生物中增殖的遗传元件。有用的遗传元件的例子包括微生物的复制起点和抗生素抗性标记。

这些载体和文中公开的任何载体,以及本领域普通技术人员容易想到的变体可以用于上文描述的任何方法从而形成可由这些方法制得的任何组合物。

构建体非同源整合到细胞基因组中使来自载体的调控元件和来自内源基因的外显子之间形成可操纵的连接。在优选实施方案中,利用载体调控序列的插入来上调内源基因的表达。上调基因表达包括将一个转录上的沉默基因转化为转录上的活化基因。它还包括使那些已具转录活性的基因,但蛋白质产生量低于所需量的基因的基因表达增强。在其它实施方案中,可以用其它方法来影响内源基因的表达,比如下调表达、建立诱导型表型或改变表达的组织特异性。

根据本发明,制备基因表达产物的体外方法可能包括,例如,(a)将本发明的载体导入细胞;(b)使载体通过非同源重组整合到细胞基因组中;(c)由载体上所含的转录调控序列上调细胞中的内源基因,从而使其过表达;(d)筛选过表达内源基因的细胞;以及(e)在有利于细胞产生所述内源基因的表达产物的条件下培养细胞。本发明的这种体外方法可能还包含分离表达产物来制备分离的基因表达产物。在这种方法中,可以有利地使用任何本领域已知的分离蛋白质的方法,包括但不限于层析(例如,HPLC、FPLC、LC、离子交换、亲合、体积排阻等)、沉淀(例如,硫酸铵沉淀、免疫沉淀等)、电泳及其它为本领域普通技术人员所熟知的蛋白质分离和纯化方法。

类似地,体内制备基因表达产物的方法可能包括,例如(a)将本发明的载体导入细胞;(b)使载体通过非同源重组整合到细胞基因组中;(c)由载体上所含的转录调控序列上调细胞中的内源基因,从而使其过表达;(d)筛选过表达内源基因的细胞;以及(e)在有利于所述细胞在真核生物体内过表达内源基因的条件下,将分离且克隆的细胞导入真核生物中。根据发明的这个方面,可以有利地使用任何真核生物,包括真菌(尤其是酵母),植物和动物,更优选动物,还优选的是脊椎动物,最优选哺乳动物,尤其是人。在某些相关实施方案中,本发明提供了这样的方法,它还进一步包括在将细胞导入真核生物之前对它进行分离和克隆。

本文中所用的短语在细胞中或由细胞在体外“有利于制备表达产物的条件”,“有利于基因过表达的条件”以及“有利于基因活化的条件”是指任何和所有适宜的环境、物理、营养或生化参数,这些参数能够允许、协助或促进细胞在体外产生表达产物、或者过表达或活化基因。这类条件当然包括使用培养基、保温、光照、湿度等,其可能是最佳或能够允许、协助或促进细胞在体外产生表达产物、或者使基因过表达或活化的条件。类似地,本文中所用的的短语在细胞中或由细胞在体内“有利于制备表达产物的条件”,“有利于基因过表达的条件”以及“有利于基因活化的条件”是指是指任何和所有适宜的环境、物理、营养或生化、行为、遗传和情感参数,在这些条件下维持含有所述细胞的动物,这些条件能够允许、协助或促进由真核生物的细胞体内产生表达产物或者使基因过表达或活化。利用已描述过的筛选方法和下面例举的方法,或者其它本领域常规的测量基因表达、活化或过表达的方法,本领域普通技术人员可以确定给定的一组条件是否有利于体外或体外进行基因表达、活化或过表达。

本发明还包括由上述任何方法制得的细胞。本发明包括含有所述载体构建体的细胞,已整合了载体构建体的细胞以及那些在所导入的转录调控序列的驱动下,由内源基因过表达所需基因产物的细胞。

用于本发明的细胞可以来源于任何真核物种,可以是初级、次级或无限增殖化的细胞。此外,细胞可以来源于生物体内的任何组织。可用来从中分离和活化细胞的组织的例子包括,但不限于,肝、肾、脾、骨髓、胸腺、心脏、肌肉、肺、脑、睾丸、卵巢、胰岛、肠、骨髓、皮肤、骨、胆囊、前列腺、膀胱、胚胎以及免疫和造血系统。细胞类型包括成纤维细胞、上皮细胞、神经细胞、干细胞和滤泡细胞。但是,利用本发明,可以用任何细胞或细胞类型来活化基因表达。

可以在来源于真核生物比如真菌、植物或动物的任何细胞中实施所述方法。优选实施方案包括脊椎动物,尤其是哺乳动物,更特别是人。

可以将构建体整合到初级、次级或无限增殖化的细胞中。初级细胞是分离自脊椎动物,并且未被传代的细胞。次级细胞是已被传代的初级细胞,但未被无限增殖化。无限增殖化的细胞是可以无限传代的细胞系。

在优选实施方案中,细胞是无限增殖化的细胞系。无限增殖化的细胞系的例子包括,但不限于,HT1080、HeLa、Jurkat、293细胞、KB癌、T84结肠上皮细胞系、Raji、HepG2或Hep 3B肝癌细胞系、A2058黑素瘤、U937淋巴瘤和WI38成纤维细胞系、体细胞杂种及杂交瘤。

用于本发明的细胞可以来源于任何真核生物物种,包括但不限于哺乳动物细胞(比如大鼠、小鼠、牛、猪、绵羊、山羊和人)、鸟类细胞、鱼类细胞、两栖动物细胞、爬行动物细胞、植物细胞和酵母细胞。优选地,通过活化来自某物种的细胞中的基因表达来过表达特定物种的内源基因或基因产物。例如,使用人类细胞来过表达内源人类蛋白质。类似地,要过表达内源牛蛋白质(例如牛生长激素),使用牛细胞。

所述细胞可以来源于真核生物中的任何组织。可用来从中分离和活化细胞的脊椎动物组织的例子包括,但不限于,肝、肾、脾、骨髓、胸腺、心脏、肌肉、肺、脑、免疫系统(包括淋巴系统)、睾丸、卵巢、胰岛、肠、胃、骨髓、皮肤、骨、胆囊、前列腺、膀胱、受精卵、胚胎和造血组织。有用的脊椎动物细胞类型包括,但不限于,成纤维细胞、上皮细胞、神经细胞、种系细胞(即精母细胞/精子以及卵母细胞)、干细胞和滤泡细胞。可用来从中分离和活化细胞的植物组织包括,但不限于叶组织、子房组织、雄蕊组织、雌蕊组织、根组织、块茎、配子、种子、胚芽等。但本领域普通技术人员会想到,利用本发明可以用任何真核的细胞或细胞类型来活化基因表达。

上述任何方法制备的任何细胞都可用来筛选所需基因产物的表达,并提供所需量的细胞内过表达的基因产物。可以将该细胞分离和克隆。

可用以该方法制得的细胞来在体外(例如用于蛋白质治疗)或体内(用于细胞疗法)制备蛋白质。

工业上的生长和制备条件经常与用于分析用途(例如克隆、蛋白质或核酸测序、制备抗体、X-射线晶体学分析、酶学分析等)的细胞生长和制备条件不同。用于摇瓶中生长的细胞放大试验包括提高细胞可以附着的表面积。因此经常加入微载体珠来提高工业生长用的表面积。旋转器培养中的细胞放大试验可能涉及体积的较大提高。微载体和旋转器培养可能需要5升或更大体积。根据目的蛋白质的固有效价(比活),体积低至1-10升。常见的是10-15升。但是,可能会需要达到50-100升,体积可能会高至10,000-15,000升。在某些情况中,可能需要更高体积。还可以在大量T型烧瓶(例如50-100个)中培养细胞。

除了生长条件,工业规模上的蛋白质纯化也与分析用纯化相当不同。在工业实践中,可以由相当于10升(大约104细胞/ml)细胞量等同物开始纯化蛋白质。开始蛋白质纯化的细胞量等同物可以达到10升(高达106或107细胞/ml)的细胞。但本领域普通技术人员会想到,更高或更低一些的起始细胞量等同物也可用于本方法。

另一种工业培养条件,特别在当终产物要临床使用时,是在无血清培养基中培养细胞,无血清培养基是指不含血清或所含血清没有达到细胞生长所需量的培养基。很显然,这避免了对有毒污染物(例如病毒)或其它类型污染物(例如会使纯化过程复杂的蛋白质)的不希望的共纯化。用于细胞生长的无血清培养基、这种培养基的工业来源及在无血清培养基中培养细胞的方法是本领域普通技术人员熟知的。

由上面描述的方面获得的单个细胞能够过表达一个基因或多个基因。通过整合一个构建体或在同一细胞中整合多重构建体(即多种类型的构建体)可以活化多个基因。因此,一个细胞可以只含一类载体构建体或不同类型的构建体,每种构建体能活化一个内源基因。

本发明还涉及通过下列一或多项步骤来制备上述细胞的方法:导入一或多个载体构建体;使导入的构建体通过非同源重组整合到细胞基因组中;在细胞内过表达1或多个内源基因;以及分离和克隆所述细胞。

方便起见,当讨论将多核苷酸导入细胞中时,本文采用术语“转染”。但是,应当明白该术语的特定用途已被用来泛指将多核苷酸导入细胞的方法,也用来指用其它本文描述的方法实现的导入,比如电穿孔,脂质体介导的导入,逆转录病毒介导的导入等(以及依照其自身特定含义的导入方法)

可以通过许多本领域已知方法将载体导入细胞。这些方法包括,但不限于,电穿孔、磷酸钙沉淀、DEAE右旋糖苷、脂质体转染和受体介导的胞吞、1,5-二甲基-1,5-二氮十一亚基聚甲溴化物(polybrene)、粒子轰击和显微注射。可选择地,可台将载体以病毒颗粒(可复制感受态病毒或复制缺陷型病毒)的形式递送到细胞中。可用于递送核苷酸的病毒的例子包括,但不限于,腺病毒、腺病毒相关病毒、逆转录病毒、疱疹病毒和痘苗病毒。本领域技术人员知道的其它适用于将核苷酸分子递送到细胞中的病毒可以被等效地用于该方法。

转染之后,在一定条件下培养细胞,该条件是本领域已知的适合载体和宿主细胞基因组之间进行非同源整合的条件。可以进一步在本领域已知的使被活化内源基因进行表达的条件下,培养含有非同源整合的载体的细胞。

可以在一个DNA构建体或各自独立的构建体上将载体构建体导入细胞,并发生连环化。

尽管在优选实施方案中,载体构建体是双链DNA载体构建体,载体构建体也包括单链DNA、单链和双链DNA的结合形式、单链RNA、双链RNA、以及单链和双链RNA的结合形式。因此,例如,载体构建体可以是单链RNA,其由逆转录酶将其转化为cDNA,cDNA再被转化为双链DNA,而双链DNA最终与宿主细胞基因组发生重组。

在优选实施方案中,导入细胞之前将构建体线性化。活化构建体的线性化产生游离DNA末端,它能在整合过程中与染色体末端反应。一般来说,构建体在调控元件(以及外显子和剪接供体序列,如果有这些序列)下游被线性化。可以通过,例如在调控序列下游加入一个独特的限制位点并在转染前用相应的限制酶处理构建体来促进线性化。在构建体上的线性化位点和近端最具功能的元件(例如未配对的剪接供体位点)之间插入一个“间隔区”序列是有利的,但这一作法不是必须的。有间隔区序列存在能够保护载体上的重要功能元件在转染过程中免受外切核苷酶的降解。所述间隔区可以由任何不会改变文中所述载体的基本功能的核苷酸序列构成。

也可以用环形构建体来活化内源基因表达。本领域已知,环形质粒在转染到细胞中时能够整合到宿主细胞基因组中。据推测,转染过程中在环形质粒中发生DNA断裂,从而产生能连接到染色体末端的游离DNA末端。构建体中的某些断裂将发生在不破坏载体的关键功能的位置(例如,断裂发生在调控序列下游),因此可以使构建体以能活化内源基因的构型整合到染色体中。如上所述,可以在构建体上插入间隔区序列(例如,调控序列下游)。转染过程中,发生在间隔区的断裂将在构建体上的某个位点形成游离末端,该游离末端适合构建体整合到宿主细胞基因组中后活化内源基因。

本发明还包括由上述方法制得的细胞文库。一个文库可以包括得自一次转染实验的所有克隆或者得自一次转染实验的一个亚组的克隆,所述亚组可以过表达相同的基因或多个基因,例如,一类基因。转染可以用单个类型的构建体或多个类型的构建体进行。

可以将得自两次或多次转染实验的所有重组细胞合并,将得自一次转染实验的1或多个亚组的细胞合并或者将得自多次转染实验的亚组的细胞合并来构成文库。所得文库可以表达相同基因,或多个基因,例如,一类基因。同样,在每次转染过程中,可以使用一个构建体或多个构建体。

所述文库可以由相同细胞类型或不同细胞类型构成。

所述文库可以由一类细胞组成,该细胞含有一种类型活化构建体,所述构建体在自发DNA断裂形成的断裂处或由同时施加(给相同细胞)或者分别施加(给各个细胞群,然后将细胞合并在一起构成文库)的辐射、限制酶、和/或DNA断裂剂导致的断裂处整合到染色体中。文库可以由多类细胞组成,这些细胞含有一个或多个构建体,所述构建体整合到用辐射、限制酶,和/或DNA断裂剂一起施加给相同细胞或者分别(施加给各个细胞群,然后将细胞合并在一起构成文库)处理过的细胞的基因组中。

本发明还涉及从相同或不同转染实验中挑选各种细胞亚组来制备文库的方法。例如,可以将所有表达核因子的细胞(由转染构建体20的细胞中核绿色荧光蛋白的存在来确定)合并以形成含有活化核因子的细胞文库。类似地,可以合并表达膜蛋白或分泌蛋白的细胞。也可以将细胞根据表型分组,例如,生长因子独立型生长、生长因子独立型增殖、集落形成、细胞分化(例如分化为神经细胞、肌细胞、上皮细胞等)、不依赖于贴壁的生长、活化细胞因子(例如,激酶、转录因子、核酸酶等),细胞-细胞粘附的获得或丧失、迁移或细胞活化(例如休眠或活化T细胞)。

本发明还涉及利用细胞文库来过表达内源基因的方法。筛选文库用于基因的表达,并挑选出能表达所需基因产物的细胞。然后,可以用细胞来纯化基因产物,用作随后使用。可以体外培养细胞或者使细胞体内表达基因来使细胞进行表达。

本发明还涉及利用文库来鉴定新基因和基因产物的方法。

本发明还涉及通过用能刺激或影响非同源整合方式的试剂处理细胞来提高基因活化效率的方法。已经证实,不同细胞类型的基因表达方式、染色质结构以及甲基化方式显著不同。即使来自相同细胞类型的不同细胞系也可能有明显差异。这些差异能够通过影响DNA断裂方式和修复过程而影响非同源整合的方式。例如,染色质化的DNA片段(可能与失活基因有关的性状)可能对限制酶和化学试剂引起的断裂作用的抗性更高,而对辐射引起的断裂作用敏感。

此外,可将失活基因甲基化,在这种情况中,被CpG甲基化阻断的限制酶不能在失活基因附近切割甲基化位点,从而更难用甲基化敏感酶来活化该基因。通过用各种DNA断裂剂在多个细胞系中建立活化文库可以避开这些问题。这样做,可以产生更完全的整合方式,并能最大可能地活化给定基因。

本发明的方法可包括给含有将要过表达的内源基因的细胞的DNA中导入双链断裂。这些方法在载体整合之前或同时给细胞内的基因组DNA中导入双链断裂。DNA断裂的机制对基因组中DNA的断裂方式会有显著影响。这样,用辐射、限制酶、博来霉素或其它断裂剂可以在不同位置自发或人为地产生DNA断裂。

为了提高整合效率以及整合位点分布的随机性,可以在转染之前或之后用低、中或高剂量辐射处理细胞。借助人工诱导的双链断裂,这时作为DNA修复过程的一部分,转染DNA可以整合到宿主细胞染色体中。通常,形成用作整合位点的双链断裂是限速步骤。因此,通过用辐射(或其它DNA破坏剂)来增加染色体断裂,在给定转染中能得到更多整合子。此外,由辐射引起的DNA断裂的机制与自发断裂的机制不同。

当高能光子击中DNA分子时,辐射能直接诱导DNA断裂。可选择地,辐射可以活化细胞中的某些化合物,后者接着与DNA链反应并使其断裂。而另一方面,自发断裂被认为是由细胞内产生的反应性化合物(比如超氧化物和过氧化物)和DNA分子之间的相互作用导致的。但是细胞内的DNA不是以裸露、去蛋白化的聚合物的形式存在,而是与染色质结合,并以凝聚状态存在。因此在细胞内导致双链断裂的试剂无法接近某些区域。辐射产生的光子波长具有击中DNA的高度凝聚区的足够短的波长,从而诱发那些不能发生自发断裂的DNA区域的断裂。因此,辐射能产生不同的DNA断裂方式,后者接下去导致不同的整合方式。

这样,利用经过/未经过辐射处理的细胞中的相同活化构建体制得的文库可能含有不同活化基因组。最后,辐射处理能将非同源整合效率提高5-10倍,这使得能用较少细胞产生完整的文库。因此,辐射处理能提高基因活化效率并在转染细胞中形成新的整合和活化方式。有用的辐射类型包括α、β、γ、x-射线,以及紫外照射。适用的辐射剂量随细胞类型而不同,但通常来说,导致0.1%到99%细胞存活的剂量范围是有用的。对于HT1080细胞,这相当于大约0.1rads到1000rads的137Cs源的辐射剂量。也可以使用其它剂量,只要该剂量能够提高整合频率或者改变整合位点的形式。

除了辐射,也可以用限制酶来人工诱导转染细胞内的染色体断裂。与辐射一样,DNA限制酶能够形成染色体断裂,后者随之作为转染DNA的整合位点。该大量的DNA断裂使得活化构建体的整体整合效率提高。另外,由限制酶导致的断裂机制与辐射断裂不同,染色体断裂的方式也很可能不同。

较之光子和能破坏DNA的小代谢物,限制酶是相对大的分子。因此,限制酶倾向于将比整个基因组的紧密程度小的区域断裂。如果目的基因存在于基因组的可接近区域内,则用限制酶处理细胞能提高活化构建体整合到目的基因上游的可能性。由于限制酶识别特异序列,并且由于给定的限制位点不存在于目的基因的上游,可以使用多种限制酶。由于每种酶有不同的特性(例如大小、稳定性、切割甲基化位点的能力以及最适反应条件),这些特性会影响到宿主染色体中哪个位点被切割,因此使用多种限制酶是重要的。每种酶,由于其可切割的限制位点的不同分布,将产生不同的整合方式。

因此,在导入活化构建体之前、期间或之后,导入限制酶(或能够表达限制酶的质粒)将导致不同基因组的活化。最后,限制酶诱导的断裂使整合效率提高5-10倍(Yorifuji等,突变研究243:121(1990)),这就使得可以转染较少的细胞而制备到完整的文库。这样,可以用限制酶形成新的整合方式,以便使那些在自发断裂或其他人工诱导的断裂处通过非同源重组产生的文库中不能被活化的基因活化。

还可以用限制酶使活化构建体偏性整合到基因组中的预期位点。例如,已描述过几种罕见的限制酶,它们能平均每50-1000kb切割真核DNA。如果一个罕见的限制酶识别序列恰巧位于目的基因的上游,通过在活化构建体进行转染的同时导入该限制酶,可以择优地在目的基因上游形成DNA断裂。然后,这些断裂可以作为活化构建体的整合位点。能在目的基因内部或附近的合适位置进行切割并且其识别位点在基因组的其他位置不多出现,或者在所述基因附近过多出现(例如,含有CpG的限制位点),任何这样的酶都可以。对于以前未被鉴定的基因,可以使用具有8bp识别位点的限制酶(例如,NotⅠ、SfiⅠ、PmeⅠ、SwaⅠ、SseⅠ、SfrⅠ、SgrAl、PacⅠ、AscⅠ、SgfⅠ和Sse8387Ⅰ)、识别含有CpG的位点的酶(例如WagⅠ、Bsi-WⅠ、MluⅠ和BssHⅡ)以及其他罕见的切割酶。

以这种方法,可以形成富含特定类型活化基因的“偏性”文库。就这方面来说,含有CpG二核苷酸的限制酶位点尤其有用,因为这些位点在整个基因组中含量少,而在许多基因5’端的CpG岛(正是用于基因活化的位置)中含量丰富。因此,识别这些位点的酶能优先在基因序列5’端切割。

可以通过几种方法将限制酶导入宿主细胞。首先,可以通过电穿孔将限制酶导入细胞(Yorifuji等,突变研究243:121(1990);Winegar等,突变研究225:49(1989))。通常,导入细胞的限制酶的量与它在电穿孔介质中的浓度成比例。必须通过调节电压、电容和电阻来优化每个细胞系的脉冲条件。其次,可以由编码该酶的质粒在真核生物调控元件的控制下瞬时表达限制酶。可以通过使用诱导型启动子以及改变诱导的强度来控制所产生的酶的含量。在某些情况中,可能希望限制所产生的限制酶的量(由于其毒性)。在这些情况中,可以利用弱的或突变的启动子、剪接位点、翻译起始密码子和polyA尾部来降低所产生的酶量。再次,可以通过能与细胞膜融合或通透的试剂来导入限制酶。脂质体和链球菌溶血素O(Pimplikar等,细胞生物学杂志125:1025(1994))是这类试剂的例子。最后,可以利用机械穿孔和显微注射来将核酸酶和其他蛋白质导入细胞。但是,任何能将活性酶递送到活细胞中的方法都是适用的。

由博莱霉素和其他DNA损伤剂诱导的DNA断裂也可以产生不同的DNA断裂方式。因此,任何能在细胞中产生双链断裂的试剂或培养条件都可以用来提高非同源重组的效率和/或改变其位点。各类化学DNA损伤剂的例子包括,但不限于,过氧化物和其他能产生自由基的化合物、烷基化试剂、拓扑异构酶抑制剂、抗肿瘤药物、酸、取代核苷酸和烯二炔(enediyne)抗生素。

特异性化学DNA损伤剂包括,但不限于,博莱霉素、过氧化氢、氢过氧化枯烯、氢过氧化叔丁基、次氯酸(与苯胺、1-萘胺或1-萘酚反应)、硝酸、磷酸、阿霉素、9-脱氧阿霉素、去甲基-6-阿霉素、5-亚氨基柔红霉素、亚德里亚霉素(adriamycin)、4-(9-丫啶氨基)甲磺间茴香胺、新制癌菌素、8-甲氧咖啡因、依托泊甙、椭圆玫瑰树碱、碘代脱氧尿嘧啶核苷和溴脱氧尿苷。

已经证明可以通过将细胞预先暴露于低剂量DNA断裂剂,比如辐射或博莱霉素中,来诱导细胞内的DNA修复机制。在转染前用这些试剂将细胞预处理大约24小时,细胞在转染后能更有效地修复DNA断裂和整合DNA。另外,可以使用较高剂量的辐射或其他DNA断裂剂,因为预处理后的LD50(导致50%处理细胞死亡的剂量)更高。这就使得能以多种剂量产生随机活化文库并在宿主细胞的染色体中形成分布不同的整合位点。

筛选

一旦制备了一个活化文库(或多个文库),就可以用许多检测方法来筛选。根据目的蛋白质的特性(例如分泌的与胞内蛋白)和用于形成文库的活化构建体的性质,可以使用以下描述的任何或所有检测方法。也可以使用其他检测形式。

ELISA.可以利用酶联免疫吸附检测法(ELISA)来检测已活化的蛋白质。如果活化的基因产物被分泌出来,在含有结合的目的蛋白质的特异抗体的孔中温育活化文库细胞集的培养物上清液。如果一个或一群细胞已经活化了目的基因,蛋白质将分泌到培养基中。通过筛选文库克隆集(所述集合可以是1到100,000个以上文库成员),可以鉴定到含有目的基因已被活化的细胞的集合。然后可以通过同胞选择、有限稀释或其他本领域已知技术将目的细胞从其他文库成员中纯化出来。除了分泌蛋白,还可以使用ELISA来筛选表达胞内或膜结合蛋白质的细胞。在这些情况下,不是筛选培养物上清液,而是从文库集合(每个细胞在每个集合中至少出现100-1000次)中取出少量细胞、裂解、澄清并加入包被抗体的小孔。

ELISA斑点检测:将ELISA斑点包被目的蛋白质的特异抗体。包被后,用1%BSA/PBS将小孔于37℃封闭1小时。随后,将随机活化文库中的100,000到500,000个细胞加入每个孔中(代表全部集合的约10%)。通常,每个孔加入一个集合。如果细胞表达目的蛋白质的频率是1/10000(即集合包含10000个单克隆,其中之一表达目的蛋白质),则每孔铺500000个细胞将产生50个特异细胞。将细胞在孔中于37℃无移动或无干扰地温育24到48小时。温育结束时,吸出细胞并将培养板用PBS/0.05%Tween 20洗3次,用PBS/1%BSA洗3次。以适当的浓度将二抗加入孔中,于室温温育2小时或者4℃温育16小时。可以将这些抗体生物素化或者直接用辣根过氧化酶(HRP)标记。吸出二抗,用PBS/1%BSA将培养板洗3次。加入标记了HRP的三抗或链霉抗生物素蛋白,并于室温温育1小时。

FACS检测:可以利用荧光激活细胞分选仪(FACS)以多种方法来筛选随机活化文库。如果目的基因编码细胞表面蛋白质,则可以将荧光标记的抗体与来自活化文库的细胞一起温育。如果目的基因编码分泌蛋白质,则可以将细胞生物素化,并与偶联到目的蛋白质的特异抗体的链霉抗生物素蛋白一起温育(Manz等,美国科学院学报92:1921(1995))。温育后,将细胞放入高浓度明胶中(或其他聚合物,比如琼脂糖或甲基纤维素)以便限制分泌蛋白质的扩散。当细胞分泌出蛋白质时,它被结合到细胞表面上的抗体捕获。就可以通过荧光标记的二抗来检测是否存在目的蛋白质。对于分泌和膜结合蛋白质,都可以随后根据其荧光信号分选细胞。然后可以分离出荧光细胞,扩增并进一步经FACS、有限稀释或其他本领域已知的细胞纯化技术将其富集。

磁珠分离:这项技术的原理与FACS类似。通过将活化文库与偶联抗体的、目的蛋白质特异的磁珠一起温育来检测膜结合蛋白质和捕获的分泌蛋白质。如果蛋白质存在于细胞表面,磁珠会与该细胞结合。利用一个磁体,可以将表达目的蛋白质的细胞从文库中的其他细胞中纯化出来。然后将细胞从小珠上释放、扩增、分析并在需要时进一步纯化。

RT-PCR:收集少量细胞(至少等于集合中各克隆的数目)并裂解以便纯化RNA。分离后,用逆转录酶将RNA进行逆转录。然后用目的基因的cDNA的特异性引物进行PCR。

可供选择的是,可以使用跨越活化构建体中的合成外显子和内源基因的外显子的引物。该引物不会与内源表达的目的基因杂交,也不使其扩增。反之,如果活化构建体整合到目的基因的上游,并活化了基因表达,则该引物与所述基因的第二个特异引物一起,依靠剪接到内源基因的外显子上的合成外显子的存在而使被活化基因发生扩增。因此,可以用这个方法来检测那些通常情况下目的基因的表达低于预期水平的细胞内的活化基因。

表型分组:在这个实施方案中,可以根据活化基因赋予的表型来挑选细胞。可以选择的表型的例子包括增殖、生长因子独立型生长、集落形成、细胞分化(例如分化成神经细胞、肌细胞、上皮细胞等)、不依赖于贴壁的生长、对细胞因子的活化作用(例如,激酶,转录因子,核酸酶等)、获得或丧失细胞-细胞粘着性、迁移和细胞活化(例如,休眠或活化的T细胞)。分离显示一种表型(比如上面描述的)的活化细胞非常重要,因为预计是由整合构建体使内源基因活化导致了所观察到的细胞表型。因此,活化基因可能是重要的治疗药物或者是治疗或诱导所观察到的表型的药物靶。

可以通过瞬时上调文库细胞中的基因表达来有效地提高上述每一检测方法的灵敏度。对于含有NF-kB位点的启动子(在活化构建体上),通过向文库中加入PMA和肿瘤坏死因子-α可以做到这一点。单独加入丁酸钠或者它与PMA和肿瘤坏死因子-α一起可以进一步增强基因表达。加入这些试剂可以提高目的基因的表达,从而可以利用较低灵敏度的检测方法来鉴定目的基因已活化的细胞。

由于建立了巨大的活化文库以便尽可能多地活化许多基因,将文库克隆组织为集合是有益的。每个集合可以含有1到100000个以上单个克隆。因此,在给定集合中,通常产生稀释浓度的许多活化蛋白质(原因在于集合的整个尺寸和该集合内产生给定活化蛋白质的有限数目的细胞)。因此,筛选前将蛋白质浓缩能有效地提高在筛选方法中检测活化蛋白质的能力。一个特别有用的浓缩方法是超滤;但是,也可以用其他方法。例如,在结合所存在的多数或全部蛋白质的条件下,通过吸附到离子交换、疏水、染料、羟基磷灰石、凝集素以及其他合适的树脂上来非特异或半特异地浓缩蛋白质。这样在筛选前可以将结合蛋白质以小体积移走。有益的做法是使细胞在无血清培养基中生长以便协助蛋白质的浓缩。

在另一个实施方案中,活化构建体上可以包括的有用序列是表位标记。所述表位标记可以包含一个能够亲合纯化(例如在免疫亲合或螯合基质上)活化蛋白质的氨基酸序列。因此,通过在活化构建体上包括表位标记可以纯化活化文库中所有的活化蛋白质。通过将活化蛋白质从其他细胞和培养基蛋白质中纯化出来,可以协助筛选新的蛋白质和酶活性。在某些情况中,可能会希望在将活化蛋白质提纯后除去表位标记。通过在活化构建体上的表位标记下游包括一个蛋白酶识别序列(例如,因子Ⅱa或肠激酶切割位点)可以达到该目的。将纯化的活化蛋白与合适的蛋白酶一起温育可以从蛋白质上释放出表位标记。

在那些表位标记位于活化构建体上的文库中,可以利用亲合纯化将所有活化蛋白质从所有其他细胞和培养基蛋白质中纯化出来。这不仅使活化蛋白质得到浓缩,还使其从可能干扰用于筛选文库的检测方法的其它活性中纯化出来。

一旦鉴定到含有过表达目的基因的细胞的克隆集合,可以采取措施来分离活化细胞。利用许多本领域已知的方法可以实现活化细胞的分离。细胞纯化方法的例子包括有限稀释、荧光活化细胞分选、磁珠分离、同胞选择和利用克隆环进行的单克隆纯化。

在本发明的优选实施方案中,所述方法包括一个纯化表达产物的步骤。在极其优选的实施方案中,培养表达内源基因产物的细胞以便产生工业应用上,特别是在诊断和治疗以及药物开发用途上可行用量的基因产物。

任何用于本文所述方法中的载体可以包括一个扩增标记。这样,可以在细胞内使载体和目的DNA(即含有过表达的基因)得到扩增,并进一步增强内源基因的表达。与此相应,所述方法可以包括一个扩增内源基因的步骤。

一旦已经分离了活化细胞,可以通过使含有目的基因和活化构建体的基因座扩增来进一步提高表达。通过以下描述的各种方法,单独或组合使用可以做到这一点。

扩增标记是能够挑选到更高拷贝数的基因。扩增标记的例子包括二氢叶酸还原酶、腺苷脱氨酶、天冬氨酸转氨甲酰酶、二氢乳清酸酶以及氨甲酰磷酸合成酶。对于这些例子,可以选择拷贝数增加的扩增标记和旁侧序列(包括目的基因)用作由扩增标记起作用的药物或毒性代谢物。总之,随着药物或毒性代谢物浓度升高,含有较少拷贝扩增标记的细胞死亡,而含有拷贝增加的标记的细胞存活并形成集落。可以将这些集落分离、扩增并分析目的基因产物的增加水平。

在活化构建体上插入一个扩增标记将导致活化细胞中的目的基因与扩增标记并列。在存在增加量选择剂(通常是药物或代谢物)的情况下培养细胞,就可以挑选出含有拷贝数增加的扩增标记和目的基因的活化细胞。例如,可以用氨甲喋呤来选择二氢叶酸还原酶(DHFR)的扩增。

当在每个升高药物浓度下得到抗药集落时,可以挑选出单个集落并鉴定扩增标记和目的基因的拷贝数,并分析目的基因的表达。可以挑选出活化基因表达水平最高的单个克隆用于在更高药物浓度下的进一步扩增。在最高药物浓度下,克隆会表达量已经大大增加的目的蛋白质。

扩增DHFR时,可以方便地在几个不同浓度的氨甲喋呤处铺上大约1×107细胞。有用的氨甲喋呤的起始浓度在大约5到100nM之间。但是必须针对每个细胞系和整合位点根据经验确定氨甲喋呤的最佳浓度。在含有氨甲喋呤的培养基中生长之后,从最高浓度氨甲喋呤中挑出集落并分析目的基因表达的提高。然后将具有最高浓度氨甲喋呤的克隆生长在更高浓度的氨甲喋呤中以便挑选出进一步扩增的DHFR和目的基因。对于含有最高程度基因扩增的克隆可以使用微摩和毫摩范围的氨甲喋呤浓度。

在活化构建体上插入一个病毒复制起点(例如,人细胞中的ori P或SV40以及小鼠细胞中的多瘤ori)将导致在活化细胞中目的基因与病毒复制起点并列。通过以反式导入病毒复制蛋白可以使起点和旁侧序列扩增。例如,使用ori P(Epstein-Barr病毒的复制起点)时,可以瞬时或稳定表达EBNA-Ⅰ。EBNA-Ⅰ能够起始从整合的ori P基因座开始复制。所述复制可以从起点双向延伸。当产生各个复制产物时,它又能起始复制。结果,可以得到许多拷贝病毒起点和包括目的基因的旁侧基因组序列。该更高的拷贝数使细胞能产生更大量的目的基因。

在某个频率处,复制产物会重新结合形成含有旁侧基因组序列(包括目的基因)的环形分子。通过单细胞克隆以及Hirt提取和Southern印迹分析可以分离出含有携带目的基因的环形分子的细胞。一旦得到纯化,可以将含有拷贝数增加(通常10-50拷贝)的附加体基因组座位的细胞在培养基中增殖。为了获得更高的扩增,可以通过在原始构建体中的第一个起点邻近出包括一个第二起点来进一步增加附加体。例如,可以用T抗原来使ori P/SV40附加体拷贝数增加到约1000(Heinzel等,病毒杂志62:3738(1988))。这种拷贝数的显著增加能够明显地提高蛋白质的表达。

本发明包括体外和体内过表达内源基因。因此,可以在体外用细胞以产生预期量的基因产物或者可以在体内用细胞以在完整动物提供基因产物。

本发明还包括由本文所述方法产生的蛋白质。这些蛋白质得自已知或未知基因。可以用所述方法制备的已知蛋白质的例子包括,但不限于,红细胞生成素、胰岛素、生长激素、葡糖脑苷脂酶,组织纤溶酶原活化物、粒细胞集落刺激因子(G-CSF)、粒细胞/巨噬细胞集落刺激因子(GM-CSF)、干扰素α、干扰素β、干扰素γ,白介素-2、白介素-6、白介素-11、白介素-12、TGF-β,凝血因子Ⅴ,凝血因子-Ⅶ、凝血因子-Ⅷ、凝血因子-Ⅸ、凝血因子-Ⅹ、TSH-β、骨骼生长因子-2、骨骼生长因子-7,肿瘤坏死因子、α-1抗胰蛋白酶、抗凝血酶Ⅲ,白血病抑制因子、胰高血糖素、蛋白C、蛋白激酶C、巨噬细胞集落刺激因子(M-CSF)、干细胞因子、促卵泡激素β、尿激酶、神经生长因子、类胰岛素生长因子、促胰岛素、甲状旁腺激素、乳铁蛋白、补体抑制因子、血小板衍生生长因子,角质细胞生长因子、神经营养蛋白-3、血小板生成素、绒膜促性腺激素、凝血调节蛋白、α糖苷、表皮生长因子、FGF、巨噬细胞集落刺激因子以及上述每个蛋白质的细胞表面受体。

从活化细胞中纯化蛋白质产物时,可以采用任何本领域已知的蛋白质纯化方法。

分离含有活化膜蛋白编码基因的细胞

从药物开发的观点来看,那些编码膜相关蛋白质的基因特别令人感兴趣。可以用这些基因和它们编码的蛋白质利用组合化学库和高产量筛选方法来,例如,开发小分子药物。另一方面,可以用这些蛋白质或蛋白质的可溶形式(例如缺少跨膜区的截短的蛋白质)作为人或动物的治疗活性剂。还可以使用膜蛋白的鉴定利用双元杂交法或亲合捕集技术来鉴定新配体(例如,细胞因子、生长因子以及其他效应分子)。膜蛋白还可能有许多其他应用。

目前鉴定编码完整膜蛋白的基因的手段包括从cDNA文库中分离所述基因并将其测序。然后利用能鉴定蛋白质的跨膜区的疏水性曲线通过ORF分析来鉴定完整膜蛋白质。不幸的是,用这个方法不能鉴定编码完整膜蛋白的基因,除非该基因能在用于制备cDNA文库的细胞中表达。另外,许多基因只在很少的细胞中,在很短的发育时期内,和/或以极低水平表达。因此,不能用现有的方法来有效地鉴定这些基因。

利用本发明能在不知道基因的序列、结构、功能或表达方式的情况下活化内源基因。利用本发明公开的方法,可以只在转录水平下活化基因,或者在转录和翻译水平下活化基因。因此,可以在含有已整合载体的细胞中制备由活化内源基因编码的蛋白质。此外,利用本文公开的特异载体,可以将由活化内源基因产生的蛋白质进行修饰以便如包括一个表位标记。其他载体(例如,上面描述的载体12-17)可以编码一个跟有表位标记的信号肽。可以用该载体来分离那些已经活化完整膜蛋白质表达的细胞(见以下实施例5)。还可以用该载体引导通常不分泌的蛋白质的分泌。

因此,本发明还涉及鉴定编码细胞完整膜蛋白质或跨膜蛋白质的内源基因的方法。本发明的这些方法可以包括一或多个步骤。例如,本发明的一个这种方法可包括(a)将本发明的一个或多个载体导入细胞中;(b)使载体通过非同源重组整合到细胞基因组中;(c)由整合载体构建体上所含的转录调控序列上调细胞中的内源基因,使其过表达;(d)筛选过表达内源基因的细胞;以及(e)鉴定活化基因以便确定它作为编码细胞完整膜蛋白质的基因的同一性。在相关实施方案中,本发明提供的这类方法还包括在鉴定活化基因之前从细胞中分离活化基因。

为了鉴定编码完整膜蛋白质的基因,整合到细胞基因组的载体应包含一个与外显子序列连接在一起的调控序列,所述外显子序列含有起始密码子、信号序列和表位标记,随后是未配对的剪接供体位点。当内源基因发生整合和活化时,产生含有来自载体的信号肽和表位标记的嵌合蛋白质,所述载体与由内源基因的下游外显子编码的蛋白质融合在一起。该嵌合蛋白质,通过载体编码的信号肽的存在,被引导到分泌途径,在此完成蛋白质的翻译并分泌蛋白。但是,如果活化内源基因编码完整膜蛋白质,并且该基因的跨膜区由位于载体整合位点3’处的外显子编码,则该嵌合蛋白质会到达细胞表面,表位标记将会在细胞表面显示出来。利用已知的细胞分离方法(例如流式细胞计分选、磁珠细胞分选、免疫吸附或其他本领域技术人员熟悉的方法),可用该表位标记的抗体从细胞群中分离出显示表位标记且已活化完整膜蛋白质编码的基因的细胞。然后用这些细胞来研究膜蛋白质的功能。另一方面,用本领域已知的任何方法来从这些细胞中分离出活化基因,例如通过与载体编码的外显子具有特异性的DNA探针进行杂交来对筛选由这些细胞制备到的cDNA文库,或者利用本文描述的遗传构建体。

由载体外显子编码的表位标记可以是一个能结合到抗体上的短肽、一个能结合到底物(例如多组氨酸/二价金属离子载体、麦芽糖结合蛋白/麦芽糖载体、谷胱苷肽S-转移酶/谷胱苷肽载体)上的短肽或者一个来自其上存在抗体或配体的完整膜蛋白质的胞外区(缺少跨膜区)。但是,应当理解,可以根据本发明等效地使用本领域技术人员熟悉的其他类型的表位标记。

对本文描述的方法和应用的其他合适的改进和变化对本领域技术人员是显而易见的,并且可以在不脱离本发明的范围或其实施方案下而进行。上面已详细描述了本发明,参照以下实施例可以更清楚地理解本发明,这些实施例在此仅做例证,而非意在限制本发明。

                      实施例实施例1:转染细胞以活化内源基因表达方法:构建pRIG-1

人DHFR由cDNA通过PCR进行扩增,所述cDNA是由HT1080细胞使用引物DHFR-F1 (5’TCCTTCGAAGCTTGTCATGGTTGGTTCGCTAAACTGCAT3’)(SEQ ID NO:1)和DHFR-R1 (5’AAACTTAAGATCGATTAATCATTCTTCTCATATACTTCAA3’)(SEQ ID NO:2)通过PCR制备的,并将人DHFR克隆至pTARGETTM(Promega)中的T位点产生pTARGET:DHFR。用NheⅠ和XbaⅠ消化PREP9分离RSV启动子,并将其插入pTARGET:DHFR的NheⅠ位点产生pTgT:RSV+DHFR。将寡核苷酸JH169(5’ATCCACCATGGCTACAGGTGAGTACTCG3’)(SEQ ID NO:3)和JH170(5’GATCCGAGTACTCACCTGTAGCCATGGTGGATTTAA3’)(SEQ IDNO:4)退火,并将其插入pTgT:RSV+DHFR的Ⅰ-Ppo-Ⅰ和NheⅠ位点以产生pTgT:RSV+DHFR+Exl。用引物Tet F1(5’GGCGAGATCTAGCGCTATATGCGTTGATGCAAT3’) (SEQ ID NO:5)和Tet F2(5’GGCCAGATCTGCTACCTTAAGAGAGCCGAAACAAGCGCTCATGAGCCCGAA3’) (SEQ ID NO:6)将相应于pBR322的230-508位核苷酸的279bp区进行PCR扩增。用BglⅡ消化扩增产物,并将其克隆至pTgT:RSV+RSV+DHFR+Exl的BamHⅠ位点产生pRIG-1。

转染-在HT1080细胞中形成pRIG-1基因活化文库

为了活化基因表达,从上述构建体组中选择合适的活化构建体。然后将所选的活化构建体通过本领域任何已知转染方法导入细胞。转染方法的例子包括电穿孔、脂质体转染、磷酸钙沉淀、DEAE右旋糖和受体介导的胞吞。导入细胞中之后,使DNA经非同源重组整合到宿主细胞的基因组中。整合可以在自发染色体断裂处或人工诱导的染色体断裂处进行。

方法:用pRIG-1转染人细胞。使2×109HH1细胞(HT1080细胞的HPRT亚克隆)在150mm组织培养板中生长至90%铺满。将培养液从细胞中吸出,作为条件培养液保存(参见下文)。通过将细胞与胰蛋白酶短暂温育而使其从培养板上脱落,将其加入培养液/10%胎牛血清中以便中和胰蛋白酶,并在Jouan离心机中于1000rpm沉淀5分钟。将细胞在1X PBS中洗涤、计数并如上述重新沉淀。将细胞沉淀以终浓度2.5×107细胞/ml重新悬浮在1XPBS(Gibco BRL Cat#14200-075)中。然后将细胞暴露于50rads来自137Cs源的γ照射中。用BamHⅠ将pRIG-1线性化,用酚/氯仿提纯,用乙醇沉淀并重悬于PBS中。将纯化和线性化的活化构建体加入细胞悬浮液中至终浓度为40μg/ml。然后将DNA/照射过的细胞混合物混匀,向每个0.4cm的电穿孔管(Biorad)中移入400μl该混合物。用电穿孔装置(Biorad)给小管以250伏、600微法拉、50欧姆输送脉冲。电脉冲后,将细胞于室温培养10分钟,然后移入含有青霉素/链霉素(Gibco/BRL)的αMEM/10%FBS中。将细胞铺在含有35mlαMEM/10%FBS/penstrep(33%条件培养液/67%新鲜培养液)的培养板上,浓度为大约7×106细胞/150mm板。于37℃培养24小时后,将取自60mg/ml储液的G418(Gibco/BRL)加入到每个培养板中至终浓度为500μg/ml。经4天选择后,用新鲜的αMEM/10%FBS/penstrep/500μg/ml G418替换培养液。然后再将细胞保温7-10天,培养物上清液用于检测新的蛋白因子的存在或者储存在-80℃用于后面的分析。药物抗性克隆可以保存在液氮中用于后面的分析。

实施例2:利用电离辐射来提高DNA整合的频率和随机性

方法:HH1细胞90%铺满时收集,在1X PBS中洗涤,以7.5×106细胞/ml的细胞浓度重悬于1X PBS中。向细胞中加入15μg线性化的DNA(pRIG-1),并混匀。将400μl加入各电穿孔管(Biorad)中,用电穿孔仪(Biorad)以250伏、600微法拉、50欧姆输送脉冲。电脉冲后,将细胞于室温培养10分钟,然后移入2.5mlαMEM/10%FBS/1X penstrep中。从每次脉冲照射中取300μl细胞在转染前或者转染后1或4小时以0、50、500和5000rads照射。照射后,立即将细胞铺在含完全培养基的组织培养板上。铺板24小时后,向培养物中加入G418至终浓度为500μg/ml。选择后7天时,将培养基换成含有500μg/ml G418的新鲜完全培养基。选择后10天时,从培养板中吸出培养基,用考马斯蓝/90%甲醇/10%乙酸将细胞集落染色,并计数多于50个细胞的集落。

实施例3:用限制酶在基因组中产生随机、半随机或导向的断裂

方法:HHI细胞90%铺满时收集,在1XPBS中洗涤,以7.5×106细胞/ml的细胞浓度重悬于1XPBS中。为了检测整合效率,向每份400μl等分的细胞中加入15μg线性化的DNA(PGK-βgeo)并混匀。然后向几份细胞中加入限制酶XbaⅠ、NotⅠ、HindⅢ、IppoⅠ(10-500单位)以便分离细胞/DNA混合物。取400μl加入每个电穿孔管中,用电穿孔仪(Biorad)以250伏、600微法拉、50欧姆输送脉冲。电脉冲后,将细胞于室温培养10分钟,然后移入2.5ml αMEM/10%FBS/1X penstrep中。从每次脉冲照射的2.5ml总细胞中取300μl细胞铺在含完全培养基的组织培养板上。铺板24小时后,向培养物中加入G418至终浓度为600μg/ml。选择后7天时,将培养基换成含有600μg/ml G418的新鲜完全培养基。选择后10天时,从培养板中吸出培养基,用考马斯蓝/90%甲醇/10%乙酸将细胞集落染色,并计数多于50个细胞的集落。

实施例4:通过对位于整合载体上的两个扩增标记进行选择来进行扩增

载体整合到宿主细胞基因组后,可以通过同时或连续选择位于整合载体上的1或多个扩增标记使遗传基因座的拷贝数扩增。例如,可以使包含两个扩增标记的载体整合到基因组中,并通过对位于载体上的这两个扩增标记进行选择来提高给定基因(即位于载体整合位点处的基因)的表达。这种方法大大方便了分离已经扩增了正确基因座(即含有整合载体的基因座)的细胞克隆。

一旦载体通过非同源重组整合到基因组中,则可将含有在独特位置处整合的载体的细胞的单个克隆与其他含有在基因组中其它位置处整合的载体的细胞分离开。另一种方法是可选择混合的细胞群体用于扩增。

然后在对第一扩增标记具有特异性的第一种选择试剂的存在下培养含有整合载体的细胞。该试剂挑选出已经扩增载体和内源染色体上的扩增标记的细胞。然后,通过在对第二扩增标记具有特异性的第二种选择试剂的存在下培养细胞选择这些细胞用于第二个选择标记的扩增。经过该第二个选择步骤,载体和旁侧基因组DNA均已扩增的细胞能够存活,而只扩增了内源的第一扩增标记的细胞或者是具备了非特异性抗性的细胞不能存活。当含有两个以上(如3,4,5或更多)的扩增标记的载体整合到细胞基因组中时,可以以类似的方式,通过在对整合载体上所含的其他扩增标记具有特异性的选择试剂的存在下对细胞进行连续培养来做附加选择。挑选后,检测存活细胞的所需基因的表达水平,并选出表达水平最高的细胞做进一步扩增。替代的做法是,可以进一步培养对两种(如果使用了两个扩增标记)或全部(如果使用了两个以上扩增标记)选择试剂具有抗性的细胞的集合,而不分离出单个克隆。然后将这些细胞扩展,并在更高浓度的第一种选择试剂(通常是高两倍)的存在下进行培养。重复该过程直至达到预期的表达水平。

可选择地,可以同时针对两种(如果使用了两个扩增标记)或全部(如果使用了两个以上扩增标记)扩增标记来挑选含有整合载体的细胞。通过将两种(如果使用了两个标记)或全部(如果使用了两个以上标记)选择试剂加入其中培养了转染细胞的选择培养基中来实现同时挑选。大多数存活细胞已扩增了整合载体。然后可以将这些克隆分别筛选来鉴定表达水平最高的细胞,或者把它们作为一个集合来进行。给这些细胞施加更高浓度的各选择试剂(通常是高两倍)。然后再检测存活细胞的表达水平。重复该过程直至达到预期表达水平。

利用任何一种选择策略(即同时或连续选择),通过从没有细胞毒性的低浓度到导致多数细胞死亡的高浓度滴定选择试剂来独立地确定所述选择试剂的起始浓度。通常,选择能形成离散集落(例如,所铺的每100000个细胞形成几百个集落)的浓度作为起始浓度。

实施例5:分离编码跨膜蛋白质的cDNA

pRIG8R1-CD2(图5A-5D;SEQ ID NO:7)、pRIG8R2-CD2(图6A-6C;SEQ ID NO:8)和pRIG8R3-CD2(图7A-7C;SEQ ID NO:9)载体含有可操纵地连接到外显子上的CMV立即早期启动子,其后是一个未配对剪接供体位点。载体上的外显子编码一个信号肽,该信号肽连接到CD2的胞外结构域(缺少框内终止密码子)。每个载体在相对剪接供体位点来说是不同的读码框内编码CD2。

为了建立活化基因文库,用50rads 137Cs源照射2×107细胞,并用15μg线性化的pRIG8R1-CD2(SEQ ID NO:7)进行电穿孔。然后分别用pRIG8R2-CD2(SEQ ID NO:8),再用pRIG8R3-CD2(SEQ ID NO:9)重复该过程。转染后,将三组细胞合并,以每皿5×106细胞的浓度铺入150mm培养皿中,来建立文库#1。转染后24小时,用500μg/mlG418将文库#1选择14天。将含有整合至宿主细胞基因组中的载体的药物抗性克隆合并、等分并冷冻以便分析。如上所述建立文库#2,但其中用pRIG8R1-CD2、pRIG8R2-CD2和pRIG8R3-CD2分别转染3×107细胞、3×107细胞和1×107细胞。

为了分离含有编码完整膜蛋白质的活化基因的细胞,培养来自各文库的3×106细胞并如下处理:

.用4ml胰蛋白酶-EDTA将细胞胰蛋白酶消化。

.在细胞脱落后,添加8ml αMEM/10%FBS中和胰蛋白酶。

.用无菌PBS将细胞洗一次,经800g离心7分钟收集。

将细胞沉淀重悬于2ml αMEM/10%FBS中。1ml用于分选,另1ml重铺在含有500μg/mlG418的αMEM/10%FBS中,扩展并保存。

.将用于分选的细胞用无菌αMEM/10%FBS洗一次,经800g离心7分钟收集。

.吸去上清液,将沉淀重新悬浮于1ml αMEM/10%FBS中。取100μl所述细胞用同种型对照物染色。

.向900μl细胞中加入200μl抗-CD2 FITC(Pharmingen目录号#30054X),而向100μl细胞中加入20μl小鼠IgG1同种型对照物(Pharmingen目录号#33814X)。将上述细胞在冰上培养20分钟。

.向含有用抗人CD2 FITC染色的细胞的试管中加入5mlPBS/1%FBS。向同种型对照物中加入900μl PBS/1%FBS。以600g离心6分钟收集细胞。

.从试管中吸出上清液。将已用同种型对照物染色的细胞重悬于500μlαMEM/10%FBS中,将已用抗CD2 FITC染色的细胞重悬于1.5ml αMEM/10%FBS中。

.在FACS Vantage流式细胞计(Becton Dickinson ImmunocytometrySystems;Mountain View,CA)上通过连续分选细胞5次来分选细胞。在每次分选中,收集所示的细胞总数的百分比的代表荧光最强的细胞(见下文),将其扩展,再分选。分选HT1080细胞作为阴性对照物。每次分选中分选并收集到以下细胞群:

    文库#1    文库#2    文库#3#1分选收集到500,000个细胞(最高10%)收集到100,000个细胞(最高10%)收集到40,000个细胞(最高10%)#2分选收集到300,000个细胞(最高5%)收集到220,000个细胞(最高11%)收集到14,000个细胞(最高5%)#3分选收集到90,000个细胞(最高5%)收集到40,000个细胞(最高的10%)收集到120,000个细胞(最高10%)#4分选收集到600,000个细胞(最高40%)(a)收集到6,000个细胞(最高5%)(b)收集到10,000个细胞(次高5%)收集到280,000个细胞(最高13%)#5分选(a)收集到260,000个细胞(最高10%)(b)收集到530,000个细胞(次高25%)(a)从#4分选的(a)组中收集到100,000个细胞(最高10%)和350,000个细胞(次高35%)(b)从#4分选的(b)组中收集到120,000个细胞(最高10%)未做
将每个文库最后一次分选得到的细胞扩展并保存于液氮中。

从FACS分选细胞中分离活化基因

一旦经如上所述将细胞进行了分选,通过基于PCR的克隆从所述分选细胞中分离活化内源基因。但本领域技术人员容易想到,可以等效地使用本领域公知的任何克隆基因的方法来从FACS分选的细胞中分离活化基因。

按照以下方案分离基因:

(1)利用PolyATract System1000 mRNA分离试剂盒(Promega),从来自文库#1和#2的3×107 CD2+细胞(如上所述,通过FACS分选5轮)中分离mRNA。

(2)分离mRNA后,通过将0.5μl分离的mRNA稀释到99.5μl水中并测定OD260来确定mRNA的浓度。从CD2+细胞回收到21μgmRNA。

(3)然后如下合成第一链cDNA:

(a)PCR仪维持在4℃,通过连续添加以下成分制备第一链反应混合物:

41微升DEPC处理过的ddH2O

4微升10mM各种dNTP

8微升0.1MDTT

16微升5xMMLV第一链缓冲液(Gibco-BRL)

5微升(10pmol/μl)共有区多腺苷酸化位点引物GDR1(SEQ ID NO:10)

1微升RNAsin(Promega)

3微升(1.25μg/μl)mRNA备注:GDR1, 5’TTTTTTTTTTTTCGTCAGCGGCCGCATCNNNNTTTATT3’(SEQ ID NO:10)是用于由mRNA合成第一链cDNA的“基因开发”引物;该引物被设计成能与多腺苷酸化信号AATAAA和下游的多腺苷酸区退火。它能给第一链导入一个NotⅠ位点。

一旦制备好样品,即如下进行温育:

(b)70℃1分钟

(c)维持于42℃,然后向每份样品中加入2μl 400U/μl的SuperScriptⅡ(Gibco-BRL;Rockville,MD),以产生82μl的最终总体积。大约3分钟后,如下温育样品:

(d)37℃30分钟

(e)94℃2分钟

(f)4℃5分钟

然后向各样品中加入2μl 20U/μl的RNace-IT(Stratagene),将样品于37℃温育10分钟。

(4)第一链合成后,用PCR洗涤试剂盒(Qiagen)如下纯化cDNA:

(a)将80μl第一链反应产物转移入1.7ml硅氧烷化的eppendorf管,并加入400μl PB。

(b)然后将样品移入PCR洗涤柱子,于14000RPM离心2分钟

(c)将柱子拆下,倾析出径流,向沉淀中加入750μl PE,然后将试管于14000RPM离心2分钟。

(d)将柱子拆下,倾析出径流,将试管于14000RPM离心2分钟以便干燥树脂。

(e)用50μl EB通过转移柱将cDNA洗脱至新的硅氧烷化的eppendorf管中,然后以14000RPM离心2分钟。

(5)如下合成第二链cDNA:

(a)于室温,连续添加以下成分制备第二链反应混合物:

ddH2O                    55μl

10xPCR缓冲液              10μl

50mM MgCl2              5μl

10 mM dNTP                2μl

25pmol/μl RIG.751-Bio*4μl

25pmol/μl GD.R2**     4μl

第一链产物                20μl

*备注:RIG.751-Bio,5’生物素-CAGATCACTAGAAGCTTTATTGCGG3’(SEQ ID NO:11),在由pRIG载体表达得到的转录产物的帽子位点处退火。

**备注:GD.R2,5’TTTTCGTCAGCGGCCGCATC3’(SEQ ID NO:12)是用于PCR扩增cDNA的引物,所述cDNA是使用引物GDR1(SEQ ID NO:10)制备的。GD.R2是GDR1的亚序列,其带有到达polyA信号序列前的简并碱基的配对序列。

(b)开始合成第二链:

94℃1分钟,

加入1μl Taq(5U/μl,Gibco-BRL),

加入1μl  Vent DNA pol(0.1U/μl,New England Biolabs),

(c)于63℃温育2分钟,

(d)于72℃温育3分钟,

(e)将步骤(b)重复4次,

(f)于72℃温育6分钟,

(g)于4℃温育(维持),

(h)结束。

(6)用STE洗3次制备200μl 1mg/ml链霉抗生物素蛋白-Paramagnetic颗粒(SA-PMP)。

(7)将第二链反应产物直接加入SA-PMP中,于室温温育30分钟。

(8)结合后,利用磁体收集SA-PMP,并回收径流物质。

(9)用500μl STE将磁珠洗3次。

(10)将磁珠重悬于50μl STE中,用磁体在试管底部收集磁珠。然后小心地将STE上清液吸出。

(11)将磁珠重悬于50μl ddH2O中,在100℃水浴中放置2分钟,从PMP上释放出纯化的cDNA。

(12)在磁体上收集PMP,并小心地吸出含有cDNA的上清液,从而回收到纯化的cDNA。

(13)将纯化产物移至干净试管中,于14000RPM离心2分钟除去所有残存的PMP。

(14)然后如下进行PCR反应以便特异扩增RIG活化cDNA:

(a)通过于室温连续添加以下成分来制备PCR反应混合物:

H2O                      59μl

10x PCR缓冲液              10μl

50mM MgCl2               5μl

10mM dNTP                  2μl

25pmol/μl RIG.F781*    2μl

25pmol/μl GD.R2         2μl

第二链产物                 20μl

*备注:RIG.F781,5’ACTCATAGGCCATAGAGGCCTATCACAGTTAAATTGCTAACGCAG3’(SEQID NO:13),在GD.F1、GD.F3、GD.F5-Bio以及RIG.F751-Bio的下游退火,并引入一个SfiⅠ位点用于cDNA的5’克隆。该引物用于巢式PCR扩增RIGExonl特异第二链cDNA。

(b)启动热循环器:

94℃3分钟,

加入1μl Taq(5U/μl,Gibco-BRL),

加入1μl 0.1U/μl的Vent DNA聚合酶(New England Biolabs),

将步骤(c)到(e)循环10次做PCR:

(c)94℃30秒,

(d)60℃40秒,

(e)72℃3分钟。

然后进行以下步骤完成PCR:

(f)94℃30秒,

(g)60℃40秒,

(h)72℃3分钟,

(i)72℃,每个循环20秒,共10个循环,

(j)72℃5分钟,

(k)维持于4℃。

(15)用50μl EB将文库材料洗脱后,加入10μl NEB缓冲液2、40μl dH2O和2μl SfiⅠ,并于50℃消化1小时将样品进行消化,以便在由正向引物(RIG.F781;SEQ ID NO:13)编码的SfiⅠ位点处切割cDNA的5’端。

(16)SfiⅠ消化后,向每份样品中加入5μl 1M NaCl和2μl NotⅠ,于37℃将样品消化1小时以便在由第一链引物(GD.R1;SEQ ID NO:10)所编码的NotⅠ位点处切割cDNA的3’端。

(17)然后,在1%低熔点琼脂糖胶上分离消化过的cDNA。从胶上切下大小为1.2Kb到8Kb范围的cDNA。

(18)用QiaexⅡGel Extraction(Qiagen)从切下的琼脂糖胶上回收cDNA。在总共10μl的1XT4连接酶缓冲液(NEB)中,用400单位T4 DNA连接酶(NEB)将2μl cDNA(大约30mg)与7μl(35ng)pBS-HSB(用SfiⅠ/NotⅠ线性化过的)连接在一起。

(19)用得自步骤(18)的0.5μl连接反应混合物转化成大肠杆菌DH10B。

(20)回收103个菌落/0.5μl连接的DNA。

(21)用引物M13F20和JH182(RIG Exonl特异性)经PCR在12.5μl体积中如下筛选这些菌落的外显子:

(a)将100μl LB(含有选择抗生素)分装到适当数量的96孔培养板中

(b)挑选出单菌落,接种到96孔培养板的各个孔中,将培养板在37℃培养厢中不震荡放置2-3小时。

(c)在冰上如下制备PCR反应的“主混物”:

    96孔培养板:12.5μl PCR rxn的全部#:  1个板  2个板  3个板    4个板    96   192    288    384    dH2O 755μl 1.47ml 2.20ml    2.94ml    5XPCR预混液-4 250μl 500μl 750μl    1.0ml F引物预混液(25pmol/微升) 10μl 20μl 30μl    40μl R引物预混液(25pmol/微升) 10μl 20μl 30μl    40μl    RNace-It cocktail 3.2μl 6.3μl 9.6μl    12.8μl    Taq聚合酶(5U/μl) 3.2μl 6.3μl 9.6μl    12.8μl    总体积(ml) 1.01 2.02 3.03    4.04

(d)将10μl主混合物分装到PCR反应板的每个孔中

(e)从每份100μl大肠杆菌培养物中取2.5μl移入PCR反应板上的相应孔中

(f)采用典型的PCR循环条件进行PCR反应:

(ⅰ)94℃/2分钟(细菌裂解和质粒变性),

(ⅱ)92℃变性15秒;60℃引物退火20秒;72℃引物延伸40秒;做30个循环,

(ⅲ)72℃最终延伸5分钟,

(ⅳ)维持于4℃。

(g)向PCR反应中加入溴酚蓝;将样品混匀、离心,然后将全部反应混合物装入琼脂糖凝胶上。

(23)在所筛选的200个克隆中,78%是载体外显子阳性的。这些克隆中的96个作为小量制备物,并依照Qiagen小量制备手册(1997年4月)用Qiagen96孔turbo-prep纯化。

(24)将2μl DNA同时用NotⅠ、BamHⅠ、XhoⅠ、HindⅢ、EcoRⅠ在NEB缓冲液3中(总体积为22μl)进行消化,然后在1%琼脂糖凝胶上电泳来除去许多重复克隆。

结果:

用所述方案筛选两个不同的cDNA文库。在第一个文库(TMT#1)中,将分离到的活化基因中的8个测序。在这8个基因中,4个基因编码已知的完整膜蛋白质,6个是新基因。在第二个文库(TMT#2)中,将11个分离到的活化基因进行测序。11个基因中,一个基因编码已知的完整膜蛋白质,一个基因编码部分测序的与一个完整膜蛋白同源的基因,9个是新基因。在分离出的基因对应已做鉴定的已知基因的所有情况下,该基因是完整膜蛋白质。

以下显示分离自每个文库的基因的示范性的显著性比对(得自GenBank):TMT#1显著性比对:

179761|gb|M76559|HUMCACNLB人神经DHP-敏感性

电压依赖性,钙通道α-2b亚单位mRNA

完整CD

长度=3600

>gi|3183974|emb|Y10183|HSMEMD人MEMD蛋白质的mRNA

长度=4235

TMT#2显著性比对:

>gi|476590|gb|U06715|HSU06715人细胞色素B561,HCYTO B561,mRNA

部分CD

长度=2463

>gi|2184843|gb|AA459959| AA459959 zx66c01.s1 soares total fetusNb2HF8 9w人cDNA克隆796414 3’类似于gb:J03171干扰素α受体前体(人)

长度=431。

为了清楚理解的目的,通过阐述和实施例对本发明进行详细描述后,本领域技术人员容易想到,可以在更宽和等效的条件、配方以及其他参数范围内对本发明进行改进或变化,而不会影响本发明的范围或其任何具体实施方案,并且所述改进或变化包括在所附权利要求书的范围内。

本说明书提及的所有出版物、专利和专利申请用于表明与本发明相关的本领域技术人员的技术水平,此处相同程度地引入作为参考文献,并视作每篇出版物、专利和专利申请均是具体并单独地引入作为参考文献。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号