首页> 中国专利> 在仓鼠细胞中的重复位点处进行定点重组的组合物和方法

在仓鼠细胞中的重复位点处进行定点重组的组合物和方法

摘要

在仓鼠细胞中的重复位点处进行定点重组的组合物和方法。本申请提供了能够在靶核苷酸序列中定点重组外源序列的组合物和方法,特别地,在靶核苷酸序列的重复位点中定点重组外源序列的组合物和方法。其中,所述靶核苷酸序列可以是仓鼠细胞(例如中国仓鼠卵巢细胞,CHO细胞)的基因组。本申请还提供了在染色体上含有重复位点的宿主细胞,在所述宿主细胞中含有本申请提供的定点重组的组合物,或者在其染色体的重复位点中定点重组了外源序列。

著录项

  • 公开/公告号CN103374569A

    专利类型发明专利

  • 公开/公告日2013-10-30

    原文格式PDF

  • 申请/专利权人 江苏吉锐生物技术有限公司;

    申请/专利号CN201310134971.0

  • 发明设计人 凌建群;苏会敏;凤阁;

    申请日2013-04-17

  • 分类号

  • 代理机构北京商专永信知识产权代理事务所(普通合伙);

  • 代理人邬玥

  • 地址 210036 江苏省南京市汉中门大街301号南京国际服务外包大厦01幢13楼A座

  • 入库时间 2024-02-19 20:30:23

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2016-08-10

    授权

    授权

  • 2014-07-09

    实质审查的生效 IPC(主分类):C12N15/11 申请日:20130417

    实质审查的生效

  • 2013-10-30

    公开

    公开

说明书

技术领域

本发明涉及基因工程技术领域,具体涉及可用于在仓鼠细胞基因组的重复位点处进行基 因重组的组合物和方法,以及由此产生的重组细胞。

背景技术

诞生于上个世纪70年代末的基因工程药物因其具有其他药物无法比拟的优点,已迅速 成为制药工业中一个引人瞩目的领域。按照宿主细胞的类型,可将基因表达系统大致分为原 核、酵母、植物、昆虫和哺乳动物细胞表达系统。与其它系统相比,哺乳动物细胞表达系统 的优势在于能够指导蛋白质的正确折叠,提供复杂的N型糖基化和准确的O型糖基化等多种 翻译后加工功能,因而表达产物在分子结构、理化特性和生物学功能方面最接近于天然的高 等生物蛋白质分子。

在基因工程研究的动物细胞表达系统中,最具代表性的就是中国仓鼠卵巢细胞(Chinese  Hamster Ovary,CHO)。它是用来表达外源蛋白最多也最成功的一类细胞,我国批准上市的 有促红细胞生成素(EPO)、CHO基因工程乙肝疫苗、治疗性抗体药物益赛普(有效成分相 当于美国食品药品管理局批准的Enbrel)和泰欣生(有效成分相当于美国食品药品管理局批 准的Erbitux)等生物技术药物。

与其他表达系统相比,CHO细胞具有许多优点,例如:(1)具有准确的转录后修饰功能, 表达的蛋白在分子结构、理化特性和生物学功能方面最接近于天然蛋白分子;(2)既可贴壁 生长,又可以悬浮培养,且有较高的耐受剪切力和渗透压能力;(3)具有重组基因的高效扩 增和表达能力,外源蛋白的整合稳定;(4)具有产物胞外分泌功能,并且很少分泌自身的内 源蛋白,便于下游产物分离纯化;(5)能以悬浮培养方式或在无血清培养基中达到高密度培 养,且培养体积能达到1000L以上,可以大规模生产。

但是,目前在CHO细胞表达系统的构建和应用中仍存在诸多问题有待解决,例如:① 构建的重组CHO细胞生产效率低,产物浓度亦低;②某些糖基化表达产物不稳定,不易纯化; ③重组CHO细胞上游构建与下游分离纯化脱节,主要表现在上游构建时着重考虑它的高效 表达,而对高效表达的产物是否能有效地提取出来,即分离纯化过程考虑较少;④重组细胞 培养费用昂贵,自动化水平低下。

目前在CHO细胞中进行的外源基因表达主要有两种形式,一种是瞬时表达,另一种是 稳定表达。前者完全由导入的质粒来执行,质粒不会插入到细胞的基因组中,虽然不会引发 DNA重排和受到调控序列的影响,但是绝大多数转入的外源基因会被降解或随细胞分裂丢 失。相反,后者被导入的外源基因整合到细胞基因组中,通过一些筛选方法,最终可以得到 富集外源基因整合的细胞系,但是现有技术无法实现定点整合或者在优选的靶位点处进行整 合。外源基因随机整合引发DNA重排、受体细胞裂解死亡的概率很高,而当整合入或靠近 异染色质区域时,外源基因的表达将被阻遏。

因此,本领域仍需开发出更成熟的CHO细胞表达系统,以提供对整合位点的控制,并 提高表达效率和可操控性。

发明内容

本申请提供了能够在靶核苷酸序列中定点重组外源序列的组合物和方法。

在一方面,本申请提供了分离的多核苷酸,其含有重复位点的至少7个连续核苷酸,其 中所述重复位点存在于仓鼠细胞的染色体或基因组中。在某些实施方式中,所述重复位点选 自SEQ ID NOs:3、16、39、40、和41所示的序列。在某些实施方式中,所述重复位点含有 重复序列单元。在某些实施方式中,所述仓鼠细胞的染色体或基因组中含有所述重复序列单 元的至少两个拷贝。在某些实施方式中,所述重复序列单元选自如SEQ ID NOs:42-46所示的 序列。

在另一方面,本申请提供了低聚化合物,含有可特异性杂交于靶位点的靶区域,所述靶 位点含有重复位点或重复序列单元的至少7个连续核苷酸,其中所述重复位点或重复序列单 元存在于仓鼠细胞的染色体或基因组中。在某些实施方式中,所述靶区域含有低聚的核苷酸。 所述靶区域可以含有至少一个修饰的核苷酸。至少一个所述修饰的核苷酸可以是锁核酸。

在某些实施方式中,所述靶区域是5’→3’走向的,且所述靶位点是3’→5’走向的,或者 所述靶区域是3’→5’走向的,且所述靶位点是5’→3’走向的。在某些实施方式中,所述靶区 域与所述靶位点有50%到100%的互补性。

在某些实施方式中,低聚化合物进一步含有能够与第二低聚化合物形成结合的结合区 域。所述结合可以是碱基配对、共价键、非共价键、共价接头、或非共价接头。所述结合区 域可以连接在所述靶区域的5’上游,或连接在所述靶区域的3’下游。在某些实施方式中,所 述结合区域可以含有核苷酸,在某些实施方式中也可以含有至少一个修饰的核苷酸,在某些 实施方式中至少一个所述修饰的核苷酸是锁核酸。

在另一方面,本申请提供了低聚构建体,其含有:第一低聚化合物,其含有与第一结合 区域连接的第一5’→3’靶区域;第二低聚化合物,其含有与第二结合区域连接的第二3’→5’ 靶区域;以及在第一结合区域和第二结合区域之间的结合;其中:所述第一5’→3’靶区域与 第一3’→5’靶位点可特异性杂交;所述第二3’→5’靶区域与第二5’→3’靶位点可特异性杂 交;且所述第一3’→5’靶位点和所述第二5’→3’靶位点各含有重复位点或重复序列单元的 至少7个连续核苷酸,其中所述重复位点或重复序列单元存在于仓鼠细胞的染色体或基因组 中。

在某些实施方式中,所述第二5’→3’靶位点位于所述第一3’→5’靶位点在所述重复位点 或重复序列单元上的互补序列的5’上游或3’下游。

在另一方面,本申请提供了多核苷酸供体,其含有第一5’→3’同源位点,其含有重复位 点或重复序列单元的5’→3’链的至少7个连续核苷酸的同源序列,其中所述重复位点或重复 序列单元存在于仓鼠细胞细胞的染色体或基因组中,并且允许位于所述重复位点或重复序列 单元中的基因高度表达。本申请还提供了多核苷酸供体,其含有第一3’→5’同源位点,其含 有重复位点或重复序列单元的3’→5’链的至少7个连续核苷酸的同源序列,其中所述重复位 点或重复序列单元存在于仓鼠细胞的染色体或基因组中,并且允许位于所述重复位点或重复 序列单元中的基因高度表达。在某些实施方式中,所述供体进一步含有第二5’→3’同源位点, 其含有所述重复位点或重复序列单元的5’→3’链的至少7个连续核苷酸的同源序列。在某些 实施方式中,所述第一3’→5’同源位点位于所述第二5’→3’同源位点在所述供体上的互补序 列的5’上游或3’下游。

在某些实施方式中,所述供体进一步含有外源序列,所述外源序列两端侧接有所述第一 3’→5’同源位点和所述第二5’→3’同源位点。在某些实施方式中,所述外源序列含有外源基 因、外源调控序列、和外源限制性克隆位点中的一个或多个。在某些实施方式中,所述外源 序列进一步含有选择性标记。

在另一方面,本申请提供了在染色体或基因组上含有重复位点或重复序列单元的宿主细 胞,其进一步含有本申请提供的低聚构建体。在某些实施方式中,所述宿主细胞进一步含有 本申请提供的多核苷酸供体。在某些实施方式中,所述供体进一步含有外源序列,所述外源 序列的两端侧接有所述第一3’→5’同源位点和所述第二5’→3’同源位点。所述外源序列可 以含有一个或多个基因。在某些实施方式中,所述宿主细胞进一步含有能够促进外源序列与 重复位点或重复序列单元重组的重组促进剂。所述重组促进剂可以是重组酶、重组酶的编码 序列或化合物。在某些实施方式中,所述宿主细胞是哺乳动物细胞、仓鼠细胞、中国仓鼠细 胞、或CHO细胞。

在另一方面,本申请提供了宿主细胞,其在染色体或基因组上含有第一重复位点或第一 重复序列单元,其中所述第一重复位点或第一重复序列单元处整合了第一外源序列。在某些 实施方式中,所述第一外源序列含有一个或多个功能性基因。在某些实施方式中,宿主细胞 的染色体上进一步含有第二重复位点或第二重复序列单元,其中所述第二重复位点或第二重 复序列单元处整合了第二外源序列。在某些实施方式中,所述第二外源序列含有一个或多个 功能性基因。所述第一外源序列中的功能性基因和所述第二外源序列中的功能性基因相同或 不同。在某些实施方式中,所述第一和/或所述第二外源序列中至少有一个外源基因能够在所 述宿主细胞中稳定表达,或稳定高表达。在某些实施方式中,所述宿主细胞传代30代以后, 所述第一和/或第二外源序列中至少有一个外源基因的表达与未整合所述外源序列的对照细 胞相比至少高10%、高15%、高20%、高30%、高40%、高50%、高60%、高70%或者更 高。所述宿主细胞可以是稳定的细胞系。如果对照细胞中不表达外源基因或者检测不到外源 基因的表达,则所述“至少高10%”是指在本发明的整合了外源基因的宿主细胞中能够检测到 外源基因的表达。在某些实施方式中,所述宿主细胞是哺乳动物细胞、仓鼠细胞、中国仓鼠 细胞、或CHO细胞。

在另一方面,本申请提供了试剂盒,其含有本申请提供的两个低聚化合物,其能够形成 如本申请所提供的低聚构建体;以及本申请所提供的多核苷酸供体,其中所述低聚构建体可 与所述供体的所述第一同源位点和所述第二同源位点特异性杂交。

在另一方面,本申请提供了试剂盒,其含有本申请提供的低聚构建体;以及本申请所提 供的多核苷酸供体,其中所述低聚构建体可与所述供体的所述第一同源位点和所述第二同源 位点特异性杂交。

在另一方面,本申请提供了在宿主细胞的基因组中引入外源序列的方法,所述宿主细胞 的染色体或基因组中含有重复位点或重复序列单元,所述方法包括:向所述宿主细胞中引入 本申请的低聚构建体,本申请提供的多核苷酸供体,其中所述低聚构建体与所述供体的所述 第一3’→5’同源位点和所述第二5’→3’同源位点特异性杂交,以及培养所述宿主细胞以允 许所述外源序列重组到所述宿主细胞的所述重复位点或重复序列单元中。所述方法可以进一 步包括向所述宿主细胞中引入重组促进剂。在某些实施方式中,所述宿主细胞是哺乳动物细 胞、仓鼠细胞、中国仓鼠细胞、或CHO细胞。

在另一方面,本申请提供了在宿主细胞的基因组中表达外源基因的方法,所述宿主细胞 的染色体或基因组中含有重复位点或重复序列单元,所述方法包括:向所述宿主细胞中引入 本申请提供的低聚构建体,本申请提供的多核苷酸供体,其中所述低聚构建体与所述供体的 所述第一5’→3’同源位点和所述第二3’→5’同源位点特异性杂交,其中所述多核苷酸供体 含有的所述外源序列是外源基因,以及培养所述宿主细胞以允许所述外源基因重组到所述宿 主细胞的所述重复位点或重复序列单元中。在某些实施方式中,所述宿主细胞是哺乳动物细 胞、仓鼠细胞、中国仓鼠细胞、或CHO细胞。

附图说明

图1显示低聚构建体的示意图。(a)中的低聚构建体中,两个低聚化合物中的靶区域位 于结合区域的3’下游,当结合区域形成结合后,两个靶区域分别位于各自低聚化合物的3’端; (b)中的低聚构建体中,两个低聚化合物中的靶区域位于结合区域的5’上游,当结合区域形 成结合后,两个靶区域分别位于各自低聚化合物的5’端。

图2为定点重组方法的原理图。简单地说,本申请的一对低聚化合物可以形成低聚构建 体,低聚构建体中的靶区域可以与靶核苷酸序列中的靶位点特异性杂交,也可以与多核苷酸 供体中的同源位点特异性杂交。这样的特异性杂交使得多核苷酸供体的同源位点附近产生了 单链结构,靶核苷酸的靶位点附近也产生了单链结构。在这些单链结构之间可以进行重组, 使得多核苷酸供体的同源位点附近的序列能够重组到靶核苷酸的靶位点附近。可选地,可以 使用重组促进剂来提高重组效率。

图3是iTS4扩增片段,其中的图片通过软件处理反色显示。M是DNA100bp ladder  marker,1是重复位点iTS4的扩增片段。

图4是8C10/Heavy扩增片段的电泳检测结果,其中的图片通过软件处理反色显示。M 是DNA10kp ladder marker(1679bp);1是8C10抗体的重链扩增片段。

图5是8C10/Light扩增片段的电泳检测结果,其中的图片通过软件处理反色显示。M是 DNA100bp ladder marker(1078bp),1是8C10抗体的轻链扩增片段。

图6是8C10-CHO-S Elisa检测结果。图6(a)显示8C10抗体基因在CHO-S细胞的iTS4 位点处的重组表达的Elisa检测结果。细胞克隆以在细胞培养板上的位置表示,例如“1-A3” 表示第1块培养板的A列第3孔的细胞。图6(b)为8C10抗体的OD值的标准曲线。

图7是iTS2扩增片段的电泳检测结果,其中的图片通过软件处理反色显示。M是DNA 100bp ladder marker,1是重复位点iTS2的扩增片段。

图8是Erb-CHO-S Elisa检测结果。图8(a)显示Erb基因在CHO-S细胞的iTS2位点 处的重组表达的Elisa检测结果。细胞克隆以在数字编号表示。图8(b)为Erb的OD值的标 准曲线。

图9是p-Rose质粒的序列(SEQ ID NO:52)。

具体实施方式

定点重组

在一方面,本申请提供的组合物和方法可用于定点重组外源序列,例如,在靶核苷酸序 列中定点重组外源序列。

“定点重组”,在本申请中是指,将外源序列通过非随机的方式整合到靶核苷酸序列的 特定的靶位点处。例如,可以整合到某特定靶位点的5’上游、3’下游、或两个特定靶位点之 间。

“外源序列”在本申请中是指,期望被定点重组到靶位点处的核苷酸序列。外源序列可 以是靶核苷酸序列中不存在的序列,或者可以是存在于靶核苷酸序列中、但是不存在于靶位 点处的序列。

“靶核苷酸序列”在本申请中是指,含有靶位点的任何多核苷酸序列,其能够容纳外源 序列在靶位点处的整合。在某些实施方式中,靶核苷酸序列是双链的DNA序列。示例的靶 核苷酸序列包括,但不限于,细胞的基因组中的多核苷酸序列、细胞基因组外的多核苷酸序 列(例如线粒体基因组)、质粒、和双链的多核苷酸。优选地,靶核苷酸序列是染色体或基因 组本身,或其中的序列,更优选地,是仓鼠细胞染色体或基因组本身,或其中的序列,再优 选地,是中国仓鼠(Cricetulus griseus,Chinese hamster)细胞染色体或基因组本身,或其中的 序列。在某些实施方式中,靶核苷酸序列是中国仓鼠卵巢细胞(CHO细胞)的染色体或基因 组本身,或其中的序列。

“靶位点”在本申请中是指,在靶核苷酸中任何一段感兴趣的核苷酸序列。靶位点的选 择不受任何限制,在靶核苷酸中任何感兴趣的核苷酸序列都可以作为靶位点。在某些实施方 式中,靶位点可以存在于仓鼠细胞(如CHO细胞)的基因组或染色体的重复位点中,或该重 复位点中的重复序列单元。

不受理论的限制,认为通过碱基互补原则,可以设计出与靶位点具有足够互补度的本申 请的组合物(如低聚化合物或低聚构建体),使其能够通过碱基互补的方式识别靶核苷酸序列 上的靶位点。同时,也可以根据靶位点的碱基序列,设计出与靶位点具有足够同源度的同源 序列,使得本申请的组合物也能够通过碱基互补的方式识别同源序列。这样,一方面,本申 请的组合物结合靶位点序列,另一方面,本申请的组合物也结合同源序列,由此促使同源序 列与靶位点序列之间的同源重组(例如,见图2)。当同源序列还连接有外源序列时,可以通 过本申请的组合物,将该外源序列定点重组到所选择的靶位点处。理论上,根据碱基互补的 原则,可以对靶核苷酸序列中任何感兴趣的靶位点设计出本申请的组合物,从而实现外源序 列在这些靶位点处的定点重组。

重复位点

在一方面,本申请提供的组合物和方法可用于在哺乳动物细胞,特别是仓鼠细胞中定点 重组外源序列。在某些实施方式中,可以在仓鼠细胞的至少一个重复位点中定点重组外源序 列。

“重复位点”在本申请中是指在仓鼠细胞的染色体或基因组中的一段多核苷酸序列,其 含有重复序列单元的一个或多个拷贝。在某些实施方式中,仓鼠细胞的染色体或基因组中含 有重复位点的两个或多个拷贝。在某些实施方式中,每个重复位点含有重复序列单元的一个 或多个拷贝。在某些实施方式中,至少一个重复位点含有重复序列单元的单个拷贝。在某些 实施方式中,每个重复位点含有重复序列单元的单个拷贝。在某些实施方式中,重复位点由 重复序列单元的单个拷贝组成。

“重复序列单元”在本申请中是指一段连续的核苷酸序列,其在仓鼠细胞的染色体或基 因组中至少出现两次,即,至少有两个拷贝。在某些实施方式中,所述重复序列单元在仓鼠 细胞的染色体或基因组中至少有3个、4个、5个、10个、20个、50个、100个、500个、 1000个、2000个、3000个、4000个、5000个、104个、105个、106个或更多个拷贝。

在某些实施方式中,所述重复序列单元由至少3个不完全相同的核苷酸组成。在某些实 施方式中,所述重复序列单元由至少5个、至少8个、至少10个、至少11个、至少12个、 至少13个、至少14个、至少15个、至少16个、至少17个、至少18个、至少19个、至少 20个、至少21个、至少22个、至少23个、至少24个、至少25个、至少26个、至少27 个、至少28个、至少29个、至少30个、至少31个、至少32个、至少33个、至少34个、 至少35个、至少36个、至少37个、至少38个、至少39个、至少40个、至少41个、至少 42个、至少43个、至少44个、至少45个、至少46个、至少47个、至少48个、至少49 个、至少50个、至少60个、至少70个、至少80个、至少90个、至少100个、至少150个、 至少200个、至少250个、至少300个、至少400个、至少500个、至少600个、至少700 个、至少800个、至少900个或、至少1000个不完全相同的核苷酸组成。在某些实施方式中, 所述重复序列单元由15个到1000个不完全相同的核苷酸组成,由25个到900个不完全相同 的核苷酸组成,由30个到800个不完全相同的核苷酸组成,由35个到700个不完全相同的 核苷酸组成,由20个到500个不完全相同的核苷酸组成,由20个到600个不完全相同的核 苷酸组成,由20个到700个不完全相同的核苷酸组成,或由20个到800个不完全相同的核 苷酸组成。

在某些实施方式中,在仓鼠细胞的染色体或基因组中,所述重复序列单元是串联重复的 (tandem repeat)。“串联重复”在本申请中是指,两个重复序列单元之间不具有间隔序列。在 另一些实施方式中,所述重复序列单元不是串联重复的。

在某些实施方式中,在仓鼠细胞的染色体或基因组中,所述重复序列单元是散在重复的 (interspersed repeat)。“散在重复”在本申请中是指,两个重复序列单元之间至少具有一个碱 基对(bp)的间隔序列。在某些实施方式中,散在重复的重复序列单元之间具有至少10个 bp的间隔序列,更优选地,至少100个bp、至少200个bp、至少300个bp、至少400个bp、 至少500个bp、至少1000个bp、至少2kb、至少3kb、至少4kb、或至少5kb的间隔序列。 在某些实施方式中,所述重复序列单元优选为散在重复的。

在某些实施方式中,所述重复序列单元是仓鼠细胞的染色体或基因组中的短散在重复序 列(short interspersed nuclear elements(SINEs),或short interspersed repeated sequences)。SINEs 的长度通常为100-500bp,在仓鼠基因组中的拷贝数为至少100个到至少106个拷贝。

在某些实施方式中,所述重复序列单元是仓鼠细胞的染色体或基因组中的长散在重复序 列(long interspersed nuclear elements(LINEs)或long interspered repeated sequences)。LINEs 的长度通常为1000bp以上,在仓鼠基因组中的拷贝数为至少105个拷贝。

可以利用本领域公知的小鼠基因组序列,找出仓鼠染色体或基因组中的重复序列单元。 在某些实施方式中,可以利用小鼠基因组中的已知重复序列单元,通过序列比对软件搜索(如, BLAST,National Center for Biotechnology Information,NCBI),得到对应的仓鼠重复序列单元 的序列。例如,可以通过公知数据库获得小鼠的全基因组序列(如,可以通过UCSC网站: http://hgdownload.cse.ucsc.edu/downloads.html#mouse),并获得小鼠某条染色体上的重复序列 的拷贝次数的数据(如,可以通过UCSC网站提供的Annotation databse: http://hgdownload.cse.ucsc.edu/goldenPath/mm10/database/),通过对数据进行统计分析,能够 获得在小鼠基因组中的重复序列单元的位置,进而获得这些重复序列单元的核苷酸序列。通 过序列比对软件(如BLAST)进行同源性搜索,可以得到与这些重复序列单元同源的仓鼠序 列。再例如,也可以直接使用本领域已知的小鼠重复序列单元,用其核苷酸序列直接进行同 源性搜索,从而获得与这些序列同源的仓鼠序列。本领域已知的小鼠基因组中的重复序列单 元有,例如,见:Tashiro K et al.A Mammalian Conserved Element Derived from SINE Displays  Enhancer Properties Recapitulating Satb2Expression in Early-Born Callosal Projection Neurons. PLoS One.2011.6(12):e28497;Walter J et al.Repetitive elements in imprinted genes.Cytogenet  Genome Res.2006.113(1-4):109-15;韩德民等,短散在元件(SINE)的研究进展,《生物化学与 生物物理进展》,2000年05期。

由于仓鼠和小鼠的基因组序列具有较高的同源性,并且仓鼠和小鼠在遗传上比较接近, 因此,与小鼠重复序列单元具有一定同源度的仓鼠序列(例如>30%同源、>50%同源、>90% 同源、优选>95%同源、更优选>98%同源、再优选>99%同源)很可能也是仓鼠基因组中的重 复序列单元。优选地,可以进一步通过序列同源性搜索软件(如BLAST)搜索这样的仓鼠序 列,以确认其在已知的至少部分仓鼠基因组序列中有至少两个拷贝。

在某些实施方式中,所述重复序列单元至少有一个拷贝(例如,至少两个、三个、五个、 十个、五十个、一百个或更多)位于可表达位点中。“可表达位点”在本申请中是指,仓鼠染 色体或基因组中的某个位点,当某基因位于这个位点中时,其能够被转录并产生基因产物(如 转录出RNA产物,和/或表达出蛋白产物)。

在某些实施方式中,所述重复序列单元至少有一个拷贝位于仓鼠基因组中的结构基因之 间。在某些实施方式中,所述重复序列单元至少有一个拷贝位于仓鼠基因组中的结构基因的 内含子中。在某些实施方式中,所述重复序列单元至少有一个拷贝位于仓鼠基因组中的结构 基因的基因簇内。

在某些实施方式中,所述重复位点选自下组:CHO-Genome.iTS1、CHO-Genome.iTS2、 CHO-Genome.iTS3、CHO-Genome.iTS4、和CHO-Genome.iTS5。在某些实施方式中,所述重 复位点选自SEQ ID NO:39、SEQ ID NO:16、SEQ ID NO:40、SEQ ID NO:3、和SEQ ID NO: 41所示的序列。

在本申请中,“CHO-Genome.iTS N”(其中N为1到5之间的任何一个整数),是指在 CHO细胞染色体或基因组上的第N种重复位点,其对应的序列为:SEQ ID NO:39、SEQ ID  NO:16、SEQ ID NO:40、SEQ ID NO:3、或SEQ ID NO:41,如表1所示。

表1

CHO-Genome.iTS N(其中N为1到5之间的任何一个整数)中含有重复序列单元,其 核苷酸序列如SEQ ID NOs:42-46所示(见表2和表1中的粗体和下划线部分)。 CHO-Genome.iTS N中的重复序列单元与小鼠的重复序列单元具有同源性。例如,下表2中 列出了与仓鼠重复序列单元同源的小鼠重复序列单元的核苷酸序列(如SEQ ID NOs:47-51 所示)。

表2

表2中所列的小鼠重复序列单元在小鼠基因组中有多个重复拷贝,例如,SEQ ID NO:47 在小鼠基因组中约有60个重复拷贝,SEQ ID NO:48在小鼠基因组中约有46个重复拷贝, SEQ ID NO:49在小鼠基因组中约有55个重复拷贝,SEQ ID NO:50在小鼠基因组中约有84 个重复拷贝,SEQ ID NO:51在小鼠基因组中约有75个重复拷贝。基于仓鼠基因组序列与小 鼠基因组序列具有的较高的同源性,本领域技术人员能够知道,与小鼠同源的仓鼠重复序列 单元在仓鼠基因组中也应具有一定的重复拷贝数。

在本申请中,每一个重复位点和重复序列单元所代表的序列既包括5’→3’链上的序列, 也包括在同一DNA双链上与之互补的3’→5’链上的序列。也就是说,每一个CHO-Genome.iTS N及其重复序列单元都可以包括两条互补的核苷酸序列。在知道一条单链序列的前提下,本 领域人员可以很容易地通过碱基互补原则,知道其互补链的序列,从而获得两条核苷酸的序 列。因此,虽然SEQ ID NO:3、SEQ ID NO:16、SEQ ID NOs:39-51在本申请中以5’→3’链 的序列显示,但应理解,即这些序列号包含了双链的序列,即,既包括了5’→3’链也包括了 3’→5’链的序列,虽然与5’→3’链互补的3’→5’链的序列未示出,但本领域技术人员可以很容 易地根据碱基互补原则得到3’→5’链的序列。

靶位点

本申请提供的组合物和方法能够在第一靶位点和第二靶位点之间实现外源序列的定点 重组。本申请所述的靶位点可以是仓鼠细胞(如CHO细胞)的基因组或染色体的重复位点中 的序列,其可以用于外源序列的定点重组。在某些实施方式中,靶位点是重复序列单元中的 序列。在某些实施方式中,靶位点是重复序列单元中的至少7个连续核苷酸序列。

第一靶位点和第二靶位点可以分别位于重复序列单元的核苷酸双链的正链(forward  strand)和反链(reverse strand)上。术语“正链”在本申请中是指,任意一条指定的具有确 定核苷酸走向的核苷酸单链。例如,可以指定5’→3’走向的核苷酸单链为正链,也可以指定 3’→5’走向的核苷酸单链为正链。术语“反链”在本申请中是指,与指定的正链具有相反走 向的核苷酸单链。例如,如指定5’→3’链为正链,则3’→5’链为对应的反链。如指定3’→5’ 链为正链,则5’→3’链为对应的反链。在双链多核苷酸中,互补的两条核苷酸单链互为正链 和反链。

在某些实施方式中,第一靶位点和第二靶位点可以包括重复序列单元中的两段核苷酸序 列,其中一段位于另一段的5’上游或3’下游。当外源序列的5’上游连接有对应的5’上游靶位 点的同源序列,3’下游连接有对应的3’下游靶位点的同源序列时,通过本申请的组合物和方 法可以将外源序列重组到重复序列单元的5’上游靶位点和3’下游靶位点之间,例如,用外源 序列替换5’上游靶位点和3’下游靶位点之间的序列。

在某些实施方式中,第一靶位点和第二靶位点可以包括重复序列单元核苷酸双链中的两 段单链核苷酸序列,其中一段位于重复序列单元的5’→3’链(即:5’→3’链靶位点),另一段 位于重复序列单元的3’→5’链(即:3’→5’链靶位点),且其中一段位于另一段的互补序列的 5’上游或3’下游。例如,5’→3’链的靶位点序列可以位于3’→5’链靶位点序列的互补序列的5’ 上游。在这样的实施方式中,当外源序列的5’→3’链的5’上游连接有对应的5’上游靶位点的 同源序列,且外源序列3’→5’链的3’下游连接有对应的3’下游靶位点的同源序列时,通过本 申请的组合物和方法可以将外源序列重组到重复序列单元的两个靶位点之间,例如,用外源 序列替换两个靶位点之间的序列。

在本申请中,“靶位点”这个术语可以是指两段核苷酸序列、一段核苷酸序列、两段单 链核苷酸序列和/或一段单链核苷酸序列,除非另有明确说明。

分离的多核苷酸

在一方面,本申请提供了分离的多核苷酸,其含有重复位点的至少7个连续核苷酸,其 中所述重复位点存在于仓鼠细胞的染色体或基因组中。在某些实施方式中,所述分离的多核 苷酸含有重复位点或重复序列单元的至少7个连续核苷酸。在某些实施方式中,所述重复序 列单元选自如SEQ ID NOs:42-46所示的序列。在某些实施方式中,重复序列单元选自SEQ ID  NO:43或SEQ ID NO:45。在某些实施方式中,重复位点选自SEQ ID NO:39、16、40、3、 和41所示的序列。在某些实施方式中,重复位点选自SEQ ID NO:3或SEQ ID NO:16。

所述分离的多核苷酸可以是双链也可以是单链。可以是DNA,也可以是RNA。当分离 的多核苷酸是RNA时,所述重复位点的至少7个连续核苷酸中的T碱基以U碱基代替。“多 核苷酸”这个术语在本申请中并不限制核苷酸分子的序列长度,本申请中的“多核苷酸”分 子的长度可以是任意适合的长度,可以短至7个核苷酸,也可以是大于7个核苷酸的任何长 度。

所述至少7个连续的核苷酸可以是重复位点内或重复序列单元内(如:CHO-Genome.iTS N)的任意至少7个连续的核苷酸,例如从重复位点或重复序列单元的第1位到第7位、第2 位到第10位、第3位到第15位……第100位到110位……第1000位到第1050位核苷酸等 等。所述至少7个连续的核苷酸可以在重复位点或重复序列单元的5’→3’的链上,也可以在 3’→5’的链上。在某些实施方式中,本申请提供的分离的多核苷酸含有CHO-Genome.iTS N 中的至少7个连续核苷酸。在某些实施方式中,所述至少7个连续核苷酸可以是在 CHO-Genome.iTS N5’→3’链上的任意至少7个连续的核苷酸,或者是CHO-Genome.iTS N3’ →5’链上的任意至少7个连续的核苷酸。

在某些实施方式中,所述至少7个连续核苷酸可以是,例如,≥7个、≥8个、≥9个、≥10 个、≥11个、≥12个、≥13个、≥14个、≥15个、≥16个、≥17个、≥18个、≥19个、≥20个、≥21 个、≥22个、≥23个、≥24个、≥25个、≥26个、≥27个、≥28个、≥29个、≥30个、≥31个、≥32 个、≥33个、≥34个、≥35个、≥36个、≥37个、≥38个、≥39个、≥40个、≥41个、≥42个、≥43 个、≥44个、≥45个、≥46个、≥47个、≥48个、≥49个、≥50个连续核苷酸。在某些实施方式 中,所述至少7个连续核苷酸可以在适当的上限范围内,例如,≤5000个、≤1000个、≤500 个、≤100个、≤90个、≤80个、≤70个、≤60个、≤50个连续核苷酸。在某些实施方式中,所 述至少7个连续核苷酸的长度可以是上述任意两个端值界定的一个范围,如同这些可能的范 围在本申请中已经逐一列出一样。

在某些实施方式中,所述重复位点或重复序列单元的至少7个连续核苷酸可作为定点重 组的靶位点。例如,可以通过本申请提供的组合物和方法,将外源序列定点重组到含有所述 靶位点(即:所述至少7个连续核苷酸)的靶核苷酸序列中。如上文所述,靶核苷酸序列可 以是任何含有靶位点的多核苷酸序列,例如可以是宿主细胞(如仓鼠细胞、中国仓鼠细胞、 CHO细胞等)的基因组或其中的片段,或者是含有靶位点的质粒或其他核苷酸载体或多核苷 酸序列。

在某些实施方式中,所述至少7个连续核苷酸(即,靶位点)在靶核苷酸序列上具有足 够的重复次数,使得外源序列能够在靶位点的至少两个拷贝中实现定点重组。优选地,外源 序列能够被定点重组到靶位点的至少3个、至少4个、至少5个、至少6个、至少7个、至 少8个、至少9个、至少10个、至少15个、至少20个、或更多的拷贝中。这样,在重组后 的靶核苷酸序列中至少含有两个拷贝的外源序列,分别位于靶位点的至少两个拷贝中。

在某些实施方式中,所述外源序列能够稳定重组到宿主细胞基因组中的重复位点或重复 序列单元的至少两个拷贝中(如CHO-Genome.iTS N中)。“稳定重组”在本申请中是指,重 组在重复位点或重复序列单元的外源序列能够在至少两次独立的实验中重复被检测到。所述 两次独立的实验中使用的宿主细胞可以有适当的传代间隔,例如,使用间隔2代、3代、4代、 5代、10代、15代、20代等的宿主细胞。检测使用的宿主细胞还可以是冻存前或后的细胞, 或不同冻存批次的细胞。在某些实施方式中,稳定重组在宿主细胞的重复位点(或重复序列 单元)处的外源序列,能够在宿主细胞传代10代、15代、20代或30代以后仍然检测到其重 组在基因组中的序列,和/或仍然能够检测到其基因产物(如mRNA或蛋白质)。外源基因在 重复序列多位点整合的检测方法,可依据荧光原位杂交的原理(fluorescence in situ  hybridization,FISH)进行设计,如:Maalouf WE et al.Three-dimensional fluorescence in situ  hybridization in mouse embryos using repetitive probe sequences.Methods Mol Biol.2010. 659:401-8.Brind Amour J&Lansdorp PM.Analysis of repetitive DNA in chromosomes by flow  cytometry.Nat Methods.2011.8(6):484-6。

在某些实施方式中,所述重组到宿主细胞基因组中的外源序列能够被表达。外源序列的 表达可以不依赖于内源启动子,或者也可以依赖于内源启动子。例如,重组的外源序列可以 含有外源的启动子,使得外源序列的表达能够不依赖于内源启动子的调控。或者,重组的外 源序列可以与宿主细胞基因组中的内源启动子操作性连接。这样的内源启动子可以在重复位 点内,也可以在重复位点外,但应能够功能性调控重组到该区段处的外源序列。在本申请中, 当“操作性连接”用于修饰核苷酸时,是指调控序列能够对与之操作性连接的核苷酸序列发 挥预期的调控功能。例如,当外源的开放阅读框与内源启动子操作性连接时,该内源启动子 能够启动该外源开放阅读框的转录。

在某些实施方式中,所述重组到宿主细胞基因组中的外源序列能够被稳定表达,优选地 高表达、更优选地稳定高表达。例如,外源序列的多个拷贝(如>5个、>10个、>20个等) 被稳定重组到宿主细胞基因组的重复位点的多个拷贝中,并这些重组的外源序列能够实现稳 定表达,或者优选地,高表达,或者更优选地,稳定高表达。

“稳定表达”在本申请中是指,在宿主细胞的生命周期中持续表达,和/或在宿主细胞的 生命周期中表达量不显著降低。例如,在宿主细胞传代10代、15代、20代或30代以后仍然 检测到重组的外源序列表达的基因产物。或者更优选地,在宿主细胞传代过程中,重组的外 源序列的基因产物的量不显著降低(例如,至少不低于90%、80%、70%、60%、50%、或 40%)。

“高表达”在本申请中是指,基因产物的表达量高于该基因产物在内源表达的条件下能 够达到的表达量。在某些实施方式中,高表达是指高于该基因产物被随机重组到同样的基因 组时,通常能够达到的表达量。某些实施方式中,高表达可以是,以蛋白计,10ug/升/天、20ug/ 升/天、30ug/升/天、40ug/升/天、50ug/升/天、60ug/升/、70ug/升/天、80ug/升/天、90ug/升/天、 100ug/升/天、150ug/升/天、200ug/升/天、250ug/升/天、300ug/升/天、350ug/升/天、400ug/升/ 天、450ug/升/天、500ug/升/天、600ug/升/天、700ug/升/天、800ug/升/天、90ug/升/天、1000ug/ 升/天或更高。本领域技术人员能够理解,当宿主细胞基因组中重组了多个拷贝的外源序列, 并且有两个或多个拷贝的重组外源序列能够正常表达时,其达到的表达总量往往会高于当宿 主细胞只含有一个拷贝的外源序列时的表达量。在宿主细胞允许的范围内,重组的外源序列 拷贝数越多,通常外源序列的基因产物的表达量也越高。

在某些实施方式中,所述重组到宿主细胞基因组中的外源序列能够被功能性表达。“功 能性表达”在本申请中是指,外源序列表达的基因产物具有生物学功能。例如,外源序列能 够被翻译成蛋白产物(如具有翻译起始位点、polyA尾等),或者被翻译的蛋白产物具有预期 的生物活性(如酶活性、荧光性质、抗体的活性、生理活性(如激动剂或拮抗剂)等),或者 外源序列的RNA产物对其作用的特定靶序列(如互补的RNA或DNA)具有反义活性(例如 通过互补结合阻断特定靶序列的翻译,或介导核酸酶将特定靶序列剪切或降解)。

在某些实施方式中,所述重组到宿主细胞基因组中的外源序列不会显著影响宿主细胞基 因组的基本功能。例如,重组后的宿主细胞具有一个或多个下列的特征:能够存活、能够传 代、能够生产外源序列的基因产物(如mRNA或蛋白)、细胞生长速度不显著低于未重组的 细胞、或可传代次数不显著低于未重组的细胞等。

为实现这样的目的,可以选择重复位点或重复序列单元(如:CHO-Genome.iTS N)中 的某些优选区域作为靶位点,例如,不位于细胞生存所必需的外显子序列内,不位于内源的 细胞生存必需的调控序列内(如:启动子、增强子、衰减子等),或者优选地,位于内含子区 域、或位于不具有编码区或调控区的基因间隔区域。

根据在仓鼠基因组中的功能性区域信息,本领域技术人员能够选择出所述重复位点或重 复序列单元中的优选区域作为靶位点。例如,可以根据已知的小鼠基因组中的功能性区域信 息(例如,见UCSC网站提供的Annotation databse,同上),了解所述重复位点或重复序列单 元在小鼠基因组中位于或者具有何种功能性区域,由此可推测出该重复位点在仓鼠基因组中 的功能性区域信息。或者,也可以通过本领域公知的方法或序列分析工具,预测和分析在小 鼠基因组或仓鼠基因组中,所述重复位点序列中或附近的功能性区域。例如,可以使用美国 国立卫生院提供的PromoterScan(http://www-bimas.cit.nih.gov/molbio/proscan/)预测序列中的 启动子区域,可以使用宾夕法尼亚大学提供的TESS(http://www.cbil.upenn.edu/cgi-bin/tess/tess) 分析序列中的转录因子结合位点,可以使用麻省理工学院提供的GENSCAN (http://genes.mit.edu/GENSCAN.html)分析序列中的基因区域,或者可以使用EMBL-EBI提 供的Genewise(http://www.ebi.ac.uk/Tools/Wise2/)分析序列中的内含子等。通过所述重复位 点所处区域的这些功能性信息,本领域技术人员能够选择出在所述重复位点中,适合重组外 源序列并且不会显著影响宿主细胞的基本生物学功能的区段。

此外,也可以通过筛选的方式找到重复位点(或重复序列单元)中优选的区域作为靶位 点。例如,可以在重复位点中选择一系列的至少7个连续核苷酸作为候选靶位点,根据这些 靶位点的序列和碱基互补原则,相应地设计出本申请提供的组合物,通过本申请提供的方法 进行外源序列的重组,检测重组后的外源序列是否具有期望的性质(如,不显著影响宿主细 胞基本功能、高表达、稳定高表达等),从而筛选得到重组后能够提供期望的性质的靶位点。

外源序列在所述重复位点中的重组可以通过本领域公知的方法检测。例如,可以设计引 物,使之互补于在重复位点中预期与重组的外源序列邻近的序列,通过PCR扩增,检测扩增 产物的长度和/或序列,从而可以确定在重复位点中是否成功重组了外源序列。再例如,可以 获得重组后的宿主细胞的RNA,进行逆转录-PCR(RT-PCR),检测RNA中是否含有被重组 的外源序列的mRNA产物,从而确定是否发生了重组。再例如,可以获得重组宿主细胞的细 胞裂解物或细胞培养液上清,用特异性针对外源序列蛋白产物的抗体,通过Western Blot的 方法检测外源序列的蛋白产物,从而确定外源序列是否发生了重组。再例如,外源的表达产 物本身可以是能够被检测的分子,如荧光蛋白或抗生素抗性蛋白,通过常规的荧光显微镜或 抗生素筛选方法即可检测得到,从而确定是否发生了重组。

低聚化合物

本申请提供了低聚化合物,其含有可特异性杂交于靶位点的靶区域,所述靶位点含有重 复位点的至少连续7个核苷酸,其中所述重复位点存在于仓鼠细胞的染色体或基因组中。所 述仓鼠细胞可以是中国仓鼠细胞,优选地,CHO细胞。

“低聚化合物”在本申请中是指一种分子,其含有以共价键连接的多个单体。单体可以 相同也可以不同,例如,可以是相同种类的单体,如核苷酸,也可以是具有不同分子式的单 体,如具有不同碱基的核苷酸。“低聚”是指在一个低聚化合物分子中连接的单体的数目不超 过1000个,更优选地,不超过500个,更优选地,不超过100个。

本申请提供的低聚化合物含有可特异性杂交于靶位点的靶区域。“靶区域”在本申请中 是指,低聚化合物中能够与靶位点特异性杂交的区段。在某些实施方式中,低聚化合物的靶 区域含有低聚的核苷酸。“特异性杂交”在本申请中是指,通过碱基互补作用,以非随机的方 式识别并结合靶位点。杂交是指,配对的碱基之间通过Watson-Crick、Hoogsteen或反向 Hoogsteen氢键结合。靶区域可以起始于与靶位点互补的第一个碱基,终止于与靶位点互补的 最后一个碱基。在此区域内可以有错配碱基,即不与靶位点互补的碱基,只要靶区域作为一 个整体能够与靶位点特异性杂交即可。

在某些实施方式中,特异性杂交的靶区域和靶位点能够在高度严谨条件(highly stringent  conditions)下杂交。杂交的严谨条件与杂交温度、离子强度和/或变性剂的浓度有关。根据杂 交的难易程度,可以将严谨条件分为高度严谨条件、中度严谨条件和低度严谨条件。高度严 谨条件可以使得完全互补或高度互补的两条核苷酸链杂交,并且排除显著不匹配的核苷酸之 间的杂交。高度严谨条件可以包括在杂交和洗脱过程中使用较高的温度和较低的盐浓度。例 如,杂交和洗脱的条件可以是65-68°C,使用0.015M氯化钠、0.0015M柠檬酸钠缓冲液(即 0.1SSC缓冲液);或者是42°C,使用0.1SSC缓冲液和50%甲酰胺。再例如,高度严谨 条件可以是使用含0.5M NaHPO4、7%SDS、和1mM EDTA的杂交缓冲液,在65°C杂交, 以及使用含0.1SSC缓冲液/0.1%SDS的洗脱液在68°C洗脱。

在某些实施方式中,特异性杂交的靶区域和靶位点能够在中度严谨条件(moderately  stringent conditions)下杂交。中度严谨条件可以是50-65°C,使用0.1SSC缓冲液,或者是 37-50°C,使用0.1SSC缓冲液和20%甲酰胺。再例如,中度严谨条件可以使用含0.5M NaHPO4、7%十二烷基硫酸钠(SDS)、和1mM EDTA的杂交缓冲液,在65°C杂交,以及 使用含0.2SSC缓冲液/0.1%SDS的洗脱液在42°C洗脱。举例来说,当在0.015M Na离子 和50°C的条件下杂交时,可以允许约21%的碱基错配。

严谨条件的选择和优化在本领域是公知常识。本领域技术人员针对具体的靶位点序列和 具体的靶位点长度,能够选择适当的高度严谨条件和中度严谨条件,并完成杂交实验。具体 可参见,例如Sambrook,Fritsch&Maniatis,Molecular Cloning:A Laboratory Manual,2nd Ed., Cold Spring Harbor Laboratory,(Cold Spring Harbor,N.Y.1989);(1989);Anderson et al.,Nucleic  Acid Hybridisation:Hybridization:a practical approach,Ch.4,IRL Press Limited(Oxford, England).Limited,Oxford,England(1999);和Asusubel,et al,Current Protocols in Molecular  Biology,Greene Publishing Associates&Wiley Interscience,NY.(1989)。

在某些实施方式中,低聚化合物中的靶区域的碱基序列与靶位点的碱基序列具有足够的 互补性,使得靶区域能够与靶位点特异性杂交。在某些实施方式中,低聚化合物中的靶区域 与靶位点具有50%到100%的互补性,例如,至少50%互补、至少60%互补、至少70%互补、 至少75%互补、至少80%互补、至少85%互补、至少90%互补、至少95%互补、至少96%互 补、至少97%互补、至少98%互补、至少99%互补、或100%互补。“互补”在本申请中是指, 根据Waston-Crick碱基配对原则,碱基之间(包括天然碱基和修饰的碱基)通过氢键结合配 对,例如A与T配对,G与C配对,A与U配对。互补的百分比(如,90%互补)是指,当 靶区域与靶位点通过碱基配对结合,并且配对的碱基数达到最多时,靶区域中与靶位点配对 结合的碱基数目占靶区域全部碱基数目的百分比。例如,靶区域共有20个碱基,当靶区域与 靶位点配对结合后,靶区域中最多有18个碱基与靶位点中的对应碱基配对结合,此时靶区域 与靶位点为90%互补。互补的百分比、互补度和互补性在本申请中可以相互替换使用。互补 百分比可以通过本领域公知的方法计算得到,例如,通过序列比对软件将低聚化合物靶区域 的碱基序列与靶位点的碱基序列进行比对,并使配对碱基数目达到最大,计算两条序列间互 补的碱基数目,并除以低聚化合物靶区域的总碱基数目,得到互补百分比。

在某些实施方式中,低聚化合物的靶区域含有天然的核苷酸。在某些实施方式中,低聚 化合物的靶区域含有至少一个修饰的核苷酸。“核苷酸”在本申请中包括天然核苷酸和修饰的 核苷酸。在本申请中,“天然核苷酸”是指自然界中天然存在的,由碱基、戊糖和磷酸组成的 分子,其中碱基通过糖苷键连接在戊糖的1’位,磷酸连接在戊糖的5’位,如下结构式所示。 天然核苷酸中的戊糖可以是核糖或脱氧核糖,当为核糖时,被称为天然的核糖核酸,即天然 RNA;当为脱氧核糖时,被称为天然的脱氧核糖核酸,即天然DNA。

天然核苷酸中的碱基可以是嘧啶碱基或嘌呤碱基。天然的嘧啶碱基有,胞嘧啶、5-甲基 胞嘧啶、胸腺嘧啶、和尿嘧啶等。天然的嘌呤碱基有,鸟嘌呤和腺嘌呤等。当碱基为嘧啶碱 基时,嘧啶碱基的第一位氮原子与戊糖1’位连接形成糖苷键;当碱基为嘌呤碱基时,嘌呤碱 基的第九位氮原子与戊糖的1’位连接形成糖苷键。

天然的核苷酸可以通过在核苷酸单体之间形成磷酸二酯键而聚合。第一个核苷酸单体的 5’位磷酸可以与第二个核苷酸单体的3’位的羟基反应,形成磷酸二酯键,从而将两个核苷酸 单体连接。磷酸二酯键的走向通常可以用来表示多核苷酸分子中的碱基序列的走向。

在本申请中,“修饰的核苷酸”是指,在天然核苷的结构上具有化学修饰,但仍具有碱基 配对能力的分子。所述修饰可以包括:1)在天然核苷酸的碱基上的修饰,例如但不限于,烷 基化的碱基(如,3-甲基尿嘧啶、5-甲基尿嘧啶、5-甲基胞嘧啶、1-甲基腺嘌呤、假尿嘧啶等)、 硫代的碱基(如,6-硫代鸟嘌呤、4-硫代尿嘧啶)、酰基取代的碱基(如4-N-乙酰基胞嘧啶、 4-N-氨基甲酰基胞嘧啶、2-N-乙酰基-9-甲基鸟嘌呤)等;2)对天然核苷酸的戊糖进行修饰, 例如,2’-O修饰(如,2’-O-甲基核糖、2’-氨基-2’-脱氧核糖、2’-氟-2’-脱氧核糖、2’甲基硒代 核糖,2’-氧和4’-碳通过亚甲基连接的核糖等);将戊糖替换为六元糖;将戊糖替换为N(2-氨 基乙基)-甘氨酸,其通过亚甲基羰基与碱基连接(这样的修饰的核苷酸也被称为肽核酸,PNA) 等等;3)在天然核苷的磷酸基团上进行修饰,例如磷硫酰化修饰(如硫代磷酸、氨基磷酸、 烷基磷酸等)。

修饰的核苷酸可以通过本领域公知的方法制得。例如,请参见:Nucleic Acids in Chemistry  and Biology,由Royal Society of Chemistry(Great Britain)编著,由Royal Society of Chemistry  出版,2006年;Modified Nucleosides:In Biochemistry,Biotechnology and Medicine,由Piet  Herdewijn主编,由Wiley-VCH出版,2008年。也可以通过商业途径购买所需的修饰的核苷。

在修饰的核苷酸单体之间,或者在修饰的核苷单体与天然的核苷酸单体可以通过适当的 核苷间连接而聚合。核苷间连接可以是天然的磷酸二酯键,也可以是任何能够实现本发明目 的的修饰的核苷间连接,例如,硫代磷酸酯、氨基磷酸酯、磷酸三酯、烷基磷酸酯、氨基烷 基磷酸三酯、亚磷酸酯、硒代磷酸酯和硼代磷酸酯、和氨基甲酸酯等等。

在某些实施方式中,低聚化合物的靶区域含有一种或多种选自下组的核苷酸:天然DNA、 天然RNA、修饰的DNA、修饰的RNA、PNA或修饰的PNA。

在某些实施方式中,低聚化合物的靶区域与靶核苷酸的靶位点之间结合的稳定性大于靶 位点与其天然互补链的结合稳定性。例如,当靶位点是基因组双链中的某一段单链序列时, 靶区域与靶位点的特异性杂交能够显著抑制原本与靶位点互补的基因组序列与靶位点的碱基 互补结合。在某些实施方式中,低聚化合物与靶位点的特异性杂交导致在基因组序列中出现 单链的结构,例如原本与靶位点互补的序列变成以单链形式存在。

在某些实施方式中,低聚化合物的靶区域与靶位点的结合稳定性可以通过Tm值表征。 靶区域与靶位点的结合稳定性越大,则Tm值往往越高。如果靶区域与靶位点的Tm值大于 靶位点与其天然互补序列的Tm值,则通常认为靶区域与靶位点的结合稳定性更高。可以使 用本领域的公知技术计算或测定靶区域与靶位点的Tm值。例如,可以将含有靶区域的低聚 化合物与含有靶位点的天然核苷酸配制成样品,用带有程序升温装置的紫外分光光度计测定 样品在某个温度范围内的吸光度值,将记录的温度和相应的吸光度绘制成DNA热变性曲线, 热变性曲线的中点对应的温度即为Tm值。或者也可以通过本领域公知的公式,通过低聚化 合物中的G+C含量,和/或锁核酸的数量等,计算低聚化合物的Tm值。利用类似的方法,也 可以获得靶位点与其天然互补序列的Tm值。

在某些实施方式中,低聚化合物的靶区域含有至少一个修饰的核苷酸,使得低聚化合物 的靶区域与靶核苷酸的靶位点之间结合的稳定性大于靶位点与其天然互补链的结合稳定性。 可以通过筛选Tm值的方式选择合适的修饰的核苷酸。在某些实施方式中,修饰的核苷酸使 得低聚化合物能够以更高的亲和力(如,Tm值)与天然核苷酸序列特异性杂交。例如,当与 某一天然核苷酸链特异性杂交时,含有修饰核苷酸的低聚化合物比具有同样碱基序列但不含 有修饰核苷酸的低聚化合物具有更高的Tm值。本领域已知多种修饰的核苷酸,当寡核苷酸 分子含有一个或多个这样的修饰的核苷酸时,能够显著提高寡核苷酸分子与靶互补序列的Tm 值,例如,但不限于,锁核酸。

在某些实施方式中,低聚化合物的靶区域含有的至少一个所述修饰的核苷酸是锁核酸。 在本申请中,“锁核酸”是指一种核苷酸单体,其具有修饰的糖结构使得糖环被基本上限制在 一种优势构型。本领域公知,核苷酸的糖环存在两种构型,C3’-endo构型(N-型)和C2’-endo 构型(S-型),并且可以相互转换,例如,请见如下结构式所示。已经发现,通过对核苷酸的 糖环进行某些修饰,能够在一定程度上限制糖环的构型转换。例如,当在糖环的2’位引入烷 氧基基团时,能够在一定程度上将糖环限制在N-型构型。

锁核酸的构象可以用本领域公知的方法测得,例如,请参见:Petersen M.et al,The  conformations of locked nucleic acids(LNA),J.Mol.Recognit.,13(1):44-53(2000)。不受理论的 限制,认为当锁核酸中的糖环被限制在某一优势构象时(例如N-构象或S-构象),有助于促 进碱基的堆砌和核苷酸链骨架的组织,因而,含有锁核酸的低聚化合物往往能够以更高的亲 和力(如,Tm值)与天然核苷酸序列杂交。在某些实施方式中,当与某一天然核苷酸链杂交 时,含有锁核酸的低聚化合物比具有同样碱基序列但仅含有天然核糖的低聚化合物具有更高 的Tm值。

在某些实施方式中,锁核酸是双环核苷。“双环核苷”是指,通过将核苷酸的糖环上的 两个环原子共价连接,形成的具有两个环结构的修饰的核苷酸。不受理论的限制,认为双环 核苷酸能够将糖环的构型基本上限制在一种优势构型,例如S-型,或N-型。糖环上任何能够 被共价连接成环的原子都可以用于形成双环核苷酸。以戊糖为例,糖环上的多个原子,例如 C2’和C4’之间、C3’和C5’之间、C-1’和C-6’之间、C-6’和C-4’之间、C-2’和C-3’之间均可共 价连接成环。环原子之间可以通过共价桥成环,例如,-CH2-桥、-C2H4-桥、-CH2-O-桥、-CH2-S- 桥、-CH2-NH-桥、-C2H4-O-桥、-C3H7-O-桥、-CH2-O-CH2-桥、二氧戊环桥等。双环核苷酸中 的糖环可以是任何适当的糖环,例如,核糖、脱氧核糖、葡萄糖等。

在某些实施方式中,锁核酸是在戊糖的C2’和C4’之间共价成环的双环核苷。C2’和C4’ 之间可以通过任何适合的共价桥连接成环,例如,但不限于,-CH2-桥、-C2H4-桥、-CH2-O- 桥、-CH2-S-桥、-CH2-NH-桥、-C2H4-O-桥、-C3H7-O-桥、-CH2-O-CH2-桥、二氧戊环桥等。这 样的双环核苷的例子包括,但不限于,具有如下所列的结构双环核苷(见,例如,Peptide Nucleic  Acids,Morpholinos and Related Antisense Biomolecules,第7章,由Christopher G.Janson等编 辑,Springer Science&Business出版,2006年):

在某些实施方式中,锁核酸是三环核苷。“三环核苷”是指修饰的核苷酸,其糖环上带 有三个环结构。三环核苷可以是在双环核苷的基础上,进一步含有桥结构连接的环原子,形 成第三个环结构。三环核苷已被证明能够将糖环限制在某一优势构型,如S-构型(见,例如, N.Albak等,Nucleosides,Nucleotides and Nucleic Acids,22(5-8):723-725(2003)),并且也被证 明能够与天然DNA链结合。三环核苷还被证明能够提高与DNA链结合的稳定性(见,例如, R.Steffens and C.Leumann(Poster SB-B4),Chimia,1997,51,436))。三环核苷的例子有,例如, 见美国专利申请20100279895和美国专利申请20050287566列出的三环核苷。

可以通过本领域的公知技术合成这些双环或三环核苷,见,例如,Christopher等,同上; 美国专利申请20100216983、美国专利申请20050287566。

在某些实施方式中,本申请中的低聚化合物的靶区域含有与天然核苷酸连接的锁核酸, 和/或与修饰核苷酸连接的锁核酸,和/或两者都有。天然核苷酸可以是天然DNA或天然RNA, 修饰核苷酸可以是修饰的DNA或修饰的RNA(如锁核酸本身)。

在某些实施方式中,低聚化合物的靶区域中含有至少一个锁核酸,或至少两个、至少三 个、至少四个、至少五个、至少六个、至少七个、至少八个、至少九个、至少十个锁核酸。 在某些实施方式中,低聚化合物的靶区域中含有至少10%、20%、30%、40%、50%、或60% 的锁核酸。在某些实施方式中,含有锁核酸的靶区域与互补序列结合时,其Tm值高于将锁 核酸用天然核苷酸代替但具有相同碱基序列的靶区域与互补序列的Tm值。

在本申请中,所述低聚化合物的靶区域特异性杂交于靶位点,所述靶位点含有重复位点 或重复序列单元的至少连续7个核苷酸。在某些实施方式中,所述重复序列单元选自如SEQ ID  NOs:42-46所示的序列。在某些实施方式中,重复序列单元选自SEQ ID NO:43或SEQ ID NO: 45。在某些实施方式中,重复位点选自SEQ ID NO:39、16、40、3、和41所示的序列。在 某些实施方式中,重复位点选自SEQ ID NO:3或SEQ ID NO:16。

在某些实施方式中,所述靶区域是5’→3’走向的,且所述靶位点是3’→5’走向的。在这 样的实施方式中,所述靶位点含有所述重复位点或重复序列单元的3’→5’链的至少7个连续 核苷酸。在这些实施方式中,所述靶位点含有所述重复位点或重复序列单元的3’→5’链的至 少8个、至少9个、至少10个、至少11个、至少12个、至少13个、至少14个、至少15 个、至少16个、至少17个、至少18个、至少19个、或至少20个连续核苷酸。在某些实施 方式中,所述3’→5’走向的靶位点包含SEQ ID NO:6、或SEQ ID NO:19。在某些实施方式 中,所述靶区域是3’→5’走向的,且所述靶位点是5’→3’走向的。在这样的实施方式中,所 述靶位点含有所述重复位点或重复序列单元的5’→3’链的至少7个连续核苷酸。在这些实施 方式中,所述靶位点含有所述重复位点或重复序列单元的5’→3’链的至少8个、至少9个、 至少10个、至少11个、至少12个、至少13个、至少14个、至少15个、至少16个、至少 17个、至少18个、至少19个、或至少20个连续核苷酸。在某些实施方式中,所述5’→3’ 走向的靶位点包含SEQ ID NO:7、或SEQ ID NO:20。

低聚化合物中的靶区域与靶位点具有50%到100%的互补性。在某些实施方式中,所述 低聚化合物的靶区域包含SEQ ID NOs:27、29、33、或35任一所示的碱基序列。在某些实施 方式中,所述靶区域包含至少一个锁核酸,且所述锁核酸的核糖是2’-O,4’-C-亚甲基-β-D-呋 喃核糖。在某些实施方式中,所述靶区域包含SEQ ID NOs:28、30、34、或36任一所示的核 酸分子。

在某些实施方式中,所述低聚化合物也可以作为PCR反应的引物,其可用于扩增靶位点 附近的核苷酸序列。这样的低聚化合物可以含有或可以不含有修饰的核苷酸。在这样的实施 方式中,低聚化合物可以与3’→5’走向的靶位点特异性杂交,或与5’→3’走向的靶位点特异 性杂交。当在3’→5’和5’→3’的两个靶位点间进行外源序列的重组后,可以使用这样的低聚 化合物(即,引物),通过PCR反应检测在两个靶位点间是否存在重组的外源序列。例如, 可以使用分别与3’→5’和5’→3’的两个靶位点特异性杂交的一对低聚化合物作为引物,通过 PCR扩增,检测靶位点间的序列;或者可以使用5’→3’走向的与3’→5’走向的靶位点特异性 杂交的低聚化合物,和3’→5’走向的与外源序列特异性杂交的另一个引物,通过PCR扩增, 检测外源序列是否重组到3’→5’走向的靶位点附近;或者可以使用3’→5’走向的与5’→3’走 向的靶位点特异性杂交的低聚化合物,和5’→3’走向的与外源序列特异性杂交的另一个引物, 通过PCR扩增,检测外源序列是否重组到5’→3’走向的靶位点附近。可以使用本领域公知的 引物设计和合成方法(例如引物设计软件Primer Premier5.0(PRIMER Biosoft International) 或者Genetyx),来获得用于这样目的的低聚化合物。

在某些实施方式中,低聚化合物进一步含有能够与另一个低聚化合物形成结合的结合区 域。为表述清楚,在此将能够形成结合的两个低聚化合物分别称为第一低聚化合物和第二低 聚化合物。相应地,如前所述,第一低聚化合物含有第一靶区域,第二低聚化合物含有第二 靶区域,分别与第一靶位点和第二靶位点特异性杂交。

第一低聚化合物与第二低聚化合物形成的结合可以是直接结合(例如通过化学键结合), 也可以是间接结合(例如通过接头结合)。在某些实施方式中,第一低聚化合物与第二低聚化 合物形成的结合可以是碱基配对、共价键、非共价键、共价接头、或非共价接头。在本申请 中,第一低聚化合物和第二低聚化合物可以是两个独立的化合物,也可以是在一个化合物整 体中通过共价键或共价接头连接的两个部分。

根据形成结合的不同,结合区域的结构可以有所不同。在某些实施方式中,结合区域含 有核苷酸,其能够形成碱基配对的结合。例如,第一低聚化合物中的结合区域可以含有碱基 序列,其可以与第二低聚化合物中的一个或多个碱基互补,形成一个或多个碱基配对结合。 优选地,这样的碱基配对基本上不影响靶区域与靶位点的特异性杂交。在某些实施方式中, 结合区域含有至少一个修饰的核苷酸。在某些实施方式中,结合区域的至少一个所述修饰的 核苷酸是锁核酸。

在某些实施方式中,结合区域含有某个基团或原子,其能够与第二低聚化合物形成共价 键或非共价键。这样的基团或原子可以是反应性的,例如羟基、羧基、氨基、巯基等,其能 够通过反应形成共价键(例如酯键、酰胺键、醚键、二硫键等),或非共价键(例如,氢键、 疏水作用力、离子键、范德华力等)。在某些实施方式中,结合区域可以是靶区域上的某个基 团或原子,例如,靶区域核苷酸上的羟基,或磷酸基团等。在这样的实施方式中,优选共价 键或非共价键的形成不显著影响靶区域与靶位点的特异性杂交。

在某些实施方式中,结合区域含有功能性的基团,其能够形成共价或非共价接头的结合。 功能性基团可以是例如胺基团、酰肼基团、巯基团等,通过与反应性基团反应(例如,亲核 基团、交联剂如异双功能化合物等),形成接头,该接头可以进一步与第二低聚化合物形成结 合。功能性基团的更多示例以及接头的形成方法请参见,例如,Greg T.Hermanson, Bioconjugate Techniques,Second Edition,Chapter27,Nucleic Acid and Oligonucleotide  Modification and Conjugation,Academic Press(2008)。

在某些实施方式中,结合区域含有非核苷类成分,使得第一低聚化合物和第二低聚化合 物中的5’→3’走向靶区域和3’→5’走向靶区域在分子内形成共价连接。这样的结合区域可以 含有,例如,带有磷酸根基团的亲水性分子,如三乙二醇磷酸酯(triethylene glycol phosphate, TEG),六乙二醇磷酸酯(hexaethylene glycol phosphate,HEG×2);或带有磷酸根基团的疏水 性分子,如长度为3个碳原子(propyl),12个碳原子(dodecyl),36个碳原子(tri-dodecyl)的烷 基磷脂类;或Cy3,和TINA(twisted intercalating nucleic acid)等。通过本领域公知的方法,可 以将5’→3’走向靶区域和3’→5’走向靶区域在分子内形成连接,由此将第一低聚化合物和第 二低聚化合物通过共价连接,形成单个化合物分子。具体的连接方法可以参见,例如,Eman  M.Zaghloul et al,Optimizing anti-gene oligonucleotide‘Zorro-LNA’for improved strand invasion  into duplex DNA,Nucleic acid research,2010:1-13,doi:10.1093/nar/gkq835。

在本申请提供的某些低聚化合物中,所述结合区域与靶区域共价连接。例如,当结合区 域含有核苷酸时,可以通过核苷间的连接(如磷酸二酯键或其他适合的核苷间连接基团)与 靶区域共价相连。在这样的实施方式中,所述结合区域连接在所述靶区域的5’上游,或连接 在所述靶区域的3’下游。

在某些实施方式中,所述第二低聚化合物含有第二靶区域和第二结合区域。在某些实施 方式中,第一低聚化合物的第一结合区域与第二低聚化合物的第二结合区域之间能够形成所 述结合。例如,第二结合区域可以含有核苷酸,当第一结合区域也含有核苷酸时,第一结合 区域和第二结合区域之间可以通过碱基配对形成结合。类似地,第二结合区域也可以含有形 成共价键或非共价键的基团和原子,或者也可以含有能够形成接头的功能性基团等。

在某些实施方式中,所述第二低聚化合物含有第二靶区域,其与第二靶位点特异性杂交, 所述第二靶位点含有在仓鼠细胞染色体或基因组中存在的重复位点的至少连续7个核苷酸, 其中所述第一靶位点和所述第二靶位点分别在所述重复位点的正链和反链上,即,当第一靶 位点位于5’→3’链时,第二靶位点位于3’→5’链,反之亦然。

在某些实施方式中,所述低聚化合物包含如SEQ ID NOs:31、32、37、或38任一所示 的碱基序列。在某些实施方式中,所述低聚化合物的所述靶区域和所述结合区域各包含至少 一个锁核酸,且所述锁核酸的核糖是2’-O,4’-C-亚甲基-β-D-呋喃核糖。在某些实施方式中, 所述低聚化合物包含如SEQ ID NOs:23、24、25、或26任一所示的核酸分子。

在某些实施方式中,本申请所述的低聚化合物的靶区域由天然核苷酸和修饰的核苷酸组 成。在某些实施方式中,所述靶区域由天然核苷酸和锁核酸组成。在某些实施方式中,所述 靶区域由天然核苷酸和锁核酸组成,其中在锁核酸的核糖部分的C2’和C4’之间通过-CH2-O- 桥连接(即:核糖是2’-O,4’-C-亚甲基-β-D-呋喃核糖)。

在某些实施方式中,本申请所述的低聚化合物的结合区域由天然核苷酸和修饰的核苷酸 组成。在某些实施方式中,所述结合区域由天然核苷酸和锁核酸组成。在某些实施方式中, 所述结合区域由天然核苷酸和锁核酸组成,其中在锁核酸的核糖部分的C2’和C4’之间通过 -CH2-O-桥连接(即:核糖是2’-O,4’-C-亚甲基-β-D-呋喃核糖)。

在某些实施方式中,本申请所述的低聚化合物还可以进一步含有缀合物。缀合物可以是 能够修饰低聚化合物的一种或多种属性的分子,例如,使得低聚化合物能够被检测的标记分 子、提高低聚化合物稳定性等化学性质的分子、改善低聚化合物的细胞摄取、分布、储存和 清除等性质的分子等等。在某些实施方式中,可以使用任何本领域已知的能够用于修饰寡核 苷酸的缀合物,例如但不限于,嵌入剂、荧光化合物(如罗丹明、荧光素、荧光染料等)、有 机聚合物(如聚乙二醇、聚酰胺、聚醚等)、生物小分子(如胆固醇、硫胆固醇、胆酸结构、 叶酸、脂肪、磷脂等)、和化合物(如吩嗪、菲啶、蒽醌、金刚烷、吖啶、香豆素等)。缀合 物可以缀合在低聚化合物的任何适当的位置,例如,低聚化合物的靶区域上、结合区域上、 或者除此以外的低聚化合物结构上。例如,缀合物可以缀合在靶区域和/或结合区域的5’末端、 3’末端等。优选地,缀合物不显著影响低聚化合物与靶位点的特异性杂交,和/或不显著影响 第一低聚化合物与第二低聚化合物之间的结合。缀合物可以直接或间接(如通过接头)缀合 在低聚化合物上,相关的方法在本领域是公知技术。

本申请所述的低聚化合物可以通过本领域公知的寡核苷酸合成方法进行制备,见例如, The Chemical Biology of Nucleic Acids,由Gunter Mayer主编,由John Wiley&Sons,Ltd出版, 2011年;Nucleic Acids in Chemistry and Biology,由Royal Society of Chemistry(Great Britain) 编著,由Royal Society of Chemistry出版,2006年。简单地说,可以在固相支持物上,通过 连续添加核苷单体并使之形成核苷间连接(如磷酸二酯键),从而使寡核苷酸链得以延长。在 形成3’-5’核苷间连接的反应中,可以事先用化学保护基团将不参与形成核苷间连接的反应性 基团保护起来,如第一个核苷的5’位的羟基、第二个核苷单体的3’羟基,碱基上的反应性基 团等。为形成核苷间连接,以磷酸二酯键为例,可以将待反应的两个羟基中的一个进行磷酸 化或亚磷酰化,然后通过偶联反应与另一个羟基进行反应,从而形成磷酸二酯键。为进行下 一步的链延长,可以选择性地去除在得到的二核苷酸中待延长的位点处的保护基团,再以相 似的方法连接下一个核苷分子。其他的核苷间连接的形成方法在本领域也是公知技术。当低 聚化合物的聚合完成后,可以从固相支持物上释放出低聚化合物。在低聚化合物的合成中, 本领域技术人员可以根据公知常识选择适当的保护基团和合成方法,这些都在本领域技术人 员的知识范围内。

低聚构建体

本申请的另一方面提供了低聚构建体,其含有:第一低聚化合物,其含有与第一结合区 域连接的第一5’→3’靶区域;第二低聚化合物,其含有与第二结合区域连接的第二3’→5’靶 区域;以及在第一结合区域和第二结合区域之间的结合;其中:所述第一5’→3’靶区域与第 一3’→5’靶位点可特异性杂交;所述第二3’→5’靶区域与第二5’→3’靶位点可特异性杂交; 且所述第一3’→5’靶位点和所述第二5’→3’靶位点各含有重复位点的至少7个连续核苷酸, 其中所述重复位点存在于仓鼠细胞的染色体或基因组中。

在某些实施方式中,在第一结合区域和第二结合区域之间的结合可以是直接结合或间接 结合,例如,可以通过碱基配对、共价键、非共价键、共价接头、或非共价接头。第一低聚 化合物与第二低聚化合物形成的结合可以是任何适合的结构,使得当低聚构建体的第一靶区 域和第二靶区域分别与第一靶位点和第二靶位点特异性杂交时,所述第一低聚化合物与第二 低聚化合物也处于结合的状态。也就是说,低聚构建体本身能够与第一靶位点和第二靶位点 都特异性杂交。

在某些实施方式中,当低聚构建体与第一靶位点和第二靶位点都特异性杂交时,低聚构 建体中的第一低聚化合物和第二低聚化合物能够稳定结合。“稳定结合”在本申请中是指,非 随机的持续的结合。

在某些实施方式中,第一结合区域和第二结合区域均含有核苷酸。在这样的实施方式中, 第一结合区域的核苷酸序列为5’→3’走向,第二结合区域的核苷酸序列为3’→5’走向。在某 些实施方式中,第一结合区域和第二结合区域中,至少一个含有修饰的核苷酸;或者两者均 含有至少一个修饰的核苷酸。在这样的实施方式中,含有修饰核苷酸的第一结合区域和第二 结合区域之间结合的Tm值大于具有同样碱基序列的天然核苷酸分子之间的Tm值。在某些 实施方式中,至少一个所述修饰的核苷酸是锁核酸。

在某些实施方式中,第一结合区域和第二结合区域通过碱基互补形成结合。例如,第一 5’→3’结合区域与第二3’→5’结合区域通过碱基互补。在某些实施方式中,第一结合区域和第 二结合区域可特异性地杂交。例如,第一结合区域的碱基序列与第二结合区域的碱基序列至 少50%互补、至少60%互补、至少70%互补、至少80%互补、至少90%互补、至少95%互补、 或100%互补。

在某些实施方式中,第一结合区域和第二结合区域的特异性杂交基本上不影响第一靶区 域与第一靶位点的特异性杂交,或/和基本上不影响第二靶区域与第二靶位点的特异性杂交。 在某些实施方式中,第一结合区域和/或第二结合区域基本上不与第一靶位点或第二靶位点特 异性杂交。本领域技术人员可以通过公知技术,设计和合成第一结合区域和第二结合区域的 碱基序列,使其与第一或第二靶位点的互补性低于80%,优选地,低于40%、低于30%、或 低于20%。在某些实施方式中,第一结合区域与第二结合区域也不是与第一靶位点和第二靶 位点紧邻的上下游序列。在某些实施方式中,可以根据第一或第二靶位点的3’下游或5’上游 的序列设计第一结合区域。例如,假设第二靶位点在第一靶位点的下游,第一靶位点是重复 位点的第1-18位核苷酸,则第一结合区域可以根据重复位点的第19-25位核苷酸设计;或者 第二靶位点是重复位点的第100-120位核苷酸,则第一结合区域可以根据重复位点的第90-100 位核苷酸设计)。这样的第一结合区域可以与第一靶位点3’下游或5’上游的序列100%互补, 至少90%互补,至少80%互补、至少70%互补、至少60%互补、或至少50%互补。相应地, 第二结合区域可以根据第一结合区域的核苷酸序列而设计(例如与第一结合区域至少50%互 补、至少60%互补、至少70%互补、至少80%互补、至少90%互补、至少95%互补、或100% 互补)。同样地,也可以先设计第二结合区域的核苷酸序列,再根据碱基互补原则,设计第一 结合区域的核苷酸序列。

在某些实施方式中,第一结合区域和/或第二结合区域基本上不与宿主染色体或基因组上 的序列特异性杂交。可以通过本领域已知的计算机程序,例如BLAST,所述第一结合区域和 第二结合区域与宿主细胞基因组上的序列的同源性,选择与宿主细胞基因组的序列的同源性 低于80%的序列作为结合区域的碱基序列。

在某些实施方式中,所述第一或所述第二结合区域分别连接在所述第一或所述第二靶区 域的5’上游。在这样的低聚构建体中,第一低聚化合物与第二低聚化合物通过结合区域结合, 形成Z型的结构(例如,见图1a),其中第一靶区域和第二靶区域的3’末端均含有核苷酸单 链结构,能够分别与第一靶位点和第二靶位点特异性杂交。

在某些实施方式中,所述第一或所述第二结合区域分别连接在所述第一或所述第二靶区 域的3’下游。在这样的低聚构建体中,第一低聚化合物与第二低聚化合物通过结合区域结合, 形成Z型的结构(例如,见图1b),其中第一靶区域和第二靶区域的5’末端均含有核苷酸单 链结构,能够分别与第一靶位点和第二靶位点特异性杂交。

在某些实施方式中,所述第一5’→3’靶区域与所述第一3’→5’靶位点有50%到100% 互补性,和/或所述第二3’→5’靶区域与所述第二5’→3’靶位点有50%到100%互补性。优选 地,所述靶区域与所述靶位点有60%到100%、70%到100%、80%到100%、90%到100%的 互补性。本领域人员可以通过设计低聚构建体,使其具有对靶位点的不同程度的互补性,通 过检测重组效果和脱靶作用,选择出具有适度互补性的靶区域。

在某些实施方式中,低聚构建体中的第一5’→3’靶区域能够与所述重复位点的第一3’→ 5’靶位点特异性杂交,并且低聚构建体中的第二3’→5’靶区域能够与重复位点的第二5’→3’ 靶位点特异性杂交。在某些实施方式中,所述第二5’→3’靶位点位于所述第一3’→5’靶位点 在所述重复位点上的互补序列的5’上游或3’下游。当低聚构建体的两个靶区域都与重复位点 上对应的靶位点结合时,重复位点的双链被打开,并且两个靶位点在重复位点上的互补链由 于不能与靶位点配对结合而呈单链状态(例如,见图2)。

在某些实施方式中,第一3’→5’靶位点和第二5’→3’靶位点在重复位点上不重叠。例如, 在重复位点的双链中,第一3’→5’靶位点的5’末端第一个核苷酸和第二5’→3’靶位点的5’末 端的第一个核苷酸刚好邻接,或者两者之间的间隔为1个或多个核苷酸,例如,1个到100 个核苷酸、1个到50个核苷酸、1个到20个核苷酸、1个到10个核苷酸、或1个到5个核 苷酸。在某些实施方式中,间隔至少为100个核苷酸、至少为200个核苷酸、至少为300个 核苷酸、至少为400个核苷酸、至少为500个核苷酸、或至少为1000个核苷酸。不受理论限 制,认为当低聚化合物与第一3’→5’靶位点和第二5’→3’靶位点同时杂交时,第一3’→5’靶 位点和第二5’→3’靶位点之间的间隔序列(如果有的话)可以形成环状结构(例如Ω形), 从而拉近第一3’→5’靶位点和第二5’→3’靶位点的空间距离。

在某些实施方式中,第一3’→5’靶位点和第二5’→3’靶位点之间的间隔序列长度可以根 据待插入的外源序列的长度进行选择,例如,约为外源序列长度的0%、5%、10%、20%、30%、 40%、50%、60%、70%、80%、90%、100%、150%、200%、或300%。

在某些实施方式中,其中所述第一3’→5’靶位点含有所述重复位点或重复序列单元的3’ →5’链的至少连续7个核苷酸。在某些实施方式中,其中所述第二5’→3’靶位点含有所述重 复位点或重复序列单元的5’→3’链的至少连续7个核苷酸。在某些实施方式中,所述重复序 列单元选自如SEQ ID NOs:42-46所示的序列,或选自SEQ ID NO:43或SEQ ID NO:45所 示的序列。在某些实施方式中,所述重复位点选自SEQ ID NO:39、16、40、3、和41所示 的序列,或选自SEQ ID NO:3或SEQ ID NO:16所示的序列。在某些实施方式中,所述第一 低聚化合物和/或所述第二低聚化合物包含如SEQ ID NOs:31、32、37、或38任一所示的碱 基序列。在某些实施方式中,所述低聚化合物的所述靶区域和所述结合区域各包含至少一个 锁核酸,且所述锁核酸的核糖是2’-O,4’-C-亚甲基-β-D-呋喃核糖。在某些实施方式中,所述 第一低聚化合物和/或所述第二低聚化合物包含SEQ ID NOs:23、24、25、或26任一所示的 核酸分子。

多核苷酸供体

本申请的另一方面提供了多核苷酸供体,其含有至少一个同源位点,该同源位点与重复 位点中的靶位点具有足够的同源百分比,使得同源位点能够与靶位点发生定点重组。多核苷 酸供体可以被引入宿主细胞中(例如通过转化、转导或转染的方式),使其携带的同源位点能 够与宿主细胞的染色体或基因组内的靶位点进行定点重组。

“多核苷酸供体”在本申请中是指一种多核苷酸的运载工具,其含有操作性插入的同源 位点。“操作性插入”是指,同源位点在多核苷酸供体上的位置能够允许其与对应的靶位点发 生定点重组。多核苷酸供体可以是任何能够用于传递多核苷酸的材料,例如:线性多核苷酸、 线性双链多核苷酸、质粒、噬菌粒、柯斯质粒、人工染色体如酵母人工染色体(YAC)、细菌 人工染色体(BAC)或P1衍生的人工染色体(PAC)、噬菌体如λ噬菌体或M13噬菌体, 以及动物病毒等。多核苷酸供体还可以含有复制起始位点,使其可以自我复制。多核苷酸供 体还可包括协助其进入细胞的成分,包括但不限于,病毒颗粒、脂质体或蛋白外壳。

在某些实施方式中,所述多核苷酸供体含有第一5’→3’同源位点,该同源位点含有重复 位点或重复序列单元的5’→3’链的至少连续7个核苷酸(即,靶位点)的同源序列,其中所 述重复位点或重复序列单元存在于仓鼠细胞的染色体或基因组中。“同源序列”在本申请中是 指,与重复位点或重复序列单元中的靶位点具有足够同源百分比的核苷酸序列。“同源百分比” 是指,当同源序列与靶位点进行序列比对,使得相同的核苷酸数目达到最多时(例如,可以 适当引入空缺),相同的核苷酸数目占同源序列的总核苷酸数目的百分比。在某些实施方式中, 同源序列与靶位点可以具有至少80%、至少85%、至少90%、至少91%、至少92%、至少 93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%的同源 百分比。

在某些实施方式中,所述多核苷酸供体含有第一3’→5’同源位点,该同源位点含有重复 位点或重复序列单元的3’→5’链的至少连续7个核苷酸的同源序列,其中所述重复位点或重 复序列单元存在于仓鼠细胞的染色体或基因组中。在某些实施方式中,所述多核苷酸供体进 一步含有第二5’→3’同源位点,其含有所述重复位点的5’→3’链的至少连续7个核苷酸的 同源序列。在某些实施方式中,所述重复序列单元选自如SEQ ID NOs:42-46所示的序列,或 选自SEQ ID NO:43或SEQ ID NO:45所示的序列。在某些实施方式中,所述重复位点选自 SEQ ID NO:39、16、40、3、和41所示的序列,或选自SEQ ID NO:3或SEQ ID NO:16所 示的序列。

在某些实施方式中,所述第一3’→5’同源位点位于所述第二5’→3’同源位点在所述供体 上的互补序列的5’上游或3’下游。多核苷酸供体上第一同源位点与第二同源位点的相对位置 与第一靶位点与第二靶位点在重复位点中的相对位置一致。例如,在重复位点中,第一3’→5’ 靶位点在第二5’→3’靶位点的互补序列的5’上游,则相应地,在多核苷酸供体上,第一3’→5’ 同源位点也相应地在第二5’→3’同源位点的互补序列的5’上游。反之亦然。

第一和第二同源位点可以根据本领域公知的方法获得。例如,可以通过DNA合成的方 法,合成具有第一和第二同源序列的DNA。或者,也可以通过PCR的方法,以含有重复位 点的序列作为模板,扩增得到第一同源序列和第二同源序列。

多核苷酸供体可以通过本领域公知的多种方法获得。例如,可以通过PCR的方法,在待 重组的序列中通过引物引入同源位点,由此得到的含有同源位点和待重组序列的多核苷酸链 可以直接作为多核苷酸供体。再例如,可以设计合成多对首尾互补的寡核苷酸,其中某一对 或多对寡核苷酸中含有全部或者部分同源位点,通过PCR,使这些首尾互补的寡核苷酸依次 相连,从而使得PCR产物的适当位置含有同源位点,由此得到的多核苷酸产物也可以作为多 核苷酸供体。再例如,可以通过商业途径购买可用作多核苷酸供体的材料,例如,质粒、噬 菌体、病毒、人工染色体等,通过常规的分子生物学方法(例如限制性酶切,或PCR),在其 中操作性插入同源位点,由此得到的含有同源位点的质粒、噬菌体、病毒、人工染色体等也 可以作为多核苷酸供体。

在某些实施方式中,多核苷酸供体是质粒。任何可以转入宿主细胞(特别是仓鼠细胞) 的质粒都可以使用。多种克隆或表达质粒可以通过商业途径很容易地获得,例如,但不限于, PUC19、pBR322、pcDNA、pCMV、pTZ19R、Lambda DNA、pGEM、和pSP。

在某些实施方式中,多核苷酸供体进一步含有期望被重组到靶位点处的外源序列。在某 些实施方式中,外源序列的两端侧接有所述第一3’→5’同源位点和所述第二5’→3’同源位 点。在某些实施方式中,外源序列可以含有外源基因、外源调控序列、和外源限制性克隆位 点中的一个或多个。

外源基因可以是任何感兴趣的开放阅读框,含有起始密码子、编码序列和终止密码子。 任何感兴趣的基因都可以使用。外源基因可以是仓鼠的基因,也可以是其他物种的基因,例 如细菌的抗生素抗性基因、荧光蛋白基因、哺乳动物如人的基因。外源基因可以是野生型的 基因,也可以是人工修饰/突变的基因,例如EGFP。

在某些实施方式中,外源基因编码治疗性多肽或蛋白、诊断用的多肽或蛋白、或预防用 途的多肽或蛋白。这样的外源基因的例子包括,但不限于:

抗体及相应的抗原结合片段,例如阿昔单抗、阿达木单抗、阿仑单抗(Alemtuzumab)、 巴利昔单抗Basiliximab、贝伐珠单抗(Bevacizumab)、赛妥珠(Certolizumab)、西妥昔单抗 (Cetuximab)、达利珠单抗(Daclizumab)、艾库组单抗(Eculizumab)、依法利珠单抗 (Efalizumab)、吉妥单抗(Gemtuzumab)、替伊莫单抗(Ibritumomab)、英夫利西单抗 (Infliximab)、莫罗单抗(Muromonab-CD3)、那他珠单抗(Natalizumab)、奥马珠单抗 (Omalizumab)、帕利珠单抗(Palivizumab)、帕尼单抗(Panitumumab)、兰尼单抗 (Ranibizumab)、利妥昔单抗(Rituximab)、托西莫单抗(131I-Tositumomab-I131)、曲妥珠单 抗(Trastuzumab)、戈利木单抗(golimumab)、Canakinumab、Ustekinumab、Ofatumumab、 tocilizumab、和denosumab,及其相应的抗原结合片段(如Fab、scFv等);

白细胞标记物,例如CD2、CD3、CD4、CD5、CD6、CD7、CD8、CD11a,b,c、CD13、 CD14、CD18、CD19、CD20、CD22、CD23、CD27及其配体,CD28及其配体B7.1、B7.2、 B7.3、CD29及其配体,CD30及其配体,CD40及其配体gp39、CD44、CD45及其异构体, CDw52(Campath抗原)、CD56、CD58、CD69、CD72、CTLA-4、LFA-1和TCR;

组织相容性抗原,例如I类或II类MHC、Lewis Y抗原、SLex、SLey、SLea和SLeb。 整合素(integrins),例如VLA-1、VLA-2、VLA-3、VLA-4、VLA-5、VLA-6和LFA-1; 粘附分子,例如Mac-1和p150、95;

选择素(selectins),例如L-选择素、P-选择素和E-选择素及其配体VCAM-1、ICAM-1、 ICAM-2和LFA-3;

白细胞介素,例如IL-1、IL-2、IL-3、IL-4、IL-5、IL-6、IL-7、IL-8、IL-10、IL-11、IL-12、 IL-13、IL-14和IL-15;

白细胞介素受体,例如IL-1R、IL-2R、IL-4R、IL-5R、IL-6R、IL-7R、IL-8R、IL-10R、 IL-11R、IL-12R、IL-13R、IL-14R和IL-15R;

趋化因子及其受体,例如PF4、RANTES、MIP1α.、MCP1、NAP-2、Grou、Grog和IL-8, 以及这些趋化因子的受体;

生长因子,例如TNF-α、TGF-β、TSH、VEGF/VPF、PTHrP、EGF家族、FGF、PDGF 家族、内皮缩血管肽和胃泌激素释放肽(GRP);

生长因子受体,例如TNF-αR、RGF-βR、TSHR、VEGFR/VPFR、FGFR、EGFR、PTHrPR、 PDGFR家族、EPO-R、GCSF-R和其他造血受体;

干扰素及其受体,如干扰素α2b、α1b、IFN.α.R、IFN.β.R和IFN.γ.R;

免疫球蛋白及其受体,例如IgE、FceRI和FCeRII;

G蛋白偶联受体,例如,G蛋白偶联受体4(GPR4)、肾上腺素能受体(如α受体、β 受体)、组胺受体、阿片受体、大麻受体、血管紧张素受体、缓激肽受体、钙调素受体、生长 抑素受体等;

离子通道,例如,钾离子通道、钠离子通道、质子通道、钠离子通道等;

肿瘤抗原,例如her2-neu、粘液素、CEA和内皮唾液酸蛋白;

变应原,例如室内尘螨抗原、lol p1(草)抗原和漆酚;

病毒蛋白,例如CMV糖蛋白B、H和gCII,HIV-1包膜糖蛋白、RSV包膜糖蛋白、HSV 包膜糖蛋白、EBV包膜糖蛋白、VZV包膜糖蛋白、HPV包膜糖蛋白、肝炎家族表面抗原;

毒素,例如假单胞菌内毒素和骨桥蛋白/尿桥蛋白、蛇毒和蜂毒;

血液因子,例如补体C3b、补体C5a、补体C5b、Rh因子、纤维蛋白原、纤维蛋白和髓 磷脂相关生长抑制剂、白蛋白;

酶类,例如胆固醇酯转移蛋白类、膜结合基质金属蛋白酶和谷氨酸脱羧酶(GAD);

蛋白激素,例如,胰岛素、促红素(EPO)、促卵泡素β、人绒促性素、人生长激素、人 凝血因子(如因子VIIa)、促黄体激素α;

细胞因子,例如干扰素(如干扰素α2b、α1b、)、粒细胞刺激因子、集落刺激因子、巨嗜 细胞-集落刺激因子;

治疗性多肽,例如阿替普酶(Alteplase)、利拉鲁肽、特立帕肽(Teriparatide)、依那西 普、内皮抑素、血管抑素K1-3、醋酸亮丙瑞林、性激素结合球蛋白、和Bikunin;以及

不同种类的抗原,包括神经节苷脂GD3、神经节苷脂GM2、LMP1、LMP2、嗜酸性粒 细胞主要碱性蛋白、嗜酸性粒细胞阳离子蛋白、PANCA、阿马杜拉蛋白、IV类胶原蛋白、糖 基化脂类、γ干扰素、A7、P糖蛋白和Fas(AFO-1)以及氧化型低密度脂蛋白(LDL)。

在某些实施方式中,所述外源序列进一步含有选择标记,例如但不限于,标记基因。“标 记基因”在本申请中是指,能够通过其表达产物的功能或特性,对含有标记基因的宿主细胞 进行筛选。例如,标记基因可以是,编码抗生素抗性基因、报告基因、荧光蛋白等。标记基 因的例子包括,但不限于,抗生素抗性基因例如,氨苄青霉素抗性、氯霉素抗性、卡那霉素 抗性、四环素抗性基因等,报告基因例如,氯霉素乙酰转移酶基因(cat)、二氢叶酸还原酶 基因、荧光素酶基因、β-葡萄糖苷酸酶基因(gus)、β-半乳糖苷酶基因(lacZ)等酶类报告 基因,以及荧光蛋白如,绿色荧光蛋白GFP/EGFP、黄色荧光蛋白等。

在某些实施方式中,外源序列进一步含有外源调控序列。外源调控序列可以含有多种控 制外源基因表达的元件,包括启动子序列、转录起始序列、增强子序列等。启动子可以促使 外源基因被转录。转录起始序列可以促进外源基因的转录和翻译。增强子可以提高外源基因 的转录水平。外源调控序列优选地与外源基因操作性连接。例如,与外源基因操作性连接的 启动子能够启动外源基因的转录。优选地,外源调控序列在哺乳动物细胞中(更优选地,仓 鼠的细胞中)具有调控活性。优选的启动子例子包括,但不限于,CMV启动子、T7启动子、 TK启动子、EF1a启动子、SV40启动子、RSV启动子、UbC启动子等。优选地,启动子的 引入不显著干扰宿主细胞内的正常基因表达。

在某些实施方式中,外源序列中可以含有一个或多个外源基因。所述一个或多个外源基 因可以是同一个基因的一个或多个拷贝,也可以是不同的基因。例如,外源序列可以含有某 个治疗性蛋白的多个拷贝,也可以含有一个治疗性蛋白和一个标记基因。在某些实施方式中, 外源序列含有至少一个标记基因。在某些实施方式中,外源序列含有两个或两个以上标记基 因。优选地,所述两个或两个以上标记基因允许通过不同的筛选方式进行宿主细胞的筛选。 例如,一个标记基因可以是抗生素抗性基因,另一个标记基因可以是荧光蛋白。

在某些实施方式中,外源基因的多个拷贝或多个不同的外源基因可以串联成多个开放阅 读框。所述多个开放阅读框可以分别与多个对应的启动子操作性连接,使得多个开放阅读框 都能够被转录成mRNA。在某些实施方式中,多个开放阅读框也可以与一个启动子连接,但 是在多个开放阅读框之间以IRES序列连接。在这样的实施方式中,多个开放阅读框被转录 成一个含有多个多肽编码区的mRNA分子,编码区之间以IRES序列间隔。在翻译过程中, IRES序列可以允许核糖体进入多肽编码区的起始密码子,即ATG,并介导在一条mRNA链 上的多个多肽编码区都被翻译。

在某些实施方式中,外源基因的多个拷贝可以串联在一个开放阅读框内,其间以接头连 接。这样的开放阅读框的表达产物为多蛋白前体,其中串联了多个以氨基酸接头连接的多肽。 通过本领域公知的多种方法,可以将一分子的多蛋白前体切割成多个分子的多肽产物,例如, 通过蛋白酶(如,枯草杆菌蛋白酶、梭菌蛋白酶、胶原酶、肠激酶、凝血因子Xa、肾素、胰 蛋白酶、胰凝乳蛋白酶等)或化学试剂(如溴化氰、甲酸和加热、羟胺和加热等)。

在某些实施方式中,外源序列含有至少一个限制性酶切位点。优选地,所述限制性酶切 位点的两端侧接有所述第一3’→5’同源位点和所述第二5’→3’同源位点。这样的限制性酶 且位点可以允许将感兴趣的外源序列,例如外源基因和/或外源调控序列通过限制性酶切的方 式连接到第一和第二同源位点之间。在某些实施方式中,所述至少一个限制性酶切位点包括 含有多种不同酶切位点的多克隆位点。

在某些实施方式中,所述多核苷酸供体是插入了第一和第二同源位点的pROSE载体。 pROSE载体可以根据本申请的实施例中提供的方法和步骤构建得到,其序列见图9。pROSE 载体中含有三个标记基因,分别为EGFP蛋白、氨苄青霉素抗性基因、嘌呤霉素抗性基因。 在某些实施方式中,第一和第二同源位点被插入在pROSE载体的Nde I位点处。当pROSE 载体与第一靶位点和第二靶位点重组时,pROSE载体上的第一和第二同源位点之间的序列都 可以作为外源序列重组到第一靶位点和第二靶位点之间,包括EGFP蛋白、氨苄青霉素抗性 基因、嘌呤霉素抗性基因。在某些实施方式中,在pROSE载体的多克隆区域还可以插入其他 外源序列。当用这样的pROSE载体进行定点重组时,第一和第二同源位点之间的序列,包括 EGFP蛋白、氨苄青霉素抗性基因、嘌呤霉素抗性基因和所述其他外源序列都可以被重组到 第一靶位点和第二靶位点之间。

宿主细胞

本申请的另一方面提供了在染色体或基因组上含有本申请所述重复位点或重复序列单 元或其片段(例如,含有至少7个连续核苷酸的片段)的宿主细胞,其进一步含有本申请提 供的低聚构建体。在某些实施方式中,所述重复位点或重复序列单元存在于仓鼠细胞染色体 或基因组中。在某些实施方式中,所述重复序列单元选自如SEQ ID NOs:42-46所示的序列, 或选自SEQ ID NO:43或SEQ ID NO:45所示的序列。在某些实施方式中,所述重复位点选 自SEQ ID NO:39、16、40、3、和41所示的序列,或选自SEQ ID NO:3或SEQ ID NO:16 所示的序列。宿主细胞的染色体或基因组中含有所述重复位点的至少7个连续核苷酸,其能 够与所述低聚构建体的第一靶区域和/或第二靶区域分别特异性杂交。在某些实施方式中,所 述宿主细胞的染色体或基因组中含有第一3’→5’靶位点和第二5’→3’靶位点,其能够分别 与所述低聚构建体的第一5’→3’靶区域和第二3’→5’靶区域特异性杂交。

在某些实施方式中,可以在含有重复位点或其片段的宿主细胞中分别或同时引入两个本 申请提供的低聚化合物,所述两个低聚化合物能够在宿主细胞中形成本申请的低聚构建体。 例如,两个低聚化合物的结合区域可以在细胞内通过碱基互补结合,形成稳定的结合。在某 些实施方式中,可以在含有重复位点的宿主细胞中引入本申请的低聚构建体。

可以使用本领域公知的任何将核苷酸引入宿主细胞的方法,将低聚化合物或低聚构建体 引入宿主细胞中。适合的方法例如,但不限于,DEAE-葡聚糖法(商业化的试剂盒例如 Sigma-Aldrich DEAE-Dextran Transfection Kit)、电转化(商业化的试剂盒例如Invitrogen  NeonTM Transfection System)、显微注射法(见,例如,Kubo et al.,FEBS Letts.241:119,(1988))、 脂质体转染(商业化的试剂盒例如Invitrogen Lipofectamine2000)、磷酸钙转染(商业化的试 剂盒例如Calcium phosphate transfection Kit,Invitrogen)、和阳离子聚合物(商业化的试剂盒例 如QbiogenejetPEITM;Qiagen SuperFect/Polyfect)。本领域技术人员可以购买商品化的试剂 盒,按照生产商的说明书将低聚化合物或低聚构建体引入宿主细胞中。或者,也可以根据本 领域公知的实验方法(见,例如Sambrook et al.,Molecular Cloning:A Laboratory Manual(Cold  Spring Harbor Laboratory,N.Y.(2001),选择合适的实验试剂和条件进行。

在某些实施方式中,所述宿主细胞进一步含有本申请提供的多核苷酸供体。例如,多核 苷酸供体上含有第一3’→5’同源位点和第二5’→3’同源位点,分别是重复位点上的第一3’ →5’靶位点和第二5’→3’靶位点的同源序列。所述低聚构建体能够与多核苷酸供体的第一3’ →5’同源位点和第二5’→3’同源位点特异性杂交。所述供体可以进一步含有外源序列,所述 外源序列的两端侧接有所述第一3’→5’同源位点和所述第二5’→3’同源位点。所述外源序 列可以含有一个或多个基因,例如同一个基因的一个或多个拷贝,或至少两个不同的基因。 所述外源序列还可以进一步含有与外源基因操作性连接的调控序列。

在某些实施方式中,可以在宿主细胞中分别或同时引入多核苷酸供体和低聚构建体。在 某些实施方式中,低聚构建体的摩尔数过量于多核苷酸供体的摩尔数。低聚构建体在宿主细 胞中可以通过碱基互补与多核苷酸供体的同源位点特异性杂交,还可以通过碱基互补与宿主 细胞的重复位点中的靶位点特异性杂交。例如,一部分的低聚构建体与重复位点的靶位点特 异性杂交,将重复位点的DNA双链打开,另一部分的低聚构建体与多核苷酸供体上的同源 位点特异性杂交,将多核苷酸供体的双链打开(例如,见图2)。通过低聚构建体的杂交,使 得多核苷酸供体同源位点间的外源序列能够与重复位点上的靶位点间的序列进行重组,从而 实现外源序列向重复位点的定点重组或整合。

在某些实施方式中,所述外源序列被重组到所述宿主细胞的所述重复位点或其片段中。 在某些实施方式中,所述外源序列在所述重复位点或其片段中具有功能。在某些实施方式中, 所述外源序列是基因,并且在所述宿主细胞中能够检测到所述外源序列产生的基因产物。可 以通过本领域公知的方法检测重组后的宿主细胞产生的基因产物,例如,通过用RT-PCR的 方法检测外源序列,或者用检测蛋白的方法检测外源序列的蛋白产物的存在或者其活性。

在某些实施方式中,可以将低聚构建体与多核苷酸供体特异性杂交后,引入宿主细胞。 例如,可以将现成的低聚构建体与多核苷酸供体在适当的条件下杂交,然后将杂交产物引入 宿主细胞。再例如,可以将能够形成低聚构建体的一对低聚化合物与多核苷酸供体在适当的 条件下杂交,使得低聚化合物不仅能够形成低聚构建体,而且还能够与多核苷酸供体特异性 杂交,然后将杂交产物引入宿主细胞。

在某些实施方式中,宿主细胞中进一步含有能够促进外源序列与重复位点重组的重组促 进剂。这样的重组促进剂可以是任何能够引发DNA损伤、和/或介导基因重组发生的物质, 例如但不限于,编码蛋白质的mRNA,由其翻译产生的重组蛋白质、天然分离的蛋白质和/ 或化合物。在某些实施方式中,重组促进剂可以是化合物,例如Ce IV-EDTA,Fe II-EDTA, Cu II-EDTA(例如,见Yuichiro Aiba et al.,Chem.Soc.Rev.,40,5657–5668(2011))。

在某些实施方式中,重组促进剂可以是重组酶、编码重组酶的表达载体、或重组酶的编 码序列。“重组酶”在本申请中是指,任何能够引发DNA损伤和/或促进DNA重组的蛋白。 在某些实施方式中,重组酶可以是任何DNA单链结合蛋白(SSB)。重组酶可以包括整合酶, 其可以来源于细菌、噬菌体、病毒或其它物种。重组酶(包括整合酶)的例子包括,但不限 于,Dmc1、Cre(Akagi K et al,Nucleic Acids Res.25(9):1766–73(1997)),Hin(Gene ID:3335204; Dhar G et al,Cell119(1):33–45(2004)),Rec A(Savir Y et al,Molecular Cell,40(3):388–96 (2010))、RAD51(Yuet al.,Mol.Cell(United States)12(4):1029–41(2003))、Tre(Sarkar,I.et al., Science.Bd.316,S.1912-1915(2007))、FLP(Zhu XDet al,Journal of Biological Chemistry270 (39):23044–54(1995))、革兰氏阳性β重组酶(见,例如,Canosa I.et al,Nucleic Acids Res.24(14): 2712–2717(1996))、HIV-1整合酶(例如,GenBank登陆号CAD92655.1)、φC31(gene ID: 2715866)、R4(gene ID:1099373)、链霉菌噬菌体TP901-1的整合酶(gene ID:921049and 921048)、乳酸菌属噬菌体SpoIVCA的整合酶(gene ID:937799)、ZFN(锌指核酸酶,见,例 如,Hurt et al,PNAS,100:12271-12276(2003))、TALENs(Transcription activator-like effector  nucleases,见,例如,Cermak et al,Nucleic Acids Research,2011,1-11),等。

在某些实施方式中,重组酶之间能够相互结合,例如形成二聚体。不受理论的限制,认 为当两个相同或不同的重组酶相互结合时,其中一个重组酶能够与靶位点处的单链DNA序 列作用,另一个重组酶能够与多核苷酸供体上的同源位点处的对应的单链DNA序列作用, 从而在空间上拉近待重组的两个位点,提高多核苷酸重组的效率。任何能够相互结合的重组 酶都能够使用,例如,RecA、RAD51、Dmc1、Hin、Sin、革兰氏阳性β重组酶、FLP、HIV-1 整合酶。

在某些实施方式中,可以将基本上纯化的重组酶导入宿主细胞中。在某些实施方式中, 重组酶是功能性的重组酶。“功能性的重组酶”在本申请中是指,重组酶能够在所述宿主细胞 中促使所述外源序列重组到所述宿主细胞的所述重复位点中。当导入宿主细胞后,能够促进 外源序列向重复位点的重组。另外,重组酶还可以进一步带有促进跨膜转运的基团。为将重 组酶直接导入宿主细胞中,可以在重组酶上连接促进跨膜转运的基团,例如穿膜肽(如,HSV  I的VP22蛋白、HIV-1的反激活蛋白TAT、Antennapedia多肽、或聚精氨酸)、细胞靶向肽等。 优选地,跨膜转运基团基本上不影响重组酶促进重组的效果。可以通过任何适合的方法将重 组酶导入宿主细胞中。例如,可以将重组酶与宿主细胞接触,并在适当的温度培养适当的时 间,使重组酶能够穿过细胞膜进入宿主细胞。

在某些实施方式中,可以将编码重组酶的表达载体导入宿主细胞中。所述载体可以是任 何核苷酸载体,例如质粒、线性DNA、人工染色体等。优选地,编码重组酶的表达载体含有 重组酶的表达框,其中不仅含有重组酶的编码序列,还含有操作性连接的表达调控序列,使 得该表达载体在宿主细胞中能够表达功能性的重组酶。可以通过任何适当的方式将编码重组 酶的表达载体导入宿主细胞中,例如,DEAE-葡聚糖法、电转化、显微注射法、脂质体转染、 磷酸钙转染、和阳离子聚合物转染等。

在某些实施方式中,可以将重组酶的编码序列导入宿主细胞中。重组酶的编码序列可以 是编码重组酶的mRNA。优选地,该mRNA被导入宿主细胞后,能够表达出功能性的重组酶。 例如,编码重组酶的mRNA含有5’帽结构(如,7-甲基鸟苷酸帽)和3’polyA尾。编码重组 酶的mRNA可以通过任何适当的方法获得。例如,可以通过体外转录的方法,将含有与启动 子操作性连接的重组酶编码DNA序列,用RNA聚合酶在核糖核酸单体存在下,在体外转录 出编码重组酶的RNA序列。转录得到的RNA可以储存在适当的条件下(如75%乙醇中)备 用。体外转录系统的试剂盒可以很容易地通过商业途径获得,例如TranscriptAidTM T7High  Yield Transcription Kit,Fermentas。

本申请提供的宿主细胞可以是任何含有本申请所述重复位点或重复序列单元或其片段 (例如,含有至少7个核苷酸的片段)的细胞。在某些实施方式中,所述宿主细胞是哺乳动 物细胞;优选地,所述哺乳动物细胞含有如SEQ ID NO:39、16、40、3、或41所示的序列, 或如SEQ ID NOs:42-46任一所示的序列或其片段(例如,含有至少7个核苷酸的片段)。在 某些实施方式中,所述宿主细胞是仓鼠细胞;更优选地,所述宿主细胞是中国仓鼠细胞;更 优选地,所述宿主细胞是中国仓鼠卵巢细胞(即:CHO细胞)。

宿主细胞可以是原代细胞,也可以是传代细胞(如,细胞系)。优选地,宿主细胞是传 代细胞。传代细胞可以是衍生自原代细胞并且可以传代的任何细胞,例如,可以是衍生自仓 鼠原代细胞的任何传代细胞。在某些实施方式中,所述传代细胞可以具有一种或多种遗传修 饰。例如,Gandor等(Biotechnol Bioeng1999;65:523-528)将玻表粘连蛋白(Vitronectin) 基因导入仓鼠传代细胞(如CHO细胞)中,促进其贴壁性,使表达产物和细胞更加容易分离 纯化。再例如,仓鼠传代细胞(如CHO细胞)可以被遗传修饰,使得其中的Bcl-2基因超表 达,从而具有增强的抗细胞凋亡的活性(Kim N S et al.,2001;Biotechnol Bioeng71:184-193)。 再例如,仓鼠传代细胞(如CHO细胞)还可以被遗传修饰,使其缺乏某种酶,例如,半乳糖 基转移酶I缺陷型(ATCC NO.CRL-2241),木糖基转移酶I缺陷型(ATCC NO.CRL-2242), N-硫酸转移酶缺陷型(ATCC NO.CRL-2246)等类型的CHO细胞。再例如,仓鼠传代细胞 (如CHO细胞)可以被遗传修饰,使其瞬时表达或稳定表达一种或多种外源基因。

任何适用于本发明的仓鼠细胞都可以使用,例如但不限于,CHO-K1细胞(ATCC NO.: CCL-61),Lec1细胞(ATCC NO.:CRL-1735),Lec2细胞(ATCC NO.:CRL-1736),Lec8 细胞(ATCC NO.:CRL-1737),Pro-5细胞(ATCC NO.:CRL-1781),CHO-1C6细胞(ATCC NO.: CRL-1793),AA8细胞(ATCC NO.:CRL-1859),UV41细胞(ATCC NO.:CRL-1860),EM9 细胞(ATCC NO.:CRL-1861),UV20细胞(ATCC NO.:CRL-1862),UV5细胞(ATCC NO.: CRL-1865),UV24细胞(ATCC NO.:CRL-1866),UV135细胞(ATCC NO.:CRL-1867), M3WT4细胞(ATCC NO.:CRL-1981),M3WT5细胞(ATCC NO.:CRL-1982),M3WT8细 胞(ATCC NO.:CRL-1983),M1WT2细胞(ATCC NO.:CRL-1984),M1WT3细胞(ATCC NO.: CRL-1985),M1WT5细胞(ATCC NO.:CRL-1986),CHO-CD36细胞(ATCC NO.:CRL-2092), CHO-ICAM-1细胞(ATCC NO.:CRL-2093),pgsB-618细胞(ATCC NO.:CRL-2241),pgsA-745 细胞(ATCC NO.:CRL-2242),pgsB-650细胞(ATCC NO.:CRL-2243),pgsD-677细胞(ATCC  NO.:CRL-2244),pgsC-605细胞(ATCC NO.:CRL-2245),pgsE-606细胞(ATCC NO.: CRL-2246),xrs5细胞(ATCC NO.:CRL-2348),HuZP3-CHOLec3.2.8.1细胞(ATCC NO.: CRL-2866),DUKX B1细胞(ATCC NO.:CRL-9010),CHO/dhFr-细胞(ATCC NO.:CRL-9096), CHO1-15细胞(ATCC NO.:CRL-9606),CHO-K1细胞(ATCC NO.:CRL-9618),LA3-5细 胞(ATCC NO.:CRL-10101),5/9m alpha3-18细胞(ATCC NO.:CRL-10154),B13-24细胞 (ATCC NO.:CRL-11397),6E6细胞(ATCC NO.:CRL-11398),CHO DP-12clone#1933细胞 (ATCC NO.:CRL-12444),CHO DP-12clone#1934细胞(ATCC NO.:CRL-12445), B14FAF28-G3细胞(ATCC NO.:CCL-14),Don细胞(ATCC NO.:CCL-16),Dede细胞(ATCC  NO.:CCL-39),V79-4细胞(ATCC NO.:CCL-93),NCTC4206细胞(ATCC NO.:CCL-14.2), R1610细胞(ATCC NO.:CRL-1657),CHL/IU细胞(ATCC NO.:CRL-1935),MC2/3细胞(ATCC  NO.:CRL-2143),和XR-V15B细胞(ATCC NO.:CRL-2349)。

在另一方面,本申请提供了宿主细胞(例如但不限于,仓鼠细胞、中国仓鼠细胞、CHO 细胞等),其在染色体或基因组上含有第一重复位点或其片段(例如,含有至少7个核苷酸的 片段),其中在所述第一重复位点处整合了第一外源序列。在某些实施方式中,所述第一重复 位点存在于仓鼠细胞染色体或基因组中。在某些实施方式中,所述第一重复位点含有选自下 组的重复序列单元:SEQ ID NOs:42-46。在某些实施方式中,所述重复序列单元选自如SEQ  ID NO:43或45所示的序列。在某些实施方式中,所述重复位点选自SEQ ID NO:39、16、 40、3、和41所示的序列,或选自SEQ ID NO:3或SEQ ID NO:16所示的序列。

“整合”在本申请中是指,在宿主细胞的染色体或基因组的重复位点中引入了外源序列。 “整合”和“重组”在本申请中可以互换使用。引入的外源序列可以通过如PCR的方法检测 到。外源序列可以插入重复位点的两个核苷酸之间且不替换任何重复位点的序列,也可以替 换重复位点中的一个或多个核苷酸。

在某些实施方式中,第一外源序列含有一个或多个功能性基因。“功能性基因”在本申 请中是指,整合在宿主细胞中、并且能够产生基因产物的核苷酸序列。例如,功能性基因在 整合到宿主细胞的染色体或基因组后,能够与内源启动子操作性连接,并且能够被转录。或 者,第一外源序列可以进一步含有与一个或多个功能性基因操作性连接的一个或多个外源启 动子,当第一外源序列被整合到宿主细胞的染色体或基因组后,所述外源启动子能够促使所 述一个或多个功能性基因在宿主细胞中产生基因产物。当第一外源序列中含有多于一个功能 性基因时,所述功能性基因可以相同或不同。在第一外源序列中,每一个功能性基因可以有 一个或多个拷贝。如上文所述,这些基因的多个拷贝可以以多个开放阅读框存在,也可以在 一个开放阅读框中通过IRES序列连接。

在某些实施方式中,所述宿主细胞在染色体或基因组上进一步含有第二重复位点,其中 所述第二重复位点处整合了第二外源序列。在某些实施方式中,所述第二重复位点存在于仓 鼠细胞染色体或基因组中。在某些实施方式中,所述第二重复位点含有选自下组的重复序列 单元:SEQ ID NOs:42-46。在某些实施方式中,所述重复序列单元选自如SEQ ID NO:43或 45所示的序列。在某些实施方式中,所述重复位点选自SEQ ID NO:39、16、40、3、和41 所示的序列,或选自SEQ ID NO:3或SEQ ID NO:16所示的序列。同样地,第二外源序列可 以含有一个或多个功能性基因。第二外源序列中的功能性基因可以与第一外源序列中的功能 性基因相同或不同。第二外源序列中也可以进一步含有与一个或多个功能性基因操作性连接 的一个或多个外源启动子,当第二外源序列被整合到宿主细胞的染色体或基因组后,所述外 源启动子能够促使所述一个或多个功能性基因在宿主细胞中产生基因产物。当第二外源序列 中含有多于一个功能性基因时,所述功能性基因可以相同或不同。在第二外源序列中,每一 个功能性基因可以有一个或多个拷贝。如上文所述,这些基因的多个拷贝可以以多个开放阅 读框存在,也可以在一个开放阅读框中通过IRES序列连接。在某些实施方式中,所述第一 和/或所述第二外源序列中至少有一个外源基因能够在所述宿主细胞中稳定表达。在某些实施 方式中,至少有一个外源基因能够稳定高表达,例如,表达的蛋白量至少为1pg/细胞/天、2pg/ 细胞/天、3pg/细胞/天、4pg/细胞/天、5pg/细胞/天、10pg/细胞/天、15pg/细胞/天、20pg/细胞/ 天、50pg/细胞/天、100pg/细胞/天或更高。

在某些实施方式中,在所述宿主细胞传代5代以后,所述第一和/或所述第二外源序列中 至少有一个外源基因的表达与未整合所述外源基因的对照细胞相比至少高10%。更优选地, 至少有一个外源基因在宿主细胞中的功能基本上不减弱。例如,当外源基因编码受体时,该 受体与配体结合的功能基本上不减弱;当外源基因编码治疗性蛋白时,该治疗性蛋白与治疗 靶点的结合和/或生物活性基本上不减弱。

在某些实施方式中,所述宿主细胞是稳定的细胞系。“稳定的细胞系”在本申请中是指, 能够在体外培养并连续传代至少5代的细胞,优选地,能够传代至少10代、15代、20代、 30代、40代、50代、60代。在某些实施方式中,稳定的细胞系能够被冻存和复苏。复苏后 的细胞在适当的培养条件下能够恢复到冻存前细胞的状态,例如但不限于,能够表达至少一 个整合的外源基因,和/或表达量与未整合所述外源基因的对照细胞相比至少高10%。

在某些实施方式中,所述稳定的细胞系可以作为高表达外源基因的细胞模型,用于各种 研究或生物活性分子的筛选用途。例如,高表达G蛋白偶联受体的稳定细胞系可以作为筛选 针对G蛋白偶联受体药物的细胞模型,高表达离子通道的稳定细胞系可以用于筛选药物对离 子通道的作用。

试剂盒

本申请的另一方面提供了试剂盒,其能够用于在重复位点定点重组外源序列。

在某些实施方式中,本申请提供的试剂盒含有本申请提供的多核苷酸供体,以及本申请 提供的两个低聚化合物,所述两个低聚化合物能够形成本申请提供的低聚构建体;且所述低 聚构建体能够与所述多核苷酸供体的第一同源位点和第二同源位点特异性杂交。

试剂盒中的两个低聚化合物的结合区域能够形成稳定的结合。例如,通过在PCR仪中进 行退火,使得两个结合区域能够通过碱基配对形成互补的双链。再例如,通过引入偶联剂, 促使两个低聚化合物的结合区域形成偶联。可以在临用前将两个低聚化合物混合,形成低聚 构建体。

形成的低聚构建体可以与重复位点中的第一靶位点和第二靶位点特异性杂交,还可以与 多核苷酸供体中的第一同源位点和第二同源位点特异性杂交。

在某些实施方式中,本申请提供的试剂盒含有本申请提供的多核苷酸供体,以及本申请 提供的低聚构建体,且所述低聚构建体可与所述供体的所述第一同源位点和所述第二同源位 点特异性杂交。

在某些实施方式中,本申请提供的试剂盒进一步含有能够促进外源序列与重复位点重组 的重组促进剂。在某些实施方式中,这样重组促进剂可以是重组酶、编码重组酶的表达载体、 或重组酶的编码序列。

定点重组的方法

在另一方面,本申请还提供了在宿主细胞(例如但不限于,仓鼠细胞、中国仓鼠细胞、 CHO细胞等)的染色体或基因组中引入外源序列的方法,所述宿主细胞的染色体或基因组中 含有重复位点或重复序列单元或其片段(例如,含有至少7个核苷酸的片段),所述方法包括: 向所述宿主细胞中引入本申请提供的低聚构建体,本申请提供的多核苷酸供体,其中所述低 聚构建体与所述供体的所述第一3’→5’同源位点和所述第二5’→3’同源位点特异性杂交, 以及培养所述仓鼠宿主细胞以允许所述外源序列重组到所述宿主细胞的所述重复位点或重复 序列单元中。在某些实施方式中,所述重复位点或重复序列单元存在于仓鼠细胞染色体或基 因组中。在某些实施方式中,所述重复位点含有选自下组的重复序列单元:SEQ ID NOs:42-46。 在某些实施方式中,所述重复序列单元选自如SEQ ID NO:43或45所示的序列。在某些实施 方式中,所述重复位点选自SEQ ID NO:39、16、40、3、和41所示的序列,或选自SEQ ID NO: 3或SEQ ID NO:16所示的序列。

在某些实施方式中,所述方法进一步包括,在宿主细胞中引入重组促进剂。所述重组促 进剂可以是重组酶蛋白、编码重组酶的表达载体,重组酶的编码序列(如mRNA序列)或化 合物。

在某些实施方式中,所述低聚构建体、多核苷酸供体、重组酶、编码重组酶的表达载体 或重组酶的编码序列等可以通过一种或多种选自下组的方法引入所述宿主细胞:DEAE-葡聚 糖法、电转化、显微注射法、脂质体转染、磷酸钙转染、和阳离子聚合物转染。

在某些实施方式中,本申请还提供了在宿主细胞中表达外源基因的方法,所述宿主细胞 的染色体或基因组中含有本申请所述的重复位点,所述方法包括:向所述宿主细胞中引入本 申请提供的低聚构建体,本申请提供的多核苷酸供体,其中所述低聚构建体与所述供体的所 述第一5’→3’同源位点和所述第二3’→5’同源位点特异性杂交,且与所述重复位点中的第 一3’→5’靶位点和第二5’→3’靶位点特异性杂交,其中所述多核苷酸供体含有外源基因,以 及培养所述宿主细胞以允许所述外源基因重组到所述宿主细胞的所述重复位点中。在某些实 施方式中,所述重复位点存在于宿主细胞染色体或基因组中。在某些实施方式中,所述重复 位点含有选自下组的重复序列单元:SEQ ID NOs:42-46。在某些实施方式中,所述重复序列 单元选自如SEQ ID NO:43或45所示的序列。在某些实施方式中,所述重复位点选自SEQ ID  NO:39、16、40、3、和41所示的序列,或选自SEQ ID NO:3或SEQ ID NO:16所示的序列。

在某些实施方式中,所述方法进一步包括,在宿主细胞中引入重组促进剂。所述重组促 进剂可以是重组酶、编码重组酶的表达载体,编码重组酶的编码序列(如mRNA序列)或化 合物。

本发明涉及以下95个技术方案:

1.分离的多核苷酸,其含有重复位点的至少7个连续核苷酸,其中所述重复位点存在于仓 鼠细胞的染色体或基因组中。

2.如方案1所述的分离的多核苷酸,其中所述重复位点选自SEQ ID NOs:3、16、39、40、和 41所示的序列。

3.如方案1所述的分离的多核苷酸,其中所述重复位点包含重复序列单元。

4.如方案3所述的分离的多核苷酸,其中所述仓鼠细胞的染色体或基因组含有所述重复序 列单元的至少两个拷贝。

5.如方案4所述的分离的多核苷酸,其中所述重复位点包含所述重复序列单元的至少一个拷 贝。

6.如方案3所述的分离的多核苷酸,其中所述重复序列单元选自SEQ ID NO:42-46所示的 序列。

7.如方案1-5所述的分离的多核苷酸,其中所述多核苷酸含有所述重复序列或重复序列单元 的至少8个、至少9个、至少10个、至少11个、至少12个、至少13个、至少14个、 至少15个、至少16个、至少17个、至少18个、至少19个、或至少20个连续核苷酸。

8.低聚化合物,含有可特异性杂交于靶位点的靶区域,所述靶位点含有重复位点的至少7 个连续核苷酸,其中所述重复位点存在于仓鼠细胞的染色体或基因组中。

9.如方案7所述的低聚化合物,其中所述靶区域含有低聚的核苷酸。

10.如方案8所述的低聚化合物,其中所述靶区域含有至少一个修饰的核苷酸。

11.如方案9所述的低聚化合物,其中至少一个所述修饰的核苷酸是锁核酸。

12.如方案8-11任一所述的低聚化合物,其中所述靶区域是5’→3’走向的,且所述靶位点是 3’→5’走向的。

13.如方案12所述的低聚化合物,其中所述靶位点含有所述重复位点的3’→5’链的至少7个 连续核苷酸,所述重复位点选自SEQ ID NO:3、16、39、40、和41。

14.如方案13所述的低聚化合物,其中所述靶位点包含重复位点的重复序列单元的3’→5’链 的至少7个连续核苷酸。

15.如方案14所述的低聚化合物,其中所述重复序列单元选自SEQ ID NO:42-46所示的序列。

16.如方案15所述的低聚化合物,其中所述重复序列单元为SEQ ID NO:43或45。

17.如方案16所述的低聚化合物,其中所述3’→5’走向的靶位点包含SEQ ID NOs:6或19。

18.如方案13-17任一所述的低聚化合物,其中所述靶位点含有所述重复序列单元的3’→5’ 链的至少8个、至少9个、至少10个、至少11个、至少12个、至少13个、至少14个、 至少15个、至少16个、至少17个、至少18个、至少19个、或至少20个连续核苷酸。

19.如方案8-11任一所述的低聚化合物,其中所述靶区域是3’→5’走向的,且所述靶位点是 5’→3’走向的。

20.如方案19所述的低聚化合物,其中所述靶位点含有所述重复位点的5’→3’链的至少7个 连续核苷酸,所述重复位点选自SEQ ID NO:3、16、39、40、和41。

21.如方案19所述的低聚化合物,所述靶位点包含所述重复位点的重复序列单元的5’→3’链 的至少7个连续核苷酸。

22.如方案21所述的低聚化合物,其中所述重复序列单元选自SEQ ID NO:42-46所示的序列。

23.如方案22所述的低聚化合物,其中所述重复序列单元为SEQ ID NO:43或45。

24.如方案23所述的低聚化合物,其中所述5’→3’走向的靶位点包含SEQ ID NOs:7或20。

25.如方案19-24所述的低聚化合物,其中所述靶位点含有所述重复序列单元的5’→3’链的至 少8个、至少9个、至少10个、至少11个、至少12个、至少13个、至少14个、至少 15个、至少16个、至少17个、至少18个、至少19个、或至少20个连续核苷酸。

26.如方案8-25所述的低聚化合物,其中所述靶区域与所述靶位点有至少50%到100%的互 补性。

27.如方案26所述的低聚化合物,其中所述低聚化合物的靶区域包含SEQ ID NOs:27、29、 33、35任一所示的碱基序列。

28.如方案27所述的低聚化合物,其中所述靶区域包含至少一个锁核酸,且所述锁核酸的核 糖是2’-O,4’-C-亚甲基-β-D-呋喃核糖。

29.如方案28所述的低聚化合物,其中所述靶区域包含SEQ ID NOs:28、30、34、36任一所 示的核酸分子。

30.如方案7-29任一所述的低聚化合物,进一步含有能够与第二低聚化合物结合的结合区域, 所述结合区域与靶区域连接。

31.如方案30所述的低聚化合物,其中所述结合是通过碱基配对、共价键、非共价键、共价 接头、或非共价接头。

32.如方案30所述的低聚化合物,其中所述结合区域连接在所述靶区域的5’上游,或连接在 所述靶区域的3’下游。

33.如方案32所述的低聚化合物,其中所述结合区域含有核苷酸。

34.如方案33所述的低聚化合物,其中所述结合区域含有至少一个修饰的核苷酸。

35.如方案34所述的低聚化合物,其中至少一个所述修饰的核苷酸是锁核酸。

36.如方案30-34所述的低聚化合物,其中所述低聚化合物包含如SEQ ID NOs:31、32、37、 38任一所示的碱基序列。

37.如方案36所述的低聚化合物,其中所述低聚化合物的所述靶区域和所述结合区域各包含 至少一个锁核酸,且所述锁核酸的核糖是2’-O,4’-C-亚甲基-β-D-呋喃核糖。

38.如方案37所述的低聚化合物,其中所述低聚化合物包含SEQ ID NOs:23-26任一所示的 核酸分子。

39.如方案30所述的低聚化合物,其中所述第二低聚化合物含有第二靶区域和第二结合区域。

40.如方案39所述的低聚化合物,其中所述第二靶区域与第二靶位点特异性杂交,所述第二 靶位点含有在仓鼠细胞染色体或基因组中存在的重复位点或重复序列单元的至少7个连 续核苷酸,其中所述第一靶位点和所述第二靶位点在所述重复位点或重复序列单元的相 反链上。

41.低聚构建体,含有:

第一低聚化合物,其含有与第一结合区域连接的第一5’→3’靶区域;

第二低聚化合物,其含有与第二结合区域连接的第二3’→5’靶区域;以及

在第一结合区域和第二结合区域之间的结合;

其中:

所述第一5’→3’靶区域与第一3’→5’靶位点可特异性杂交;所述第二3’→5’靶区 域与第二5’→3’靶位点可特异性杂交;且

所述第一3’→5’靶位点和所述第二5’→3’靶位点各含有重复位点或重复序列单元 的至少7个连续核苷酸,其中所述重复位点或重复序列单元存在于仓鼠细胞的染色 体或基因组中。

42.如方案41所述的低聚构建体,其中所述结合是碱基配对、共价键、非共价键、共价接头、 或非共价接头。

43.如方案41或42所述的低聚构建体,其中所述第一或所述第二结合区域分别连接在所述 第一或所述第二靶区域的5’上游。

44.如方案41或42任一所述的低聚构建体,其中所述第一或所述第二结合区域分别连接在 所述第一或所述第二靶区域的3’下游。

45.如方案41-44任一所述的低聚构建体,其中所述第一5’→3’靶区域与所述第一3’→5’靶 位点有50%到100%互补性,和/或所述第二3’→5’靶区域与所述第二5’→3’靶位点有 50%到100%互补性。

46.如方案41-45任一所述的低聚构建体,其中所述第一3’→5’靶位点含有所述重复序列单 元或重复位点的3’→5’链的至少7个连续核苷酸,所述重复序列单元选自SEQ ID NO: 42-46所示的序列,所述重复位点选自SEQ ID NO:3、16、39、40、41所示的序列。

47.如方案46所述的低聚构建体,其中所述第二5’→3’靶位点含有所述重复序列单元的5’ →3’链的至少7个连续核苷酸。

48.如方案46-47任一所述的低聚构建体,其中所述重复序列单元为SEQ ID NO:43或45, 所述重复位点为SEQ ID NO:3或16。

49.如方案41-48所述的低聚构建体,其中所述第一低聚化合物和/或第二低聚化合物包含如 SEQ ID NOs:31、32、37、38任一所示的碱基序列。

50.如方案49所述的低聚构建体,其中所述低聚化合物的所述靶区域和所述结合区域各包含 至少一个锁核酸,且所述锁核酸的核糖是2’-O,4’-C-亚甲基-β-D-呋喃核糖。

51.如方案50所述的低聚构建体,其中所述第一低聚化合物和/或所述第二低聚化合物包含 SEQ ID NOs:23-26任一所示的核酸分子。

52.如方案44所述的低聚构建体,其中所述第二5’→3’靶位点位于所述第一3’→5’靶位点在 所述重复位点或重复序列单元上的互补序列的5’上游或3’下游。

53.多核苷酸供体,含有第一5’→3’同源位点,所述同源位点含有重复位点或重复序列单元 的5’→3’链的至少7个连续核苷酸的同源序列,其中所述重复位点或重复序列单元存在 于仓鼠细胞的染色体或基因组中。

54.多核苷酸供体,含有第一3’→5’同源位点,所述同源位点含有重复位点或重复序列单元 的3’→5’链的至少7个连续核苷酸的同源序列,其中所述重复位点或重复序列单元存在 于仓鼠细胞的染色体或基因组中。

55.如方案54所述的供体,其中所述供体进一步含有第二5’→3’同源位点,其含有所述重复 位点或重复序列单元的5’→3’链的至少7个连续核苷酸的同源序列。

56.如方案53-55任一所述的供体,其中所述重复序列单元选自SEQ ID NO:42-46所示的序 列,所述重复位点选自SEQ ID NO:3、16、39、40、41所示的序列。

57.如方案56所述的供体,其中所述重复序列单元为SEQ ID NO:43或45,所述重复位点为 SEQ ID NO:3或16。

58.如方案57所述的供体,其中所述3’→5’同源位点包含SEQ ID NO:6或19。

59.如方案57所述的供体,其中所述5’→3’同源位点包含SEQ ID NO:7或20。

60.如方案55-59任一所述的供体,其中所述第一3’→5’同源位点位于所述第二5’→3’同源 位点在所述供体上的互补序列的5’上游或3’下游。

61.如方案60所述的供体,进一步含有外源序列,所述外源序列两端侧接有所述第一3’→5’ 同源位点和所述第二5’→3’同源位点。

62.如方案61所述的供体,其中所述外源序列含有外源基因、外源调控序列、和外源限制性 克隆位点中的一个或多个。

63.如方案62所述的供体,其中所述外源序列进一步含有选择性标记。

64.试剂盒,含有:

如方案30所述的两个低聚化合物,其能够形成如方案41所述的低聚构建体;以及 如方案55所述的多核苷酸供体,

其中所述低聚构建体可与所述供体的所述第一同源位点和所述第二同源位点特异性杂 交。

65.试剂盒,含有:

如方案41所述的低聚构建体;以及

如方案55所述的多核苷酸供体,

其中所述低聚构建体可与所述供体的所述第一同源位点和所述第二同源位点特异性杂 交。

66.在染色体或基因组上含有重复位点或重复序列单元的宿主细胞,进一步含有如方案41所 述的低聚构建体。

67.如方案66所述的宿主细胞,其中所述重复序列单元选自如SEQ ID NO:42-46所示的序列。

68.如方案67所述的宿主细胞,其中所述重复序列单元为SEQ ID NO:43或45。

69.如方案66所述的宿主细胞,其中所述重复位点选自SEQ ID NO:3、16、39、40、41所 示的序列。

70.如方案69所述的宿主细胞,其中所述重复位点为SEQ ID NO:3、或SEQ ID NO:16。

71.如方案66-70任一所述的宿主细胞,进一步含有如方案55所述的多核苷酸供体。

72.如方案71所述的宿主细胞,其中所述供体进一步含有外源序列,所述外源序列的两端侧 接有所述第一3’→5’同源位点和所述第二5’→3’同源位点。

73.如方案72所述的宿主细胞,其中所述外源序列含有一个或多个基因。

74.如方案73所述的宿主细胞,其中所述外源序列含有同一个基因的一个或多个拷贝。

75.如方案72所述的宿主细胞,其中所述外源序列含有至少两个不同的基因。

76.如方案72-75任一所述的宿主细胞,进一步含有能够促进外源序列与所述重复序列单元或 重组位点重组的重组促进剂。

77.如方案76所述的宿主细胞,其中所述重组促进剂是重组酶、重组酶的编码序列或化合物。

78.如方案72-76任一所述的宿主细胞,其中所述外源序列被重组到所述宿主细胞的所述重复 序列单元或重复位点中。

79.如方案78所述的宿主细胞,其中所述外源序列在所述重复序列单元或重复位点中具有功 能。

80.如方案79所述的宿主细胞,其中所述外源序列是基因,并且在所述宿主细胞中能够检测 到所述外源序列产生的基因产物。

81.宿主细胞,在染色体或基因组上含有第一重复序列单元或第一重复位点,其中在所述第 一重复序列单元或第一重复位点处整合了第一外源序列。

82.如方案81所述的宿主细胞,其中所述第一外源序列含有一个或多个功能性基因。

83.如方案82所述的宿主细胞,在染色体上进一步含有第二重复序列单元或第二重复位点, 其中所述第二重复序列单元或第二重复位点处整合了第二外源序列。

84.如方案83所述的宿主细胞,其中所述第二外源序列含有一个或多个功能性基因。

85.如方案84所述的宿主细胞,其中所述第一外源序列中的功能性基因和所述第二外源序列 中的功能性基因相同或不同。

86.如方案82或84所述的宿主细胞,其中所述第一和/或所述第二外源序列中至少有一个外 源基因能够在所述宿主细胞中稳定表达。

87.如方案86所述的宿主细胞,其中所述第一和/或第二外源序列中至少有一个外源基因能够 稳定高表达。

88.如方案86所述的宿主细胞,其中在所述宿主细胞传代10代以后,所述第一和/或第二外 源序列中至少有一个外源基因的表达与未整合所述外源序列的对照细胞相比至少高 10%。

89.如方案86所述的宿主细胞,其中所述宿主细胞是稳定的细胞系。

90.在宿主细胞的基因组中引入外源序列的方法,所述宿主细胞的染色体或基因组中含有重 复序列单元或重复位点,所述方法包括:

向所述宿主细胞中引入如方案41所述的低聚构建体,如方案61所述的多核苷酸供体, 其中所述低聚构建体与所述供体的所述第一3’→5’同源位点和所述第二5’→3’ 同源位点特异性杂交,以及

培养所述宿主细胞以允许所述外源序列重组到所述宿主细胞的所述重复序列单元或所 述重复位点中。

91.如方案90所述的方法,进一步包括向所述宿主细胞中引入重组促进剂。

92.如方案90或91所述的方法,其中所述低聚构建体、多核苷酸供体、重组酶或重组酶的 编码序列通过一种或多种选自下组的方法引入宿主细胞:DEAE-葡聚糖法、电转化、显 微注射法、脂质体转染、磷酸钙转染、和阳离子聚合物转染。

93.如方案91所述的方法,其中所述重组促进剂是重组酶、重组酶的编码序列或化合物。

94.在宿主细胞中表达外源基因的方法,所述宿主细胞的染色体或基因组中含有重复序列单 元或重复位点,所述方法包括:

向所述宿主细胞中引入如方案41所述的低聚构建体,如方案61所述的多核苷酸供体, 其中所述低聚构建体与所述供体的所述第一5’→3’同源位点和所述第二3’→5’ 同源位点特异性杂交,

其中所述多核苷酸供体含有的所述外源序列是外源基因,以及

培养所述宿主细胞以允许所述外源基因重组到所述宿主细胞的所述重复序列单元或所 述重复位点中。

95.如方案94所述的方法,进一步包括向所述宿主细胞中引入重组促进剂。

实施例

实施例1:pCMV-RP载体的构建

以大肠杆菌的基因组DNA为模板,通过PCR获得RecA基因,使用Phusion DNA聚合 酶(NEB Biolabs)和引物P1和P2:

P1:GACCGGCGCGCCGGATCCATGGCTATCGACGAAAACAAACAG(SEQ ID NO:1);

P2:CACTGGACTAGTGGATCCTTAAAAATCTTCGTTAGTTTCTGCTACG(SEQ ID NO:2)。

将含有RecA基因的PCR产物克隆到除去EGFP-puromycin-ubiquitin编码序列的pROSE 质粒的BamH I酶切位点处,得到含有RecA基因的表达载体,并命名为pCMV-RP。将质粒 测序,验证了RecA基因的插入。扩增pCMV-RP,纯化备用。

实施例2:含有iTS4同源位点的重组载体的构建

在本实施例中,选择小鼠基因组iTS4位点序列,在NCBI网站中通过Blast,检索并下 载CHO基因组中的同源iTS4位点作为重复位点,构建与靶位点匹配的重组载体和低聚构建 体,用于在该重复位点处重组外源序列。

选择重复位点中的一段序列(共109bp,SEQ ID NO:3,序列如下所示)作为靶核苷酸 序列。设计引物P3和P4(序列如下所示),通过PCR合成靶核苷酸序列。

SEQ ID NO:3:

GGCAGGCAGATCTCTGTGAGTTCGAGGCCAGCCTG GTCTCCAGAGCGAGTGCCAGGATAGGCTCCAAAGCTACACAGAGAAACCCTGTC

P3:5’-CCCAGCACTCGGGAGGCAGA-3’(SEQ ID NO:4)

P4:5’-GACAGGGTTTCTCTGTGTAGCTTTG-3’(SEQ ID NO:5)

其中,在靶核苷酸序列的3’→5’链中的靶位点为3’CCGTCCGTCTAGAGACACTC-5’ (即:SEQ ID NO:6,其互补序列在在SEQ ID NO:3中以单下划线表示),在5’→3’链中的 靶位点为(即:SEQ ID NO:7,其序列在SEQ ID NO:3 中以双下划线表示)。将与靶核苷酸序列100%同源的序列作为同源序列(即,SEQ ID NO:3), 其中与靶位点100%同源的序列作为同源位点。

使用常规的酚-氯仿法(参见《分子克隆实验指南》北京:科学出版社,2002:463-476) 提取CHO-S细胞的基因组DNA,作为克隆靶位点的模板。在PCR体系中分别加入上述模板、 引物对P3和P4、dNTP混合物、Phusion酶(New England Biolabs)等,进行PCR反应,扩 增含有同源位点的同源序列。得到的PCR产物保存备用(图3)。

构建含有iTS4同源位点的重组载体。

以pCHO1.0载体(来源于Invitrogen FreedomTM CHO-S Kit,Cat.NO.A13696-01)为基 础,构建重组载体。将来源于pCHO1.0载体的NdeI位点的接头序列(在引物序列中以下划 线表示),分别加在引物P3和P4的序列5’端,合成得到新的引物P5和P6。引物的序列如下: P5引物序列(上游,SEQ ID NO:8):

5’-TGAGAGTGCACCATATGCCCAGCACTCGGGAGGCAGA-3’;

P6引物序列(下游,SEQ ID NO:9):

5’-ATTTCACACCGCATATGGACAGGGTTTCTCTGTGTAGCTTTG-3’。

将上述由P3和P4扩增得到的PCR产物以1:100倍稀释,稀释后的产物作为模板,用 P5和P6引物,和Phusion酶进行PCR扩增,回收得到带有接头序列的同源位点片段,作为 下一轮PCR反应的引物。

将质粒用NdeI酶切后,用InFusion试剂盒(Clontech)将其和PCR产物连接构建重组载 体。具体方法见InFusion试剂盒说明书。将得到的连接产物用电泳检测,回收大于模板pCHO 1.0的条带,作为重组载体pCHO1.0-iTS4保存备用。

实施例3:pCHO1.0-iTS4重组载体中插入外源抗体基因8C10

在本实施例中,以8C10基因作为外源基因。根据8C10抗体基因的重链和轻链,设计引 物P7,P8和9,P10

P7引物序列(上游,下划线部分为Kozak序列,小写部分为载体上序列):

5’-gagctcaagcttgatatcGCCACCATGGCTACAGGTAAGCGCC-3’(SEQ ID NO:10);

P8引物序列(下游,小写部分为载体上序列):

5’-ttaattaacgccgatatcTCATTTACCCGGAGACAGGGAG-3’(SEQ ID NO:11)。

P9引物序列(上游,下划线部分为Kozak序列,小写部分为载体上序列):

5’-ttccgggccgcctaggGCCACCATGGCTACAGGTAAGCGCC-3’(SEQ ID NO:12);

P10引物序列(下游,小写部分为载体上序列):

5’-agtatacagtcctaggCTAACACTCTCCCCTGTTGAAGC-3’(SEQ ID NO:13)。

以质粒p8C10/Light和p8C10/Heavy作为模板,分别用引物P7,P8和P9,P10并用Phusion 酶进行PCR扩增,得到8C10抗体基因的重链和轻链(图4和图5)。

用InFusion试剂盒(Clontech)将扩增得到的8C10抗体基因的重链和轻链插入到重组载 体pCHO1.0-iTS4中。将得到的连接产物用电泳检测,回收大于模板pCHO1.0-iTS4的条带, 作为重组载体pCHO1.0-iTS4-8C10保存备用。

实施例4:iTS4-L1和iTS4-L2低聚化合物的制备

参照实施例2中的靶位点序列,依次设计一对上下游引物,并将其中某些特定位置的核 苷酸用锁核酸代替,合成得到一对低聚化合物,分别是iTS4-L1和iTS4-L2。碱基序列如下所 示,其中锁核酸以大写字母表示,dNTPs以小写字母表示。其中每一个锁核酸的核糖都是2’-O, 4’-C-亚甲基-β-D-呋喃核糖。iTS4-L1序列中的下划线部分是与3’→5’链中的靶位点互补的靶 区域(其碱基序列为SEQ ID NO:27(ggcaggcagatctctgtgag,可含有或不含有核酸修饰),其 核酸分子序列为SEQ ID NO:28(ggCAgGCaGAtCTcTgtGAG,在大写字母表示的位点处含有 锁核酸修饰),iTS4-L2序列中的下划线部分是与5’→3’链中的靶位点互补的靶区域(其碱基 序列为SEQ ID NO:29(tctgcctcccgagtgctgg,可含有或不含有核酸修饰),其核酸分子序列为 SEQ ID NO:30(tCTgcCTcCcGAgTGcTGG,在大写字母表示的位点处含有锁核酸修饰)。 iTS4-L1和iTS4-L2中无下划线的部分是结合区域,可以通过碱基配对结合。

iTS4-L1:5’-gACaTgAggCAgGCaGAtCTcTgtGAG-3’(其碱基序列为SEQ ID NO:31 (gacatgaggcaggcagatctctgtgag,可含有或不含有核酸修饰),其核酸分子序列为SEQ ID NO:23 (gACaTgAggCAgGCaGAtCTcTgtGAG,在大写字母表示的位点处含有锁核酸修饰);

iTS4-L2:5’-tCaTgtCtCTgcCTcCcGAgTGcTGG-3’(其碱基序列为SEQ ID NO:32 (tcatgtctctgcctcccgagtgctgg,可含有或不含有核酸修饰),其核酸分子序列为SEQ ID NO:24 (tCaTgtCtCTgcCTcCcGAgTGcTGG,在大写字母表示的位点处含有锁核酸修饰)。

低聚化合物由上海博尚生物技术有限公司合成并提供。合成的低聚化合物用去离子水溶 解,贮存浓度为100uM。

实施例5:iTS4-L1和iTS4-L2低聚构建体的制备

将实施4中制备得到的低聚化合物iTS4-L1和iTS4-L2,各4.5ul,加入10×磷酸缓冲液 (PBS,150mM,pH7.4)1ul中,混匀、瞬时离心,加10ul矿物油热封防止加热时蒸发,在 95°C变性2分钟。自然降温至室温后,4°C保存备用。

实施例6:在CHO-S细胞中iTS4位点定点重组8C10抗体基因

准备细胞:

CHO-S细胞在培养基中培养,用1×D-PBS洗涤消化的细胞两次。以4×105细胞/孔的 密度,将细胞在6孔培养板(美国康宁,3506)中铺板。

制备重组构建体:

将实施例5中制备的低聚构建体2ul,实施例3中制备的pCHO1.0-iTS4-8C10质粒1ul (1ug/ul),和2.5×磷酸缓冲液2ul混匀,95°C变性2分钟,37°C放置过夜,并在4°C保存 备用。

转染细胞:

使用Invitrogen Transfection System,按照生产商的说明书,转染细胞。简单地说, 收获培养好的CHO-S细胞,并将其与实施例5中制备的低聚构建体4ul、上述重组构建体5ul、 和重组酶表达载体1ul(1ug/ul)在100ul R缓冲液中(Invitrogen Transfection10ul Kit) 混匀,将混合物加入到NeonTM Pipette tip中,再插入转染装置中,按照1350V/20mS 的条件下电击2次的实验方案进行转染,转染结束后将细胞转移到6孔板中,继续培养24h 后,在荧光显微镜下观察到荧光。

筛选重组的细胞:

将细胞培养液换成含plasmocin(25ug/ml)(Invivogen ant-mpp)的培养基,在培养液中 另加入8ug/ml的puromycin,100nM的MTX在三抗生素存在的条件下培养细胞,传代10代 时,待细胞于96孔板生长至对数期时通过Elisa法(《分子克隆实验指南》第三版,北京:科 学出版社)检测8C10基因的表达情况。Sheep anti-human fd antibody作为一抗(购自 BIODESIGN W90075C,用Fab anti-human Kappa-HRP作为二抗(购自Southern Biotech 2062)。结果如图6(a),未重组的CHO-S细胞不表达该抗体,重组后的CHO-S细胞能够大量 表达8C10抗体,对照图6(b)标准曲线图,对于OD450>1.0的细胞克隆样品,8C10抗体基 因的表达量>100ug/L/24h,表明8C10抗体基因被重组到重复位点后能够被高表达。

实施例7:含有iTS4同源位点的重组载体的构建

构建含有iTS4同源位点的重组载体。

以pAS_puro_Erb_LC载体(Shatzman AR&Rosenberg M.The pAS vector system and its  application to heterologous gene expression in Escherichia coli.Hepatology.1987Jan-Feb;7(1 Suppl):30S-35S.)为基础,构建重组载体。将来源于pAS_puro_Erb_LC载体序列的两段约20bp 的接头序列(在引物序列中以下划线表示),分别加在引物P3和P4的序列5’端,合成得到 新的引物P11和P12。引物的序列如下:

P11引物序列(上游,SEQ ID NO:14):

5’-GAAGCGCTTTGGCTTCCCTGAAGGCCAGCACTCGGGAGGCAGA-3’;

P12引物序列(下游,SEQ ID NO:15):

5’-AGCAGAGGAACTCACCTCTACGCTGGACAGGGTTTCTCTGTGTAGCTTTG-3’。

将上述由P3和P4扩增得到的PCR产物以1:100倍稀释,稀释后的产物作为模板,用 P11和P12引物,和Phusion酶进行PCR扩增,回收得到带有接头序列的同源位点片段,作 为下一轮PCR反应的引物。

以质粒pAS_puro_Erb_LC作为模板,带有接头序列的同源位点片段为引物(模板和引物 的摩尔比为1:250),用Phusion酶通过Touch up(or down)PCR法构建重组载体。按照Phusion 酶说明书,选择PCR反应体系和反应条件。将得到的PCR产物用电泳检测,回收大于模板 pAS_puro_Erb_LC的条带,作为重组载体pAS_puro_Erb_LC_iTS4保存备用。

实施例8:含有iTS2同源位点的重组载体的构建

在本实施例中,选择小鼠基因组iTS2位点序列,在NCBI网站中通过Blast,检索并下 载CHO基因组中的同源iTS2位点作为重复位点,构建与靶位点匹配的重组载体和低聚构建 体,用于在该重复位点处重组外源序列。

选择重复位点iTS2中的一段序列(SEQ ID NO:16,序列如下所示)作为靶核苷酸序列。 设计引物P13和P14(序列如下所示),通过PCR合成靶核苷酸序列。

SEQ ID NO:16:

GTGTGAACTTGTAAGACCACTTTGGAAATCAGTATGGCGGTTGCTCAGAAAAATGG GAATCAATCTACCTCAAGATCCAGCCATTCCTCTCTTGGGTATATACCCAAATACTGCTTG TCCATACAACAAGGACATATGTTCAACCATGTTCATAGCAGCATTGTTTGTAATAGCCAG AACCTGGAAACAACCTAGATGCCAGAGAAAATGTGGTACATTTATACAATGGAGTACTACTCAGCAG

P13:5’-GTGTGAACTTGTAAGACCACTTTG-3’(SEQ ID NO:17)

P14:5’-CTGCTGAGTAGTACTCCATTGTA-3’(SEQ ID NO:18)

其中,在靶核苷酸序列的3’→5’链中的靶位点为3’-TCTCTTTTACACCATGTAAA-5’ (即:SEQ ID NO:19,其互补序列在SEQ ID NO:16中以单下划线表示),在5’→3’链中的 靶位点为5’-CCTCAACTGAAGAATGGA-3’(即:SEQ ID NO:7,其序列在SEQ ID NO:16 中以双下划线表示)。将与靶核苷酸序列100%同源的序列作为同源序列(即,SEQ ID NO:20), 其中与靶位点100%同源的序列作为同源位点。

使用常规的酚-氯仿法(参见《分子克隆实验指南》北京:科学出版社,2002:463-476) 提取CHO-S细胞的基因组DNA,作为克隆靶位点的模板。在PCR体系中分别加入上述模板、 引物对P13和P14、dNTP混合物、Phusion酶(New England Biolabs)等,进行PCR反应, 扩增含有同源位点的同源序列。得到的PCR产物保存备用(图7)。

构建含有iTS2同源位点的重组载体。

以pAS_puro_Erb_HC载体(Shatzman AR&Rosenberg M.The pAS vector system and its  application to heterologous gene expression in Escherichia coli.Hepatology.1987Jan-Feb;7(1 Suppl):30S-35S.)为基础,构建重组载体。将来源于pAS_puro_Erb_HC载体序列的两段约20bp 的接头序列(在引物序列中以下划线表示),分别加在引物P13和P14的序列5’端,合成得 到新的引物P15和P16。引物的序列如下:

P15引物序列(上游,SEQ ID NO:21):

5’-GAAGCGCTTTGGCTTCCCTGAAGGGTGTGAACTTGTAAGACCACTTTG-3’;

P16引物序列(下游,SEQ ID NO:22):

5’-AGCAGAGGAACTCACCTCTACGCTGCTGCTGAGTAGTACTCCATTGTA-3’。

将上述由P13和P14扩增得到的PCR产物以1:100倍稀释,稀释后的产物作为模板,用 P15和P16引物,和Phusion酶进行PCR扩增,回收得到带有接头序列的同源位点片段,作 为下一轮PCR反应的引物。

以质粒pAS_puro_Erb_HC作为模板,带有接头序列的同源位点片段为引物(模板和引物 的摩尔比为1:250),用Phusion酶通过Touch up(or down)PCR法构建重组载体。按照Phusion 酶说明书,选择PCR反应体系和反应条件。将得到的PCR产物用电泳检测,回收大于模板 pAS_puro_Erb_HC的条带,作为重组载体pAS_puro_Erb_HC_iTS2保存备用。

实施例9:iTS2-L1和iTS2-L2低聚化合物的制备

参照实施例8中的靶位点序列,依次设计一对上下游引物,并将其中某些特定位置的核 苷酸用锁核酸代替,合成得到一对低聚化合物,分别是iTS2-L1和iTS2-L2。碱基序列如下所 示,其中锁核酸以大写字母表示,dNTPs以小写字母表示。其中每一个锁核酸的核糖都是2’-O, 4’-C-亚甲基-β-D-呋喃核糖。iTS2-L1序列中的下划线部分是与3’→5’链中的靶位点互补的靶 区域(其碱基序列为SEQ ID NO:33(agagaaaatgtggtacattt,可含有或不含有核酸修饰),其核 酸分子序列为SEQ ID NO:34(aGAgAAaATgTGgTAcATTt,在大写字母表示的位点处含有锁 核酸修饰),iTS2-L2序列中的下划线部分是与5’→3’链中的靶位点互补的靶区域(其碱基序 列为SEQ ID NO:35(tccattcttcagttgagg,可含有或不含有核酸修饰),其核酸分子序列为SEQ  ID NO:36(TCcATtCTtCAgTTgAGG,在大写字母表示的位点处含有锁核酸修饰)。iTS2-L1 和iTS2-L2中无下划线的部分是结合区域,可以通过碱基配对结合。

iTS2-L1:5’-gTTgGtGaGAgAAaATgTGgTAcATTt-3’(其碱基序列为SEQ ID NO:37 (gttggtgagagaaaatgtggtacattt,可含有或不含有核酸修饰),其核酸分子序列为SEQ ID NO:25 (gTTgGtGaGAgAAaATgTGgTAcATTt,在大写字母表示的位点处含有锁核酸修饰);

iTS2-L2:5’-cAcCaaCaTCcATtCTtCAgTTgAGG-3’(其碱基序列为SEQ ID NO:38 (caccaacatccattcttcagttgagg,可含有或不含有核酸修饰),其核酸分子序列为SEQ ID NO:26 (cAcCaaCaTCcATtCTtCAgTTgAGG,在大写字母表示的位点处含有锁核酸修饰).

低聚化合物由上海博尚生物技术有限公司合成并提供。合成的低聚化合物用去离子水溶 解,贮存浓度为100uM。

实施例10:iTS2-L1和iTS2-L2低聚构建体的制备

将实施9中制备得到的低聚化合物iTS2-L1和iTS2-L2,各4.5ul,加入10×磷酸缓冲液 (PBS,150mM,pH7.4)1ul中,混匀、瞬时离心,加10ul矿物油热封防止加热时蒸发,在 95°C变性2分钟。自然降温至室温后,4°C保存备用。

实施例11:同时在CHO-S细胞中iTS4和iTS2位点定点重组Erb抗体基因

准备细胞:

CHO-S细胞在培养基中培养,用1×D-PBS洗涤消化的细胞两次。以4×105细胞/孔的 密度,将细胞在6孔培养板(美国康宁,3506)中铺板。

制备重组构建体:

将实施例5和10中制备的低聚构建体各2ul,pAS_puro_Erb_LC_iTS4和 pAS_puro_Erb_HC_iTS2质粒各1ul(1ug/ul),和2.5×磷酸缓冲液2ul混匀,95°C变性2分 钟,37°C放置过夜,并在4°C保存备用。

转染细胞:

使用InvitrogenTransfection System,按照生产商的说明书,转染细胞。简单地说, 收获培养好的CHO-S细胞,并将其与实施例5和10中制备的低聚构建体各4ul、上述两种 重组构建体各5ul、和重组酶表达载体1ul(1ug/ul)在100ul R缓冲液中(InvitrogenTransfection10ulKit)混匀,将混合物加入到NeonTM Pipette tip中,再插入转染装置 中,按照1350V/20mS的条件下电击2次的实验方案进行转染,转染结束后将细胞转移到6 孔板中,继续培养24h后,在荧光显微镜下观察到荧光。

筛选重组的细胞:

将细胞培养液换成含plasmocin(25ug/ml)(Invivogen ant-mpp)的培养基,在培养液中 另加入8ug/ml的puromycin,在二抗生素存在的条件下培养细胞。细胞传代10代后,待细胞 于96孔板生长至对数期时,通过Elisa法(《分子克隆实验指南》第三版,北京:科学出版社) 检测ERB基因的表达情况。Sheep anti-human fd antibody作为一抗(购自BIODESIGN  W90075C),用Fab anti-human Kappa-HRP作为二抗(购自Southern Biotech2062)。结果 如图8(a)所示,未重组的CHO-S细胞不表达该抗体,重组后的CHO-S细胞能够大量表达Erb 抗体,对照图8(b)标准曲线图,对于OD450>0.5的细胞克隆样品,Erb抗体基因的表达量 >1000ug/L/24h,表明Erb抗体基因被重组到重复位点后能够被高表达。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号