首页> 中国专利> 用于基因表达的突变体反向四环素反式激活因子

用于基因表达的突变体反向四环素反式激活因子

摘要

本文提供了突变体反向四环素反式激活因子(rtTA)蛋白和编码突变体rtTA的工程化核酸(例如病毒载体,包括慢病毒载体、腺病毒载体、AAV载体、疱疹病毒载体和逆转录病毒载体;以及非病毒载体,包括RNA和质粒DNA),其可用于例如调节基因表达、诱导细胞重编程、组织修复、组织再生、器官再生、逆转衰老、治疗疾病(例如急性损伤、神经变性疾病、慢性疾病、增殖性疾病、心血管疾病、遗传病、炎性疾病、自身免疫性疾病、神经学疾病、血液学疾病、疼痛病况、精神障碍、代谢障碍、癌症、衰老、年龄相关的疾病以及影响受试者中任何组织的疾病),或它们的任何组合。本文还提供了包含工程化核酸的重组病毒(例如慢病毒、腺病毒、甲病毒、牛痘病毒、逆转录病毒、疱疹病毒或AAV),以及通过将工程化核酸或包含其的重组病毒施用到细胞、组织或受试者(例如患有病况的受试者的细胞或组织,所述病况包括任何疾病(例如眼病)、衰老、神经变性疾病、癌症和年龄相关的疾病)中来调节(例如抑制或诱导)细胞重编程、组织修复、组织再生或它们的任何组合的方法,所述施用包括施用突变体rtTA和编码转基因的诱导型核酸(例如工程化核酸,包括表达载体)。

著录项

  • 公开/公告号CN113164625A

    专利类型发明专利

  • 公开/公告日2021-07-23

    原文格式PDF

  • 申请/专利权人 哈佛大学的校长及成员们;

    申请/专利号CN201980076921.7

  • 发明设计人 D.A.辛克莱尔;Y.卢;N.J.戴维森;

    申请日2019-09-27

  • 分类号A61K48/00(20060101);C12N15/63(20060101);C12N15/90(20060101);

  • 代理机构11105 北京市柳沈律师事务所;

  • 代理人张文辉

  • 地址 美国马萨诸塞州

  • 入库时间 2023-06-19 11:57:35

说明书

相关申请

本专利申请依据35U.S.C.§119(e)要求于2018年9月28日提交的美国临时申请号62/738,894的权益,其以引用的方式全文并入本文。

背景技术

诱导型基因表达在基因疗法和其他生物医学应用方面有着巨大的前景。按需和严密调控的基因表达可以避免与表达时间延长相关的毒性或与外源基因的超生理表达相关的毒性。

例如,四环素开启(Tet-On)系统通常利用反向四环素反式激活因子(rtTA)来诱导基因表达。反向四环素反式激活因子(rtTA)包含突变体四环素阻遏物DNA结合蛋白(TetR)和反式激活结构域(例如Gossen等人,Science.1995年6月23日;268(5218):1766-9)。这些反式激活因子可在四环素(例如强力霉素)存在下被激活,并随后结合至含有四环素应答元件(TRE)的启动子,以诱导基因表达(Gossen等人,Science.1995年6月23日;268(5218):1766-9);Baron等人,Methods Enzymol.2000;327:401-21。TRE包含至少一个Tet操纵子(Tet-O)序列(例如Tet-O序列的多个重复序列),并且可位于最小启动子(例如,衍生自人巨细胞病毒(hCMV)即刻早期启动子的最小启动子序列)的上游。

然而,Tet-On系统即使在不存在四环素的情况下也启动基因表达(即“渗漏”)的趋势阻碍了它们的使用。因此,需要具有很少乃至没有渗漏以及高四环素敏感性的改进的Tet-On系统。

发明概述

本公开源于出乎意料的发现,即与rtTA3(SEQ ID NO:11)中的位置G72、G12、F67和R171相对应的残基中的四个突变显著地提高了体内Tet-On系统的敏感性并且降低了Tet-On系统的渗漏。在一些实施方案中,本文提供了突变体rtTA(例如rtTA4)、编码其的工程化核酸(例如表达载体,包括病毒和非病毒载体)、包含工程化核酸(例如表达载体)的重组病毒(例如慢病毒、腺病毒、甲病毒、牛痘病毒、逆转录病毒、疱疹病毒或AAV)、药物组合物及其试剂盒。在一些实施方案中,编码突变体rtTA4的工程化核酸还编码与四环素应答元件(TRE)启动子可操作地连接的转基因(例如,蛋白质编码序列、基因靶向核酸和/或治疗性序列)。在一些实施方案中,药物组合物和试剂盒还包含含有与转基因可操作地连接的四环素应答元件(TRE)启动子的第二载体(例如多个第二载体)或第二重组病毒(例如多个第二重组病毒)(例如慢病毒、腺病毒、甲病毒、牛痘病毒、逆转录病毒、疱疹病毒或AAV)。在一些实施方案中,药物组合物和试剂盒还包含含有与转基因可操作地连接的四环素应答元件(TRE)启动子的多个载体或多个重组病毒(例如慢病毒、牛痘病毒、甲病毒、腺病毒、逆转录病毒、疱疹病毒、或腺相关病毒(AAV))。本文还提供了促进基因表达的方法,该方法包括向细胞、组织或有此需要的受试者施用(1)编码突变体rtTA(例如rtTA4)的本文所述的任何工程化核酸(例如表达载体),以及(2)四环素。在某些实施方案中,该方法还包括施用(3)包含与转基因可操作地连接的TRE启动子的第二核酸(例如工程化核酸,包括表达载体)。在某些实施方案中,施用多个第二工程化核酸(例如表达载体)。

本文所述的突变体rtTA(例如rtTA4)、工程化核酸(例如表达载体)、重组病毒、药物组合物、试剂盒和方法可用于在体内调节基因表达。不受特殊的理论限制,与rtTA3 Tet-On系统相比,渗漏的降低改善了rtTA4 Tet-On系统的毒性特征,并允许转基因的瞬时表达。

本公开的方面提供了突变体rtTA(例如rtTA4)。本公开的突变体rtTA包含与rtTA3(SEQ ID NO:11)的位置G72、G12、F67和R171相对应的四个突变,并且包含这些位置处的四个突变的此类突变体rtTA被称为rtTA4。

在某些实施方案中,突变体rtTA还包含与rtTA3(SEQ ID NO:11)中的位置相对应的残基的至少一个(例如至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、35、40、45、50、55、60、65、70、80、90、100、110、120、130、140、150、160、170、180、190、200、210、220、230或240个)突变,所述突变不是G72、G12、F67或R171。

在某些实施方案中,与rtTA3(SEQ ID NO:11)中的位置相对应的残基的突变(即不是位置G72、G12、F67或R171)为点突变、截短突变、缺失或插入。

在某些实施方案中,G72突变为G72V、G72I、G72L或G72P;G12突变为G12S或G12T;F67突变为F67S或F67T;并且R171突变为R171K或R171H。

在某些实施方案中,四个突变为G72V或G72P、G12S、F67S和R171K。编码突变体rtTA(例如rtTA4)的氨基酸序列可包含与SEQ ID NO:13至少70%(例如至少75%、80%、85%、90%、95%、98%、99%或100%)相同的序列,并且包含与rtTA3(SEQ ID NO:11)中的以下位置相对应的残基处的突变:G72、G12、F67和R171。编码突变体rtTA(例如rtTA4)的核酸可为密码子优化的,并且可包含与SEQ ID NO:12至少70%(例如至少75%、80%、85%、90%、95%、98%、99%或100%)相同的序列。

在本公开的另一方面,核酸(例如工程化核酸,包括表达载体)(例如病毒表达载体,包括慢病毒、逆转录病毒、腺病毒、疱疹病毒、或腺相关病毒(AAV))包含与启动子(例如组成型启动子或组织特异性启动子)可操作地连接的编码突变体rtTA(例如rtTA4)的核酸序列。在某些实施方案中,编码突变体rtTA(例如rtTA4)的核酸(例如工程化核酸,包括表达载体)包含与SEQ ID NO:17至少70%(例如至少75%、80%、85%、90%、95%、98%、99%或100%)相同的序列。在某些实施方案中,编码突变体rtTA(例如rtTA4)的核酸(例如工程化核酸,包括表达载体)由SEQ ID NO:17组成。在某些实施方案中,编码突变体rtTA(例如rtTA4)的核酸(例如工程化核酸,包括表达载体)包含与结蛋白-rtTA4载体(SEQ ID NO:30)至少70%(例如至少75%、80%、85%、90%、95%、98%、99%或100%)相同的序列。在某些实施方案中,编码突变体rtTA(例如rtTA4)的核酸(例如工程化核酸,包括表达载体)由SEQID NO:30组成。

与编码突变体rtTA(例如rtTA4)的核酸可操作地连接的启动子可为组成型启动子(例如CP1、CMV、EF1a、SV40、PGK1、Ubc、人β肌动蛋白、CAG、Ac5、多角体蛋白(polyhedrin)、TEF1、GDS、CaM3 5S、Ubi、H1、或U6启动子)。为了允许rtTA的组织特异性表达,启动子可为组织特异性的(例如眼特异性启动子、骨特异性启动子、肺特异性启动子、乳腺特异性启动子、胰腺特异性启动子、肌肉特异性启动子、肝特异性启动子、皮肤特异性启动子、心脏特异性启动子、脑特异性启动子、神经组织特异性启动子、肾特异性启动子、睾丸特异性启动子、卵巢特异性启动子或肠特异性启动子)。

在某些实施方案中,编码突变体rtTA(例如rtTA4)的核酸(例如工程化核酸,包括表达载体)还编码四环素阻遏物(例如tetR、tetRKRAB、TRSID),其可在不存在四环素时阻止rtTA与TRE启动子结合。在某些实施方案中,编码突变体rtTA(例如rtTA4)的核酸序列和编码四环素阻遏物(例如tetRKRAB)的核酸序列与同一启动子可操作地连接。在某些实施方案中,间隔序列(例如内部核糖体进入位点(IRES)或2A肽)存在于核酸(例如工程化核酸,包括表达载体)中,并且分隔开至少两个核酸序列,这可有助于由一个表达载体产生两个单独的氨基酸序列。

在某些实施方案中,编码突变体rtTA(例如rtTA4)的核酸(例如工程化核酸,包括表达载体)还包含土拨鼠肝炎病毒(WHP)转录后调节元件(WPRE),其可用于增强转基因表达(例如,来自病毒载体)。在某些实施方案中,WPRE序列与SEQ ID NO:21至少70%(例如至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或至少100%)相同。

在某些实施方案中,编码突变体rtTA(例如rtTA4)的核酸(例如工程化核酸,包括表达载体)是病毒载体(例如慢病毒载体、腺病毒载体、牛痘病毒、甲病毒、腺相关病毒载体、腺相关病毒(AAV)载体、或逆转录病毒载体)。在某些实施方案中,AAV载体是AAV1、AAV2、AAV3、AAV4、AAV5、AAV6、AAV7、AAV8、AAV9或AAV10载体。病毒载体(例如AAV载体)还可包含末端反向重复序列(ITR)。在某些实施方案中,ITR包含与SEQ ID NO:22至少70%相同(例如至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或至少100%相同)的序列。

本公开的另一方面提供了携带任何编码突变体rtTA(例如rtTA4)的工程化核酸(例如表达载体)的重组病毒。

在本公开的另一方面,提供了包含任何突变体rtTA(例如rtTA4)和药学上可接受的赋形剂的药物组合物。药物组合物还可包含编码转基因的第二核酸(例如工程化核酸,包括表达载体)。第二核酸(例如工程化核酸,包括表达载体)包含与转基因可操作地连接的四环素应答元件(TRE)启动子(例如与SEQ ID NO:7至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或至少100%相同的TRE3G序列)。在一些实施方案中,TRE启动子是TRE2或Ptight启动子。在一些实施方案中,TRE启动子是TRE2启动子,并且包含与SEQ ID NO:23至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或至少100%相同的序列。在一些实施方案中,TRE启动子是Ptight启动子,并且包含与SEQ ID NO:24至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或至少100%相同的序列。

在某些实施方案中,转基因是任何蛋白质编码基因。在某些实施方案中,转基因是基因靶向核酸。在某些实施方案中,转基因是治疗性序列。在某些实施方案中,治疗性序列可用于治疗急性损伤、神经变性疾病、慢性疾病、增殖性疾病、心血管疾病、遗传病、炎性疾病、自身免疫性疾病、神经学疾病、血液学疾病、疼痛病况、精神障碍、代谢障碍、癌症、衰老、年龄相关的疾病以及影响受试者中任何组织的疾病。

在某些实施方案中,诱导型核酸(例如工程化核酸,包括表达载体)(例如病毒载体)编码OCT4、SOX2和KLF4。参见例如,U.S.S.N.62/738,922,2018年9月28日提交的标题为CELLULAR REPROGRAMMING TO REVERSE AGING AND PROMOTE ORGAN AND TISSUEREGENERATION的美国临时申请,代理案卷号为H0824.70296US00;U.S.S.N.62/792,283,标题为CELLULAR REPROGRAMMING TO REVERSE AGING AND PROMOTE ORGAN AND TISSUEREGENERATION,2019年1月14日提交;U.S.S.N.62/865,877,标题为CELLULARREPROGRAMMING TO REVERSE AGING AND PROMOTE ORGAN AND TISSUE REGENERATION,2019年6月24日提交;以及U.S.S.N.62/880,488,标题为CELLULAR REPROGRAMMING TO REVERSEAGING AND PROMOTE ORGAN AND TISSUE REGENERATION,2019年7月30日提交;以及标题为CELLULAR REPROGRAMMING TO REVERSE AGING AND PROMOTE ORGAN AND TISSUEREGENERATION的PCT申请,代理案卷号为H0824.70296WO00,与本申请在同日提交,这些专利各自以引用的方式全文并入本文。

在某些实施方案中,编码突变体rtTA(例如rtTA4)的核酸(例如工程化核酸,包括表达载体)以及编码与TRE启动子可操作地连接的转基因的核酸(例如工程化核酸,包括表达载体)均为病毒载体,并且处于病毒(例如慢病毒、腺病毒、甲病毒、牛痘病毒、逆转录病毒、疱疹病毒或AAV)中。在某些实施方案中,药物组合物包含两种病毒载体和/或两种病毒。

在本公开的另一方面,提供了细胞和/或系统,该细胞和/或系统包含任何突变体rtTA(例如rtTA4)、编码突变体rtTA和/或与TRE启动子可操作地连接的转基因的任何工程化核酸(例如表达载体)、和/或任何病毒(例如慢病毒、腺病毒、甲病毒、牛痘病毒、逆转录病毒、疱疹病毒或AAV)。

在本公开的另一方面,提供了试剂盒,该试剂盒包含本文所述的任何突变体rtTA(例如rtTA4)、编码突变体rtTA的任何工程化核酸(例如表达载体)、任何病毒(例如慢病毒、腺病毒、甲病毒、牛痘病毒、逆转录病毒、疱疹病毒或AAV)、细胞、系统、和/或任何药物组合物。

本公开的另一方面提供了用于促进基因表达的方法,该方法包括向细胞、组织或有此需要的受试者施用(1)任何突变体rtTA(例如rtTA4)、编码突变体rtTA(例如rtTA4)的任何工程化核酸(例如表达载体)、或包含编码突变体rtTA的任何工程化核酸(例如表达载体)的重组病毒;(2)编码与TRE启动子可操作地连接的转基因的任何工程化核酸(例如表达载体);以及(3)四环素(例如强力霉素)。在某些实施方案中,本文所述的编码突变体rtTA的工程化核酸(例如表达载体)或包含任何突变体rtTA表达载体的重组病毒还编码四环素阻遏物(例如tetRKRAB)。在某些实施方案中,本公开的编码突变体rtTA的核酸(例如工程化核酸,包括表达载体)或重组病毒还包含与TRE启动子(例如TRE3G、TRE2或P tight启动子)可操作地连接的转基因。该方法还可包含撤除(即停止施用)四环素。

在某些实施方案中,受试者是哺乳动物(例如人或非人)。在某些实施方案中,受试者患有疾病(例如急性损伤、神经变性疾病、慢性疾病、增殖性疾病、心血管疾病、遗传病、炎性疾病、自身免疫性疾病、神经学疾病、血液学疾病、疼痛病况、精神障碍、代谢障碍、癌症、衰老、年龄相关的疾病以及影响受试者中任何组织的任何疾病)。在某些实施方案中,该方法包括调节细胞重编程、组织修复、治疗疾病(例如急性损伤、神经变性疾病、慢性疾病、增殖性疾病、心血管疾病、遗传病、炎性疾病、自身免疫性疾病、神经学疾病、血液学疾病、疼痛病况、精神障碍、代谢障碍、癌症、衰老、年龄相关的疾病以及影响受试者中任何组织的任何疾病)、组织再生、器官再生、逆转衰老,或它们的任何组合。

本文提出了本发明的一个或多个实施方案的细节。根据具体实施方式、实施例、附图和权利要求,本发明的其他特征、目的和优点将显而易见。

本申请中引用的参考文献以引用方式并入本文。

定义

“AAV”或“腺相关病毒”是非包膜病毒,其能够携带和递送核酸(例如编码转基因、突变体rtTA4的核酸或它们的任何组合),并且属于依赖细小病毒属(Dependoparvovirus)。通常,AAV不整合进基因组中。AAV的组织特异性靶向能力通常由AAV衣壳血清型决定(对于AAV血清型的实例及其在组织特异性递送中的效用,参见例如下表1)。AAV的非限制性血清型包括AAV1、AAV2、AAV3、AAV4、AAV5、AAV6、AAV7、AAV8、AAV9、AAV10、AAV11,以及它们的变体。在某些实施方案中,AAV血清型是AAV9的变体(例如AAV PHP.b)。

“重组病毒”是已从其自然环境(例如从宿主细胞、组织或受试者)分离出或人工产生的病毒(例如慢病毒、腺病毒、甲病毒、牛痘病毒、逆转录病毒、疱疹病毒、或腺相关病毒(AAV))。

如本文所用,术语“AAV载体”是包含侧接于表达盒(例如,包含单独或组合地编码转基因的核酸的表达盒,或编码rtTA或tTA的表达盒)的AAV反向末端重复序列(ITR)的核酸。AAV载体还可包含启动子序列。

如本文所用,术语“施用”、“给药”或“给予”是指引入核酸(例如编码转基因和/或编码突变体rtTA的工程化核酸)、重组细胞、重组病毒(例如慢病毒、腺病毒、甲病毒、牛痘病毒、逆转录病毒、疱疹病毒或AAV)、突变体rtTA(例如rtTA4)、或它们的任何组合或它们的药物组合物。工程化核酸、重组细胞、突变体rtTA4、病毒(例如慢病毒、腺病毒、甲病毒、牛痘病毒、逆转录病毒、疱疹病毒或AAV)、或它们的药物组合物能够以以下方式施用:静脉内、皮内、动脉内、病灶内、瘤内、颅内、关节内、前列腺内、胸膜内、鼻内、玻璃体内、阴道内、直肠内、局部、瘤内、肌内、腹膜内、皮下、结膜下、膀胱内、粘膜、心包内、脐内、眼内、经口、外用、局部、全身地、注射、输注、连续输注、直接局部灌注浸浴靶细胞、经由导管、以乳膏、以脂质组合物(例如脂质体)或通过本领域的普通技术人员已知的其他方法或前述的任何组合(参见例如Remington’s Pharmaceutical Sciences(1990),其以引用方式并入本文)。可将本公开的核酸(例如工程化核酸,包括表达载体)、重组细胞、突变体rtTA蛋白或重组病毒(例如慢病毒、腺病毒、甲病毒、牛痘病毒、逆转录病毒、疱疹病毒或AAV)施用至任何组织、细胞、器官或受试者。

术语“表观基因组”或“表观遗传学”是指控制细胞中核酸(例如工程化核酸)或基因组信息表达的细胞内的修饰和结构变化。表观基因组的改变发生在胚胎发育、疾病进展和衰老的过程期间,并且驱动这些过程。

术语“细胞衰老”是指已经退出细胞周期,显示出与衰老一致的表观遗传学标记,或表达衰老细胞标记(例如衰老相关的β-半乳糖苷酶或炎性细胞因子)的细胞。细胞衰老可为部分的或完全的。

术语“基因表达”是指细胞或组织中的特定基因或所有基因转录为RNA的程度。在一些情况下,RNA被细胞翻译成蛋白质。表观基因组控制基因表达模式。

术语“细胞重编程”是指利用重编程因子改变细胞的表观基因组的过程(例如,逆转或防止细胞中的表观遗传变化,这些变化是功能障碍、恶化、细胞死亡、衰老或老化的原因)。细胞重编程可为完全重编程,使得分化的细胞(例如体细胞)重编程为多能干细胞。细胞重编程可为不完全的,使得分化的细胞(例如体细胞)保持其细胞种类(例如谱系特异性干细胞)。细胞重编程可为不完全的(例如未产生干细胞),使得细胞可恢复活力,或呈现出更幼年的属性(例如存活率增加、炎症减少、或分裂的能力)。细胞重编程可提供额外的细胞功能,或防止细胞老化(例如转分化或向细胞衰老转变)。细胞重编程可以诱导暂时性或永久性的基因表达变化。在一些实施方案中,不完全的细胞重编程由缺乏Nanog表达显示。在一些实施方案中,细胞重编程防止衰老发生。

术语“病况”、“疾病”和“障碍”可互换使用。病况、疾病和障碍的非限制性实例包括急性损伤、神经变性疾病、慢性疾病、增殖性疾病、心血管疾病、遗传病、炎性疾病、自身免疫性疾病、神经学疾病、血液学疾病、疼痛病况、精神障碍、代谢障碍、癌症、衰老、年龄相关的疾病以及影响受试者中任何组织的疾病。例如,年龄相关的病况包括心力衰竭、中风、心脏病、动脉粥样硬化、神经变性疾病(例如帕金森病和阿尔茨海默病)、认知衰退、记忆丧失、糖尿病、骨质疏松症、关节炎、肌肉损失、听力损失(部分或全部)、眼相关病况(例如视力减退或视网膜疾病)、青光眼和癌症。在某些实施方案中,疾病是视网膜疾病(例如黄斑变性)。在一些实施方案中,年龄相关的病况是衰老。作为非限制性实例,神经胶质细胞的衰老可能是阿尔茨海默病的原因。参见例如Bussian等人,Nature.2018年9月19日。

如本文所用,“眼病”或“眼疾病”是眼睛的疾病或病况。影响眼睛的病况的非限制性实例包括睑外翻、兔眼、眼睑松弛、上眼睑下垂、麦粒肿、睑黄斑瘤、皮炎、毛囊螨、利什曼病、罗阿丝虫病、盘尾丝虫病、虱病(单纯疱疹病毒)、麻风病、触染性软疣、结核、雅司病、带状疱疹、脓疱性皮炎、泪腺炎、泪溢、突眼、结膜炎、巩膜炎、角膜炎、角膜溃疡/角膜擦伤、雪盲/电弧眼、Thygeson浅层点状角膜病变、角膜新血管形成、富克斯营养不良症、圆锥角膜、干燥性角结膜炎、虹膜炎、虹膜、葡萄膜炎、交感神经性眼炎、白内障、晶状体、脉络膜视网膜炎、局灶性脉络膜视网膜炎、脉络视网膜炎、脉络膜炎、视网膜炎、视网膜脉络膜炎、播散性脉络膜视网膜炎、渗出性视网膜病变、后睫状体炎、睫状体扁平部炎、脉络膜视网膜炎、原田氏病、脉络膜视网膜炎、脉络膜、脉络膜视网膜瘢痕、斑点瘢痕、后极(炎症后)(创伤后)、日光性视网膜病、脉络膜变性、萎缩、硬化症、血管样纹、脉络膜营养障碍、无脉络膜症、脉络膜乳晕(视乳头周围)螺旋状萎缩、脉络膜、鸟氨酸血症(ornithinaemia)、脉络膜出血、脉络膜出血NOS(未另外说明)、脉络膜脱离、脉络膜视网膜、脉络膜视网膜炎症、感染和寄生虫病、梅毒性脉络膜视网膜炎、弓形虫、结核、脉络膜视网膜、视网膜脱离、视网膜、脉络膜、视物变形、视网膜襞裂症、高血压性视网膜病、糖尿病性视网膜病、视网膜病、早产儿视网膜病、年龄相关性黄斑变性、黄斑、黄斑变性、牛眼状黄斑部病变、视网膜前膜、周围性视网膜变性、遗传性视网膜营养不良、色素性视网膜炎、视网膜下出血、视网膜层、中心性浆液视网膜病、视网膜脱离、黄斑部水肿视网膜疾病、黄斑视网膜疾病、糖尿病性视网膜病、青光眼、视神经疾病、高眼压症、开角型青光眼、闭角型青光眼、正常眼压性青光眼、开角型青光眼、闭角型青光眼、飞蚊症、Leber遗传性视神经病变、视盘玻璃膜疣、斜视、眼肌瘫痪、眼肌、进行性眼外肌麻痹、内斜视、外斜视、屈光和调节疾患、远视、近视、散光、屈光参差、老花眼、外眼肌瘫痪、弱视眼、伯氏先天性黑内障、暗点、视力缺失、色盲、全色盲/Maskun、视锥细胞、夜盲症、失明症、河盲、小眼症/虹膜裂、视神经、脑、脊髓、红眼、阿罗瞳孔、瞳孔、角膜真菌病、眼球干燥症和无虹膜症。在一些实施方案中,眼病是急性或慢性眼损伤。

在一些实施方案中,眼病是角膜擦伤。

在一些实施方案中,眼病是角膜疾病(例如影响角膜或角膜细胞的疾病)。

在一些实施方案中,眼病是棘阿米巴角膜炎、睑外翻、弱视(lagoph amblyopia)、瞳孔不等、散光、贝尔麻痹、睑缘炎、视力模糊、眼睛灼烧、白内障、黄斑变性、年龄相关性黄斑变性、糖尿病眼疾、青光眼、干眼症、视力不良(例如低视力)、散光、眼睑炎、白内障、睑板腺囊肿、结膜炎、糖尿病视网膜病变、干眼症、青光眼、角膜炎、圆锥角膜病、黄斑变性、高眼压症、睑裂斑、眼翳、色素性视网膜炎、或眼癌(例如视网膜母细胞瘤、眼黑色素瘤、眼淋巴瘤、髓质上皮瘤、结膜鳞状细胞癌)。角膜疾病的实例包括但不限于角膜新血管形成(NV)、角膜营养不良、角膜炎症、角膜擦伤和角膜纤维化。在一些实施方案中,眼病是圆锥角膜病(Keritaconus)。在一些实施方案中,眼病是黄斑变性。眼疾病的附加非限制性实例可见于疾病和相关健康问题的国际统计分类(International Statistical Classification ofDiseases and Related Health Problems)(例如眼和附属器的VII型疾病)。

眼病可以影响眼和/或附属器的任何部位。在一些实施方案中,眼病是眼睑、泪腺系统和/或眼眶的障碍。在一些实施方案中,眼病是结膜障碍。在一些实施方案中,眼病是巩膜、角膜、虹膜和/或睫状体的障碍。在一些实施方案中,眼病是晶状体障碍。在一些实施方案中,眼病是脉络膜和/或视网膜障碍。在一些实施方案中,眼病是青光眼。在一些实施方案中,眼病是玻璃体和/或眼球的障碍。在一些实施方案中,眼病是视神经和/或视觉通路的障碍。在一些实施方案中,眼病是眼肌、双眼运动、调视和/或屈光的障碍。在一些实施方案中,眼病为眼肌、双眼运动、调视和屈光。在一些实施方案中,眼病是视力障碍和/或失明。

术语“遗传疾病”是指由受试者的基因组中的一种或多种异常引起的疾病,诸如从受试者出生起就存在的疾病。遗传疾病可为可遗传的,并且可以从亲代基因遗传下来。遗传疾病也可由受试者的DNA和/或RNA的突变或改变而引起。在此类情况下,如果遗传疾病发生在种系中,则其将是可遗传的。示例性遗传疾病包括但不限于阿-斯氏(Aarskog-Scott)综合征、阿瑟综合征、软骨发育不全、肢端发育不全、成瘾、肾上腺脑白质营养不良、白化病、先天性眼睑缺损巨口综合征、阿拉吉欧综合征、黑尿酸尿症、α-1-抗胰蛋白酶缺、奥尔波特综合征、阿尔茨海默病、哮喘、自身免疫性多腺综合征、雄激素不敏感综合征、快乐木偶综合征、共济失调、共济失调性毛细血管扩张症、动脉粥样硬化、注意力缺陷多动障碍(ADHD)、自闭症、秃发、贝敦氏症、贝克威思-威德曼综合征、贝斯特病、双相情感障碍、短指症、乳腺癌、伯基特淋巴瘤、慢性髓样白血病、腓骨肌萎缩症、克罗恩病、唇裂、科克因综合征、科芬劳里综合征、结肠癌、先天性肾上腺增生、狄兰吉氏综合征、克斯提洛氏弹性蛋白缺陷症、考登综合征、颅额鼻发育异常综合征、克里格勒-纳贾二氏综合征、库贾氏病、囊肿性纤维化、聋症、抑郁症、糖尿病、畸型发育不良、迪格奥尔格综合征、唐氏综合征、阅读障碍、杜氏肌营养不良、多博维茨综合征、外胚层发育不良、埃利伟氏综合征、埃-当综合征、大疱性表皮松解症、癫痫症、特发性震颤、家族性血胆脂醇过多症、家族性地中海热、脆性X综合征、弗里德希共济失调、戈谢病、青光眼、葡萄糖-半乳糖吸收不良、戊二酸尿症、螺旋状萎缩、什普林茨恩-戈德堡综合征(颚心脸综合征)、戈尔林综合征、家族性良性慢性天疱疮、偏身肥大、血色素沉淀着症、血友病、遗传性运动和感觉神经病(HMSN)、遗传性非息肉病性结直肠癌(HNPCC)、亨丁顿舞蹈症、高IgM的免疫缺陷、青少年型糖尿病、克兰费尔特综合征、歌舞伎综合征、leigh病、长QT综合征、肺癌、恶性黑素瘤、躁狂抑郁、马方综合征、卷发综合征、流产、粘多糖疾病、多发性内分泌腺瘤形成、多发性硬化、肌肉萎缩症、肌萎缩性脊髓侧索硬化症、强直性肌营养不良症、多发性神经纤维瘤、尼曼匹克病、努南综合征、肥胖、卵巢癌、胰腺癌、帕金森病、阵发性睡眠性血红蛋白尿症、彭德莱综合征、腓骨肌萎缩症、苯丙酮尿症(PKU)、多囊性肾病、小胖威利症、原发性胆汁性肝硬化、前列腺癌、REAR综合征、雷夫叙姆病、色素性视网膜炎、视网膜母细胞瘤、雷特氏症、沙费利波综合征、精神分裂症、重症联合免疫缺陷、镰刀型细胞贫血病、脊柱裂、脊髓肌肉萎缩、小脑萎缩症、成人猝死综合症、丹吉尔病、戴萨克斯症、桡骨缺失综合征、肛门-耳-肢体畸形综合征、结节性硬化症、特纳综合征、尤塞氏综合征、视网膜小脑脊髓血管瘤症、瓦登伯格综合征、韦弗综合征、沃纳综合征、威廉姆斯综合征、威尔森氏症、着色性干皮病,以及赵苇格氏症。

术语“肌肉骨骼疾病”或“MSD”是指受试者的关节、韧带、肌肉、神经、肌腱和支撑肢体、颈部和背部的结构中的损伤和/或疼痛。在某些实施方案中,MSD是退行性疾病。在某些实施方案中,MSD包括炎性病况。可与MSD相关的受试者的身体部分包括上背和下背、颈部、肩部和四肢(手臂、腿、脚和手)。在某些实施方案中,MSD为骨疾病,诸如软骨发育不全、肢端肥大症、骨痂、骨骼脱矿质化、骨折、骨髓疾病、骨髓肿瘤、先天性角化不良、白血病(例如毛细胞白血病、淋巴细胞性白血病、髓性白血病、费城染色体阳性白血病、浆细胞白血病、干细胞性白血病)、全身性肥大细胞增多症、骨髓增生异常综合征、阵发性夜间血红蛋白尿、髓样肉瘤、骨髓纤维化疾病、多发性骨髓瘤、真性红细胞增多症、pearson骨髓-胰腺综合征、骨肿瘤、骨髓肿瘤、尤文肉瘤、骨软骨瘤、破骨细胞瘤、骨肉瘤、短指畸形、进行性骨干发育不良综合征、颅缝早闭症、克鲁松氏颅骨面骨发育不全、侏儒症、软骨发育不全、布卢姆综合征、科克因综合征、埃利伟氏综合征、塞克尔综合征、脊椎骨骺发育不良、先天性椎体骨骺结构不良、沃纳综合征、骨质增生、骨赘、不全型克-瑞-维氏综合征、马方综合征、多发性骨纤维营养不良、骨炎、骨性关节炎、骨软骨炎、莫尔基奥氏病、卡斯比克病、Leri-Weill软骨发育不良、骨软骨病、骨营养不良、成骨不全症、骨自溶症、Gorham-Stout综合征、骨软化症、骨髓炎、骨坏死、骨质稀少症、骨硬化症、骨质疏松症、骨骼石化症、耳脊椎骨骺发育不良、骨膜增生性厚皮症、骨派吉特氏病、多指趾畸形、麦克综合征、佝偻病、Rothmund-Thomson综合征、索托氏症、脊椎骨骺发育不良、先天性椎体骨骺结构不良、并指症、阿佩尔综合征、II型并指或沃纳综合征。在某些实施方案中,MSD为软骨疾病,诸如软骨瘤、骨软骨炎、莫尔基奥氏病、卡斯比克病或Leri-Weill软骨发育不良。在某些实施方案中,MSD为疝气,诸如腰椎间盘突出症。在某些实施方案中,MSD为关节疾病,诸如关节痛、关节炎(例如痛风(例如凯-赛二氏综合征、莱斯奈恩综合征))、莱姆病、骨性关节炎、牛皮癣性关节炎、反应性关节炎、风湿热、类风湿性关节炎、费尔蒂综合征、滑膜炎、Blau综合征、指甲髌骨综合征、脊椎关节病、反应性关节炎、史蒂克勒氏综合征、滑膜疾病、滑膜炎或Blau综合征。在某些实施方案中,MSD为兰-吉综合征。在某些实施方案中,MSD为肌肉疾病,诸如巴斯综合征、线粒体脑肌病、MELAS综合征、MERRF综合征、MNGIE综合征、线粒体肌病、卡恩斯-塞尔综合征、肌痛、纤维肌痛、风湿性多肌痛、肌瘤、肌炎、皮肌炎、神经肌肉疾病、卡恩斯-塞尔综合征、肌肉萎缩症、肌无力、先天性肌无力综合征、朗伯-伊顿肌无力综合征、重症肌无力、肌强直、先天性肌强直、脊髓性肌萎缩、手足搐搦、外眼肌麻痹或横纹肌溶解症。在某些实施方案中,MSD为普罗蒂斯综合征。在某些实施方案中,MSD为风湿性疾病,诸如关节炎(例如痛风(例如凯-赛二氏综合征、莱斯奈恩综合征、莱姆病))、骨性关节炎、牛皮癣性关节炎、反应性关节炎、风湿热、类风湿性关节炎、费尔蒂综合征、滑膜炎、Blau综合征、痛风(例如凯-赛二氏综合征、莱斯奈恩综合征)、风湿性多肌痛、风湿热、风湿性心脏病或干燥综合征。在某些实施方案中,MSD为施詹二氏综合征。在某些实施方案中,MSD为骨骼疾病,诸如Leri-Weill软骨发育不良、骨骼发育畸形、梅-尼二氏综合征、骨膜增生性厚皮症、Rieger综合征、脊柱疾病、椎间盘突出症、脊柱侧凸、脊柱裂、脊椎炎、强直性脊柱炎、脊椎关节病、反应性关节炎、脊柱骨骺发育不良、先天性椎体骨骺结构不良或颈椎病。在一些实施方案中,疾病为肌骨病。

“增殖性疾病”是指由于细胞增殖的异常生长或扩展而发生的疾病(Walker,Cambridge Dictionary of Biology;Cambridge University Press:Cambridge,UK,1990)。增殖性疾病可与以下相关:1)正常静息细胞的病理性增殖;2)细胞从其正常部位的病理性迁移(例如赘生性细胞的转移);3)蛋白水解酶诸如基质金属蛋白酶(例如胶原酶、明胶酶和弹性蛋白酶)的病理表达;或4)如增生性视网膜病和肿瘤转移中的病理性血管生成。示例性增殖性疾病包括癌症(即“恶性瘤”)、良性瘤、血管生成、炎性疾病和自身免疫病。

术语“瘤”和“肿瘤”在本文中可互换使用并且是指异常的组织块,其中块的生长超过正常组织的生长且与正常组织的生长不协调。瘤或肿瘤可为“良性的”或“恶性的”,这取决于以下特征:细胞分化程度(包括形态学和功能性)、生长速率、局部侵入和转移。“良性瘤”通常完全分化,具有比恶性瘤典型更慢的生长,并且保持局限于起源部位。另外,良性瘤没有浸润、侵入或转移到远处部位的能力。示例性良性瘤包括但不限于脂肪瘤、软骨瘤、腺瘤、软垂疣、老年血管瘤、脂溢性角化病、雀斑和皮脂腺增生。在一些情况下,某些“良性”肿瘤可能后续产生恶性瘤,其可能由肿瘤的赘生性细胞亚群中的额外遗传变化引起,并且这些肿瘤被称为“癌前瘤”。示例性的癌前瘤是畸胎瘤。相反,“恶性瘤”通常分化不良(退行发育)并且具有典型快速的生长,同时伴随进行性浸润、侵入和周围组织的破坏。此外,恶性瘤通常具有转移至远处部位的能力。术语“转移”、“转移性”或“肿瘤转移”是指癌细胞从原发性肿瘤或原肿瘤向另一器官或组织扩散或迁移,并且通常可由原发性肿瘤或原肿瘤的组织类型(而非继发性(转移)肿瘤所在的器官或组织)的“继发性肿瘤”或“继发性细胞块”的存在来鉴定。例如,已经迁移到骨的前列腺癌被称为转移性前列腺癌,并且包括骨组织中正在生长的癌性前列腺癌细胞。

术语“癌症”是指以异常细胞的发育为特征的一类疾病,所述异常细胞不受控制地增殖并且具有浸润和破坏正常身体组织的能力。参见例如Stedman’s MedicalDictionary,第25版;Hensyl编辑;Williams&Wilkins:Philadelphia,1990。示例性癌症包括但不限于听神经瘤;腺癌;肾上腺癌;肛门癌;血管肉瘤(例如淋巴管肉瘤、淋巴管内皮肉瘤、血管肉瘤);阑尾癌;良性单克隆丙球蛋白病;胆管癌(例如胆管细胞癌);膀胱癌;乳腺癌(例如乳腺腺癌、乳腺乳头状癌、乳癌、乳腺髓样癌);脑癌(例如脑膜瘤、恶性胶质瘤、胶质瘤(例如星形细胞瘤、少突神经胶质瘤)、髓母细胞瘤);支气管癌;类癌瘤;宫颈癌(例如宫颈腺癌);绒毛膜癌;背索上皮瘤;颅咽管瘤;结肠直肠癌(例如结肠癌、直肠癌、结肠直肠腺癌);结缔组织癌;上皮癌;室管膜瘤;内皮肉瘤(例如卡波济氏肉瘤、多发性特发性出血性肉瘤);子宫内膜癌(例如子宫癌、子宫肉瘤);食道癌(例如食道的腺癌、巴雷特腺癌);尤因肉瘤;眼癌(例如眼内黑素瘤、成视网膜细胞瘤);常见嗜酸球增多症;胆囊癌;胃癌(例如胃腺癌);胃肠道间质瘤(GIST);生殖细胞癌;头颈癌(例如头颈部鳞片状细胞癌、口腔癌(例如口腔鳞状细胞癌)、咽喉癌(例如喉癌、咽癌、鼻咽癌、口咽癌));造血系统癌症(例如白血病,诸如急性淋巴细胞性白血病(ALL)(例如B细胞ALL、T细胞ALL)、急性髓细胞性白血病(AML)(例如B细胞AML、T细胞AML)、慢性髓细胞性白血病(CML)(例如B细胞CML、T细胞CML)以及慢性淋巴细胞性白血病(CLL)(例如B细胞CLL、T细胞CLL));淋巴瘤诸如霍奇金淋巴瘤(HL)(例如B细胞HL、T细胞HL)和非霍奇金淋巴瘤(NHL)(例如B细胞NHL,诸如弥散大细胞淋巴瘤(DLCL)(例如弥漫大B细胞淋巴瘤)、滤泡性淋巴瘤、慢性淋巴细胞性白血病/小淋巴细胞性淋巴瘤(CLL/SLL)、套细胞淋巴瘤(MCL)、边缘区B细胞淋巴瘤(例如粘膜相关淋巴组织(MALT)淋巴瘤、结内边缘区B细胞淋巴瘤、脾边缘区B细胞淋巴瘤)、原发性纵膈B细胞淋巴瘤、伯基特淋巴瘤、淋巴浆细胞性淋巴瘤(即华氏巨球蛋白血症)、毛细胞白血病(HCL)、成免疫大细胞淋巴瘤、B前躯淋巴芽细胞淋巴瘤和原发性中枢神经系统(CNS)淋巴瘤;以及T细胞NHL诸如T前躯淋巴芽细胞淋巴瘤/白血病、周围T细胞淋巴瘤(PTCL)(例如皮肤T细胞淋巴瘤(CTCL)(例如蕈样肉芽肿病、Sezary综合征)、血管免疫母细胞性T细胞淋巴瘤、结外自然杀伤T细胞淋巴瘤、肠病型T细胞淋巴瘤、皮下脂膜炎样T细胞淋巴瘤和退行性大细胞淋巴瘤);如上所述的一种或多种白血病/淋巴瘤的混合;和多发性骨髓瘤(MM))、重链病(例如α链病、γ链病、μ链病);成血管瘤;下咽癌;炎性肌纤维母细胞瘤;免疫细胞淀粉样变;肾癌(例如肾母细胞瘤,亦称威尔姆氏瘤、肾细胞癌);肝癌(例如肝细胞癌(HCC)、恶性肝癌);肺癌(例如支气管癌、小细胞肺癌(SCLC)、非小细胞肺癌(NSCLC)、肺腺癌);平滑肌肉瘤(LMS);肥大细胞增生病(例如全身性肥大细胞增生病);肌肉癌;脊髓发育不良综合症(MDS);间皮瘤;骨髓增生性疾病(MPD)(例如真性红细胞增多症(PV)、原发性血小板增多症(ET)、特发性髓样化生(AMM),亦称骨髓纤维化(MF)、慢性特发性骨髓纤维化、慢性髓性白血病(CML)、慢性嗜中性白血病(CNL)、高嗜酸性粒细胞综合征(HES));成神经细胞瘤;纤维神经瘤(例如1型或2型神经纤维瘤病(NF),神经鞘瘤);神经内分泌癌(例如胃肠胰神经内分泌肿瘤(GEP-NET)、类癌瘤);骨肉瘤(例如骨癌);卵巢癌(例如囊腺癌、卵巢胚胎性癌、卵巢腺癌);乳头状腺癌;胰腺癌(例如胰腺腺癌、管内乳头状黏液性肿瘤(IPMN)、胰岛细胞癌);阴茎癌(例如阴茎和阴囊的佩吉特病);松果体瘤;原始神经外胚层肿瘤(PNT);浆细胞瘤;副肿瘤综合征;上皮内肿瘤;前列腺癌(例如前列腺腺癌);直肠癌;横纹肌肉瘤;唾液腺癌;皮肤癌(例如鳞状细胞癌(SCC)、角化棘皮瘤(KA)、黑素瘤、基底细胞癌(BCC));小肠癌(例如阑尾癌);软组织肉瘤(例如恶性纤维性组织细胞瘤(MFH)、脂质肉瘤、恶性周围神经鞘肿瘤(MPNST)、软骨肉瘤、纤维肉瘤、粘液肉瘤);皮脂腺癌;小肠癌;汗腺癌;滑膜瘤;睾丸癌(例如精原细胞瘤、睾丸胚胎性癌);甲状腺癌(例如甲状腺乳头癌、乳头状甲状腺癌(PTC)、髓样甲状腺癌);尿道癌;阴道癌;以及外阴癌(例如外阴佩吉特病)。

术语“炎性疾病”是指由炎症引起、造成、或导致炎症的疾病。术语“炎性疾病”还可指失调的炎性反应,其引起巨噬细胞、粒细胞和/或T淋巴细胞的过度反应,从而导致异常组织损伤和/或细胞死亡。炎性疾病可为急性或慢性的炎性病况,并且可以由感染或非感染因素引起。炎性疾病包括但不限于动脉粥样硬化、动脉硬化、自身免疫疾病、多发性硬化症、系统性红斑狼疮、风湿性多肌痛(PMR)、痛风性关节炎、退行性关节炎、肌腱炎、粘液囊炎、银屑病、囊性纤维化、关节骨炎、类风湿性关节炎、炎性关节炎、干燥综合征、巨细胞性动脉炎、进行性系统性硬化症(硬皮病)、强直性脊柱炎、多肌炎、皮肌炎、寻常性天疱疮、炎天疱疮、糖尿病(例如I型)、重症肌无力、桥本甲状腺炎、格雷夫斯病、古德帕斯丘疾病、混合性结缔组织病、硬化性胆管炎、炎性肠病、克罗恩病、溃疡性结肠炎、恶性贫血症、炎性皮肤病、常见间质性肺炎(UIP)、石棉沉滞症、矽肺、支气管扩张、铍尘肺、滑石肺、尘肺、肉样瘤病、脱屑性间质性肺炎、淋巴细胞性间质性肺炎、巨细胞间质性肺炎、细胞间质性肺炎、外源性变应性肺泡炎、韦格纳肉芽肿病和脉管炎的相关形式(颞动脉炎和结节性多动脉炎)、炎性皮肤病、肝炎、迟发型超敏反应(例如毒漆藤皮炎)、肺炎、呼吸道炎症、成人呼吸窘迫综合征(ARDS)、脑炎、速发型超敏反应、哮喘、枯草热、过敏症、急性过敏症、风湿热、肾小球性肾炎、肾盂肾炎、蜂窝组织炎、膀胱炎、慢性胆囊炎、局部缺血(局部缺血性损伤)、再灌注损伤、同种异体移植排斥、宿主抗移植物排斥、阑尾炎、动脉炎、睑缘炎、细支气管炎、支气管炎、子宫颈炎、胆管炎、绒膜羊膜炎、结肠炎、泪腺炎、皮肌炎、心内膜炎、子宫内膜炎、肠炎、小肠结肠炎、上髁炎、附睾炎、筋膜炎、纤维肌炎、胃炎、肠胃炎、龈缘炎、回肠炎、虹膜炎、喉炎、脊髓炎、心肌炎、肾炎、脐炎、卵巢炎、睾炎、骨炎、中耳炎、胰腺炎、腮腺炎、心包炎、咽侧炎、肋膜炎、静脉炎、局限性肺炎、直肠炎、前列腺炎、鼻炎、输卵管炎、鼻窦炎、口腔炎、滑膜炎、腮腺炎、扁桃体炎、尿道炎、膀胱炎、葡萄膜炎、阴道炎、脉管炎、外阴炎、外阴阴道炎、血管炎、慢性支气管炎、骨髓炎、视神经炎、颞动脉炎、横贯性脊髓炎、坏死性筋膜炎和坏死性小肠结肠炎。眼炎性疾病包括但不限于术后炎症。在一些实施方案中,炎性疾病是炎性衰老(inflammaging)(例如作为衰老副作用的炎症)。

“自身免疫性疾病”是指由受试者的身体针对正常存在于身体内的物质和组织产生的不适当免疫应答引起的疾病。换言之,免疫系统将身体的某些部分误认为是病原体并攻击其自身细胞。这可限于某些器官(例如在自身免疫性甲状腺炎中)或涉及不同位置的特定组织(例如可影响肺和肾两者中的基底膜的古德帕斯丘疾病)。自身免疫性疾病的治疗通常采用免疫抑制,例如降低免疫应答的药物。示例性自身免疫性疾病包括但不限于肾小球性肾炎、古德帕斯丘综合征、坏死性血管炎、淋巴腺炎、结节性动脉周围炎、系统性红斑狼疮、类风湿性关节炎、牛皮癣性关节炎、系统性红斑狼疮、牛皮癣、溃疡性结肠炎、系统性硬化病、皮肌炎/多发性肌炎、抗磷脂抗体综合征、抗磷脂硬皮病、寻常型天疱疮、ANCA相关血管炎(例如韦格纳肉芽肿病、显微镜下多血管炎)、葡萄膜炎、干燥综合征、克罗恩病、赖特尔综合征、强直性脊柱炎、Lyme病、吉兰-巴雷综合征、桥本甲状腺炎和心肌病。

术语“肝疾病”或“肝病”是指肝的损伤或疾病。肝疾病的非限制性实例包括肝内胆汁郁积(例如阿拉吉欧综合征、胆汁性肝硬变)、脂肪肝(例如酒精性脂肪肝、瑞氏综合征)、肝静脉血栓形成、肝豆状核变性(即威尔逊氏病)、肝肿大、肝脓肿(例如阿米巴肝脓肿)、肝硬化(例如酒精性、胆汁性和实验性肝硬化)、酒精性肝病(例如脂肪肝、肝炎、肝硬化)、寄生虫性肝疾病(例如肝包虫病、肝片吸虫病、阿米巴肝脓肿)、黄疸(例如溶血性、肝细胞性、胆汁淤滞性黄疸)、胆汁淤积、门静脉高血压、肝肿大、腹腔积液、肝炎(例如酒精性肝炎、动物肝炎)、慢性肝炎(例如自身免疫性乙型肝炎、丙型肝炎、丁型肝炎、药物诱导的慢性肝炎)、中毒性肝炎、病毒性人肝炎(例如甲型肝炎、乙型肝炎、丙型肝炎、丁型肝炎、戊型肝炎)、肉芽肿性肝炎、继发性胆汁性肝硬变、肝性脑病、静脉曲张、原发性胆汁性肝硬变、原发性硬化性胆管炎、肝细胞腺瘤、血管瘤、胆结石、肝衰竭(例如肝性脑病、急性肝衰竭)、血管平滑肌脂肪瘤、钙化性肝转移瘤、囊肿性肝转移瘤、纤维板层肝癌、肝腺瘤、肝细胞癌、肝囊肿(例如单纯性囊肿、多囊肝病、肝胆管囊腺瘤、胆总管囊肿)、间充质肿瘤(间叶性错构瘤、婴儿血管内皮细胞瘤、血管瘤、肝紫癜、脂瘤、炎性假瘤)、上皮肿瘤(例如错构瘤、胆管腺瘤)、局灶性结节性增生、结节再生性增生、肝母细胞癌、肝细胞癌、胆管腺癌、囊腺癌、血管肿瘤、腺血管肉瘤、卡波西肉瘤、血管内皮瘤、胚胎肉瘤、纤维肉瘤、平滑肌肉瘤、横纹肌肉癌、癌肉瘤、畸胎瘤、类癌、鳞状细胞癌、原发性淋巴瘤、肝紫癜病、红细胞肝性卟啉症、肝卟啉病(例如急性间歇性卟啉症、迟发性皮肤卟啉症)和泽尔韦格氏综合征。

术语“脾疾病”是指脾的疾病。脾疾病的实例包括但不限于脾肿大、脾癌、无脾、脾外伤、特发性紫癜、费尔蒂综合征、霍奇金病和免疫介导的脾损伤。

术语“肺疾病”或“肺病”是指肺的疾病。肺疾病的实例包括但不限于支气管扩张、支气管炎、支气管肺发育不良、间质性肺病、职业性肺病、肺气肿、囊性纤维化、急性呼吸窘迫综合征(ARDS)、严重急性呼吸道综合征(SARS)、哮喘(例如间歇性哮喘、轻度持续性哮喘、中度持续性哮喘、重度持续性哮喘)、慢性支气管炎、慢性阻塞性肺病(COPD)、肺气肿、间质性肺病、结节病、石棉肺、曲霉肿、曲霉病、肺炎(例如大叶性肺炎、多叶肺炎、支气管性肺炎、间质性肺炎)、肺纤维化、肺结核、类风湿性肺病、肺栓塞和肺癌(例如非小细胞肺癌(例如腺癌、鳞状细胞肺癌、大细胞肺癌)、小细胞肺癌)。

“血液学疾病”包括影响造血细胞或组织的疾病。血液学疾病包括与异常血液学含量和/或功能相关的疾病。血液学疾病的实例包括由对癌症疾病的骨髓照射或化疗治疗引起的疾病,诸如恶性贫血、出血性贫血、溶血性贫血、再生障碍性贫血、镰状细胞性贫血、铁粒幼红细胞贫血、与慢性感染诸如疟疾、锥虫病、HTV、肝炎病毒或其他病毒相关的贫血、由骨髓缺乏引起的骨髓病性贫血、由贫血引起的肾衰竭、贫血症、红血球增多症、传染性单核细胞增多症(EVI)、急性非淋巴细胞白血病(ANLL)、急性髓细胞性白血病(AML)、急性早幼粒细胞白血病(APL)、急性粒单核细胞白血病(AMMoL)、真性红细胞增多症、淋巴瘤、急性淋巴细胞白血病(ALL)、慢性淋巴细胞白血病、威尔姆氏瘤、尤文氏肉瘤、视网膜母细胞瘤、血友病、血栓形成风险增大相关的障碍、疱疹、地中海贫血、抗体介导的病症诸如输血反应和骨髓成红细胞增多症、红细胞的机械性创伤诸如微血管病性溶血性贫血、血栓性血小板低下紫斑症和弥漫性血管内凝血、由寄生虫诸如疟原虫引起的感染、由例如铅中毒和脾功能亢进引起的化学损伤。

术语“神经性疾病”是指神经系统的任何疾病,包括涉及中枢神经系统(脑、脑干和小脑)、周围神经系统(包括颅神经)和植物性神经系统(其部分位于中枢和周围神经系统两者中)的疾病。神经变性疾病是指以神经细胞丧失为特征的神经性疾病的类型,包括但不限于阿尔茨海默病、帕金森病、肌萎缩性脊髓侧索硬化、Tau蛋白病(tauopathy)(包括额颞痴呆)和亨廷顿舞蹈病。神经性疾病的实例包括但不限于头痛、木僵和昏迷、痴呆、癫痫发作、睡眠障碍、创伤、感染、瘤、神经眼科、运动障碍、脱髓鞘疾病、脊索障碍、以及外周神经、肌肉和神经肌肉接头的障碍。成瘾和精神疾病包括但不限于双相性精神障碍和精神分裂症,也包括在神经性疾病的定义中。神经性疾病的另外实例包括后天性癫痫样失语症;急性散播性脑脊髓炎;脑白质肾上腺萎缩症;胼胝体发育不全;认识不能;艾卡尔迪综合征;亚历山大症;阿尔珀斯病;交替性偏瘫;阿尔茨海默氏病;肌萎缩性侧索硬化;无脑畸形;快乐木偶综合征;血管瘤病;缺氧症;失语症;失用症;蛛网膜囊肿;蛛网膜炎;阿-基氏脑畸形;动静脉畸形;亚斯伯格综合征;共济失调毛细血管扩张;注意缺陷多动症;孤独症;自主功能障碍;背痛;贝敦氏症;贝切特氏病;贝耳麻痹;良性自发性眼睑痉挛症;良性局灶性;肌萎缩;良性颅内高压;宾斯万格病;睑痉挛;色素失调症;臂丛神经损伤;脑脓肿;脑损伤;脑瘤(包括多形性成胶质细胞瘤);脊柱瘤;脊髓侧方压迫-脊髓半断综合征;卡纳范疾病;腕管综合征(CTS);灼痛;中枢性疼痛综合症;脑桥中央髓鞘溶解症;头部障碍;脑动脉瘤;脑动脉硬化;脑萎缩;脑性巨人症;脑性瘫痪;进行性腓骨肌萎缩;化疗致神经病变和神经性疼痛;chiari畸形;舞蹈病;慢性炎性脱髓鞘性多发性神经病(CIDP);慢性疼痛;慢性区域性疼痛综合征;科芬-劳里综合征;昏迷,包括持续性植物状态;先天性两侧面瘫;皮质基底变性;颅动脉炎;颅缝早闭;库贾氏病;累积创伤失调;柯兴综合征;巨细胞性包涵体病(CIBD);细胞巨化病毒感染;眼足舞蹈综合征;第四脑室闭锁综合征;Dawson疾病;De Morsier综合征;下臂丛神经麻痹;痴呆;皮肤肌炎;糖尿病性的神经病;弥漫性硬化症;家族性自主神经异常;书写困难;诵读困难;肌张力障碍;早期婴儿型癫痫性脑病;空蝶鞍综合征;脑炎;脑膨出;脑三叉神经血管瘤病;癫痫症;尔勃氏麻痹;特发性震颤;弥漫性体血管角质瘤;法尔综合征;昏厥;家族性痉挛性麻痹;热性惊厥;菲希尔综合征;弗里德赖希氏共济失调;额颞叶痴呆和其他“Tau蛋白病”;脑苷脂病;格斯特曼综合征;巨细胞性动脉炎;巨细胞性包涵体病;球状体细胞白质营养不良;格林-巴利综合征;HTLV-1相关性脊髓病;蛋白球色素退变综合征;颅脑损伤;头痛;半面痉挛;遗传性痉孪性截瘫;雷弗素姆氏病;耳带状疱疹;带状疱疹;平山综合征;HIV相关痴呆和神经病变(另参见AIDS的神经表现);前脑无裂畸形;亨廷顿舞蹈病及其他多麸胺醯胺重复序列病;水脑畸形;脑积水;皮质醇过多症;缺氧症;免疫介导的脑脊髓炎;包涵体肌炎;色素失调症;惊风烦渴;植烷酸贮积病;婴儿型瑞福森氏疾病;婴儿痉挛;炎性肌病;颅内囊肿;颅内高压;朱伯特综合征;卡恩斯-塞尔综合征;肯尼迪病;金斯伯恩综合征;先天性短颈综合征;克拉伯病;库格尔贝格-韦兰德病;库鲁病;拉福拉病;朗伯-伊顿肌无力综合征;获得性癫痫失语综合征;延髓外侧(瓦伦贝格)综合征;学习无能症;利氏病;伦-格综合征;莱斯奈恩综合征;脑白质营养不良;路易体痴呆;无脑回症;闭锁综合征;葛雷克氏症(亦名运动神经元病或肌萎缩性侧索硬化);腰椎间盘突出症;莱姆病-神经系统后遗症;马查多-约瑟夫病;巨脑;巨脑畸形;梅-罗综合征;梅尼埃病;脑膜炎;发扭结综合征;异染性脑白质营养不良;头小畸型;偏头痛;米勒费雪症候群;轻微中风;线粒体肌病;莫比斯综合征;单肢肌萎缩;运动神经元疾病;脑底异常血管网病;粘多糖症;多发梗死性痴呆;多灶性运动神经病;多发性硬化症和其他脱髓鞘疾病;伴有体位性低血压的多系统萎缩症;肌肉萎缩;重症肌无力;弥漫性脱髓鞘硬化;乳儿肌阵挛性脑病;肌阵挛;肌病;先天肌强直;发作性睡病;神经纤维瘤病;神经阻滞剂恶性综合征;AIDS的神经表现;狼疮的神经系统后遗症;神经性肌强直;神经元蜡样质脂褐质沉积症;神经元移行异常;尼曼匹克病;O’Sullivan-McLeod综合征;枕神经痛;隐性脊柱神经管闭合不全序列征;大田原综合征;橄榄体脑桥小脑萎缩;眼肌阵挛性肌阵挛;视神经乳头炎;直立性低血压;过度使用综合征;感觉错乱;帕金森氏病;先天强直性肌痉挛;附肿瘤性疾病;阵发性发作;柏罗氏综合征;佩-迈二氏病;周期性瘫痪;外周神经病;痛性神经病变和神经性疼痛;持续性植物状态;广泛性发展障碍;旋光性喷嚏反射;植烷酸贮积病;皮克氏病;神经受压;垂体肿瘤;多肌炎;孔洞脑;脊髓灰质炎后遗症;带状疱疹后遗神经痛(PHN);感染后脑脊髓炎;体位性低血压;普-威综合征;原发性脊髓侧索硬化;朊病毒病;进行性;面部单侧萎缩;进行性多灶性白质脑病;进行性硬化性灰质萎缩;渐进性核上性麻痹;假脑瘤;膝状神经节综合征(I型和II型);Rasmussen脑炎;反射性交感神经营养不良综合征;雷夫叙姆病;重复性运动损伤;重复性压力损伤;不宁腿综合征;逆转录病毒相关的脊髓病;雷特氏症;瑞氏综合征;圣维特斯舞蹈病;山德霍夫氏病;谢尔德氏病;脑裂畸形;眼中隔发育不良;摇晃婴儿综合征;带状疱疹;希-德二氏综合征;干燥综合征;睡眠呼吸暂停;大脑性巨大症;痉挛;脊柱裂;脊髓损伤;脊髓肿瘤;脊髓性肌萎缩;僵人综合征;中风;斯特偶-韦伯综合征;亚急性硬化全脑炎;蛛网膜下出血;皮层下动脉硬化性脑病;小舞蹈病;晕厥;脊髓空洞症;迟发的运动障碍;黑蒙性家族性痴愚;颞动脉炎;脊髓拴系综合征;肌强直性白内障;胸廓出口综合征;痛性抽搐;托德麻痹;图雷特多综合征;短暂性缺血发作;传染性海绵状脑病;横贯性脊髓炎;创伤性脑损伤;震颤;三叉神经痛;热带痉挛性轻截瘫;结节性硬化;血管性痴呆(多发梗塞性痴呆);血管炎,包括颞动脉炎;希佩尔-林道病(VHL);瓦伦伯格氏综合征;韦德尼希-霍夫曼病;韦斯特综合征;颈部受伤;威廉姆斯综合征;威尔逊病;和泽尔韦格氏综合征。

“疼痛病况”包括但不限于神经性疼痛(例如周围神经性疼痛)、中枢痛、传入障碍性疼痛、慢性疼痛(例如慢性伤害感受性疼痛以及其他形式的慢性疼痛诸如术后疼痛,例如髋、膝、或其他置换手术后疼痛)、术前疼痛、痛觉受体的刺激(伤害感受性疼痛)、急性疼痛(例如幻觉和短暂的急性疼痛)、非炎性疼痛、炎性疼痛、与癌症相关的疼痛、伤口疼痛、烧伤疼痛、术后疼痛、与医疗程序相关的疼痛、瘙痒症导致的疼痛、膀胱疼痛综合征、与经前焦虑性障碍和/或经期前综合症相关的疼痛、与慢性疲劳综合征相关疼痛、与早产相关的疼痛、与药物成瘾的脱瘾症状相关的疼痛、关节疼痛、关节炎疼痛(例如结晶性关节炎、骨性关节炎、银屑病关节炎、痛风性关节炎、反应性关节炎、类风湿性关节炎或Reiter关节炎相关的疼痛)、腰骶疼痛、肌肉骨骼痛、头痛、偏头痛、肌肉痛、下背部疼痛、颈痛、齿痛、牙痛/颌面部疼痛、内脏痛等。本文所考虑的一种或多种疼痛病况可包括上文和本文提供的各种类型的疼痛的混合(例如伤害性疼痛、炎性疼痛、神经性疼痛等)。在一些实施方案中,特定的疼痛可占主导地位。在其他实施方案中,疼痛病况包括两种或更多种类型的疼痛,而无一种占主导地位。熟练临床医师可以基于疼痛病况来确定对特定受试者实现治疗有效量的剂量。

术语“精神障碍”是指心理疾病,并且包括由American PsychiatricAssociation,Washington D.C.(1994)公布的Diagnostic and Statistical Manual ofMental Disorders-第四版(DSM-IV)中所列的疾病和障碍。精神障碍包括但不限于焦虑障碍(例如急性应激障碍广场恐怖症、一般性焦虑症、强迫性障碍、惊恐性障碍、创伤后应激障碍、分离焦虑障碍、社会恐怖症和特殊恐惧障碍)、儿童期障碍(例如注意力缺陷/机能亢进障碍、品行障碍和对抗性挑衅行为障碍)、饮食障碍(例如神经性厌食症和神经性暴食症)、情绪障碍(例如抑郁症、双相型障碍、循环型情感障碍、精神抑郁障碍和严重抑郁症)、人格障碍(例如反社会人格障碍、回避型人格障碍、边缘型人格障碍、依赖性个性障碍、表演样人格障碍、自恋型个性障碍、强迫性人格障碍、偏执型人格障碍、精神分裂样人格障碍和分裂型人格障碍)、精神障碍(例如短时精神障碍、妄想性障碍、情感分裂性精神障碍、精神分裂症样障碍、综合失调症和分享性精神障碍)、药物相关性障碍(例如酒精依赖性、安非他明依赖性、大麻依赖性、可卡因依赖性、致幻剂依赖性、吸入剂依赖性、尼古丁依赖性、阿片类物质依赖性、苯环利定依赖性和镇静剂依赖性)、适应性障碍、孤独症、精神错乱、痴呆、多梗死性痴呆、学习和记忆障碍(例如健忘症和年龄相关相关的记忆丢失)和图雷特综合征。

术语“代谢障碍”是指涉及碳水化合物、脂质、蛋白质、核酸或它们的组合的正常代谢发生改变的任何障碍。代谢障碍与导致核酸、蛋白质、脂质和/或碳水化合物的代谢不平衡的代谢途径的缺乏或过度相关联。影响代谢的因素包括但不限于内分泌(激素)控制系统(例如胰岛素途径、肠内分泌激素,包括GLP-1、PYY等)、神经控制系统(例如脑内GLP-1)等。代谢障碍的实例包括但不限于糖尿病(例如I型糖尿病、II型糖尿病、妊娠期糖尿病)、高血糖、高胰岛素血症、胰岛素抗性和肥胖。

在一些实施方案中,疾病以细胞功能障碍为特征。例如,疾病可为线粒体疾病。非限制性线粒体疾病包括弗里德希氏共济失调、alphers疾病、巴斯综合征、β-氧化缺陷、肉碱缺乏、CPTI缺乏和线粒体DNA缺失。细胞功能障碍可包括线粒体功能障碍、RNA复制功能障碍、DNA复制功能障碍、翻译功能障碍和/或蛋白质折叠功能障碍。

在一些实施方案中,疾病或病况是由神经错乱(wood)、出血、损伤(例如骨折、枪弹创伤、割伤、外科手术期间留下的疤痕(例如剖腹产)引起的。

在一些实施方案中,疾病是感染性疾病(例如由病原体和/或病毒引起的疾病)。感染性疾病的非限制性实例包括肺结核、HIV/AIDS、狂犬病、瘟疫、霍乱、登革热、麻疹、疟疾、脑膜炎、百日咳、莱姆病、流感、丙型肝炎、伤寒和脊髓灰质炎。

如本文所用,术语“有效量”和“治疗有效的量”是指当施用给受试者时有效地至少部分治疗受试者所患的病况的本发明化合物的量或浓度。

如本文所用,“功能性”或“活性”蛋白质是保留其生物活性的蛋白质(例如能够充当转录因子或诱导剂)。相反,无功能或无活性的蛋白质是不能执行其一种或多种野生型功能的蛋白质。

“真核细胞”是包括由膜包围的细胞核的细胞。真核细胞的非限制性实例包括动物细胞、植物细胞、真菌或原生生物细胞,任选地其中动物细胞是哺乳动物细胞。

术语“基因”是指表达蛋白质的核酸片段,包括在编码序列之前(5'非编码序列)和之后(3'非编码序列)的调节序列。“天然基因”是指天然发现的并携带其自身调节序列的基因。“嵌合基因”或“嵌合构建体”是指任何基因或构建体,并非天然基因,且包含非同时存在于自然中的调节和编码序列。因此,嵌合基因或者嵌合构建体可以包含衍生自不同来源的调节序列和编码序列,或者衍生自同一来源、但以非天然方式排列的调节序列和编码序列。“内源基因”是指在生物体的基因组中的自然位置的天然基因。“外源”基因是指在宿主生物体中并非通常存在的,而是通过基因转移引入到宿主生物体中的基因。外源基因可包含插入到非天然生物体中的天然基因,或嵌合基因。“转基因”指通过转化程序被引入基因组中的基因。

“同源物”或“同源”是指共享特定百分比同一性(例如至少5%、至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少71%、至少72%、至少73%、至少74%、至少75%、至少76%、至少77%、至少78%、至少79%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%百分比同一性)的序列(例如核酸或氨基酸序列)。同源序列包括但不限于平行同源或直向同源序列。平行同源序列源于物种基因组内基因的复制,而直向同源序列在物种形成事件后分歧化。功能同源物保留野生型蛋白质的一种或多种生物活性。在某些实施方案中,由转基因编码的蛋白质的功能同源物保留野生型对应物的生物学活性(例如转录因子活性)的至少10%、至少20%、至少30%、至少40%、至少50%、至少60%、至少70%、至少80%、至少90%或至少100%。

“反向末端重复序列”或“ITR”是彼此反向互补的核酸序列。一般来讲,在AAV载体中,IRT存在于盒(例如包含编码转基因、突变体rtTA或其任何组合的核酸的表达盒)的任一侧。AAV ITR包括来自AAV1、AAV2、AAV3、AAV4、AAV5、AAV6、AAV7、AAV8、AAV9、AAV10、AAV11以及它们的AAV变体的ITR。

术语“核酸”、“多核苷酸”、“核苷酸序列”、“核酸分子”、“核酸序列”和“寡核苷酸”是指DNA和RNA中的一系列核苷酸碱基(也称为“核苷酸”),并且意指两个或更多个核苷酸的任何链。术语“核酸”或“核酸序列”、“核酸分子”、“核酸片段”或“多核苷酸”可以与“基因”、“基因编码的mRNA”和“cDNA”互换地使用。

核酸可为单链或双链的嵌合混合物或其衍生物或修饰的变型。例如,可在碱基部分、糖部分或磷酸酯主链上修饰寡核苷酸,例如以改善分子的稳定性、其杂交参数等。核苷酸序列典型地携带遗传信息,包括细胞机构用于制备蛋白质和酶的信息。这些术语包括双链或单链基因组和cDNA、RNA、任何合成和遗传操作的多核苷酸,以及有义和反义多核苷酸两者。这包括单链和双链分子即DNA-DNA、DNA-RNA和RNA-RNA杂交体,以及通过使碱基偶联于氨基酸主链形成的“蛋白核酸”(PNA)。这还包括含有碳水化合物或脂质的核酸。示例性DNA包括单链DNA(ssDNA)、双链DNA(dsDNA)、质粒DNA(pDNA)、基因组DNA(gDNA)、互补DNA(cDNA)、反义DNA、叶绿体DNA(ctDNA或cpDNA)、微卫星DNA、线粒体DNA(mtDNA或mDNA)、动基体DNA(kDNA)、前病毒、溶原性细菌、重复DNA、卫星DNA和病毒DNA。示例性RNA包括单链RNA(ssRNA)、双链RNA(dsRNA)、小干扰RNA(siRNA)、信使RNA(mRNA)、前体信使RNA(pre-mRNA)、小发夹RNA或短发夹RNA(shRNA)、微RNA(miRNA)、导向RNA(gRNA)、转移RNA(tRNA)、反义RNA(asRNA)、核不均一RNA(hnRNA)、编码RNA、非编码RNA(ncRNA)、长非编码RNA(长ncRNA或lncRNA)、卫星RNA、病毒卫星RNA、信号识别颗粒RNA、小细胞质RNA、小核RNA(snRNA)、核糖体RNA(rRNA)、Piwi相互作用RNA(piRNA)、聚肌苷酸、核酶、flexizyme、核仁小RNA(snoRNA)、剪接前导RNA、病毒RNA和病毒卫星RNA。

本文所述的核酸可通过本领域已知的标准方法合成,例如通过使用DNA自动合成仪(诸如可从Biosearch,Applied Biosystems等商购获得的那些)。例如,硫代磷酸酯寡核苷酸可通过Stein等人,Nucl.Acids Res.,16,3209,(1988)的方法合成,膦酸甲酯寡核苷酸可通过使用可控孔径的玻璃聚合物载体制备(Sarin等人,Proc.Natl.Acad.Sci.U.S.A.85,7448-7451,(1988))。已经开发出用于将反义DNA或RNA递送到细胞中的多种方法,例如,可将反义分子直接注射入组织部位,或者可将设计用于靶向期望细胞的经修饰反义分子(与靶细胞表面表达的受体或抗原特异性结合的肽或抗体相连的反义分子)进行全身施用。另选地,RNA分子可以通过使编码反义RNA分子的DNA序列体外和体内转录来产生。此类DNA序列可被引入多种载体中,这些载体中引入了适当的RNA聚合酶启动子,诸如T7或SP6聚合酶启动子。另选地,根据所用的启动子,可将组成性或诱导性地合成反义RNA的反义cDNA构建体稳定引入细胞系中。然而,通常难以达到足以抑制内源mRNA翻译的胞内反义浓度。因此,优选的方法利用了重组DNA构建体,其中反义寡核苷酸处于强启动子的控制之下。使用此类构建体转染患者体内的靶细胞将导致足量的单链RNA转录,该单链RNA将与内源靶基因转录物形成互补碱基配对并由此阻止靶基因mRNA的翻译。例如,载体可被引入体内从而被细胞吸收并指导反义RNA的转录。只要此类载体可转录产生期望的反义RNA,其就可保持游离体状态或整合到染色体中。通过本领域标准的重组DNA技术方法,可以构建此类载体。载体可以是用于在哺乳动物细胞中进行复制和表达的质粒、病毒或本领域中已知的其他载体。编码反义RNA的序列的表达可通过本领域已知的任何启动子在哺乳动物(优选地人)细胞中进行。此类启动子可为诱导型或组成型。任何类型的质粒、粘粒、酵母人造染色体,或病毒载体都可用于制备能直接引入组织部位的重组DNA构建体。

核酸可侧接有天然调节(表达控制)序列或者可结合异源序列,包括启动子、内部核糖体进入位点(IRES)和其他核糖体结合位点序列、增强子、应答元件、抑制子、信号序列、聚腺苷酸化序列、内含子、5′-和3′-非编码区等。也可以用本领域已知的许多方法修饰该核酸。此类修饰的非限制性实例包括甲基化、“加帽”、用类似物取代一个或多个天然存在的核苷酸,以及核苷酸间修饰,例如具有不带电荷的键(例如甲基膦酸酯、磷酸三酯、磷酸酰胺化物、氨基甲酸酯等)和带电荷的键(例如硫代磷酸酯、二硫代磷酸酯等)的那些。多核苷酸可含有一或多个额外的共价连接的部分,例如蛋白质(例如核酸酶、毒素、抗体、信号肽、聚-L-赖氨酸等)、嵌入物(例如吖啶、补骨酯素等)、螯合剂(例如金属、放射性金属、铁、氧化金属等),以及烷化剂。多核苷酸可以通过形成磷酸三甲基酯或磷酸三乙基酯或氨基磷酸烷基酯连接而衍生化。此外,也可利用能够直接或间接提供可检测信号的标记对本文的多核苷酸进行修饰。示例性标记包括放射性同位素、荧光分子、同位素(例如放射同位素)、生物素等。

“重组核酸分子”或“工程化核酸”是已经经历分子生物学操纵的核酸分子,即,非天然存在的核酸分子或遗传工程化的核酸分子。此外,术语“重组DNA分子”或“工程化核酸”是指非天然存在的核酸序列,或是可通过人工组合两个原本分离的核酸序列片段(即,通过将通常不连续的DNA片段连接在一起)而制备的核酸序列。所谓的“重组产生”是指通常通过化学合成方法或者以人工操纵分离的核酸片段实现的人工组合,例如,通过使用限制性酶、连接酶的遗传工程技术,以及如由例如以下描述的类似重组技术:Sambrook等人,Molecular Cloning,第二版,Cold Spring Harbor Laboratory,Plainview,N.Y.;(1989),或Ausubel等人,Current Protocols in Molecular Biology,Current Protocols(1989),以及DNA Cloning:A Practical Approach,第I和II卷(D.N.Glover编辑)IREL Press,Oxford,(1985);其各自以引用方式并入本文。

可以进行此类操纵,以用编码相同或保守氨基酸的多余密码子取代另一个密码子,同时常常引入或去除序列识别位点。另选地,可以将期望功能的核酸片段连接在一起,以产生包含非天然存在的功能的期望组合的单一遗传实体。限制性酶别位点通常是此类人工操纵的靶标,但是也可通过设计引入其他位点特异性靶标,例如启动子、DNA复制位点、调节序列、控制序列、开放阅读框或其他有用特征。

如本文所用,“保守氨基酸取代”是指不改变发生氨基酸取代的蛋白质的相对电荷或大小特征的氨基酸取代。可根据本领域普通技术人员已知的用于改变多肽序列的方法来制备变体,诸如在汇编此类方法的参考文献中所见,例如Molecular Cloning:ALaboratory Manual,J.Sambrook等人编辑,第二版,Cold Spring Harbor LaboratoryPress,Cold Spring Harbor,New York,1989,或Current Protocols in MolecularBiology,F.M.Ausubel等人编辑,John Wiley&Sons,Inc.,New York。氨基酸的保守取代包括在以下组内的氨基酸之间进行的取代:(a)M、I、L、V;(b)F、Y、W;(c)K、R、H;(d)A、G;(e)S、T;(f)Q、N;和(g)E、D。

“重组细胞”或“工程化细胞”是包含重组核酸的细胞。

“序列X中与序列Y中的位置a相对应的残基”是指当使用本领域已知的氨基酸序列比对工具(例如Clustal Omega或

术语“渗漏的”在用于涉及诱导型系统(例如Tet-On系统或Tet-Off)时是指在不存在基因诱导的情况下由诱导型启动子的转基因表达。例如,在Tet-On系统中,在不存在四环素(例如强力霉素)的情况下转基因的表达被认为是“渗漏”系统。又如,在Tet-Off系统中,在存在四环素(例如强力霉素)的情况下转基因的表达被认为是“渗漏”系统。诱导型系统的“渗漏”水平可通过在不存在基因诱导的情况下(例如,在Tet-On系统中不存在四环素的情况下或在Tet-Off系统中存在四环素的情况下)测量基因表达的水平(例如,通过蛋白质印迹、RNA分析或ELISA)来确定。

术语“启动子”是指核酸序列的控制区,在该控制区,核酸序列的剩余部分的启动和转录速度被控制。启动子也可含有调节蛋白和分子如RNA聚合酶和其他转录因子能够结合在其上的子区域。启动子可为组成型、诱导型、可活化型、阻抑型、组织特异型或它们的任何组合。启动子驱动其调节的核酸序列的表达或驱动其调节的核酸序列的转录。在本文中,当启动子处在相对于其所调节的核酸序列的正确功能位置和方向以控制(“驱动”)该序列的转录起始、该序列的表达或它们的组合时,认为该启动子是“可操作连接的”。

启动子可以促进来自任何物种(包括人)的可操作连接的核酸序列的遍在表达或组织特异性表达。在一些实施方案中,启动子是真核启动子。真核启动子的非限制性实例包括TDH3、PGK1、PKC1、TDH2、PYK1、TPI1、AT1、CMV、EF1a、SV40、PGK1(人或小鼠)、Ubc、人β肌动蛋白、CAG、TRE、UAS、Ac5、多角体蛋白、CaMKIIa、GAL1、GAL10、TEF1、GDS、ADH1、CaMV35S、Ubi、H1和U6,如本领域的普通技术人员已知的(参见例如Addgene website:blog.addgene.org/plasmids-101-the-promoter-region)。

遍在启动子的非限制性实例包括四环素反应性启动子(处于相关条件下)、CMV、EF1α、SV40启动子、PGK1、Ubc、CAG、人β肌动蛋白基因启动子和包含上游激活序列(UAS)的启动子。在某些实施方案中,启动子是哺乳动物启动子。组织特异性启动子的非限制性实例包括脑特异性、肝特异性、肌肉特异性、神经细胞特异性、肺特异性、心脏特异性、骨特异性、肠特异性、皮肤特异性启动子、脑特异性启动子和眼特异性启动子。例如,肌肉特异启动子是结蛋白启动子(例如,与SEQ ID NO:29至少70%(例如至少75%、80%、85%、90%、95%、98%、99%或100%)相同的序列)。

组成型启动子的非限制性实例包括CP1、CMV、EF1α、SV40、PGK1、Ubc、人β肌动蛋白、β微管蛋白、CAG、Ac5、多角体蛋白、TEF1、GDS、CaM3 5S、Ubi、H1和U6。Ubc启动子可包含与SEQID NO:18至少70%(例如至少75%、80%、85%、90%、95%、98%、99%或100%)相同的序列。

“诱导型启动子”是特征在于当存在诱导剂,受诱导剂影响,或与诱导剂接触时启动或增强转录活性的启动子。诱导剂可为内源性或通常外源性条件、化合物、试剂或蛋白质,它们以在由诱导型启动子诱导转录活性方面具有活性的方式与工程化核酸接触。在某些实施方案中,诱导剂是四环素敏感蛋白(例如rtTA)。

根据本公开使用的诱导型启动子包括本文描述的或本领域普通技术人员已知的任何诱导型启动子。诱导型启动子的实例包括但不限于化学/生物化学调控和物理调控的启动子,诸如醇调控的启动子、四环素调控的启动子(例如,脱水四环素(aTc)反应性启动子和其他四环素反应性启动子系统,其包括四环素阻抑蛋白(tetRTetR,例如SEQ ID NO:26;或TetRKRAB,例如SEQ ID NO:27)、四环素操纵子序列(tetO)和四环素反式激活因子融合蛋白(tTA),以及四环素操纵子序列(tetO)和反向四环素反式激活因子融合蛋白(rtTA))、类固醇调控的启动子(例如,基于大鼠糖皮质激素受体、人雌激素受体、蛾蜕皮激素受体的启动子,以及来自类固醇/类视黄醇/甲状腺25受体超家族的启动子)、金属调控的启动子(例如,衍生自酵母、小鼠和人的金属硫蛋白(结合并多价螯合金属离子的蛋白质)基因的启动子)、发病机制调控的启动子(例如,由水杨酸、乙烯或苯并噻二唑(BTH)诱导)、温度/热诱导型启动子(例如热休克启动子),以及光调控的启动子。使用光调控的启动子的诱导型系统的非限制性实例提供于Wang等人,Nat.Methods.2012年2月12日;9(3):266-9。

如本文所用,“TRE启动子”是含有四环素应答元件(TRE)的启动子。如本文所用,TRE包含至少一个(例如至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个)Tet-O序列。Tet-O序列的非限制性实例是与SEQ ID NO:19至少70%(例如75%、80%、85%、90%、95%、98%、99%或100%)相同的序列。在一些实施方案中,TRE启动子还包含位于tet-O序列下游的最小启动子。最小启动子是含有启动子的最小元件(例如,TATA盒和转录起始位点)的启动子,但是在不存在上游增强子(例如,含有Tet-O的序列)的情况下无活性。例如,最小启动子可为包含与SEQ ID NO:20至少70%(例如至少75%、80%、85%、90%、95%、98%、99%或100%)相同的序列的最小CMV启动子。例如,TRE启动子可为TRE3G启动子(例如包含与SEQ ID NO:7至少70%(例如至少75%、80%、85%、90%、95%、98%、99%或100%)相同的序列的TRE3G启动子)。在一些实施方案中,TRE启动子是包含与SEQ ID NO:23至少70%(例如至少75%、80%、85%、90%、95%、98%、99%或100%)相同的序列的TRE2启动子。在一些实施方案中,TRE启动子是包含与SEQ ID NO:24至少70%(例如至少75%、80%、85%、90%、95%、98%、99%或100%)相同的序列的P tight启动子。

如本文所用,“反向四环素反式激活因子”(“rtTA”)是在四环素(例如强力霉素)存在下与TRE启动子(例如TRE3G、P tight或TRE2启动子)结合并且能够驱动与TRE启动子可操作地连接的转基因的表达的诱导剂。rtTA通常包含突变体四环素阻遏物DNA结合蛋白(TetR)和反式激活结构域(参见例如Gossen等人,Science.1995年6月23日;268(5218):1766-9。可使用任何合适的反式激活结构域。非限制性实例包括VP64、P65、RTA和MPH MS2-P65-HSF1。在一些实施方案中,本公开的rtTA包含至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、30、40、50、60、70、80、90或100个反式激活结构域。当与四环素结合时,突变体TetR结构域能够与TRE启动子结合。

rtTA可为rtTA3、rtTA4或它们的变体。如本文所用,rtTA3氨基酸序列包含与SEQID NO:11中的残基相对应的位置处的以下氨基酸:残基72处的甘氨酸,残基12处的甘氨酸,残基67处的苯丙氨酸,以及残基171处的精氨酸。在某些实施方案中,编码rtTA3的核酸包含与SEQ ID NO:10至少70%(例如至少75%、至少80%、至少85%、至少90%、至少95%或至少100%)相同的序列,并且/或者核酸序列编码rtTA3蛋白质,该rtTA3蛋白质包含与SEQ IDNO:11中的残基相对应的位置处的以下氨基酸:残基72处的甘氨酸,残基12处的甘氨酸,残基67处的苯丙氨酸,以及残基171处的精氨酸。rtTA3核苷酸序列可由SEQ ID NO:10组成。在某些实施方案中,编码rtTA3的氨基酸序列包含与(SEQ ID NO:11)至少70%(例如至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或至少100%)相同的序列,并且包含与SEQ ID NO:11中的指定位置相对应的以下氨基酸:残基72处的甘氨酸,残基12处的甘氨酸,残基67处的苯丙氨酸,以及残基171处的精氨酸。rtTA3氨基酸序列可由SEQ ID NO:11组成。

如本文所用,rtTA4氨基酸序列包含与SEQ ID NO:11中的以下残基相对应的位置处的突变:G72;G12;F67;和R171。在某些实施方案中,G72;G12;F67;和R171可突变成任何残基。在某些实施方案中,编码rtTA4的核酸包含与SEQ ID NO:12至少70%(例如至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或至少100%)相同的序列,并且编码具有与rtTA3(SEQ ID NO:11)中的以下位置相对应的以下残基处的突变的蛋白质:G72;G12;F67;和R171。rtTA4核酸序列可由SEQ ID NO:12组成。

在某些实施方案中,编码rtTA4的氨基酸序列包含与SEQ ID NO:13至少70%(例如至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或至少100%)相同的序列,并且/或者编码具有与rtTA3(SEQ ID NO:11)中的以下位置相对应的以下残基处的突变的蛋白质:G72;G12;F67;和R171。在某些实施方案中,相对于rtTA3而言,rtTA4氨基酸序列包含以下突变:与SEQ ID NO:11中的位置G72相对应的残基处的缬氨酸(V)或脯氨酸(P)突变,与SEQ ID NO:11中的位置G12相对应的残基处的丝氨酸(S)突变,与SEQ ID NO:11中的位置F67相对应的残基处的丝氨酸(S)突变,以及与SEQ ID NO:11中的位置R171相对应的残基处的赖氨酸(K)突变。rtTA4氨基酸序列可由SEQ ID NO:13组成。

“多顺反子载体”是编码超过一个氨基酸序列的载体(例如编码至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、40、50、60、70、80、90或100个蛋白质的载体)。多顺反子载体允许由核酸序列表达多个氨基酸序列。编码各个蛋白质的核酸序列可以连接或者分离,使得它们产生未连接的蛋白质。例如,可以将内部核糖体进入位点(IRES)或多肽切割信号置于载体中编码每个转录因子的核酸序列之间。示例性多肽切割信号包括2A肽(例如T2A、P2A、E2A和F2A)。2A肽可包含与SEQ ID NO:9至少70%(例如至少至少75%、80%、85%、90%、95%、98%、99%或100%)相同的序列。在一些实施方案中,本公开的核酸(例如工程化核酸,包括表达载体)是多顺反子表达载体。

“蛋白质”、“肽”或“多肽”包括通过肽键连接在一起的氨基酸残基的聚合物。该术语是指任何大小、结构或功能的蛋白质、多肽和肽。典型地,蛋白的长度将至少为三个氨基酸。蛋白质可以指单独的蛋白质或蛋白质的集合。本发明的蛋白质优选地仅含有天然氨基酸,但也可另选地采用非-天然氨基酸(即在自然界中不存在但可引入多肽链中的化合物)和/或如本领域已知的氨基酸类似物。此外,可以修饰蛋白质中的一个或多个氨基酸,例如通过添加化学实体,诸如碳水化合物基团、羟基、磷酸基、法呢基、异法呢基、脂肪酸基、用于缀合或官能化的接头,或其他修饰。蛋白质也可为单个分子,或者可为多分子复合物。蛋白质可为天然存在的蛋白质或肽的片段。蛋白质可以是天然存在的、重组的、合成的,或这些的任何组合。

“原核细胞”是缺乏膜结合的细胞器的细胞。原核生物的非限制性实例包括古生菌和细菌。

如本文所用,“逆转衰老”是指改变与衰老相关的物理特征。所有动物通常经历一段生长和成熟期,紧接着一段进行性和不可逆的生理衰退,以死亡告终。从出生到死亡的时间长度被称为生物体的寿命期,并且每种生物体具有特征性平均寿命。衰老是时间流逝基础上变化的物理表现,如由平均寿命的百分比所测量。

预期所施用的“受试者”包括但不限于人(即任何年龄组的男性或女性,例如儿童受试者(例如婴儿、少儿、青少年)或成人受试者(例如青年、中年人、或老年人))和/或其他非人动物,例如哺乳动物(例如灵长类(例如猕猴、恒河猴);商业上相关的哺乳动物,诸如牛、猪、马、绵羊、山羊、猫和/或狗)和鸟类(例如商业上相关的鸟类,诸如鸡、鸭、鹅和/或火鸡)。在某些实施方案中,动物是哺乳动物。动物可以是雄性或雌性并且处于任何发育阶段。非人动物可以是转基因动物。

如本文所用,“终止子”或“终止序列”是导致转录终止的核酸序列。终止子可以是单向的或双向的。其由参与特异性终止RNA聚合酶合成RNA转录物的DNA序列组成。终止序列防止下游核酸序列被上游启动子转录激活。因此,在某些实施方案中,考虑了终止RNA转录物产生的终止子。

最常用的终止子类型是正向终止子。当置于通常被转录的核酸序列的下游时,正向转录终止子将导致转录中止。在一些实施方案中,可以使用双向转录终止子,其通常导致转录在正向和反向链两者上终止。在一些实施方案中,可以使用逆转录终止子,其通常仅终止反向链上的转录。

哺乳动物终止序列的非限制性实例包括牛生长激素终止子和病毒终止序列,诸如SV40终止子、spy、yejM、secG-leuU、thrLABC、rrnB T1、hisLGDCBHAFI、metZWV、rrnC、xapR、aspA和arcA终止子。在某些实施方案中,终止序列是SV40并且包含与SEQ ID NO:8至少70%(例如至少75%、80%、85%、90%、95%、98%、99%或100%)相同的序列。

如本文所用,“Tet-Off”系统是一类诱导型系统,其能够在四环素(例如强力霉素(DOX))存在下抑制特定转基因的表达。相反地,Tet-Off系统能够在不存在四环素(例如强力霉素DOX)的情况下诱导特定转基因的表达。在某些实施方案中,Tet-Off系统包含与转基因(例如,编码蛋白质、基因靶向核酸和/或治疗性基因)可操作地连接的四环素反应性启动子和四环素控制的反式激活因子(tTA)。具有四环素反应性启动子(例如TRE3G、TRE2或Ptight启动子)的转基因和四环素控制的反式激活因子可以在同一载体上编码或者在分开的载体上编码。

如本文所用,“Tet-On”系统是一类诱导型系统,其能够在四环素(例如强力霉素(DOX))存在下诱导特定转基因的表达。在某些实施方案中,Tet-On系统包含与转基因(例如治疗性序列、基因靶向核酸和/或编码蛋白质的核酸)可操作地连接的四环素反应性启动子和反向四环素控制的反式激活因子(rtTA)。

编码四环素反应性启动子(例如,包含TRE的启动子,包括TRE3G、P tight和TRE2)的表达盒和反向四环素控制的反式激活因子可以在同一载体上编码或在分开的载体上编码。

术语“四环素阻遏物”或“TetR”是指能够在不存在四环素(例如强力霉素)的情况下与Tet-O序列(例如TRE中的Tet-O序列)结合且在不存在四环素(例如强力霉素)的情况下阻止rtTA(例如rtTA3、rtTA4或它们的变体)结合的蛋白质。TetR在不存在四环素(例如强力霉素)的情况下阻止由含有TRE的启动子的基因表达。在四环素存在下,TetR不能结合含有TRE的启动子,并且TetR不能阻止转录。TetR的非限制性实例包括tetR(例如SEQ ID NO:26)和tetRKRAB(例如SEQ ID NO:28)。在一些实施方案中,TetR是TetR融合物(例如TRSID,其可通过使TetR融合至Mad1的mSIN30相互作用结构域(SID)产生)。参见例如Zhang等人,J BiolChem.2001年11月30日;276(48):45168-74。

如本文所用,术语“治疗性序列”是编码治疗性核酸和/或蛋白(包括预防性核酸和/或蛋白以及诊断性核酸和/或蛋白)的任何转基因。例如,作为治疗性序列的转基因序列的非限制性列表描述于O’Connor等人,Nat Rev Genet.2006年4月;7(4):261-76。治疗性蛋白的非限制性实例包括抗体、酶、激酶、激素、生长因子、细胞因子、血浆蛋白、融合蛋白、膜裂解蛋白和凝血因子。在一些实施方案中,治疗性蛋白是致炎因子。在一些实施方案中,治疗性蛋白是抗炎剂。在一些实施方案中,治疗性蛋白是免疫调节剂。在一些实施方案中,治疗性蛋白是抗癌剂。在一些实施方案中,治疗性蛋白是代谢剂。在一些实施方案中,治疗性蛋白是抗病毒剂/杀病毒剂。在一些实施方案中,治疗性蛋白是抗细菌剂/杀细菌剂。

术语“组织”是指受试者的任何生物组织(包括细胞群、身体部分或器官)或其部分,包括血管和/或淋巴管,其是本发明的化合物、颗粒和/或组合物所要递送的对象。组织可以是需要治疗的异常或不健康组织。组织也可以是正常或健康组织,其变异常或不健康的风险高于正常风险,这可能需要加以预防。在某些实施方案中,组织被认为是健康的,但是在当前或未来条件下,性能或存活未达最佳标准。例如,在农业实践中,包括气候和生长条件(例如营养)的环境条件可以受益于本文所述的任何方法。在某些实施方案中,组织是中枢神经系统。在某些实施方案中,组织是指来自某些实施方案的组织,细胞或组织来自于眼、耳、鼻、口(包括齿龈和齿根)、骨、肺、乳腺、乳房、胰腺、胃、食管、肌肉(包括心肌)、肝、血管、皮肤(包括毛发)、心脏、脑、神经组织、肾、睾丸、前列腺、阴茎、泄殖腔、鳍、卵巢或肠。在某些实施方案中,组织是受损的(例如,归因于先天性缺陷、损伤、意外事故或医源性损伤)并且/或者是老化组织。在某些实施方案中,组织是用光纤探头可到达的深层组织。

在受损组织的语境中,术语“组织修复”是指组织结构、组织损伤后的功能或它们的组合的恢复。组织修复包括组织再生、细胞生长、组织更替和/或现有组织的重新布局(重编程)。

术语“组织再生”是指在与感兴趣的组织类型相同(例如,与受损组织或细胞类型相同)的组织内产生新的组织或细胞。在一些实施方案中,本文所提供的方法促进器官再生。

术语“组织更替”是指产生与感兴趣的组织相比类型不同的组织(例如结缔组织更替受损组织)。

如本文所用,术语“治疗”、“处理”和“医治”是指逆转、减轻、延缓疾病或障碍或其一种或多种症状的发作或抑制疾病或障碍或其一种或多种症状的进展,如本文所述。在某些实施方案中,治疗可以在已经出现一种或多种症状之后给予。在其他实施方案中,治疗可以在没有症状的情况下给予。例如,治疗可以在症状发作之前给予易感个体,或者可以用另一种损伤剂进行治疗(例如,根据症状史,根据遗传或其他易感因素、疾病疗法或它们的任何组合)。还可以在症状已经消退之后继续治疗,例如,以预防或延迟它们的复发。

术语“变体”或“突变体”是指相对于野生型序列(例如rtTA3序列)而言包含修饰的序列。氨基酸序列的非限制性修饰包括插入、缺失、截短突变和点突变。对核酸序列的非限制性修饰包括移码突变、核苷酸插入和核苷酸缺失。

术语“WPRE”是指土拨鼠肝炎病毒(WHP)转录后调节元件(WPRE)。WPRE在核酸(例如表达载体)中产生三级结构,并且能够增强转基因表达(例如来自病毒载体)。在某些实施方案中,WPRE序列与SEQ ID NO:21至少70%(例如至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或至少100%)相同。

在发明详述、实施例和权利要求书中更详细地描述了这些和其他示例性取代物。本发明不旨在以任何方式受限于上述取代物示例性列表。

附图简要说明

图1是示出编码反向四环素反式激活因子4(rtTA4)的腺相关病毒(AAV)载体的特征的载体图谱。Ubc是与编码rtTA4的核酸可操作地连接的组成型启动子。SV40pA是SV40衍生的终止序列。该载体的序列提供于SEQ ID NO:17中。

图2A-2M包括将图1所示的特征示意性映射到编码rtTA4的载体的核酸序列上的一系列示意图。

图3示出了图2A-2M所描绘的各特征的位置和尺寸。

图4A-4B包括示出以rtTA3(SEQ ID NO:11)作为诱导剂的四环素开启(Tet-On)系统在体内渗漏的数据。图4A是包含两种核酸的Tet-On系统的非限制性实例。第一核酸包含与编码rtTA3的序列可操作地连接的UBC启动子、自切割肽(2A肽)以及mKate(远红色荧光蛋白)(图4A,顶部)。第二核酸编码具有与GFP可操作地连接的四环素应答元件(TRE)(TRE3G启动子,SEQ ID NO:7)的诱导型启动子(图4A,底部)。DOX指示强力霉素。图4B示出了用以下项处理的小鼠的肝样本的蛋白质印记:(1)无AAV;(2)在不存在强力霉素(DOX)情况下,携带包含图4A中第一核酸的AAV载体的AAV,以及携带包含图4A中第二核酸的AAV载体的AAV;或(3)在存在强力霉素(DOX)的情况下(2)的AAV。示出了mKate、GFP和肌动蛋白表达。

图5A-5B示出了采用rtTA4(SEQ ID NO:13)的四环素开启(Tet-On)系统比采用rtTA3的相同系统渗漏更少。图5A是描绘采用rtTA4的Tet-On系统报告系统的示意图。示意图的顶部示出了核酸,其中启动子序列与编码rtTA4的序列可操作地连接。示意图的底部示出了第二核酸,其中TRE3G启动子与编码萤光素酶的序列可操作地连接。图5B是示出与使用rtTA4的Tet-On报告系统相比,使用rtTA3的Tet-On报告系统中强力霉素(DOX,ng/ml)对萤光素酶产量的影响的图。萤光素酶产量以发光/蛋白质测量。示出了在不存在任何rtTA的情况下发光/蛋白质的基线水平。

图6A-6C包括示出与采用rtTA3的Tet-On系统相比,采用rtTA4的Tet-On系统响应于强力霉素撤除而更快速关闭的一系列图。使用DOX诱导型萤光素酶报告系统,并且萤光素酶产量以发光/蛋白质来测量。+DOX表示强力霉素处理,-DOX表示不存在强力霉素处理,+-DOX表示在强力霉素处理之后撤除强力霉素。图6A是示出强力霉素对Tet-On报告系统中的表达的影响的图,其中rtTA3表达由结蛋白启动子驱动并且萤光素酶表达由TRE3G启动子控制。图6B是示出强力霉素对Tet-On报告系统中的表达的影响的图,其中rtTA4表达由结蛋白启动子驱动并且萤光素酶表达由TRE3G启动子控制。图6C是示出与采用rtTA4的Tet-On报告系统相比,采用rtTA3的Tet-On报告系统中降低萤光素酶表达所需的强力霉素撤除的时间长度的图。在这两种报告系统中,rtTA的表达均由UBC启动子驱动,并且萤光素酶的表达由TRE3G启动子控制。

图7是比较293T细胞中强力霉素处理和撤除对由rtTA3(SEQ ID NO:11)和rtTA4(SEQ ID NO:13)诱导的转基因表达的影响的蛋白质印记。编码rtTA3的核酸序列(SEQ IDNO:10)与UBC启动子(SEQ ID NO:18)可操作地连接,而rtTA4与UBC启动子(SEQ ID NO:18)或结蛋白启动子(SEQ ID NO:29)可操作地连接。

图8A-8C包括示出包含rtTA4(SEQ ID NO:13)的Tet-On系统在小鼠肝中具有低渗漏的数据。图8A是一系列免疫荧光图像,其显示在不存在强力霉素(无DOX)和存在强力霉素(具有DOX)的情况下,KLF4在施用有携带图8B所示的核酸的AAV的小鼠的肝中的表达。DAPI是用于使细胞可视化的核染料。图8B是描绘施用给小鼠的AAV9病毒中的两种核酸的示意图。图8C是来自接受图8B所描绘的构建体并且不用强力霉素或用强力霉素处理的小鼠的肝样本的蛋白质印迹。OCT4、KLF4和SOX2水平使用抗体如所指出的那样检测。肌动蛋白显示为加载对照。

图9是描绘编码Oct4、SOX2和KLF4的诱导型AAV载体(TRE3G-OSK-SV40pA,SEQ IDNO:16)的非限制性实例的载体图谱,其可与本文所述的任何rtTA4载体组合使用。

图10是示出组合rtTA(例如rtTA4)和四环素阻遏物(tetR,例如tetRKRAB)的诱导型表达系统的非限制性实例的示意图。三角形表示tetR(例如tetRKRAB)蛋白,并且圆形表示rtTA4蛋白。

图11是pAAV2_CMV_rtTA(VP16)(SEQ ID NO:31)的载体图谱。该载体是编码rtTA的载体的非限制性实例。

图12是pAAV-MCS-tTA2(或CAG-tTA)(SEQ ID NO:32)的载体图谱。该载体是在CAG启动子下编码tTA的载体的非限制性实例。

图13是p-AAV-TetO-OSK-WPRE3-SV50LpA(TRE2-OSK、pAAV-TRE2-OSK-SV40LpA或TRE2-OSK)(SEQ ID NO:33)的载体图谱。该载体是包含核酸(例如工程化核酸)序列的AAV载体的非限制性实例,该核酸序列在载体中的两个ITR之间大于4.7kb。

图14示出在rtTA4控制下用AAV递送的多顺反子OSK的部分重编程是无毒的。图14示出在前4周采用或不采用强力霉素诱导情况下的WT小鼠、OSK转基因小鼠和AAV介导的OSK表达小鼠(1.0×10

图15A-15E示出可用于体内控制OSK表达的rtTA4。图15A示出与转基因小鼠相比肝中的AAV9表达。图15B示出在前4周后9个月中采用或不采用强力霉素情况下的WT小鼠和AAV介导的OSK表达小鼠(总共1.0×10^12个基因拷贝)的体重(分别地,n=5,3,6,4)。图15C示出用于测量组织分布的AAV-UBC-rtTA和AAV-TRE-Luc载体。图15D示出在眶后注射AAV9-UBC-rtTA和AAV9-TRE-Luc(总共1.0×10^12个基因拷贝)之后2个月时WT小鼠的萤光素酶成像。如右侧所示,将强力霉素以饮用水(1mg/mL)递送给小鼠7天。图15E示出在眶后注射AAV9-UBC-rtTA和AAV9-TRE-Luc,然后用强力霉素处理7天后2个月时眼(Ey)、脑(Br)、脑下垂体(Pi)、心脏(He)、胸腺(Th)、肺(Lu)、肝(Li)、肾(Ki)、脾(Sp)、胰腺(Pa)、睾丸(Te)、脂肪(Ad)、肌肉(Mu)、脊髓(SC)、胃(St)、小肠(In)和盲肠(Ce)的萤光素酶成像。萤光素酶信号主要在肝中。以更长的曝光时间对相同组织成像(图15E,下组)显示胰腺中的萤光素酶信号水平较低(肝被去除)。

本发明的某些实施方案的详细描述

本公开至少部分地基于意料不到的结果,其表明与rtTA3(SEQ ID NO:11)中残基G72、G12、F67和R171相对应的四个突变产生了相比于rtTA3具有更低渗漏且对四环素撤除具有提高的敏感性的突变体rtTA(本文称为rtTA4)。现有的rtTA3 Tet-On系统在体内(例如在小鼠肝中)是渗漏的(图4B),而本文所述的rtTA4系统并未诱导可检测的转基因表达(例如在小鼠肝中)。

如本文所示,rtTA4序列(例如SEQ ID NO:13)比rtTA3(SEQ ID NO:11)泄漏更小,并且在不存在四环素(例如强力霉素)的情况下,rtTA4并未在肝中诱导可检测的转基因表达,而rtTA3即使在不存在四环素(例如强力霉素)的情况下也诱导转基因表达。此外,采用rtTA4的Tet-On系统比rtTA3关闭快4-12倍。在某些实施方案中,本文所述的rtTA4 Tet-On系统进一步由tetR(tetRKRAB)调节,其可在不存在四环素(例如强力霉素)的情况下与TRE启动子结合,从而阻止rtTA的结合并由此进一步抑制基因表达。

因此,在一些实施方案中,本文提供了突变体rtTA(例如rtTA4)、工程化核酸(例如表达载体)、重组病毒、系统、试剂盒,以及包含它们的组合物以及使用它们调节基因表达的方法。任何突变体rtTA、包含突变体rtTA的核酸(例如工程化核酸,包括表达载体)、重组病毒、系统、试剂盒以及包含它们的组合物可用于调节基因表达、诱导细胞重编程、组织修复、组织再生、器官再生、逆转衰老、治疗疾病(例如急性损伤、神经变性疾病、慢性疾病、增殖性疾病、心血管疾病、遗传病、炎性疾病、自身免疫性疾病、神经学疾病、血液学疾病、疼痛病况、精神障碍、代谢障碍、癌症、衰老、年龄相关的疾病以及影响受试者中任何组织的疾病),或它们的任何组合。

突变体反向四环素反式激活因子(rtTA)

本公开的方面提供了突变体反向四环素反式激活因子(rtTA),其能够在四环素(例如强力霉素)存在下由可操作连接的四环素应答元件(TRE)(例如TRE3G、TRE2、或Ptight启动子)激活基因的表达。

本公开的突变体rtTA包含至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、30、40、50、60、70、80、90或100个反式激活结构域。反式激活结构域的非限制性实例包括VP64、P65、RTA和MPH MS2-P65-HSF1。在一些实施方案中,编码VP64的核苷酸序列包含与SEQ ID NO:34至少70%(例如至少75%、80%、85%、90%、95%、98%、99%或100%)相同的序列。在一些实施方案中,编码VP64的氨基酸序列包含与SEQ ID NO:34编码的氨基酸序列至少70%(例如至少75%、80%、85%、90%、95%、98%、99%或100%)相同的序列。在一些实施方案中,编码P65的核苷酸序列包含与SEQ ID NO:35至少70%(例如至少75%、80%、85%、90%、95%、98%、99%或100%)相同的序列。在一些实施方案中,编码P65的氨基酸序列包含与SEQ ID NO:35编码的氨基酸序列至少70%(例如至少75%、80%、85%、90%、95%、98%、99%或100%)相同的序列。在一些实施方案中,编码RTA的核苷酸序列包含与SEQ ID NO:36至少70%(例如至少75%、80%、85%、90%、95%、98%、99%或100%)相同的序列。在一些实施方案中,编码RTA的氨基酸序列包含与SEQ ID NO:36编码的氨基酸序列至少70%(例如至少75%、80%、85%、90%、95%、98%、99%或100%)相同的序列。在一些实施方案中,编码MPH MS2-P65-HSF1的核苷酸序列包含与SEQ ID NO:37至少70%(例如至少75%、80%、85%、90%、95%、98%、99%或100%)相同的序列。在一些实施方案中,编码MPH MS2-P65-HSF1的氨基酸序列包含与SEQ ID NO:37编码的氨基酸序列至少70%(例如至少75%、80%、85%、90%、95%、98%、99%或100%)相同的序列。

本公开的突变体rtTA(例如rtTA4)包含与SEQ ID NO:11中的以下残基相对应的位置处的突变:G72;G12;F67;和R171。SEQ ID NO:11是rtTA3序列的非限制性实例。突变的非限制性实例包括点突变、截短突变、缺失或插入。

与SEQ ID NO:11中的残基G12相对应的位置处的非限制性突变包括丙氨酸(A)、精氨酸(R)、天冬酰胺(N)、天冬氨酸(D)、半胱氨酸(C)、谷氨酰胺(Q)、谷氨酸(E)、组氨酸(H)、异亮氨酸(I)、赖氨酸(K)、甲硫氨酸(M)、苯丙氨酸(F)、脯氨酸(P)、丝氨酸(S)、苏氨酸(T)、色氨酸(W)、酪氨酸(Y)和缬氨酸(V)。

与SEQ ID NO:11中的残基G72相对应的位置处的非限制性突变包括丙氨酸(A)、精氨酸(R)、天冬酰胺(N)、天冬氨酸(D)、半胱氨酸(C)、谷氨酰胺(Q)、谷氨酸(E)、组氨酸(H)、异亮氨酸(I)、赖氨酸(K)、甲硫氨酸(M)、苯丙氨酸(F)、脯氨酸(P)、丝氨酸(S)、苏氨酸(T)、色氨酸(W)、酪氨酸(Y)和缬氨酸(V)。

与SEQ ID NO:11中的残基F67相对应的位置处的非限制性突变包括丙氨酸(A)、精氨酸(R)、天冬酰胺(N)、天冬氨酸(D)、半胱氨酸(C)、谷氨酰胺(Q)、谷氨酸(E)、甘氨酸(G)、组氨酸(H)、异亮氨酸(I)、赖氨酸(K)、甲硫氨酸(M)、脯氨酸(P)、丝氨酸(S)、苏氨酸(T)、色氨酸(W)、酪氨酸(Y)和缬氨酸(V)。

与SEQ ID NO:11中的残基F67相对应的位置处的非限制性突变包括丙氨酸(A)、天冬酰胺(N)、天冬氨酸(D)、半胱氨酸(C)、谷氨酰胺(Q)、谷氨酸(E)、甘氨酸(G)、组氨酸(H)、异亮氨酸(I)、赖氨酸(K)、甲硫氨酸(M)、脯氨酸(P)、苯丙氨酸(F)、丝氨酸(S)、苏氨酸(T)、色氨酸(W)、酪氨酸(Y)和缬氨酸(V)。

与SEQ ID NO:11中的残基F67相对应的位置处的非限制性突变包括丙氨酸(A)、精氨酸(R)、天冬酰胺(N)、天冬氨酸(D)、半胱氨酸(C)、谷氨酰胺(Q)、谷氨酸(E)、甘氨酸(G)、组氨酸(H)、异亮氨酸(I)、赖氨酸(K)、甲硫氨酸(M)、脯氨酸(P)、丝氨酸(S)、苏氨酸(T)、色氨酸(W)、酪氨酸(Y)和缬氨酸(V)。

G72;G12;F67;和/或R171处的突变可以是突变为具有带电荷侧链的氨基酸(例如精氨酸、组氨酸、赖氨酸、天冬氨酸或谷氨酸)。氨基酸可含有带负电荷的侧链(例如天冬氨酸或谷氨酸)。氨基酸可含有带正电荷的侧链(精氨酸、组氨酸或赖氨酸)。

G72;G12;F67;和/或R171处的突变可以是突变为含有极性不带电荷侧链的氨基酸(例如丝氨酸、苏氨酸、天冬酰胺、谷氨酰胺)或含有疏水性侧链的氨基酸(例如丙氨酸、缬氨酸、异亮氨酸、亮氨酸、甲硫氨酸、苯丙氨酸、酪氨酸或色氨酸)。

G72;G12;F67;和/或R171处的突变可以是突变为含有芳环的氨基酸(例如苯丙氨酸、酪氨酸或色氨酸)。

在某些实施方案中,编码rtTA4的核酸包含与SEQ ID NO:12至少70%(例如至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或至少100%)相同的序列,并且/或者编码具有与rtTA3(SEQ ID NO:11)中的以下位置相对应的以下残基处的突变的蛋白质:G72;G12;F67;和R171。rtTA4核酸序列可由SEQ ID NO:12组成。

在某些实施方案中,编码rtTA4的氨基酸序列包含与SEQ ID NO:13至少70%(例如至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或至少100%)相同的序列,并且/或者编码具有与rtTA3(SEQ ID NO:11)中的以下位置相对应的以下残基处的突变的蛋白质:G72;G12;F67;和R171。

在某些实施方案中,除了与SEQ ID NO:11中的残基G72;G12;F67;和R171相对应的突变之外,突变体rtTA还包含与rtTA3(SEQ ID NO:11)相对应的位置处的至少另一个突变。在某些实施方案中,突变体rtTA包含至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、35、40、45、50、55、60、65、70、80、90、100、110、120、130、140、150、160、170、180、190、200、210、220、230或240个附加突变,这些附加突变与不是SEQ ID NO:11中的残基G72、G12、F67和R171的位置相对应。

应当理解,任何rtTA(例如rtTA3或M2-rtTA)可用作待突变的参考序列。例如,本公开的突变体rtTA可包含与SEQ ID NO:11的残基G72;G12;F67;和R171相对应的突变,但另外包含存在于M2-rtTA中的氨基酸序列。在某些实施方案中,除了与SEQ ID NO:11的残基G72;G12;F67;和R171相对应的突变之外,本公开的rtTA还可包含至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、35、40、45、50、55、60、65、70、80、90、100、110、120、130、140、150、160、170、180、190、200、210、220、230或240个附加突变,这些附加突变与不是SEQ ID NO:11中的残基G72、G12、F67和R171的位置相对应。

在某些实施方案中,相对于rtTA3而言,rtTA4氨基酸序列包含以下突变:与SEQ IDNO:11中的位置G72相对应的残基处的缬氨酸(V)或脯氨酸(P)突变,与SEQ ID NO:11中的位置G12相对应的残基处的丝氨酸(S)突变,与SEQ ID NO:11中的位置F67相对应的残基处的丝氨酸(S)突变,以及与SEQ ID NO:11中的位置R171相对应的残基处的赖氨酸(K)突变。rtTA4氨基酸序列可由SEQ ID NO:13组成。

任何合适的序列对比算法可用于比对两个感兴趣的序列(例如,本公开的rtTA4与如SEQ ID NO:11所示的rtTA3),以鉴定rtTA3中的相对应的残基位置。作为非限制性实例,可使用Clustal Omega来比对SEQ ID NO:13(rtTA4的氨基酸序列)与SEQ ID NO:11(rtTA3的氨基酸序列)(参见例如Larkin等人,Bioinformatics.2007年11月1日;23(21):2947-8)。在以下的示例性比对中,SEQ ID NO:11中的位置12(甘氨酸)突变为SEQ ID NO:13中的丝氨酸,SEQ ID NO:11中的位置72(甘氨酸)突变为SEQ ID NO:13中的缬氨酸,SEQ ID NO:11中的位置67(苯丙氨酸)突变为SEQ ID NO:13中的丝氨酸,SEQ ID NO:11中的位置171(精氨酸)突变为SEQ ID NO:13中的赖氨酸。

应当理解,本公开涵盖包含与rtTA3(SEQ ID NO:11)中的以下位置相对应的以下残基处的突变的rtTA4变体:G72;G12;F67;和R171。此类rtTA4变体可包含与SEQ ID NO:13至少70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%但小于100%序列相同的序列。

如本领域已知,术语“序列同一性”是指如由序列比较(比对)所测定的两个多肽或两个多核苷酸的序列之间的关系。在一些实施方案中,序列同一性在突变体rtTA(例如rtTA4)序列的全长上测定。在一些实施方案中,序列同一性在突变体rtTA(例如rtTA4)的区域(例如氨基酸或核苷酸链的片段,诸如10、20、30、40、50等个氨基酸或核苷酸)上测定。

同一性还可指两个序列间序列相关性的程度,如通过两个或更多个残基(例如核苷酸或氨基酸残基)的链之间的匹配数目来测定。同一性通过特定数学模型或计算机程序(例如“算法”)解决空位比对(如果有的话)以测量两个或更多个序列的较小者之间相同匹配的百分比。

相关多肽或核酸序列的同一性可以通过本领域普通技术人员已知的任何方法容易地计算。两个序列(例如核酸或氨基酸序列)的“百分比同一性”可例如使用Karlin和AltschulProc.Natl.Acad.Sci.USA 87:2264-68,1990的算法(如Karlin和AltschulProc.Natl.Acad.Sci.USA 90:5873-77,1993中所修改)来测定。此类算法结合到Altschul等人,J.Mol.Biol.215:403-10,1990的

例如,可使用的另一种局部对比技术基于Smith-Waterman算法(Smith,T.F.&Waterman,M.S.(1981)“Identification of common molecular subsequences.”J.Mol.Biol.147:195-197)。例如,可使用的一般全局比对技术是Needleman–Wunsch算法(Needleman,S.B.&Wunsch,C.D.(1970)“A general method applicable to the searchfor similarities in the amino acid sequences of two proteins.”J.Mol.Biol.48:443-453),其基于动态编程。

最近,开发出一种快速最优全局序列比对算法(FOGSAA),据称该算法比包括Needleman–Wunsch算法在内的其他最优全局比对方法更快地产生核酸和氨基酸序列的全局比对。在一些实施方案中,通过比对两个氨基酸序列,计算相同氨基酸的数目,并除以一个氨基酸序列的长度来测定两个多肽的同一性。在一些实施方案中,通过比对两个核苷酸序列并计算相同核苷酸的数目,并除以一个核酸的长度来测定两个核酸的同一性。

对于多序列比对,可使用包括Clustal Omega的计算机程序(Sievers等人,MolSyst Biol.2011年10月11日;7:539)。

在一些实施方案中,编码突变体rtTA(例如rtTA4)的蛋白质与蛋白转导结构域融合。不受特殊的理论限制,蛋白转导结构域有利于运载物(例如蛋白质、核酸、纳米颗粒、病毒颗粒等)穿过细胞膜递送。蛋白转导结构域包括阳离子肽、疏水肽和/或细胞特异性肽。参见例如Zhou等人,Cell Stem Cell.2009年5月8日;4(5):381-4;Zahid等人,Curr GeneTher.2012年10月;12(5):374-80。

在一些实施方案中,将蛋白质配制在纳米颗粒中用于递送。在一些实施方案中,壳聚糖聚合物纳米颗粒负载有突变体rtTA(例如rtTA4)蛋白质。参见例如Tammam等人,Oncotarget.2016年6月21日;7(25):37728-37739。

编码突变体rtTA的核酸(例如工程化核酸)

可将本文所述的编码重组rtTA(例如rtTA4)的任何核酸序列克隆到表达载体中。本公开的核酸(例如工程化核酸)可存在于病毒或非病毒载体上。合适的非病毒载体包括但不限于质粒DNA或RNA(例如mRNA)。在一些实施方案中,可以将质粒DNA引入纳米颗粒中和/或融合至蛋白转导结构域(PTD)。参见上文。

作为非限制性实例,本公开的工程化核酸(例如表达载体)(例如本公开的RNA,包括mRNA,或DNA(例如质粒DNA))可配制在纳米颗粒中用于递送。参见例如Dong等人,NanoLett.2016年2月10日;16(2):842-8。在一些实施方案中,纳米颗粒包含乙酰化半乳糖。参见例如Lozano-Torres等人,J Am Chem Soc.2017年7月5日;139(26):8808-8811。在一些实施方案中,将工程化核酸(例如表达载体)(例如RNA,包括mRNA,或DNA)电穿孔或转染到细胞中。在某些实施方案中,工程化核酸作为裸核酸(例如裸DNA或裸RNA)递送。

病毒载体的非限制性实例包括慢病毒、腺病毒、甲病毒、牛痘病毒、逆转录病毒、疱疹病毒和AAV载体。使用本领域已知的方法的任何重组rtTA。含有表达必需元件的表达载体是可商购的并且是本领域普通技术人员已知的(参见例如Sambrook等人,MolecularCloning:A Laboratory Manual,第四版,Cold Spring Harbor Laboratory Press,2012)。还可参见例如以下常规技术。核酸(例如工程化核酸,包括表达载体)上的元件的非限制性实例包括启动子、与启动子可操作地连接的核酸序列(例如开放阅读框)、终止序列、间隔序列或WPRE序列。载体可包含这些元件中的一个或多个。

在某些实施方案中,编码突变体rtTA的核酸序列例如为在特定宿主细胞中表达进行了密码子优化。在某些实施方案中,编码突变体rtTA的序列为在哺乳动物细胞中表达进行了密码子优化。在某些实施方案中,编码突变体rtTA的序列为在人细胞中表达进行了密码子优化。在某些实施方案中,编码突变体rtTA的序列与SEQ ID NO:12至少70%(例如75%、80%、85%、90%、95%、98%、99%或100%)相同。

本公开的编码突变体rtTA(例如rtTA4)的工程化核酸(例如表达载体)包含与编码rtTA的核酸可操作地连接的启动子。启动子可为组成型启动子(例如CP1、CMV、EF1a、SV40、PGK1、Ubc、人β肌动蛋白、CAG、Ac5、多角体蛋白、TEF1、GDS、CaM3 5S、Ubi、H1、或U6启动子)。Ubc启动子可包含与SEQ ID NO:18至少70%(例如至少75%、80%、85%、90%、95%、98%、99%或100%)相同的序列。

为了允许突变体rtTA的组织特异性表达,启动子可为组织特异性的(例如眼特异性启动子、骨特异性启动子、肺特异性启动子、乳腺特异性启动子、胰腺特异性启动子、肌肉特异性启动子、肝特异性启动子、皮肤特异性启动子、心脏特异性启动子、脑特异性启动子、神经组织特异性启动子、肾特异性启动子、睾丸特异性启动子、卵巢特异性启动子或肠特异性启动子)。在某些实施方案中,肌肉特异性启动子是结蛋白启动子。在一些实施方案中,结蛋白启动子包含与SEQ ID NO:29至少70%(例如75%、80%、85%、90%、95%、98%、99%或100%)相同的序列。

如本领域普通技术人员所理解的,与编码突变体rtTA的核酸可操作地连接的启动子可基于用于表达的宿主细胞进行选择。例如,哺乳动物启动子可用于驱动突变体rtTA在哺乳动物细胞中的表达。真核启动子可用于驱动rtTA在真核细胞中的表达。原核启动子可用于驱动rtTA在原核细胞中的表达。组织特异性启动子可用于在受试者体内的感兴趣组织中表达突变体rtTA。

在某些实施方案中,编码突变体rtTA的核酸(例如工程化核酸)序列为在特定宿主细胞中表达进行了密码子优化。例如,编码突变体rtTA的核酸(例如工程化核酸)可为在真核细胞(例如哺乳动物细胞)或原核细胞中表达进行了密码子优化。

编码突变体rtTA的核酸(例如工程化核酸,包括表达载体)还可包含土拨鼠乙肝病毒(WHP)转录后调节元件(WPRE),其可用于增强转基因的基因表达(例如,来自病毒载体)。在某些实施方案中,WPRE序列与SEQ ID NO:21至少70%(例如至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或至少100%)相同。在某些实施方案中,WPRE序列位于编码突变体rtTA(例如rtTA4)的核酸的下游。

终止序列可用于指定转录物的末端(致使转录终止)。哺乳动物终止序列的非限制性实例包括牛生长激素终止子和病毒终止序列,诸如SV40终止子、spy、yejM、secG-leuU、thrLABC、rrnB T1、hisLGDCBHAFI、metZWV、rrnC、xapR、aspA和arcA终止子。在某些实施方案中,终止序列是SV40并且包含与SEQ ID NO:8至少70%(例如至少75%、80%、85%、90%、95%、98%、99%或100%)相同的序列。

编码突变体rtTA(例如rtTA4)的核酸(例如工程化核酸,包括表达载体)还可编码四环素阻遏物(TetR),其在不存在四环素(例如强力霉素)的情况下阻止含有TRE的启动子的基因表达。在四环素存在下,TetR不能结合含有TRE的启动子,并且TetR不能阻止转录。TetR的非限制性实例包括TetR、TRSID和tetRKRAB。在一些实施方案中,TetR(例如TetR)由包含与SEQ ID NO:25至少70%(例如至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或至少100%)相同的序列的核酸编码。在一些实施方案中,TetR(例如TetR)包含与SEQ ID NO:26至少70%(例如至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或至少100%)相同的序列。在一些实施方案中,TetR(例如tetRKRAB)由包含与SEQ ID NO:27至少70%(例如至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或至少100%)相同的序列的核酸编码。在一些实施方案中,TetR(例如tetRKRAB)包含与SEQ ID NO:28至少70%(例如至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或至少100%)相同的序列。与存在四环素的情况相比,在不存在四环素(例如强力霉素)的情况下,TetR可使启动子的转基因表达下降至少10%、至少20%、至少30%、至少40%、至少50%、至少60%、至少70%、至少80%、至少90%或100%。可使用任何合适的方法测量基因表达,包括评估蛋白质水平和RNA水平。

核酸(例如工程化核酸,包括表达载体)还可包含间隔序列(例如IRES或多肽切割信号)。示例性多肽切割信号包括2A肽(例如T2A、P2A、E2A和F2A)。2A肽可包含与SEQ ID NO:9至少70%(例如至少75%、80%、85%、90%、95%、98%、99%或100%)相同的序列。对于编码一个以上转基因(例如突变体rtTA和tetR(例如tetRKRAB))的表达载体,每个转基因可以与不同的启动子或相同的启动子可操作地连接。转基因可以在表达载体上隔开(例如IRES或多肽切割信号)。核酸的表达导致编码每种感兴趣蛋白质的的氨基酸序列分开。

在一些实施方案中,编码突变体rtTA(例如rtTA4)的核酸(例如工程化核酸,包括表达载体)可包含与pAAV-UBC-rtTA4-WPRE3-SV40pA(SEQ ID NO:17)至少70%(例如75%、80%、85%、90%、95%、98%、99%或100%)相同的序列。在一些实施方案中,编码突变体rtTA(例如rtTA4)的核酸(例如工程化核酸,包括表达载体)由SEQ ID NO:17组成。在一些实施方案中,编码突变体rtTA(例如rtTA4)的核酸(例如工程化核酸,包括表达载体)可包含与结蛋白-rtTA4载体(SEQ ID NO:30)至少70%(例如75%、80%、85%、90%、95%、98%、99%或100%)相同的序列。在一些实施方案中,编码突变体rtTA(例如rtTA4)的核酸(例如工程化核酸,包括表达载体)由SEQ ID NO:30组成。

本发明的载体还可以包含标记序列,用于鉴定已经或未被载体转化或转染的细胞。标记包括例如编码能增强或减弱对抗生素(例如氨苄青霉素抗性基因、卡那霉素抗性基因、新霉素抗性基因、四环素抗性基因和氯霉素抗性基因)或其他化合物的抗性或敏感性的蛋白质的基因;编码具有可通过本领域已知的标准测定法检测的活性的酶(例如β-半乳糖苷酶、萤光素酶或碱性磷酸酶)的基因;以及能明显影响转化或转染的细胞、宿主、集落或噬斑(例如绿色荧光蛋白)的表型的基因。在一些实施方案中,本文所用的载体能够自主复制并表达存在于它们可操作地连接的DNA片段中的结构基因产物。

在一些实施方案中,编码rtTA的核酸(例如工程化核酸,包括表达载体)是病毒载体(例如慢病毒载体、腺病毒载体、甲病毒载体、牛痘病毒载体、疱疹病毒载体、腺相关病毒(AAV)载体)。如本文所用,AAV载体通常包含侧接于表达盒(例如包含与编码突变体rtTA(包括rtTA4)的序列可操作地连接的启动子序列的核酸)的ITR。

在某些实施方案中,本公开的AAV载体中的两个ITR之间的碱基对的数目小于5千碱基(kb)(例如小于4.9kb、小于4.8kb、小于4.7kb、小于4.6kb、小于4.5kb、小于4.4kb、小于4.3kb、小于4.2kb、小于4.1kb、小于4kb、小于3.5kb、小于3kb、小于2.5kb、小于2kb、小于1.5kb、小于1kb或小于0.5kb)。在某些实施方案中,两个ITR之间的距离小于4.7kb的AAV载体能够以至少0.5×10^10颗粒形成单位/ml(pfu/ml)、至少1×10^10pfu/ml、至少5×10^10pfu/ml、至少1×10^11pfu/ml、至少5×10^11pfu/ml、至少1×10^12pfu/ml、至少2×10^12pfu/ml、至少3×10^12pfu/ml、至少4×10^12pfu/ml、至少5×10^12pfu/ml、至少6x10^12pfu/ml、至少7×10^12pfu/ml、至少8×10^12pfu/ml、至少9×10^12pfu/ml、或至少1×10^13pfu/ml的滴度包装到病毒中。

在某些实施方案中,细胞(例如动物细胞,包括哺乳动物细胞)中携带本公开的突变体rtTA(例如rtTA4)载体的重组病毒(例如慢病毒、腺病毒、甲病毒、牛痘病毒、逆转录病毒、疱疹病毒或AAV)的感染效率为至少20%(例如至少30%、至少40%、至少50%、至少60%、至少70%、至少80%、或至少90%或100%)。

在某些实施方案中,本公开的核酸(例如工程化核酸,包括表达载体)为至少1千碱基(kb)(例如至少1kb、2kb、3kb、4kb、5kb、6kb、7kb、8kb、9kb、10kb、50kb或100kb)。在某些实施方案中,本公开的核酸(例如工程化核酸,包括表达载体)小于10kb(例如小于9kb、小于8kb、小于7kb、小于6kb、小于5kb、小于4kb、小于3kb、小于2kb或小于1kb)。

编码转基因的诱导型表达载体

本文所述的任何突变体rtTA可用于促进与诱导型启动子可操作地连接的转基因的表达。在某些实施方案中,编码突变体rtTA的核酸(例如工程化核酸,包括表达载体)还包含与诱导型启动子可操作地连接的转基因。在某些实施方案中,编码突变体rtTA的核酸(例如工程化核酸,包括表达载体)与编码与诱导型启动子可操作地连接的转基因的核酸(例如工程化核酸,包括表达载体)分开。突变体rtTA可以驱动至少1个含有Tet-O序列的诱导型启动子的表达。突变体rtTA可以驱动至少2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90或100个含有Tet-O序列的诱导型启动子的表达。

应当理解,一个含有Tet-O序列的诱导型启动子可以与至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、30、40、50、60、70、80、90或100个转基因序列可操作地连接。

与本公开的突变体rtTA一起使用的合适的编码转基因的表达载体包含含有至少一个Tet-O序列的诱导型启动子(例如TRE启动子)(例如诱导型启动子可含有至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20 30、40、50、60、70、80、90个或所有的Tet-O序列)。本公开的TRE启动子可包含与SEQ ID NO:7至少70%(例如至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%)相同的序列。TRE启动子通常包含最小启动子,其在缺乏TRE启动子中存在的上游增强子时不能促进转录。最小启动子可为最小CMV启动子(例如,与SEQ ID NO:20至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%相同的序列)。例如,TRE启动子可为TRE3G启动子(例如,与SEQ ID NO:7至少70%(例如至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%)相同的序列)。例如,TRE启动子可为TRE3G启动子(例如,与SEQ ID NO:7至少70%(例如至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%)相同的序列)。在一些实施方案中,TRE启动子是TRE2或P tight启动子。在一些实施方案中,TRE启动子是TRE2启动子,并且包含与SEQ ID NO:23至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或至少100%相同的序列。在一些实施方案中,TRE启动子是P tight启动子,并且包含与SEQ ID NO:24至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或至少100%相同的序列。

本公开的诱导型表达载体包含至少1个(例如2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90或100个)转基因。转基因可编码任何基因(例如蛋白质编码基因、基因靶向核酸和/或治疗性基因)。基因的非限制性实例包括在遗传疾病中突变的野生型基因。在某些实施方案中,基因是转录因子。在某些实施方案中,转基因单独或组合地编码OCT4、SOX2、KLF4,或它们的同源物或变体(例如功能性变体)。在某些实施方案中,工程化核酸编码c-Myc。在某些实施方案中,工程化核酸不编码c-Myc。在某些实施方案中,工程化核酸不编码功能性c-Myc,因为其缺乏c-Myc序列。测定转录因子(例如OCT4、SOX2、KLF4、c-Myc或它们的任何组合)活性的测定法是本领域已知的,并且包括基于细胞的转录测定法和体外转录测定法。也可以使用其他方法测定转录因子表达,包括酶联免疫吸附测定(ELISA)、蛋白质印迹和RNA定量(例如,使用逆转录聚合酶链反应)。

基因的非限制性实例包括Tet1、Tet2、Nanog、SIRT1、SIRT2、SIRT3、SIRT4、SIRT5、SIRT6、SIRT7、FGF21、GDF15、GDF11、NF-kb、PCSK9、mTERT、HAS2、PDE4By358c、sIGF1r-FC、sIGF2r-FC、Fat-1、mTOR、Klotho、TFEB、Grin2b、DNMT1、AMPK、NRF2、NEU1、NGF、Bcat-1、FoxP2、ZAG、脂联素和TFAM。

在一些实施方案中,转基因编码基因靶向核酸。在一些实施方案中,基因靶向核酸与基因的内源基因座的启动子和/或增强子区互补。在一些实施方案中,基因靶向核酸与基因的蛋白编码区互补。在一些实施方案中,基因靶向核酸与RNA(例如mRNA)互补。在一些实施方案中,RNA(例如mRNA)编码蛋白质。

在一些实施方案中,基因靶向核酸是小干扰RNA(siRNA)、小发夹RNA或短发夹RNA(shRNA)、微RNA(miRNA)、导向RNA(gRNA)或反义RNA(asRNA)。在一些实施方案中,siRNA、shRNA、miRNA或asRNA能够使靶基因的表达降低至少10%、20%、30%、40%、50%、60%、70%、80%、90%或100%。

在一些实施方案中,导向RNA是CRISPR导向RNA并且可将Cas9核酸酶引导至基因组中的内源位置。导向RNA和CRISPR系统可用于敲除基因表达或激活基因表达。当与供体模板一起使用时,导向RNA和CRISPR系统还可用于敲入感兴趣的等位基因或基因。使用CRISPR系统的方法和导向RNA设计的考虑是本领域已知的。许多基于web的工具可用于设计导向RNA。例如,非限制性实例可来自MIT(例如http://crispr.mit.edu/)以及来自Broad Institute(https://portals.broadinstitute.org/gpp/public/analysis-tools/sgrna-design)。还可参见例如Hsu等人,Cell.2014年6月5日;157(6):1262-78;Sander等人,NatBiotechnol.2014年4月;32(4):347-55;Doench等人,Nat Biotechnol.2016年2月;34(2):184-191。

在一些实施方案中,转基因编码融合到转录激活复合物(例如包含VP64、P65、Rta和/或MPH)的Cas9和/或核酸酶缺陷型Cas9。

一般来讲,CRISPR激活系统包含融合至转录激活复合物(例如包含VP64、P65、Rta和/或MPH)的酶催化死亡的Cas9核酸酶(或核酸酶缺陷型Cas9(dCas9))。下文提供了编码VP64、P65、Rta和/或MPH的序列的非限制性实例。VP64、P65、Rta或MPH可包含与本文所述的任何VP64、P65、Rta和/或MPH序列至少70%(例如75%、80%、85%、90%、95%、98%、99%或100%)相同的序列。该Cas9融合蛋白可称为CRISPR激活剂。在CRISPR激活系统中使用靶向感兴趣基因的启动子和/或增强子区的导向RNA,以靶向dCas9转录激活复合物并驱动内源基因的表达。

在一些实施方案中,施用诱导型核酸(例如工程化核酸,包括表达载体)导致靶基因的表达下降至少10%、20%、30%、40%、50%、60%、70%、80%、90%或100%,该诱导性核酸包含与编码Cas9的转基因可操作地连接的TRE启动子和/或靶向感兴趣内源基因的导向RNA。在一些实施方案中,Cas9和导向RNA位于两个分开的表达载体上。在一些实施方案中,施用诱导型核酸(例如工程化核酸,包括表达载体)导致可操作连接的基因的表达提高10%、20%、30%、40%、50%、60%、70%、80%、90%、100%、150%、200%、300%、400%、500%、600%、700%、800%、900%或1000%,该诱导性核酸包含与编码融合至激活复合物的dCas9的转基因可操作地连接的TRE启动子和/或靶向感兴趣内源基因的启动子和/或增强子区的导向RNA。

本公开的转基因(例如编码以下的转基因:蛋白质、治疗性序列、基因靶向核酸、编码OCT4、SOX2、KLF4、c-Myc的核酸、转录因子或其同源物或变体,包括哺乳动物OCT4、哺乳动物SOX2和哺乳动物KLF4)可由单一核酸编码,或者单一核酸可编码两个或更多个转基因(例如,各自可操作地连接至不同的启动子,或全部可操作地连接至同一启动子)。例如,在某些实施方案中,核酸能够以任何顺序编码OCT4、SOX2、c-Myc、KLF4、OCT4和SOX2;OCT4和KLF4;SOX2和KLF4;或OCT4、SOX2和KLF4;OCT4、c-Myc和SOX2;OCT4、c-Myc和KLF4;SOX2、c-Myc和KLF4;或OCT4、SOX2、c-Myc和KLF4。

在某些实施方案中,核酸(例如工程化核酸,包括表达载体)编码至少一个(例如2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、30、40、50、60、70、80、90、或100个)转基因。

在某些实施方案中,转基因编码蛋白质。在某些实施方案中,蛋白质是人蛋白质。在某些实施方案中,蛋白质是非人蛋白质(例如哺乳动物(例如灵长类(例如猕猴、恒河猴);商业上相关的哺乳动物,诸如牛、猪、马、绵羊、山羊、猫和/或狗)和鸟类(例如商业上相关的鸟类,诸如鸡、鸭、鹅和/或火鸡))。如果两个或更多个转基因在一个载体上,它们可为任何顺序。词语“第一”、“第二”和“第三”并不意味着暗示载体上基因的顺序。

在某些实施方案中,转基因编码治疗性序列。治疗性序列也可称为本领域中适于基因治疗的基因。治疗性蛋白的非限制性实例包括抗体、酶、激酶、激素、生长因子、细胞因子、血浆蛋白、融合蛋白、膜裂解蛋白和凝血因子。在一些实施方案中,治疗性蛋白是致炎因子。在一些实施方案中,治疗性蛋白是抗炎剂。在一些实施方案中,治疗性蛋白是免疫调节剂。在一些实施方案中,治疗性蛋白是抗癌剂。在一些实施方案中,治疗性蛋白是代谢剂。在一些实施方案中,治疗性蛋白是抗病毒剂/杀病毒剂。在一些实施方案中,治疗性蛋白是抗细菌剂/杀细菌剂。

本文所述的转基因(例如治疗性序列、基因靶向核酸)可包含一个或多个氨基酸置换。可根据本领域普通技术人员已知的用于改变多肽序列的方法来制备变体,诸如在汇编此类方法的参考文献中所见的那些,例如Molecular Cloning:A Laboratory Manual,J.Sambrook等人编辑,第二版,Cold Spring Harbor Laboratory Press,Cold SpringHarbor,New York,1989,或Current Protocols in Molecular Biology,F.M.Ausubel等人编辑,John Wiley&Sons,Inc.,New York。氨基酸的保守取代包括在以下组内的氨基酸之间进行的取代:(a)M、I、L、V;(b)F、Y、W;(c)K、R、H;(d)A、G;(e)S、T;(f)Q、N;和(g)E、D。

含有表达必需元件的表达载体是可商购的并且是本领域普通技术人员已知的(参见例如Sambrook等人,Molecular Cloning:A Laboratory Manual,第四版,Cold SpringHarbor Laboratory Press,2012)。

在某些实施方案中,含有转基因(例如蛋白质编码基因、基因靶向核酸和/或治疗性基因)的核酸(例如工程化核酸,包括表达载体)存在于病毒载体(例如AAV载体)上。如本文所用,AAV载体通常包含侧接于表达盒(例如包含与转基因(例如治疗性序列、基因靶向核酸和/或蛋白质编码序列)可操作地连接的TRE启动子的核酸)的ITR。

在某些实施方案中,含有转基因(例如蛋白质编码基因、基因靶向核酸和/或治疗性基因)的核酸(例如工程化核酸,包括表达载体)存在于非病毒载体(例如用于瞬时转染的质粒)上。

在某些实施方案中,本公开的AAV载体中的两个ITR之间的碱基对的数目小于5千碱基(kb)(例如小于4.9kb、小于4.8kb、小于4.7kb、小于4.6kb、小于4.5kb、小于4.4kb、小于4.3kb、小于4.2kb、小于4.1kb、小于4kb、小于3.5kb、小于3kb、小于2.5kb、小于2kb、小于1.5kb、小于1kb或小于0.5kb)。在某些实施方案中,两个ITR之间的距离小于4.7kb的AAV载体能够以至少0.5×10^10颗粒形成单位/ml(pfu/ml)、至少1×10^10pfu/ml、至少5×10^10pfu/ml、至少1×10^11pfu/ml、至少5×10^11pfu/ml、至少1×10^12pfu/ml、至少2×10^12pfu/ml、至少3×10^12pfu/ml、至少4×10^12pfu/ml、至少5×10^12pfu/ml、至少6x10^12pfu/ml、至少7×10^12pfu/ml、至少8×10^12pfu/ml、至少9×10^12pfu/ml、或至少1×10^13pfu/ml的滴度包装到病毒中。

在某些实施方案中,本公开的核酸(例如工程化核酸,包括表达载体)为至少1千碱基(kb)(例如至少1kb、2kb、3kb、4kb、5kb、6kb、7kb、8kb、9kb、10kb、50kb或100kb)。在某些实施方案中,本公开的核酸(例如工程化核酸,包括表达载体)小于10kb(例如小于9kb、小于8kb、小于7kb、小于6kb、小于5kb、小于4kb、小于3kb、小于2kb或小于1kb)。

不受特殊的理论限制,与编码一个或两个转基因的单独核酸相比,编码多个转基因(例如蛋白质编码序列、基因靶向核酸和/或治疗性序列)的核酸(例如工程化核酸,包括表达载体)(例如AAV载体)在一个启动子下导致所有转基因在体内更有效的转导。在某些实施方案中,细胞(例如真核细胞或原核细胞)中携带本公开的转基因载体的重组病毒(例如慢病毒、腺病毒、甲病毒、牛痘病毒、逆转录病毒、疱疹病毒或AAV)的感染效率为至少20%(例如至少30%、至少40%、至少50%、至少60%、至少70%、至少80%、或至少90%或100%)。

重组病毒

本公开的方面提供了重组病毒(例如慢病毒、腺病毒、疱疹病毒、甲病毒、牛痘病毒、逆转录病毒或AAV)。重组病毒(例如慢病毒、腺病毒、甲病毒、牛痘病毒、逆转录病毒、疱疹病毒或AAV)可携带编码突变体rtTA的核酸(例如工程化核酸,包括表达载体)、包含转基因(例如治疗性序列、基因靶向核酸和/或蛋白质编码序列)的诱导型核酸(例如工程化核酸,包括表达载体),或它们的组合。

在某些实施方案中,重组病毒是重组AAV。在一些实施方案中,重组AAV具有组织特异性靶向能力,使得AAV的转基因将被特异性地递送至一个或多个预定组织。通常,AAV衣壳是决定AAV的组织特异性靶向能力的相关因素。AAV衣壳可以包含衍生自AAV1、AAV2、AAV3、AAV4、AAV5、AAV6、AAV7、AAV8、AAV9、AAV10、AAV11以及它们的变体的氨基酸序列。AAV血清型的组织特异性的非限制性实例提供在表1中。“x”表示指定的AAV血清型能够将转基因递送至特定组织。

表1.AAV血清型及其在特定组织中的效用的非限制性实例:

包含特定衣壳蛋白的重组AAV可使用任何合适的方法产生。参见例如美国专利申请公布US 2003/0138772,其以引用方式并入本文。AAV衣壳蛋白序列也是本领域已知的。参见例如已公布的PCT专利申请WO2010/138263,其以引用方式并入本文。通常,重组AAV在具有以下组分的宿主细胞中产生:(1)编码AAV衣壳蛋白的核酸序列或其片段,(2)编码功能性rep基因的核酸,(3)包含侧接于转基因(例如编码蛋白质的序列、基因靶向核酸和/或治疗性序列)的AAV反向末端重复序列的重组AAV载体,以及(4)允许将重组AAV载体包装到AAV衣壳蛋白中的辅助功能物。在某些实施方案中,辅助功能物经由本领域已知的辅助载体引入。

在某些情况下,根据常规实践,合适的宿主细胞系(例如HEK293T细胞)可用于产生本文所公开的重组AAV。编码一种或多种上述组分的一种或多种表达载体可以通过外源核酸引入宿主细胞中,该宿主细胞可在允许产生AAV颗粒的合适条件下培养。当需要时,辅助载体可用于促进复制,促进AAV颗粒的组装,或它们的任何组合。在某些实施方案中,重组AAV载体存在于与其他组分(例如,编码AAV衣壳蛋白的核酸序列或其片段、编码功能性rep基因的核酸以及允许将重组AAV载体包装到AAV衣壳蛋白中的辅助功能物)分开的核酸上。在某些实施方案中,宿主细胞可以稳定地表达产生AAV病毒所需的一种或多种组分。在这种情况下,可以将剩余组分引入宿主细胞中。可以收集细胞培养物的上清液,并且可以经由常规方法学收集其中所含的病毒颗粒。

本公开的组合物可包含单独的或与一种或多种其他重组病毒(例如编码具有一个或多个不同转基因的第二AAV)组合的本文所述的任何重组病毒(例如慢病毒、腺病毒、甲病毒、牛痘病毒、逆转录病毒、疱疹病毒或AAV)。在一些实施方案中,组合物包含各自具有一个或多个不同转基因的1、2、3、4、5、6、7、8、9、10种或更多种不同的病毒(例如慢病毒、腺病毒、甲病毒、牛痘病毒、逆转录病毒、疱疹病毒或AAV)。

在一些实施方案中,组合物还包含药学上可接受的载剂。考虑到重组病毒(例如慢病毒、腺病毒、甲病毒、牛痘病毒、逆转录病毒、疱疹病毒或AAV)所针对的适应症,本领域的技术人员可容易地选择合适的载剂。例如,一种合适的载剂包括盐水,其可以用多种缓冲溶液配制(例如磷酸盐缓冲盐水)。其他示例性载剂包括无菌盐水、乳糖、蔗糖、磷酸钙、明胶、葡聚糖、琼脂、果胶、花生油、芝麻油和水。载剂的选择并非本公开的限制。

任选地,除了重组病毒(例如慢病毒、腺病毒、甲病毒、牛痘病毒、逆转录病毒、疱疹病毒或AAV)和一种或多种载剂之外,本公开的组合物还可包含其他药物成分,诸如防腐剂或化学稳定剂。合适的示例性防腐剂包括氯代丁醇、山梨酸钾、山梨酸、二氧化硫、没食子酸丙酯、对羟基苯甲酸酯、乙基香兰素、甘油、苯酚和对氯苯酚。合适的化学稳定剂包括明胶和白蛋白。

重组病毒(例如慢病毒、腺病毒、甲病毒、牛痘病毒、逆转录病毒、疱疹病毒或AAV)以足以转染期望组织(例如眼组织,诸如角膜组织)的细胞并提供足够水平的基因转移和表达而无不适副作用的量施用。药学上可接受的施用途径的实例包括但不限于直接递送至所选择的器官(例如基质内递送至眼)、经口、吸入(包括鼻内和气管内递送)、眼内、静脉内、肌内、皮下、真皮内、瘤内和其他肠胃外施用途径。可根据需要联用施用途径。

实现特定治疗效果所需的重组病毒(例如慢病毒、腺病毒、甲病毒、牛痘病毒、逆转录病毒、疱疹病毒或AAV)病毒体的剂量,例如,以基因组拷贝数/每公斤体重(GC/kg)计的剂量单位将基于若干因素而变化,包括但不限于:重组病毒(例如慢病毒、腺病毒、甲病毒、牛痘病毒、逆转录病毒、疱疹病毒或AAV)病毒体施用途径、实现治疗效果所需的基因或RNA表达水平、所治疗的具体疾病或障碍,以及基因或RNA产物的稳定性。基于上述因素以及其他因素,本领域的技术人员可以容易地确定治疗患有特定疾病或障碍的患者的重组病毒(例如慢病毒、腺病毒、甲病毒、牛痘病毒、逆转录病毒、疱疹病毒或AAV病毒体)剂量范围。

有效量的重组病毒(例如慢病毒、腺病毒、甲病毒、牛痘病毒、逆转录病毒、疱疹病毒或AAV)是足以靶向感染动物,靶向期望组织的量。在一些实施方案中,有效量的重组病毒(例如慢病毒、腺病毒、甲病毒、牛痘病毒、逆转录病毒、疱疹病毒或AAV)是足以产生稳定的体细胞转基因动物模型的量。有效量将主要取决于诸如物种、年龄、体重、受试者的健康状态和要靶向的组织等因素,并因此可以在动物和组织之间变化。例如,重组病毒(例如慢病毒、腺病毒、甲病毒、牛痘病毒、逆转录病毒、疱疹病毒或AAV)的有效量通常为约1ml至约100ml含有约10

在一些实施方案中,给受试者施用重组病毒(例如慢病毒、腺病毒、甲病毒、牛痘病毒、逆转录病毒、疱疹病毒或AAV)的剂量每日历日(例如24小时期间)不超过一次。在一些实施方案中,给受试者施用重组病毒(例如慢病毒、腺病毒、甲病毒、牛痘病毒、逆转录病毒、疱疹病毒或AAV)的剂量每2、3、4、5、6或7个日历日不超过一次。在一些实施方案中,给受试者施用重组病毒(例如慢病毒、腺病毒、甲病毒、牛痘病毒、逆转录病毒、疱疹病毒或AAV)的剂量每日历周(例如7个日历日)不超过一次。在一些实施方案中,给受试者施用重组病毒(例如慢病毒、腺病毒、甲病毒、牛痘病毒、逆转录病毒、疱疹病毒或AAV)的剂量不超过两周一次(例如两个日历周一次)。在一些实施方案中,给受试者施用重组病毒(例如慢病毒、腺病毒、甲病毒、牛痘病毒、逆转录病毒、疱疹病毒或AAV)的剂量每日历月不超过一次(例如30个日历日一次)。在一些实施方案中,给受试者施用重组病毒(例如慢病毒、腺病毒、甲病毒、牛痘病毒、逆转录病毒、疱疹病毒或AAV)的剂量每六个日历月不超过一次。在一些实施方案中,给受试者施用重组病毒(例如慢病毒、腺病毒、甲病毒、牛痘病毒、逆转录病毒、疱疹病毒或AAV)的剂量每日历年(例如365天或闰年366天)不超过一次。

在一些实施方案中,重组病毒(例如慢病毒、腺病毒、甲病毒、牛痘病毒、逆转录病毒、疱疹病毒或AAV)组合物被配制成减少组合物中AAV颗粒的聚集,特别是在存在高重组病毒(例如慢病毒、腺病毒、甲病毒、牛痘病毒、逆转录病毒、疱疹病毒或AAV)浓度(例如~10

在一些实施方案中,核酸以非病毒方式递送(例如,不在病毒载体上和/或不在病毒中)。在一些实施方案中,编码与TRE启动子可操作地连接的转基因和/或突变体rtTA(例如rtTA4)的核酸(例如RNA或DNA)以脂质体施用。在一些实施方案中,核酸是RNA(例如mRNA)。在一些实施方案中,编码与TRE启动子可操作地连接的转基因和/或突变体rtTA(例如rtTA4)的核酸(例如RNA或DNA)以纳米颗粒施用。

包含突变体rtTA或其核酸(例如工程化核酸,包括表达载体)的系统和重组细胞

本公开的方面还提供了包含突变体rtTA(例如rtTA蛋白)和/或编码其突变体rtTA的核酸(例如工程化核酸,包括表达载体)的系统或细胞。细胞可为真核或原核,并且可来自于任何组织(例如耳、鼻、口(包括齿龈和齿根)、骨、肺、乳腺、乳房、胰腺、胃、食管、肌肉(包括心肌)、肝、血管、皮肤(包括毛发)、心脏、脑、神经组织、肾、睾丸、前列腺、阴茎、泄殖腔、鳍、卵巢或肠)。

在某些实施方案中,系统或细胞包含编码突变体rtTA和与含有Tet-O序列的诱导型启动子可操作地连接的转基因两者的核酸(例如工程化核酸,包括表达载体)。在某些实施方案中,系统或细胞包含编码突变体rtTA的核酸(例如工程化核酸,包括表达载体)以及第二核酸(例如工程化核酸,包括表达载体),该第二核酸包含与含有Tet-O序列的诱导型启动子可操作地连接的转基因。在某些实施方案中,系统或细胞包含编码一个或多个转基因(例如至少1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90或100个转基因)的多个(例如至少1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90或100个)表达载体。

在一些实施方案中,将编码突变体rtTA(例如rtTA4)和/或TRE启动子(例如TRE3G、TRE2和/或P tight)的核酸整合到细胞的基因组中。在一些实施方案中,将编码突变体rtTA(例如rtTA4)和/或TRE启动子(例如TRE3G、TRE2和/或P tight)的核酸整合到受试者的基因组中(例如以产生转基因受试者)。可以使用任何合适的方法来整合编码突变体rtTA(例如rtTA4)和/或TRE启动子的核酸。参见例如Cho等人,Curr Protoc Cell Biol.2009年3月;CHAPTER:Unit–19.11。在一些实施方案中,使用CRISPR将突变体rtTA和/或TRE启动子敲入细胞或受试者中。参见例如Aida等人,Genome Biol.2015年4月29日;16:87。作为非限制性实例,可将rtTA整合到小鼠的rosa 26基因座中,并且/或者可将TRE整合到Col1a1基因座中。

在一些实施方案中,体外产生重组细胞并施用给有此需要的受试者。

组合物(例如药物组合物)

本公开的方面提供了组合物,该组合物包含任何突变体rtTA、重组细胞、编码rtTA的核酸(例如工程化核酸、表达载体、质粒DNA和/或RNA)、编码转基因的诱导型载体、编码rtTA和/或转基因的重组病毒或它们的组合。可将任何突变体rtTA、重组细胞、编码rtTA的核酸(例如工程化核酸、表达载体、质粒DNA和/或RNA)、编码转基因的诱导型载体、编码rtTA和/或转基因的重组病毒或它们的组合与药学上可接受的赋形剂一起配制到药物组合物中。药学上可接受的赋形剂和载剂溶液的配制是本领域的技术人员熟知的,正如开发适当的给药和治疗方案以在各种治疗方案中使用本文所述的特定组合物。通常,这些制剂可包含至少约0.1%的活性化合物或更多,但是一种或多种活性成分的百分比当然可以变化,并且可以方便地为总制剂重量或体积的约1%或2%至约70%或80%或更多。自然地,活性化合物在各治疗上有用的组合物中的量能够按使得以任何给定的化合物单位剂量得到合适剂量的方式制备。制备此类药用制剂的技术人员应当考虑诸如溶解度、生物利用率、生物半衰期、施用途径、产品保存期及其他药理学考虑因素,因此,多种剂量和治疗方案可能是希望的。

在一些实施方案中,本文所述的突变体rtTA、重组细胞、编码rtTA的核酸(例如工程化核酸、表达载体、质粒DNA和/或RNA)、编码转基因的诱导型载体和/或重组病毒是适当配制的,本文所公开的药物组合物被直接递送至受试者的靶组织和/或器官,例如直接递送至眼、耳、鼻、口(包括齿龈和齿根)、骨、肺、乳腺、乳房、胰腺、胃、食管、肌肉(包括心肌)、肝、血管、皮肤(包括毛发)、心脏、脑、神经组织、肾、睾丸、前列腺、阴茎、泄殖腔、鳍、卵巢或肠。

然而,在某些情况下,可能需要单独地或另外地经由另一途径递送重组病毒、重组细胞、核酸(例如工程化核酸)和/或突变体rtTA(例如rtTA4),例如静脉内、皮内、动脉内、病灶内、瘤内、颅内、关节内、前列腺内、胸膜内、鼻内、玻璃体内、阴道内、直肠内、局部、瘤内、肌内、腹膜内、皮下、结膜下、膀胱内、粘膜、心包内、脐内、眼内、经口、外用、局部、全身地、注射、输注、连续输注、直接局部灌注浸浴靶细胞、经由导管、以乳膏、以脂质组合物(例如脂质体)。

在一些实施方案中,如美国专利No.5,543,158;5,641,515和5,399,363(各自特别地全文以引用方式并入本文)所述的施用形式可用于递送重组病毒(例如慢病毒、腺病毒、甲病毒、牛痘病毒、逆转录病毒、疱疹病毒或AAV)。在一些实施方案中,优选的施用模式是通过基质内注射。

适于注射应用的药物形式包括无菌水溶液或分散体,以及用于无菌可注射溶液或分散体的临时配制的无菌粉末。也可在甘油、液态聚乙二醇以及它们的混合物和油中制备分散体。在正常储存和使用条件下,这些制剂含有防腐剂,以便阻止微生物的生长。在许多情况下,该形式是无菌的并且是达到易于注射程度的流体。它在制造和储存条件下必须是稳定的,并且必须防止微生物诸如细菌和真菌的污染作用。载剂可以是溶剂或分散介质,含有例如水、乙醇、多元醇(例如甘油、丙二醇和液态聚乙二醇等)、它们合适的混合物和/或植物油。例如,可通过使用包衣诸如卵磷脂,在分散体的情况下通过维持所需粒度和通过使用表面活性剂来维持适当的流动性。可通过各种抗细菌剂和抗真菌剂,例如对羟基苯甲酸酯、氯代丁醇、苯酚、山梨酸、硫柳汞等预防微生物的作用。在许多情况下,优选的是包括等渗剂,例如糖或氯化钠。通过在组合物中使用延迟吸收的试剂例如单硬脂酸铝和明胶,可以实现可注射组合物的延长吸收。

对于可注射水溶液的施用,例如,溶液可以根据需要进行适当的缓冲处理,并且液体稀释剂首先使用足够的盐水或葡萄糖进行等渗处理。这些特定的水溶液尤其适于静脉内、肌内、皮下和腹膜内施用。就这一点而言,可以采用合适的无菌水性介质。例如,可以将一个剂量溶于1ml等渗NaCl溶液中,并加入到1000ml皮下输液中或在指定的输注部位注射(参见例如“Remington's Pharmaceutical Sciences”第15版,第1035-1038和1570-1580页)。取决于宿主的病况,有必要产生剂量上的一些变化。负责施用的人将在任何事件中确定对于各宿主的适当剂量。

无菌可注射溶液剂通过将所需量的活性重组病毒(例如慢病毒、腺病毒、甲病毒、牛痘病毒、逆转录病毒、疱疹病毒或AAV)与本文列举的各种其他成分按需要引入适当的溶剂中,然后过滤灭菌来制备。通常,通过将各种灭菌活性成分引入含有基本分散基质和所需要的来自以上列举的那些的其他成分的无菌载剂中来制备分散体。就制备无菌可注射溶液的无菌粉末而言,制备的优选方法是真空干燥和冻干技术,该技术得到活性成分加上任何附加所需的来自其先前无菌过滤溶液的成分的粉末。

本文所公开的重组病毒(例如慢病毒、腺病毒、甲病毒、牛痘病毒、逆转录病毒、疱疹病毒或AAV)组合物还可配制成中性或盐的形式。药学上可接受的盐包括酸加成盐(与蛋白质的游离氨基形成)并且其与无机酸或有机酸形成,所述无机酸诸如盐酸或磷酸,所述有机酸诸如乙酸、草酸、酒石酸、扁桃酸等。与游离羧基形成的盐还可例如源于无机碱,诸如钠、钾、铵、钙或铁的氢氧化物,以及有机碱诸如异丙胺、三甲胺、组氨酸、普鲁卡因等。在配制后,以与剂量制剂兼容的方式并以治疗有效的量施用该溶液。制剂易于以各种剂型施用,诸如可注射溶液、药物释放胶囊等。

载剂包括任何和所有的溶剂、分散介质、媒介物、包衣、稀释剂、抗细菌剂和抗真菌剂、等渗剂和延迟吸收剂、缓冲液、载剂溶液、悬浮液、胶体等。此类介质和试剂对于药学活性物质的使用在本领域中是公知的。补充的活性成分也可以被引入组合物中。

递送媒介物诸如脂质体、纳米胶囊、微粒、微球、脂质颗粒、囊泡等可用于将本公开的组合物引入合适的宿主细胞中。作为非限制性实例,重组病毒(例如慢病毒、腺病毒、甲病毒、牛痘病毒、逆转录病毒、疱疹病毒或AAV)载体递送的转基因可以被配制成用于以包封在脂质颗粒、脂质体、囊泡、纳米球或纳米颗粒等中来递送。

此类制剂优选地可用于引入本文所公开的核酸(例如工程化核酸,包括表达载体)或重组病毒(例如慢病毒、腺病毒、甲病毒、牛痘病毒、逆转录病毒、疱疹病毒或AAV)构建体的药学上可接受的制剂。脂质体的形成和应用通常是本领域技术人员已知的。最近,脂质体被开发为具有改善的血清稳定性和循环半衰期(美国专利No.5,741,516)。此外,已经描述了作为潜在药物载剂的脂质体和脂质体样制剂的各种方法(美国专利No.5,567,434;5,552,157;5,565,213;5,738,868和5,795,587;其各自以引用方式并入本文)。

脂质体已经成功地用于通常对通过其他方法转染产生抵抗的许多细胞类型。此外,脂质体没有DNA长度限制,其是基于病毒的递送系统中的典型特征。脂质体已经有效地用于将基因、药物、放射治疗剂、病毒、转录因子和变构效应物引入各种培养的细胞系和动物中。此外,已经完成了检验脂质体介导的药物递送的有效性的几个成功的临床试验。

脂质体由在水性介质中分散的磷脂形成并且自动形成多层同心双层囊泡(也称为多层脂质体(MLV))。MLV通常具有25nm至4μm的直径。对MLV进行超声处理导致小的单层囊泡(SUV)的形成,其直径为200至500.ANG.,在核中含有水溶液。

另选地,可以使用重组病毒(例如慢病毒、腺病毒、甲病毒、牛痘病毒、逆转录病毒、疱疹病毒或AAV)的纳米胶囊制剂。纳米胶囊可通常以稳定和可重现的方式包裹物质。为了避免胞内聚合过载引起的副作用,此类超细颗粒(大小约为0.1μm)应当利用能够在体内降解的聚合物来设计。考虑使用满足这些要求的可生物降解的聚烷基氰基丙烯酸纳米颗粒。

试剂盒和相关的组合物

在一些实施方案中,本文所述的试剂可以组装到药物或诊断或研究试剂盒中,以促进其用于治疗、诊断或研究应用中。试剂盒可以包括容纳本公开的组分和使用说明的一个或多个容器。具体地,此类试剂盒可以包括本文所述的一种或多种试剂,以及描述预期应用和这些试剂的适当用途的说明。在某些实施方案中,试剂盒中的试剂可为适于特定应用和试剂的施用方法的药物制剂和剂量。用于研究目的的试剂盒可以包含用于运行各种实验的适当浓度或量的组分。

在一些实施方案中,本公开涉及试剂盒,该试剂盒包含编码突变体rtTA(例如rtTA4)的核酸(例如工程化核酸,包括表达载体),其可用于例如产生重组病毒(例如慢病毒、腺病毒、甲病毒、牛痘病毒、逆转录病毒、疱疹病毒或AAV)。试剂盒可以包括容纳编码突变体rtTA(例如rtTA4)的核酸(例如工程化核酸,包括表达载体)的容器。试剂盒还可包括容纳编码转基因(例如与疾病如视网膜疾病相关的基因)的核酸(例如工程化核酸,包括表达载体)的第二容器。在某些实施方案中,转基因是编码蛋白质的序列、基因靶向核酸和/或治疗性序列。在一些实施方案中,试剂盒还包括用于产生重组病毒(例如慢病毒、腺病毒、甲病毒、牛痘病毒、逆转录病毒、疱疹病毒或AAV)的说明。

在一些实施方案中,本公开涉及包括容纳本文所述的任何工程化核酸(例如表达载体)或重组病毒的容器的试剂盒。例如,试剂盒可包含编码诱导剂的核酸(例如工程化核酸,包括表达载体)或重组病毒。在一些实施方案中,编码突变体rtTA4的核酸(例如工程化核酸,包括表达载体)包含与SEQ ID NO:17至少70%相同的序列。在一些实施方案中,编码诱导剂的核酸(例如工程化核酸,包括表达载体)由与SEQ ID NO:17至少70%相同的序列组成。在一些实施方案中,编码突变体rtTA4的核酸(例如工程化核酸,包括表达载体)包含与结蛋白-rtTA4(SEQ ID NO:30)至少70%相同的序列。在一些实施方案中,编码诱导剂的核酸(例如工程化核酸,包括表达载体)由与结蛋白-rtTA4(SEQ ID NO:30)至少70%相同的序列组成。试剂盒还可包含编码与含有Tet-O的启动子(例如TRE启动子)可操作地连接的任何转基因(例如治疗性序列、基因靶向核酸和/或编码蛋白质的序列)的核酸(例如工程化核酸,包括表达载体)或重组病毒。编码转基因(例如多个转基因)的载体的非限制性实例提供于SEQ ID NO:16中。在一些实施方案中,编码转基因的核酸(例如工程化核酸,包括表达载体)包含SEQ ID NO:16。

试剂盒可被设计成便于研究者使用本文所述的方法并且可以采取多种形式。在适用的情况下,试剂盒的每种组合物能够以液体形式(例如以溶液形式)或以固体形式(例如干粉)提供。在某些情况下,一些组合物可为可组成的或以其他方式可处理的(例如,成为活性形式),例如通过添加合适的溶剂或其他物类(例如水或细胞培养介质),其可以与或可以不与试剂盒一起提供。如本文所用,“说明”可定义说明和/或推广的组分,并且典型地涉及本公开包装上的书面说明或与本公开包装相关的书面说明。说明还可以包括以任意方式提供的任意口头或电子说明,使得用户将清楚地认识到该说明将与试剂盒相关联,例如视听(例如录像带、DVD等)、因特网和/或基于web的通信等。书面说明可为监管药品或生物制品的制造、使用或销售的政府机构拟定的形式,该说明还可以反映机构批准针对动物施用的制造、使用或销售。

试剂盒可以在一个或多个容器中包含本文所述的任何一种或多种组分。例如,在一个实施方案中,试剂盒可包括用于混合试剂盒的一种或多种组分和/或分离和混合样品并应用于受试者的说明。试剂盒可包括容纳本文所述的试剂的容器。试剂可为液体、凝胶或固体(粉末)的形式。试剂可以无菌地制备,包装在注射器中并冷藏装运。另选地,其可容纳在小瓶或储存用的其他容器中。第二容器可具有无菌制备的其他试剂。另选地,试剂盒可包括在注射器、小瓶、管或其他容器中预混合并装运的活性剂。试剂盒可以具有将试剂施用给动物所需的一种或多种或所有组分,诸如注射器、局部施用装置或静脉注射(iv)针管和袋,特别是在用于产生特定体动物模型的试剂盒的情况下。

试剂盒可具有多种形式,诸如泡罩袋、收缩包裹袋、真空可密封袋、可密封热成型托盘、或类似的袋或托盘形式,以及松散地包装在袋内的附件、一个或多个管、容器、盒或袋。可在加入附件之后对试剂盒进行灭菌,由此允许容器中的各个附件以其他方式展开。试剂盒可使用任何适当的灭菌技术进行灭菌,诸如辐射灭菌、热灭菌或本领域已知的其他灭菌方法。该试剂盒还可根椐具体应用包括其他组分,例如容器、细胞介质、盐、缓冲液、试剂、注射器、针、用于施用或除去消毒剂的织物诸如纱布、一次性手套,在施用前用于这些试剂的支持物等。

治疗应用

包含本文所述的突变体rtTA(例如rtTA4)、编码突变体rtTA的核酸(例如工程化核酸,包括表达载体)、编码转基因的诱导型核酸(例如工程化核酸,包括表达载体)、编码突变体rtTA或编码与诱导型启动子可操作地连接的转基因的重组病毒的任何组合物(例如药物组合物)可用于调节(例如抑制或诱导)细胞重编程、组织修复、组织再生、治疗疾病、器官再生、逆转衰老,或它们的任何组合。组合物可用于调节细胞重编程、组织修复、组织存活、组织再生、组织生长、组织功能、器官再生、器官存活、器官功能或它们的任何组合。调节可包括体内或体外诱导细胞重编程、逆转衰老、改善组织功能、改善器官功能、组织修复、组织存活、组织再生、组织生长、血管生成、瘢痕形成、衰老外观、器官再生、器官存活、改变衍生自动物的农产品的味道和品质、治疗疾病或它们的任何组合,可以施用至体内的细胞、组织或器官(例如受试者的部分),或者可施用至离体的细胞、组织或器官。如本文所用,调节可指任何类型的调节,包括诱导或促进、抑制和/或停止。血管生成是指新血管的生长。

在某些情况下,病毒载体(例如慢病毒、腺病毒、甲病毒、牛痘病毒、逆转录病毒、疱疹病毒或AAV载体)以重组病毒(例如慢病毒、腺病毒、甲病毒、牛痘病毒、逆转录病毒、疱疹病毒或AAV)施用。

不受特殊的理论限制,一种或多种转基因(例如OCT4、SOX2、KLF4、任何转录因子、任何蛋白质编码序列、任何基因靶向核酸和/或任何治疗性序列)的瞬时表达可导致细胞的部分重编程。例如,部分重编程可诱导完全分化的细胞成为多能的。在一些情况下,一种或多种转录因子(例如,任何转录因子,包括OCT4、SOX2、KLF4和/或c-MYC)的延长表达(例如,持续表达至少1天、至少5天、至少1周、或至少1个月)导致细胞的完全重编程。例如,细胞可以完全重编程为多能细胞(例如诱导多能细胞)。

为了实践该实施方案,可将有效量的突变体rtTA(例如rtTA4)连同包含与TRE启动子(例如TRE2、P tight或TRE3G启动子)可操作地连接的待表达转基因(蛋白质编码序列、基因靶向核酸和/或治疗性序列)的核酸(例如工程化核酸,包括表达载体)一起施用至细胞、组织或受试者。在某些实施方案中,突变体rtTA(例如rtTA4)作为蛋白质施用。在某些实施方案中,突变体rtTA(例如rtTA4)以核酸(例如工程化核酸,包括表达载体)施用。

在一些实施方案中,编码突变体rtTA4和/或与TRE启动子(例如TRE3G、P tight或TRE2启动子)可操作地连接的转基因的核酸(例如工程化核酸)不为病毒载体。例如,核酸可为质粒(例如质粒DNA)或RNA(例如mRNA)。作为非限制性实例,本公开的工程化核酸(例如RNA,包括mRNA,或DNA)可以配制到用于递送的纳米颗粒中。参见例如Dong等人,NanoLett.2016年2月10日;16(2):842-8。在一些实施方案中,纳米颗粒包含乙酰化半乳糖。参见例如Lozano-Torres等人,J Am Chem Soc.2017年7月5日;139(26):8808-8811。在一些实施方案中,将工程化核酸(例如RNA,包括mRNA,或DNA)电穿孔或转染到细胞中。在某些实施方案中,工程化核酸作为裸核酸(例如裸DNA或裸RNA)递送。在一些实施方案中,裸核酸是质粒DNA。在一些实施方案中,核酸(例如工程化核酸)以脂质体施用。

在一些实施方案中,编码突变体rtTA4和/或编码与TRE启动子(例如TRE3G、Ptight或TRE2启动子)可操作地连接的转基因的核酸(例如工程化核酸)是病毒载体。病毒载体的非限制性实例包括慢病毒载体、腺病毒载体、甲病毒载体、牛痘病毒载体、疱疹病毒载体、腺病毒(AAV)载体。

在某些实施方案中,核酸(例如编码突变体rtTA(例如rtTA4)的工程化核酸)以病毒(例如慢病毒、腺病毒、甲病毒、牛痘病毒、逆转录病毒、疱疹病毒或AAV)施用。在某些实施方案中,包含与TRE启动子(例如TRE3G、P tight、或TRE2启动子)可操作地连接的转基因的核酸(例如工程化核酸,包括表达载体)以病毒(例如慢病毒、腺病毒、甲病毒、牛痘病毒、逆转录病毒、疱疹病毒或AAV)施用。

可添加合适量的四环素(例如强力霉素)以驱动TRE启动子(例如TRE3G、P tight、或TRE2启动子)的表达。待添加的四环素的合适量可由本领域的普通技术人员确定并且可取决于多种因素,包括药物赋形剂的类型(如果有的话)、细胞类型、组织类型、或受试者的任何特征(例如,体重、病史、遗传学等)。

在一些实施方案中,四环素以下列方式施用:静脉内、皮内、动脉内、病灶内、瘤内、颅内、关节内、前列腺内、胸膜内、鼻内、玻璃体内、阴道内、直肠内、局部、瘤内、肌内、腹膜内、皮下、结膜下、膀胱内、粘膜、心包内、脐内、眼内、经口、外用、局部、全身地、注射、输注、连续输注、直接局部灌注浸浴靶细胞、经由导管、以乳膏或以脂质组合物。

在一些实施方案中,编码突变体rtTA和/或与TRE启动子可操作地连接的转基因的重组病毒和/或表达载体全身施用。在一些实施方案中,编码突变体rtTA和/或与TRE启动子可操作地连接的转基因的重组病毒和/或表达载体局部施用(例如直接施用至感兴趣的组织或器官,包括眼、耳、鼻、口(包括齿龈和齿根)、骨、肺、乳腺、乳房、胰腺、胃、食管、肌肉(包括心肌)、肝、血管、皮肤(包括毛发)、心脏、脑、神经组织、肾、睾丸、前列腺、阴茎、泄殖腔、鳍、卵巢或肠)。

在一些实施方案中,病毒和/或表达载体与四环素(例如强力霉素)一起施用。在一些实施方案中,含有TRE启动子的病毒和/或表达载体与四环素(例如强力霉素)分开施用。例如,本文所述的含有TRE启动子的任何病毒和/或表达载体可以全身施用,并且四环素可以局部施用(例如施用至感兴趣的器官或组织)。在一些实施方案中,本文所述的含有TRE启动子的任何病毒和/或表达载体可局部施用(例如直接施用至感兴趣的组织或器官,包括眼、耳、鼻、口(包括齿龈和齿根)、骨、肺、乳腺、乳房、胰腺、胃、食管、肌肉(包括心肌)、肝、血管、皮肤(包括毛发)、心脏、脑、神经组织、肾、睾丸、前列腺、阴茎、泄殖腔、鳍、卵巢或肠),并且四环素和/或突变体rtTA(例如突变体rtTA蛋白或编码突变体rtTA的核酸)可全身施用。作为非限制性实例,含有TRE启动子的病毒和/或表达载体直接施用(例如注射)到受试者的眼中,并且四环素(例如强力霉素)和/或突变体rtTA(例如突变体rtTA蛋白或编码突变体rtTA的核酸)全身施用(例如作为丸剂口服)。在一些实施方案中,将含有TRE启动子的核酸(例如工程化核酸)以与突变体rtTA(例如突变体rtTA蛋白或编码突变体rtTA的核酸)相同的途径施用至受试者。在一些实施方案中,将含有TRE启动子的核酸(例如工程化核酸)以与突变体rtTA(例如突变体rtTA蛋白或编码突变体rtTA的核酸)不同的途径施用至受试者。

在本公开的某些实施方案中,该方法还包括在施用四环素之后从细胞、组织、或受试者撤除四环素(例如强力霉素),其可用于终止转基因的表达。可在施用四环素后至少1小时、至少2小时、至少3小时、至少4小时、至少5小时、至少10小时、至少24小时、至少2天、至少3天、至少4天、至少5天、至少6天、至少1周、至少2周、至少3周、至少1月或至少1年撤除四环素。在某些实施方案中,撤除四环素导致转基因表达可检测的降低(例如至少5%、至少10%、至少20%、至少30%、至少40%、至少50%、至少60%、至少70%、至少80%、至少90%或100%降低)。例如,可在撤除四环素后至少1小时、至少2小时、至少3小时、至少4小时、至少5小时、至少10小时、至少24小时、至少2天、至少3天、至少4天、至少5天、至少6天、至少1周、至少2周、至少3周、至少1月或至少1年检测到转基因表达的降低。

不受特殊的理论限制,与rtTA3(SEQ ID NO:11)相比,rtTA4中的四个突变(与SEQID NO:11中的G12、F67、R171或G72相对应的位置处的突变,例如G12S、G72V或G72P、F67S和R171K)导致更低的渗漏,因为在不存在四环素的情况下,这些突变降低了rtTA4对启动子的结合亲和力。在一些实施方案中,在不存在四环素(例如强力霉素)的情况下,采用rtTA4(例如SEQ ID NO:13)的转基因表达的量比检测到的采用rtTA3(例如SEQ ID NO:11)的转基因表达的量低至少10%、20%、30%、40%、50%、60%、70%、80%、90%或100%。不受特殊的理论限制,与rtTA3(SEQ ID NO:11)相比,rtTA4中的四个突变(与SEQ ID NO:11中的G12、F67、R171或G72相对应的位置处的突变,例如G12S、G72V或G72P、F67S和R171K)导致对撤除四环素的更强敏感性,因为这些突变降低了rtTA对四环素的结合亲和力。在一些实施方案中,与采用rtTA3(例如SEQ ID NO:11)的转基因表达的量相比,当四环素(例如强力霉素)撤除给定的时间时,采用rtTA4(例如SEQ ID NO:13)的转基因表达的量降低至少快2倍、3倍、4倍、5倍、6倍、7倍、8倍、9倍、10倍、20倍、30倍、40倍、50倍、60倍、70倍、80倍、90倍或100倍。

编码突变体rtTA(例如rtTA4)的核酸(例如工程化核酸,包括表达载体)、包含与转基因(例如治疗性序列、基因靶向核酸和/或蛋白质编码序列)可操作地连接的TRE启动子(例如TRE3G、TRE2或P tight启动子)的核酸(例如工程化核酸,包括表达载体)、以及四环素的施用使细胞中转基因的表达提高至少10%、至少20%、至少30%、至少40%、至少50%、至少60%、至少70%、至少80%、至少90%、至少100%、至少200%、至少300%、至少400%、至少500%、至少500%、至少600%、至少700%、至少800%、至少900%、或至少1,000%。可通过常规方法测定基因表达,包括酶联免疫吸附测定(ELISA)、蛋白质印迹和RNA定量(例如逆转录聚合酶链反应)。

可将本文所述的药物组合物施用给有此需要的受试者。受试者的非限制性实例包括任何动物(例如哺乳动物,包括人)。受试者可被怀疑患有病况,处于病况的风险中,或患有病况。例如,病况可为损伤或疾病,并且病况可影响任何组织(例如耳、鼻、口(包括齿龈和齿根)、骨、肺、乳腺、乳房、胰腺、胃、食管、肌肉(包括心肌)、肝、血管、皮肤(包括毛发)、心脏、脑、神经组织、肾、睾丸、前列腺、阴茎、泄殖腔、鳍、卵巢或肠)。病况、疾病和障碍的非限制性实例包括急性损伤、神经变性疾病、慢性疾病、增殖性疾病、心血管疾病、遗传病、炎性疾病、自身免疫性疾病、神经学疾病、血液学疾病、疼痛病况、精神障碍、代谢障碍、癌症、衰老、年龄相关的疾病以及影响受试者中任何组织的疾病。在一些实施方案中,疾病是眼病。

在某些实施方案中,病况是衰老。所有动物通常经历一段生长和成熟期,紧接着一段进行性和不可逆的生理衰退,以死亡告终。从出生到死亡的时间长度被称为生物体的寿命期,并且每种生物体具有特征性平均寿命。衰老是时间流逝基础上变化的物理表现,如由平均寿命的百分比所测量。

在一些情况下,衰老的特征可以是相当明显的。例如,年老的人的特征包括皮肤皱纹、头发花白、脱发和白内障,以及色素沉着过多、骨质疏松症、大脑皮层萎缩、淋巴衰竭、胸腺萎缩,II型糖尿病、动脉粥样硬化、癌症和心脏病的发病率增高。Nehlin等人(2000),Annals NY Acad Sci 980:176-79。哺乳动物衰老的其他方面包括体重减轻、脊柱后凸(驼背脊椎)、缺乏活力、淋巴萎缩、骨密度减小、真皮增厚和皮下脂肪组织、耐受应力(包括热或冷、创伤、麻醉和造血前体细胞消融)能力降低、肝脏病理、小肠绒毛萎缩、皮肤溃疡、淀粉样沉积物和关节疾病。Tyner等人(2002),Nature 415:45-53。

本领域的技术人员认识到衰老过程也表现在细胞水平以及线粒体中。细胞衰老表现为倍增能力丧失、细胞凋亡水平提高、分化表型改变和代谢改变,例如蛋白质合成和周转水平降低。

考虑到细胞和生物体衰老的程序化性质,可以借助于与衰老相关的表型特征来评价细胞或生物体的“生物学年龄”。例如,可从以下模式推导生物学年龄:基因表达、抗应激性(例如氧化性或基因毒应激)、细胞增殖速率、以及细胞的代谢特征(例如,蛋白质合成和周转速率、线粒体功能、泛醌生物合成、胆固醇生物合成、细胞内ATP水平、细胞内克雷布斯循环中间物水平、葡萄糖代谢、核酸代谢、核糖体翻译速率等)。如本文所用,“生物学年龄”是基于细胞或生物体的分子特征的细胞或生物体的年龄的量度。生物学年龄不同于“时间年龄”,其是指如由天、月和年所测量的细胞或生物体的年龄。

可通过多种方法,例如通过以下项中的一种或多种来确定生物体,例如无脊椎动物(例如蠕虫或苍蝇)或脊椎动物(例如啮齿动物,例如小鼠)的衰老速度:a)评估细胞或生物体的寿命;(b)评估具有生物学年龄依赖性表达模式的细胞或生物体中基因转录物或基因产物的存在或丰度;(c)评价细胞或生物体对应激,例如基因毒应激(例如依托泊苷、紫外线照射、暴露于诱变剂等)或氧化应激的抗性;(d)评价细胞或生物体的一种或多种代谢参数;(e)评价生物体中存在的细胞或一组细胞的增殖能力;和(f)评价细胞或生物体的物理外观或行为。在一个示例中,评价衰老速度包括直接测量一组动物(例如一组遗传匹配的动物)的平均寿命,并将所得平均值与对照组动物(例如,未接受测试化合物但与接受测试化合物的动物组遗传匹配的一组动物)的平均寿命进行比较。另选地,可以通过测量与年龄相关的参数来确定生物体的衰老速度。年龄相关的参数的实例包括:外观,例如可见的衰老迹象;一个或多个基因或蛋白质(例如具有年龄相关表达模式的基因或蛋白质)的表达;耐氧化应激性;代谢参数(例如,蛋白质合成或降解、泛醌生物合成、胆固醇生物合成、ATP水平、葡萄糖代谢、核酸代谢、核糖体翻译速率等);以及细胞增殖(例如,视网膜细胞、骨细胞、白细胞等的增殖)。

所述方法可用于预防或减轻神经变性和相关的周围神经病变。神经变性疾病包括帕金森病、阿尔茨海默病、多发性硬化症、肌萎缩性侧索硬化(ALS)、亨廷顿病和肌肉萎缩症。神经变性可以使用本领域已知的任何方法定量。例如,可以确定个体的执行功能(Moreira等人,Front Aging Neurosci.2017年11月9日;9:369)。

可以治疗的其他年龄相关病况包括心力衰竭、中风、糖尿病、骨质疏松症、关节炎、听力损失(部分或全部)、眼相关病况(例如视力减退或视网膜疾病)、青光眼和癌症。在某些实施方案中,疾病是视网膜疾病(例如黄斑变性)。病况可为视网膜疾病、癌症、衰老、年龄相关疾病、损伤或神经变性疾病。在某些实施方案中,细胞或组织来自于眼、耳、鼻、口(包括齿龈和齿根)、骨、肺、乳腺、乳房、胰腺、胃、食管、肌肉(包括心肌)、肝、血管、皮肤(包括毛发)、心脏、脑、神经组织、肾、睾丸、前列腺、阴茎、泄殖腔、鳍、卵巢或肠。在某些实施方案中,组织是受损的(例如,归因于损伤、意外事故、或医源性损伤)并且/或者是老化组织。在某些实施方案中,组织可被认为是健康的,但是在当前或未来条件下性能或存活未达最佳标准(例如,在农业或不良条件中,包括毒性疗法、日光暴露,或在地球大气层外行进)。

例如,病况可为损伤或疾病,并且病况可影响任何组织(例如眼、耳、骨、肺、乳腺、胰腺、肌肉、心脏、肝、皮肤、脑、神经组织或肠)。病况、疾病和障碍的非限制性实例包括急性损伤、神经变性疾病、慢性疾病、癌症、衰老、年龄相关的疾病以及影响受试者中任何组织的疾病。

在一些实施方案中,任何突变体rtTA4、编码rtTA4的核酸(例如工程化核酸)、包含与转基因序列可操作地连接的TRE启动子的核酸、重组病毒和/或重组细胞可用于治疗影响非人受试者的疾病(例如,影响家畜、驯养宠物和/或其他非人动物的疾病)。例如,疾病可为牛疾病、灵长类(例如猕猴、恒河猴)疾病、影响商业上相关的动物(诸如牛、猪、马、绵羊、山羊、猫和/或狗)的疾病和/或影响鸟类(例如商业上相关的鸟类,诸如鸡、鸭、鹅和/或火鸡)的疾病。例如,本文所述的任何突变体rtTA4、编码rtTA4的核酸(例如工程化核酸)、包含与转基因序列可操作地连接的TRE启动子的核酸、重组病毒和/或重组细胞可用于促进伤口愈合、治疗损伤(例如,骨折、出血性枪弹损伤和/或减少外科手术期间留下的疤痕)。在一些实施方案中,外科手术包括剖腹产。

用于鉴定怀疑患有病况的受试者的方法可包括身体检查、受试者的家庭病史、受试者的病史、活组织检查、遗传测试或多种成像技术,诸如超声波检查、计算机断层扫描、磁共振成像、磁共振波谱或正电子成像。

如本领域技术人员所认识到,核酸(例如工程化核酸,包括表达载体)、病毒(例如慢病毒、腺病毒、甲病毒、牛痘病毒、逆转录病毒、疱疹病毒或AAV)或它们的组合物的有效量根据施用途径、赋形剂使用以及与其他活性剂的共同使用而变化。待施用的量取决于待治疗的受试者,包括例如受试者的年龄、病况的严重程度、受试者的体重、受试者的遗传学、待靶向的细胞、组织或器官,或它们的任何组合。

使用本文所公开的突变体rtTA,一种或多种转基因(例如治疗性序列、基因靶向核酸和/或蛋白质编码序列)的表达可导致细胞重编程、组织修复、组织再生、器官再生、逆转衰老、感染性疾病、疾病预防、疾病治疗或它们的任何组合。细胞重编程可通过确定细胞的分化程度(例如,通过确定一种或多种谱系标记或多潜能标记,包括OCT4、KLF4、SOX2、NANOG、ESRRB、NR4A2和C/EBPα的表达)来确定。还可使用常规分化测定法来确定细胞的分化潜能。组织修复可通过组织更替和组织再生测定来确定。例如,组织更替测定包括伤口愈合测定。组织再生可以通过定量与转基因表达前相比转基因表达(例如,一种或多种转录因子,包括OCT4、KLF4和SOX2的表达)后的特定细胞类型来确定。在某些情况下,本文所述的方法促进器官再生。

通过考虑以下实施例,将进一步理解本发明的这些和其他方面,它们旨在说明本发明的某些特定实施方案,但不旨在限制如由权利要求所限定的其范围。

通用技术

除非另有说明,本发明的实践将采用分子生物学(包括重组技术)、微生物学、细胞生物学、生物化学和免疫学的常规技术,这些技术在本领域的技术范围内。MolecularCloning:A Laboratory Manual,第二版(Sambrook等人,1989)Cold Spring HarborPress;Oligonucleotide Synthesis(M.J.Gait编辑,1984);Methods in MolecularBiology,Humana Press;Cell Biology:A Laboratory Notebook(J.E.Cellis编辑,1998)Academic Press;Animal Cell Culture(R.I.Freshney编辑,1987);Introduction toCell and Tissue Culture(J.P.Mather和P.E.Roberts,1998)Plenum Press;Cell andTissue Culture:Laboratory Procedures(A.Doyle,J.B.Griffiths和D.G.Newell编辑,1993-8)J.Wiley and Sons;Methods in Enzymology(Academic Press,Inc.);Handbookof Experimental Immunology(D.M.Weir和C.C.Blackwell编辑);Gene Transfer Vectorsfor Mammalian Cells(J.M.Miller和M.P.Calos编辑,1987);Current Protocols inMolecular Biology(F.M.Ausubel等人编辑,1987);PCR:The Polymerase ChainReaction,(Mullis等人编辑,1994);Current Protocols in Immunology(J.E.Coligan等人编辑,1991);Short Protocols in Molecular Biology(Wiley and Sons,1999);Immunobiology(C.A.Janeway和P.Travers,1997);Antibodies(P.Finch,1997);Antibodies:a practical approach(D.Catty.编辑,IRL Press,1988-1989);Monoclonalantibodies:a practical approach(P.Shepherd和C.Dean编辑,Oxford UniversityPress,2000);Using antibodies:a laboratory manual(E.Harlow和D.Lane(Cold SpringHarbor Laboratory Press,1999);The Antibodies(M.Zanetti和J.D.Capra编辑,HarwoodAcademic Publishers,1995)。在没有进一步详细描述的情况下,相信本领域技术人员可以基于上述描述最大程度地利用本发明。下述具体实施方案因此被解释为仅仅阐述,无论如何决不是限制所公开内容的其余部分。为了本文引用的目的或主题,本文引用的所有出版物通过引用并入本文。

通过考虑以下实施例,将进一步理解本发明的这些和其他方面,它们旨在说明本发明的某些特定实施方案,但不旨在限制如由权利要求所限定的其范围。

实施例

为了可以更全面地理解本公开,阐述以下实施例。提供本申请中描述的合成和生物实施例以说明本文提供的化合物、药物组合物和方法,并且不以任何方式解释为限制其范围。

实施例1:体外Tet-On系统中在强力霉素撤除下具有低渗漏和改善的反应时间的突变体反向四环素反式激活因子(rtTA)的开发。

使用常规克隆技术工程化突变体反向四环素反式激活因子(rtTA)。与rtTA3(SEQID NO:11)相比,示例性突变体rtTA(rtTA4)包含四个突变(G12S、F67S、G72V和R171K)。包含rtTA3(SEQ ID NO:11)的位置G12、F67、G72和R171处的四个突变的rtTA在本文称为rtTA4。rtTA4(SEQ ID NO:13)包含三个VP16反式激活结构域,而rtTA3(SEQ ID NO:11)包含两个VP16反式激活结构域。

使用常规方法将编码rtTA4(SEQ ID NO:13)的核酸序列(SEQ ID NO:12)克隆到AAV载体中。pAAV-UBC-rtTA4-WPRE3-SV40pA(SEQ ID NO:17)载体示出于图1、图2A-2M和图3中。图1是示出编码rtTA4的AAV载体的特征的载体图谱。UBC是与编码rtTA4的核酸可操作地连接的组成型启动子。SV40pA是SV40衍生的终止序列。图2A-2M包括将图1所示的特征示意性映射到编码rtTA4的载体的核酸序列上的一系列示意图。图3示出了图2A-2M所描绘的各特征的位置和尺寸。

pAAV-UBC-rtTA4-WPRE3-SV40pA载体(SEQ ID NO:17)包含两个反向末端重复序列(ITR),其侧接于编码UBC启动子的序列,该UBC启动子与编码rtTA4(SEQ ID NO:12)的核酸序列可操作地连接。AAV载体还包含WPRE3序列(SEQ ID NO:21)和SV40终止序列(SEQ IDNO:8)。限制性酶消化位点的位置如下表2所示。

表2.pAAV-UBC-rtTA4-WPRE3-SV40pA(SEQ ID NO:17)中的限制性酶消化位点

如图4A-4B所示,即使在不存在强力霉素的情况下,rtTA3(SEQ ID NO:11)也是渗漏的并且诱导与四环素诱导型启动子可操作地连接的转基因的表达。编码rtTA3的核酸序列提供为SEQ ID NO:10。图4A是描绘本实验中使用的两种核酸的示意图。一种核酸编码与(1)编码rtTA4(SEQ ID NO:13)的核酸(SEQ ID NO:12),(2)编码2A肽的核酸,以及(3)编码mKate(远红外荧光蛋白)的核酸可操作地连接的UBC启动子。mKate表达被用作rtTA3表达的读出(图4B)。第二核酸在TRE3G(SEQ ID NO:7)启动子控制下编码GFP。GFP应当仅在强力霉素(DOX)存在下表达,如图4A所示。

接着,在体内测试图4A所示的载体。将携带图4A的顶部中所描绘的UBC-rtTA3载体的AAV和携带图4B的底部所描绘的TRE3G-GFP启动子的AAV施用给小鼠。无AAV施用被用作对照。不采用强力霉素(DOX)或采用DOX处理小鼠。然后利用相关抗体使用蛋白质印迹分析肝样本,以测定mKate表达(rtTA3表达的读出)、GFP表达和肌动蛋白表达。如图4B所示,即使在不存在强力霉素的情况下也监测到GFP表达。因此,rtTA3在体内渗漏。

为了确定rtTA4与rtTA3相比是否渗漏更少并且对强力霉素更敏感,使用了Tet-On萤光素酶报告系统。图5A是在本实验中使用的两种核酸的示意图。第一核酸包含驱动rtTA表达的启动子(图5A,顶部)。rtTA4示出于图5A中,但在用于测试rtTA3的Tet-On萤光素酶报告系统中用rtTA3替代rtTA4。第二核酸(TRE3G-Luc)包含与编码萤光素酶(luc)的核酸序列可操作地连接的TRE3G启动子(图5A,底部)。将编码rtTA4或rtTA3的Tet-On报告系统用单独的载体引入293T细胞,并且用浓度递增的强力霉素处理细胞。通过测量发光/蛋白质来测定萤光素酶表达。如图5B所示,当强力霉素水平较低(0.01ng/ml至1ng/ml)时,发光/蛋白质水平较低。在这些低水平的强力霉素下,采用rtTA4的发光/蛋白质水平与不存在任何rtTA情况下的基线水平相同(基线在图5B中用虚线表示)。在采用rtTA4的Tet-On系统中,发光/蛋白质水平随着强力霉素水平的增加而增加(图5B)。相比之下,即使在低水平的强力霉素(例如0.01ng/ml至1ng/ml DOX)下,采用rtTA3的发光/蛋白质水平也显著高于基线。这些结果表明rtTA4比rtTA3渗漏更少(在不存在强力霉素的情况下不诱导可检测的转基因表达),但在强力霉素浓度增加的情况下能够诱导转基因表达。

为了比较rtTA4和rtTA3对强力霉素撤除的敏感性,使用与图5A中描绘的类似的Tet-On萤光素酶报告系统。对于图6A所示的结果,TRE3G-luc载体和处于结蛋白启动子控制下的编码rtTA3的载体引入到293T细胞中。细胞仅接受空载体或TRE3G-luc载体作为对照。携带TRE3G-luc载体和处于结蛋白启动子控制下的编码rtTA3的载体两者的细胞如下处理:(1)不采用强力霉素(-DOX),(2)采用强力霉素(+DOX),或(3)采用强力霉素,然后撤除强力霉素(+-DOX)。如图6A所示,采用处理(3)检测的发光/蛋白质水平显著高于采用处理(1)的发光/蛋白质水平。这些结果表明rtTA3是渗漏的。相比之下,如图6B所示,当用rtTA4进行相同的实验时,强力霉素撤除使检测到的发光/蛋白质的量显著降低至与从未接受强力霉素的细胞中检测到的水平相当的水平。因此,与rtTA3相比,rtTA4对强力霉素撤除更敏感。

为了比较采用rtTA4与采用rtTA3相比撤除强力霉素以关闭转基因表达所需的时间长度,将包含TRE3G-luc载体和编码一种rtTA蛋白的载体的Tet-On萤光素酶报告系统引入到293T细胞中。将TRE3G-luc载体单独引入细胞中作为对照。还测定了rtTA3和rtTA4系统在不存在任何强力霉素处理(-DOX)的情况下的发光/蛋白质水平(图6C)。随后,将具有rtTA3 Tet-On系统或rtTA4 Tet-On系统的细胞采用强力霉素(+DOX),或者采用强力霉素之后撤除强力霉素(+-)来处理指定的小时数(图6C)。rtTA4能够比rtTA3更快地关闭转基因表达(图6C)。如图6A-6C所示,采用结蛋白启动子和Ubc启动子,rtTA4比rtTA3关闭快4-12倍。

在哺乳动物293T细胞中的Tet-On系统中进一步测试rtTA4。将TRE3G-GFP-SV40pAAAV载体和具有(1)编码与UBC启动子可操作地连接的rtTA3的序列,(2)编码与UBC启动子可操作地连接的rtTA4的序列,或(3)编码与结蛋白启动子可操作地连接的rtTA4的序列的第二AAV载体引入到293T细胞(图7)中。然后,在不存在强力霉素(-DOX)的情况下,在强力霉素(+DOX)存在下,或者在DOX存在(+DOX)然后撤除强力霉素(-DOX)的情况下对细胞进行处理。如图7所示,rtTA3即使在不存在强力霉素的情况下也诱导GFP表达,而rtTA4没有。此外,与UBC-rtTA3系统相比,在强力霉素处理一天后移除DOX七天导致了UBC-rtTA4系统中更低的GFP表达。因此,包含编码rtTA4的AAV载体的Tet-On系统在哺乳动物细胞中成功地诱导转基因表达,与采用rtTA3的相同系统相比具有更低的渗漏,并且在强力霉素移除后显示出更快的转基因表达抑制。

实施例2:编码突变体反向四环素反式激活因子(rtTA)的AAV载体在小鼠肝脏中显示出低渗漏。

还使用重组AAV9病毒在体内测试了包含rtTA4(SEQ ID NO:13)的Tet-On系统。使用包含图8B所示的组分的两个AAV载体。将编码与UBC启动子可操作地连接的rtTA4的AAV病毒(pAAV-UBC-rtTA4-WPRE3-SV40pA载体提供为SEQ ID NO:17)和编码具有图9所描绘的载体图谱的AAVTRE3G-OSK-SV40pA载体(SEQ ID NO:16)的AAV病毒施用给小鼠。对小鼠不用强力霉素或用强力霉素处理,收集肝样本。如图8A的免疫荧光图像所示,在不存在强力霉素的情况下,在肝中检测不到KLF4表达。当小鼠通过其饮用水用强力霉素处理时,在肝中检测到KLF4表达(图8A)。使用抗OCT4、KLF4和SOX2的抗体,通过蛋白质印迹以测定这些蛋白质表达,这些结果也是明显的(图8C)。肌动蛋白用作加载对照(图8C)。当小鼠用强力霉素处理时,仅在肝中检测到OCT4、KLF4和SOX2(图8C)。

实施例3:四环素阻遏物和rtTA4组合的Tet-On系统的开发。

为了在不存在DOX的情况下进一步降低rtTA与TRE操纵子的背景结合,我们已经开发出rtTA和tetR(tetRKRAB)的双保险系统(图10)。tetR或tetRKRAB可在不存在DOX的情况下与TRE操纵子结合,阻止rtTA的结合并抑制TRE的活性。当DOX加入到系统中时,tetR或tetRKRAB离开TRE元件并将其暴露给rtTA结合以激活TRE的基因下游的表达。将该rtTA-IRES-tetRKRAB或rtTA-IRES-tetR置于连续表达启动子如UBC、CAG或组织特异性启动子之下,允许在整个动物或特定组织中实现蛋白质表达的严格控制。

实施例4.使用rtTA4在体内控制基因表达。

为了确定rtTA4系统是否可在体内起作用,将两种AAV(UBC-rtTA4和TRE-Luc或TRE-OSK)通过眶后注射递送至小鼠。用rtTA4和TRE-OSK AAV9感染5月龄C57BL/6J小鼠。在不存在DOX处理的情况下,未检测到TRE启动子的表达(图15A)。然而,在用DOX处理的情况下观察到在组织如肝和胰腺中的强表达,使得所诱导的水平与转基因小鼠的水平相当(图15A)。令人惊奇地,连续诱导OSK超过一年,在超过一年内对小鼠没有可察觉的负面影响(图14和图15B)。不受特殊的理论限制,对小鼠表面上没有可察觉的负面影响,这是因为避免了在肠内的高水平表达(图15C-15E),因此避免了在其他研究中所见到的发育异常和体重减轻,包括Abad等人,Nature 502,340-345,doi:10.1038/nature12586(2013)。因此,rtTA4系统允许体内基因表达的空间和时间控制。

方法

小鼠品系

C57BL6/J野生型小鼠购自Jackson实验室(000664),用于视神经挤压和青光眼模型实验。对于衰老实验,使用来自NIA衰老啮齿动物群体的雌性(https://www.nia.nih.gov/research/dab/aged-rodent-colonies-handbook)。Col1a1-tetOP-OKS-mCherry/Rosa26-M2rtTA等位基因描述于Bar-Nur等人,Nat Methods,2014.11(11):第1170-6页。所有动物工作经哈佛医学院、波士顿儿童医院、大众眼部和耳部机构动物护理和使用委员会(Mass Eye and Ear Institutional animal care and use committees)批准。

AAV的产生

通过将小鼠Oct4、Sox2和Klf4 cDNA克隆到由Tet应答元件(TRE3G启动子)和SV40元件组成的AAV质粒中来制备AAV-TRE-OSK的载体。其他载体直接化学合成。然后将表6中所列的所有pAAV包装到血清型2/2或2/9的AAV中(滴度:>5×10

AAV9全身递送至内脏器官

通过眶后注射AAV9(3×10

实施例5.序列的非限制性实例.

编码OCT4的核苷酸序列(无终止密码子):(SEQ ID NO:1):

ATGGCTGGACACCTGGCTTCAGACTTCGCCTTCTCACCCCCACCAGGTGGGGGTGATGGGTCAGCAGGGCTGGAGCCGGGCTGGGTGGATCCTCGAACCTGGCTAAGCTTCCAAGGGCCTCCAGGTGGGCCTGGAATCGGACCAGGCTCAGAGGTATTGGGGATCTCCCCATGTCCGCCCGCATACGAGTTCTGCGGAGGGATGGCATACTGTGGACCTCAGGTTGGACTGGGCCTAGTCCCCCAAGTTGGCGTGGAGACTTTGCAGCCTGAGGGCCAGGCAGGAGCACGAGTGGAAAGCAACTCAGAGGGAACCTCCTCTGAGCCCTGTGCCGACCGCCCCAATGCCGTGAAGTTGGAGAAGGTGGAACCAACTCCCGAGGAGTCCCAGGACATGAAAGCCCTGCAGAAGGAGCTAGAACAGTTTGCCAAGCTGCTGAAGCAGAAGAGGATCACCTTGGGGTACACCCAGGCCGACGTGGGGCTCACCCTGGGCGTTCTCTTTGGAAAGGTGTTCAGCCAGACCACCATCTGTCGCTTCGAGGCCTTGCAGCTCAGCCTTAAGAACATGTGTAAGCTGCGGCCCCTGCTGGAGAAGTGGGTGGAGGAAGCCGACAACAATGAGAACCTTCAGGAGATATGCAAATCGGAGACCCTGGTGCAGGCCCGGAAGAGAAAGCGAACTAGCATTGAGAACCGTGTGAGGTGGAGTCTGGAGACCATGTTTCTGAAGTGCCCGAAGCCCTCCCTACAGCAGATCACTCACATCGCCAATCAGCTTGGGCTAGAGAAGGATGTGGTTCGAGTATGGTTCTGTAACCGGCGCCAGAAGGGCAAAAGATCAAGTATTGAGTATTCCCAACGAGAAGAGTATGAGGCTACAGGGACACCTTTCCCAGGGGGGGCTGTATCCTTTCCTCTGCCCCCAGGTCCCCACTTTGGCACCCCAGGCTATGGAAGCCCCCACTTCACCACACTCTACTCAGTCCCTTTTCCTGAGGGCGAGGCCTTTCCCTCTGTTCCCGTCACTGCTCTGGGCTCTCCCATGCATTCAAAC

编码OCT4的氨基酸序列:(SEQ ID NO:2):

MAGHLASDFAFSPPPGGGDGSAGLEPGWVDPRTWLSFQGPPGGPGIGPGSEVLGISPCPPAYEFCGGMAYCGPQVGLGLVPQVGVETLQPEGQAGARVESNSEGTSSEPCADRPNAVKLEKVEPTPEESQDMKALQKELEQFAKLLKQKRITLGYTQADVGLTLGVLFGKVFSQTTICRFEALQLSLKNMCKLRPLLEKWVEEADNNENLQEICKSETLVQARKRKRTSIENRVRWSLETMFLKCPKPSLQQITHIANQLGLEKDVVRVWFCNRRQKGKRSSIEYSQREEYEATGTPFPGGAVSFPLPPGPHFGTPGYGSPHFTTLYSVPFPEGEAFPSVPVTALGSPMHSN

编码SOX2的核苷酸序列(无终止密码子):(SEQ ID NO:3):

ATGTATAACATGATGGAGACGGAGCTGAAGCCGCCGGGCCCGCAGCAAGCTTCGGGGGGCGGCGGCGGAGGAGGCAACGCCACGGCGGCGGCGACCGGCGGCAACCAGAAGAACAGCCCGGACCGCGTCAAGAGGCCCATGAACGCCTTCATGGTATGGTCCCGGGGGCAGCGGCGTAAGATGGCCCAGGAGAACCCCAAGATGCACAACTCGGAGATCAGCAAGCGCCTGGGCGCGGAGTGGAAACTTTTGTCCGAGACCGAGAAGCGGCCGTTCATCGACGAGGCCAAGCGGCTGCGCGCTCTGCACATGAAGGAGCACCCGGATTATAAATACCGGCCGCGGCGGAAAACCAAGACGCTCATGAAGAAGGATAAGTACACGCTTCCCGGAGGCTTGCTGGCCCCCGGCGGGAACAGCATGGCGAGCGGGGTTGGGGTGGGCGCCGGCCTGGGTGCGGGCGTGAACCAGCGCATGGACAGCTACGCGCACATGAACGGCTGGAGCAACGGCAGCTACAGCATGATGCAGGAGCAGCTGGGCTACCCGCAGCACCCGGGCCTCAACGCTCACGGCGCGGCACAGATGCAACCGATGCACCGCTACGACGTCAGCGCCCTGCAGTACAACTCCATGACCAGCTCGCAGACCTACATGAACGGCTCGCCCACCTACAGCATGTCCTACTCGCAGCAGGGCACCCCCGGTATGGCGCTGGGCTCCATGGGCTCTGTGGTCAAGTCCGAGGCCAGCTCCAGCCCCCCCGTGGTTACCTCTTCCTCCCACTCCAGGGCGCCCTGCCAGGCCGGGGACCTCCGGGACATGATCAGCATGTACCTCCCCGGCGCCGAGGTGCCGGAGCCCGCTGCGCCCAGTAGACTGCACATGGCCCAGCACTACCAGAGCGGCCCGGTGCCCGGCACGGCCATTAACGGCACACTGCCCCTGTCGCACATG

编码SOX2的氨基酸序列(翻译的):(SEQ ID NO:4)

MYNMMETELKPPGPQQASGGGGGGGNATAAATGGNQKNSPDRVKRPMNAFMVWSRGQRRKMAQENPKMHNSEISKRLGAEWKLLSETEKRPFIDEAKRLRALHMKEHPDYKYRPRRKTKTLMKKDKYTLPGGLLAPGGNSMASGVGVGAGLGAGVNQRMDSYAHMNGWSNGSYSMMQEQLGYPQHPGLNAHGAAQMQPMHRYDVSALQYNSMTSSQTYMNGSPTYSMSYSQQGTPGMALGSMGSVVKSEASSSPPVVTSSSHSRAPCQAGDLRDMISMYLPGAEVPEPAAPSRLHMAQHYQSGPVPGTAINGTLPLSHM

编码KLF4的核苷酸序列(无终止密码子):(SEQ ID NO:5):

ATGAGGCAGCCACCTGGCGAGTCTGACATGGCTGTCAGCGACGCTCTGCTCCCGTCCTTCTCCACGTTCGCGTCCGGCCCGGCGGGAAGGGAGAAGACACTGCGTCCAGCAGGTGCCCCGACTAACCGTTGGCGTGAGGAACTCTCTCACATGAAGCGACTTCCCCCACTTCCCGGCCGCCCCTACGACCTGGCGGCGACGGTGGCCACAGACCTGGAGAGTGGCGGAGCTGGTGCAGCTTGCAGCAGTAACAACCCGGCCCTCCTAGCCCGGAGGGAGACCGAGGAGTTCAACGACCTCCTGGACCTAGACTTTATCCTTTCCAACTCGCTAACCCACCAGGAATCGGTGGCCGCCACCGTGACCACCTCGGCGTCAGCTTCATCCTCGTCTTCCCCAGCGAGCAGCGGCCCTGCCAGCGCGCCCTCCACCTGCAGCTTCAGCTATCCGATCCGGGCCGGGGGTGACCCGGGCGTGGCTGCCAGCAACACAGGTGGAGGGCTCCTCTACAGCCGAGAATCTGCGCCACCTCCCACGGCCCCCTTCAACCTGGCGGACATCAATGACGTGAGCCCCTCGGGCGGCTTCGTGGCTGAGCTCCTGCGGCCGGAGTTGGACCCAGTATACATTCCGCCACAGCAGCCTCAGCCGCCAGGTGGCGGGCTGATGGGCAAGTTTGTGCTGAAGGCGTCTCTGACCACCCCTGGCAGCGAGTACAGCAGCCCTTCGGTCATCAGTGTTAGCAAAGGAAGCCCAGACGGCAGCCACCCCGTGGTAGTGGCGCCCTACAGCGGTGGCCCGCCGCGCATGTGCCCCAAGATTAAGCAAGAGGCGGTCCCGTCCTGCACGGTCAGCCGGTCCCTAGAGGCCCATTTGAGCGCTGGACCCCAGCTCAGCAACGGCCACCGGCCCAACACACACGACTTCCCCCTGGGGCGGCAGCTCCCCACCAGGACTACCCCTACACTGAGTCCCGAGGAACTGCTGAACAGCAGGGACTGTCACCCTGGCCTGCCTCTTCCCCCAGGATTCCATCCCCATCCGGGGCCCAACTACCCTCCTTTCCTGCCAGACCAGATGCAGTCACAAGTCCCCTCTCTCCATTATCAAGAGCTCATGCCACCGGGTTCCTGCCTGCCAGAGGAGCCCAAGCCAAAGAGGGGAAGAAGGTCGTGGCCCCGGAAAAGAACAGCCACCCACACTTGTGACTATGCAGGCTGTGGCAAAACCTATACCAAGAGTTCTCATCTCAAGGCACACCTGCGAACTCACACAGGCGAGAAACCTTACCACTGTGACTGGGACGGCTGTGGGTGGAAATTCGCCCGCTCCGATGAACTGACCAGGCACTACCGCAAACACACAGGGCACCGGCCCTTTCAGTGCCAGAAGTGCGACAGGGCCTTTTCCAGGTCGGACCACCTTGCCTTACACATGAAGAGGCAC

编码KLF4的氨基酸序列(翻译的):(SEQ ID NO:6):

MRQPPGESDMAVSDALLPSFSTFASGPAGREKTLRPAGAPTNRWREELSHMKRLPPLPGRPYDLAATVATDLESGGAGAACSSNNPALLARRETEEFNDLLDLDFILSNSLTHQESVAATVTTSASASSSSSPASSGPASAPSTCSFSYPIRAGGDPGVAASNTGGGLLYSRESAPPPTAPFNLADINDVSPSGGFVAELLRPELDPVYIPPQQPQPPGGGLMGKFVLKASLTTPGSEYSSPSVISVSKGSPDGSHPVVVAPYSGGPPRMCPKIKQEAVPSCTVSRSLEAHLSAGPQLSNGHRPNTHDFPLGRQLPTRTTPTLSPEELLNSRDCHPGLPLPPGFHPHPGPNYPPFLPDQMQSQVPSLHYQELMPPGSCLPEEPKPKRGRRSWPRKRTATHTCDYAGCGKTYTKSSHLKAHLRTHTGEKPYHCDWDGCGWKFARSDELTRHYRKHTGHRPFQCQKCDRAFSRSDHLALHMKRH

TRE3G启动子序列(TRE启动子的非限制性实例):(SEQ ID NO:7):TTTACTCCCTATCAGTGATAGAGAACGTATGAAGAGTTTACTCCCTATCAGTGATAGAGAACGTATGCAGACTTTACTCCCTATCAGTGATAGAGAACGTATAAGGAGTTTACTCCCTATCAGTGATAGAGAACGTATGACCAGTTTACTCCCTATCAGTGATAGAGAACGTATCTACAGTTTACTCCCTATCAGTGATAGAGAACGTATATCCAGTTTACTCCCTATCAGTGATAGAGAACGTATAAGCTTTAGGCGTGTACGGTGGGCGCCTATAAAAGCAGAGCTCGTTTAGTGAACCGTCAGATCGCCTGGAGCAATTCCACAACACTTTTGTCTTATACCAACTTTCCGTACCACTTCCTACCCTCGTAAA

SV40衍生的终止序列:(SEQ ID NO:8):

TGCGCGCAGCGGCCGACCATGGCCCAACTTGTTTATTGCAGCTTATAATGGTTACAAATAAAGCAATAGCATCACAAATTTCACAAATAAAGCATTTTTTTCACTGCATTCTAGTTGTGGTTTGTCCAAACTCATCAATGTATCTTATCATGTCTGGATCTCGGTACCG

T2A序列(SEQ ID NO:9):GSGEGRGSLLTCGDVEENPGP

编码rtTA3的核苷酸序列(3'端具有2个VP16结构域):(SEQ ID NO:10):

ATGTCTAGGCTGGACAAGAGCAAAGTCATAAACGGAGCTCTGGAATTACTCAATGGTGTCGGTATCGAAGGCCTGACGACAAGGAAACTCGCTCAAAAGCTGGGAGTTGAGCAGCCTACCCTGTACTGGCACGTGAAGAACAAGCGGGCCCTGCTCGATGCCCTGCCAATCGAGATGCTGGACAGGCATCATACCCACTTCTGCCCCCTGGAAGGCGAGTCATGGCAAGACTTTCTGCGGAACAACGCCAAGTCATACCGCTGTGCTCTCCTCTCACATCGCGACGGGGCTAAAGTGCATCTCGGCACCCGCCCAACAGAGAAACAGTACGAAACCCTGGAAAATCAGCTCGCGTTCCTGTGTCAGCAAGGCTTCTCCCTGGAGAACGCACTGTACGCTCTGTCCGCCGTGGGCCACTTTACACTGGGCTGCGTATTGGAGGAACAGGAGCATCAAGTAGCAAAAGAGGAAAGAGAGACACCTACCACCGATTCTATGCCCCCACTTCTGAGACAAGCAATTGAGCTGTTCGACCGGCAGGGAGCCGAACCTGCCTTCCTTTTCGGCCTGGAACTAATCATATGTGGCCTGGAGAAACAGCTAAAGTGCGAAAGCGGCGGGCCGACCGACGCCCTTGACGATTTTGACTTAGACATGCTCCCAGCCGATGCCCTTGACGATTTTGACCTTGACATGCTCCCCGGGTAA

编码rtTA3的氨基酸序列:(SEQ ID NO:11):

MSRLDKSKVINGALELLNGVGIEGLTTRKLAQKLGVEQPTLYWHVKNKRALLDALPIEMLDRHHTHFCPLEGESWQDFLRNNAKSYRCALLSHRDGAKVHLGTRPTEKQYETLENQLAFLCQQGFSLENALYALSAVGHFTLGCVLEEQEHQVAKEERETPTTDSMPPLLRQAIELFDRQGAEPAFLFGLELIICGLEKQLKCESGGPTDALDDFDLDMLPADALDDFDLDMLPG

编码rtTA4的核苷酸序列(3'端具有3个VP16结构域):(SEQ ID NO:12):

ATGTCCCGCTTGGATAAGAGCAAGGTAATAAATAGCGCACTCGAACTCCTCAACGGCGTGGGCATCGAAGGTCTGACTACTCGAAAGCTCGCCCAGAAATTGGGTGTGGAGCAACCTACATTGTATTGGCATGTCAAGAACAAAAGAGCCCTGCTGGACGCTCTTCCTATTGAAATGCTTGACAGGCATCACACTCATTCCTGCCCCCTTGAGGTCGAGAGTTGGCAAGATTTTCTCCGAAACAATGCAAAGTCCTACCGCTGCGCACTTTTGTCCCATAGGGATGGAGCAAAAGTGCACCTGGGAACCAGGCCAACAGAGAAACAATACGAGACTCTCGAGAACCAGTTGGCTTTCTTGTGCCAACAGGGGTTCTCACTTGAAAATGCCCTTTACGCACTGTCAGCCGTTGGACATTTTACCCTGGGGTGCGTTCTTGAGGAGCAAGAACATCAGGTTGCTAAGGAGGAGCGCGAGACTCCAACCACTGATTCTATGCCACCTTTGCTGAAACAGGCCATTGAACTTTTCGATAGACAGGGTGCTGAACCTGCCTTTCTCTTCGGGTTGGAGCTGATTATTTGTGGTCTCGAAAAACAGCTGAAATGTGAAAGTGGTGGCCCTACTGACGCCCTCGATGATTTCGACCTGGATATGCTGCCAGCCGATGCACTTGATGATTTCGATTTGGATATGCTTCCAGCCGACGCACTGGACGACTTCGATTTGGACATGCTTCCCGGTTAA

编码rtTA4的氨基酸序列:(SEQ ID NO:13):

MSRLDKSKVINSALELLNGVGIEGLTTRKLAQKLGVEQPTLYWHVKNKRALLDALPIEMLDRHHTHSCPLEVESWQDFLRNNAKSYRCALLSHRDGAKVHLGTRPTEKQYETLENQLAFLCQQGFSLENALYALSAVGHFTLGCVLEEQEHQVAKEERETPTTDSMPPLLKQAIELFDRQGAEPAFLFGLELIICGLEKQLKCESGGPTDALDDFDLDMLPADALDDFDLDMLPADALDDFDLDMLPG

编码M2-rtTA的核苷酸序列(SEQ ID NO:14):

ATGCCTTTGTATCATGCTATTGCTTCCCGTATGGCTTTCATTTTCTCCTCCTTGTATAAATCCTGGTTGCTGTCTCTTTATGAGGAGTTGTGGCCCGTTGTCAGGCAACGTGGCGTGGTGTGCACTGTGTTTGCTGACGCAACCCCCACTGGTTGGGGCATTGCCACCACCTGTCAGCTCCTTTCCGGGACTTTCGCTTTCCCCCTCCCTATTGCCACGGCGGAACTCATCGCCGCCTGCCTTGCCCGCTGCTGGACAGGGGCTCGGCTGTTGGGCACTGACAATTCCGTGGTGTTGTCGGGGAAATCATCGTCCTTTCCTTGGCTGCTCGCCTGTGTTGCCACCTGGATTCTGCGCGGGACGTCCTTCTGCTACGTCCCTTCGGCCCTCAATCCAGCGGACCTTCCTTCCCGCGGCCTGCTGCCGGCTCTGCGGCCTCTTCCGCGTCTTCGCCTTCGCCCTCAGACGAGTCGGATCTCCCTTTGGGCCGCCTCCCCGCATCGATACCGTCGACCTCGAGACCTAGAAAAACATGGAGCAATCACAAGTAGCAATACAGCAGCTACCAATGCTGATTGTGCCTGGCTAGAAGCACAAGAGGAGGAGGAGGTGGGTTTTCCAGTCACACCTCAGGTACCTTTAAGACCAATGACTTACAAGGCAGCTGTAGATCTTAGCCACTTTTTAAAAGAAAAGGGGGGACTGGAAGGGCTAATTCACTCCCAACGAAGACAAGATATCCTTGATCTGTGGATCTACCACACACAAGGCTACTTCCCTGATTGGCAGAACTACACACCAGGGCCAGGGATCAGATATCCACTGACCTTTGGATGGTGCTACAAGCTAGTACCAGTTGAGCAAGAGAAGGTAGAAGAAGCCAATGAAGGAGAGAACACCCGCTTGTTACACCCTGTGAGCCTGCATGGGATGGATGACCCGGAGAGAGAAGTATTAGAGTGGAGGTTTGACAGCCGCCTAGCATTTCATCACATGGCCCGAGAGCTGCATCCGGACTGTACTGGGTCTCTCTGGTTAGACCAGATCTGA

编码M2-rtTA的氨基酸序列(SEQ ID NO:15):

MPLYHAIASRMAFIFSSLYKSWLLSLYEELWPVVRQRGVVCTVFADATPTGWGIATTCQLLSGTFAFPLPIATAELIAACLARCWTGARLLGTDNSVVLSGKSSSFPWLLACVATWILRGTSFCYVPSALNPADLPSRGLLPALRPLPRLRLRPQTSRISLWAASPHRYRRPRDLEKHGAITSSNTAATNADCAWLEAQEEEEVGFPVTPQVPLRPMTYKAAVDLSHFLKEKGGLEGLIHSQRRQDILDLWIYHTQGYFPDWQNYTPGPGIRYPLTFGWCYKLVPVEQEKVEEANEGENTRLLHPVSLHGMDDPEREVLEWRFDSRLAFHHMARELHPDCTGSLWLDQI

pAAV-TRE3G-OSK-SV40pA或TRE3G-OSK-SV40pA载体的核酸序列(SEQ ID NO:16):

TTATGCAGTGCTGCCATAACCATGAGTGATAACACTGCGGCCAACTTACTTCTGACAACGATCGGAGGACCGAAGGAGCTAACCGCTTTTTTGCACAACATGGGGGATCATGTAACTCGCCTTGATCGTTGGGAACCGGAGCTGAATGAAGCCATACCAAACGACGAGCGTGACACCACGATGCCTGTAGTAATGGTAACAACGTTGCGCAAACTATTAACTGGCGAACTACTTACTCTAGCTTCCCGGCAACAATTAATAGACTGGATGGAGGCGGATAAAGTTGCAGGACCACTTCTGCGCTCGGCCCTTCCGGCTGGCTGGTTTATTGCTGATAAATCTGGAGCCGGTGAGCGTGGGTCTCGCGGTATCATTGCAGCACTGGGGCCAGATGGTAAGCCCTCCCGTATCGTAGTTATCTACACGACGGGGAGTCAGGCAACTATGGATGAACGAAATAGACAGATCGCTGAGATAGGTGCCTCACTGATTAAGCATTGGTAACTGTCAGACCAAGTTTACTCATATATACTTTAGATTGATTTAAAACTTCATTTTTAATTTAAAAGGATCTAGGTGAAGATCCTTTTTGATAATCTCATGACCAAAATCCCTTAACGTGAGTTTTCGTTCCACTGAGCGTCAGACCCCGTAGAAAAGATCAAAGGATCTTCTTGAGATCCTTTTTTTCTGCGCGTAATCTGCTGCTTGCAAACAAAAAAACCACCGCTACCAGCGGTGGTTTGTTTGCCGGATCAAGAGCTACCAACTCTTTTTCCGAAGGTAACTGGCTTCAGCAGAGCGCAGATACCAAATACTGTCCTTCTAGTGTAGCCGTAGTTAGGCCACCACTTCAAGAACTCTGTAGCACCGCCTACATACCTCGCTCTGCTAATCCTGTTACCAGTGGCTGCTGCCAGTGGCGATAAGTCGTGTCTTACCGGGTTGGACTCAAGACGATAGTTACCGGATAAGGCGCAGCGGTCGGGCTGAACGGGGGGTTCGTGCACACAGCCCAGCTTGGAGCGAACGACCTACACCGAACTGAGATACCTACAGCGTGAGCTATGAGAAAGCGCCACGCTTCCCGAAGGGAGAAAGGCGGACAGGTATCCGGTAAGCGGCAGGGTCGGAACAGGAGAGCGCACGAGGGAGCTTCCAGGGGGAAACGCCTGGTATCTTTATAGTCCTGTCGGGTTTCGCCACCTCTGACTTGAGCGTCGATTTTTGTGATGCTCGTCAGGGGGGCGGAGCCTATGGAAAAACGCCAGCAACGCGGCCTTTTTACGGTTCCTGGCCTTTTGCTGGCCTTTTGCTCACATGTTCTTTCCTGCGTTATCCCCTGATTCTGTGGATAACCGTATTACCGCCTTTGAGTGAGCTGATACCGCTCGCCGCAGCCGAACGACCGAGCGCAGCGAGTCAGTGAGCGAGGAAGCGGAAGAGCGCCCAATACGCAAACCGCCTCTCCCCGCGCGTTGGCCGATTCATTAATGCAGCTGGCACGACAGGTTTCCCGACTGGAAAGCGGGCAGTGAGCGCAACGCAATTAATGTGAGTTAGCTCACTCATTAGGCACCCCAGGCTTTACACTTTATGCTTCCGGCTCGTATGTTGTGTGGAATTGTGAGCGGATAACAATTTCACACAGGAAACAGCTATGACCATGATTACGCCAGATTTAATTAAGGCCTTAATTAGGCTGCGCGCTCGCTCGCTCACTGAGGCCGCCCGGGCAAAGCCCGGGCGTCGGGCGACCTTTGGTCGCCCGGCCTCAGTGAGCGAGCGAGCGCGCAGAGAGGGAGTGGCCAACTCCATCACTAGGGGTTCCTTGTAGTTAATGATTAACCCGCCATGCTACTTATCTACGTAGCCATGCTCTAGGAAGATCGGAATTCTTTACTCCCTATCAGTGATAGAGAACGTATGAAGAGTTTACTCCCTATCAGTGATAGAGAACGTATGCAGACTTTACTCCCTATCAGTGATAGAGAACGTATAAGGAGTTTACTCCCTATCAGTGATAGAGAACGTATGACCAGTTTACTCCCTATCAGTGATAGAGAACGTATCTACAGTTTACTCCCTATCAGTGATAGAGAACGTATATCCAGTTTACTCCCTATCAGTGATAGAGAACGTATAAGCTTTAGGCGTGTACGGTGGGCGCCTATAAAAGCAGAGCTCGTTTAGTGAACCGTCAGATCGCCTGGAGCAATTCCACAACACTTTTGTCTTATACCAACTTTCCGTACCACTTCCTACCCTCGTAAAGCGGCCGCGCCACCATGGCTGGACACCTGGCTTCAGACTTCGCCTTCTCACCCCCACCAGGTGGGGGTGATGGGTCAGCAGGGCTGGAGCCGGGCTGGGTGGATCCTCGAACCTGGCTAAGCTTCCAAGGGCCTCCAGGTGGGCCTGGAATCGGACCAGGCTCAGAGGTATTGGGGATCTCCCCATGTCCGCCCGCATACGAGTTCTGCGGAGGGATGGCATACTGTGGACCTCAGGTTGGACTGGGCCTAGTCCCCCAAGTTGGCGTGGAGACTTTGCAGCCTGAGGGCCAGGCAGGAGCACGAGTGGAAAGCAACTCAGAGGGAACCTCCTCTGAGCCCTGTGCCGACCGCCCCAATGCCGTGAAGTTGGAGAAGGTGGAACCAACTCCCGAGGAGTCCCAGGACATGAAAGCCCTGCAGAAGGAGCTAGAACAGTTTGCCAAGCTGCTGAAGCAGAAGAGGATCACCTTGGGGTACACCCAGGCCGACGTGGGGCTCACCCTGGGCGTTCTCTTTGGAAAGGTGTTCAGCCAGACCACCATCTGTCGCTTCGAGGCCTTGCAGCTCAGCCTTAAGAACATGTGTAAGCTGCGGCCCCTGCTGGAGAAGTGGGTGGAGGAAGCCGACAACAATGAGAACCTTCAGGAGATATGCAAATCGGAGACCCTGGTGCAGGCCCGGAAGAGAAAGCGAACTAGCATTGAGAACCGTGTGAGGTGGAGTCTGGAGACCATGTTTCTGAAGTGCCCGAAGCCCTCCCTACAGCAGATCACTCACATCGCCAATCAGCTTGGGCTAGAGAAGGATGTGGTTCGAGTATGGTTCTGTAACCGGCGCCAGAAGGGCAAAAGATCAAGTATTGAGTATTCCCAACGAGAAGAGTATGAGGCTACAGGGACACCTTTCCCAGGGGGGGCTGTATCCTTTCCTCTGCCCCCAGGTCCCCACTTTGGCACCCCAGGCTATGGAAGCCCCCACTTCACCACACTCTACTCAGTCCCTTTTCCTGAGGGCGAGGCCTTTCCCTCTGTTCCCGTCACTGCTCTGGGCTCTCCCATGCATTCAAACGCTAGCGGCAGCGGCGCCACGAACTTCTCTCTGTTAAAGCAAGCAGGAGATGTTGAAGAAAACCCCGGGCCTGCATGCATGTATAACATGATGGAGACGGAGCTGAAGCCGCCGGGCCCGCAGCAAGCTTCGGGGGGCGGCGGCGGAGGAGGCAACGCCACGGCGGCGGCGACCGGCGGCAACCAGAAGAACAGCCCGGACCGCGTCAAGAGGCCCATGAACGCCTTCATGGTATGGTCCCGGGGGCAGCGGCGTAAGATGGCCCAGGAGAACCCCAAGATGCACAACTCGGAGATCAGCAAGCGCCTGGGCGCGGAGTGGAAACTTTTGTCCGAGACCGAGAAGCGGCCGTTCATCGACGAGGCCAAGCGGCTGCGCGCTCTGCACATGAAGGAGCACCCGGATTATAAATACCGGCCGCGGCGGAAAACCAAGACGCTCATGAAGAAGGATAAGTACACGCTTCCCGGAGGCTTGCTGGCCCCCGGCGGGAACAGCATGGCGAGCGGGGTTGGGGTGGGCGCCGGCCTGGGTGCGGGCGTGAACCAGCGCATGGACAGCTACGCGCACATGAACGGCTGGAGCAACGGCAGCTACAGCATGATGCAGGAGCAGCTGGGCTACCCGCAGCACCCGGGCCTCAACGCTCACGGCGCGGCACAGATGCAACCGATGCACCGCTACGACGTCAGCGCCCTGCAGTACAACTCCATGACCAGCTCGCAGACCTACATGAACGGCTCGCCCACCTACAGCATGTCCTACTCGCAGCAGGGCACCCCCGGTATGGCGCTGGGCTCCATGGGCTCTGTGGTCAAGTCCGAGGCCAGCTCCAGCCCCCCCGTGGTTACCTCTTCCTCCCACTCCAGGGCGCCCTGCCAGGCCGGGGACCTCCGGGACATGATCAGCATGTACCTCCCCGGCGCCGAGGTGCCGGAGCCCGCTGCGCCCAGTAGACTGCACATGGCCCAGCACTACCAGAGCGGCCCGGTGCCCGGCACGGCCATTAACGGCACACTGCCCCTGTCGCACATGGCATGCGGCTCCGGCGAGGGCAGGGGAAGTCTTCTAACATGCGGGGACGTGGAGGAAAATCCCGGCCCACTCGAGATGAGGCAGCCACCTGGCGAGTCTGACATGGCTGTCAGCGACGCTCTGCTCCCGTCCTTCTCCACGTTCGCGTCCGGCCCGGCGGGAAGGGAGAAGACACTGCGTCCAGCAGGTGCCCCGACTAACCGTTGGCGTGAGGAACTCTCTCACATGAAGCGACTTCCCCCACTTCCCGGCCGCCCCTACGACCTGGCGGCGACGGTGGCCACAGACCTGGAGAGTGGCGGAGCTGGTGCAGCTTGCAGCAGTAACAACCCGGCCCTCCTAGCCCGGAGGGAGACCGAGGAGTTCAACGACCTCCTGGACCTAGACTTTATCCTTTCCAACTCGCTAACCCACCAGGAATCGGTGGCCGCCACCGTGACCACCTCGGCGTCAGCTTCATCCTCGTCTTCCCCAGCGAGCAGCGGCCCTGCCAGCGCGCCCTCCACCTGCAGCTTCAGCTATCCGATCCGGGCCGGGGGTGACCCGGGCGTGGCTGCCAGCAACACAGGTGGAGGGCTCCTCTACAGCCGAGAATCTGCGCCACCTCCCACGGCCCCCTTCAACCTGGCGGACATCAATGACGTGAGCCCCTCGGGCGGCTTCGTGGCTGAGCTCCTGCGGCCGGAGTTGGACCCAGTATACATTCCGCCACAGCAGCCTCAGCCGCCAGGTGGCGGGCTGATGGGCAAGTTTGTGCTGAAGGCGTCTCTGACCACCCCTGGCAGCGAGTACAGCAGCCCTTCGGTCATCAGTGTTAGCAAAGGAAGCCCAGACGGCAGCCACCCCGTGGTAGTGGCGCCCTACAGCGGTGGCCCGCCGCGCATGTGCCCCAAGATTAAGCAAGAGGCGGTCCCGTCCTGCACGGTCAGCCGGTCCCTAGAGGCCCATTTGAGCGCTGGACCCCAGCTCAGCAACGGCCACCGGCCCAACACACACGACTTCCCCCTGGGGCGGCAGCTCCCCACCAGGACTACCCCTACACTGAGTCCCGAGGAACTGCTGAACAGCAGGGACTGTCACCCTGGCCTGCCTCTTCCCCCAGGATTCCATCCCCATCCGGGGCCCAACTACCCTCCTTTCCTGCCAGACCAGATGCAGTCACAAGTCCCCTCTCTCCATTATCAAGAGCTCATGCCACCGGGTTCCTGCCTGCCAGAGGAGCCCAAGCCAAAGAGGGGAAGAAGGTCGTGGCCCCGGAAAAGAACAGCCACCCACACTTGTGACTATGCAGGCTGTGGCAAAACCTATACCAAGAGTTCTCATCTCAAGGCACACCTGCGAACTCACACAGGCGAGAAACCTTACCACTGTGACTGGGACGGCTGTGGGTGGAAATTCGCCCGCTCCGATGAACTGACCAGGCACTACCGCAAACACACAGGGCACCGGCCCTTTCAGTGCCAGAAGTGCGACAGGGCCTTTTCCAGGTCGGACCACCTTGCCTTACACATGAAGAGGCACTAAATGACTAGTGCGCGCAGCGGCCGACCATGGCCCAACTTGTTTATTGCAGCTTATAATGGTTACAAATAAAGCAATAGCATCACAAATTTCACAAATAAAGCATTTTTTTCACTGCATTCTAGTTGTGGTTTGTCCAAACTCATCAATGTATCTTATCATGTCTGGATCTCGGTACCGGATCCAAATTCCCGATAAGGATCTTCCTAGAGCATGGCTACGTAGATAAGTAGCATGGCGGGTTAATCATTAACTACAAGGAACCCCTAGTGATGGAGTTGGCCACTCCCTCTCTGCGCGCTCGCTCGCTCACTGAGGCCGGGCGACCAAAGGTCGCCCGACGCCCGGGCTTTGCCCGGGCGGCCTCAGTGAGCGAGCGAGCGCGCAGCCTTAATTAACCTAATTCACTGGCCGTCGTTTTACAACGTCGTGACTGGGAAAACCCTGGCGTTACCCAACTTAATCGCCTTGCAGCACATCCCCCTTTCGCCAGCTGGCGTAATAGCGAAGAGGCCCGCACCGATCGCCCTTCCCAACAGTTGCGCAGCCTGAATGGCGAATGGGACGCGCCCTGTAGCGGCGCATTAAGCGCGGCGGGTGTGGTGGTTACGCGCAGCGTGACCGCTACACTTGCCAGCGCCCTAGCGCCCGCTCCTTTCGCTTTCTTCCCTTCCTTTCTCGCCACGTTCGCCGGCTTTCCCCGTCAAGCTCTAAATCGGGGGCTCCCTTTAGGGTTCCGATTTAGTGCTTTACGGCACCTCGACCCCAAAAAACTTGATTAGGGTGATGGTTCACGTAGTGGGCCATCGCCCTGATAGACGGTTTTTCGCCCTTTGACGTTGGAGTCCACGTTCTTTAATAGTGGACTCTTGTTCCAAACTGGAACAACACTCAACCCTATCTCGGTCTATTCTTTTGATTTATAAGGGATTTTGCCGATTTCGGCCTATTGGTTAAAAAATGAGCTGATTTAACAAAAATTTAACGCGAATTTTAACAAAATATTAACGTTTATAATTTCAGGTGGCATCTTTCGGGGAAATGTGCGCGGAACCCCTATTTGTTTATTTTTCTAAATACATTCAAATATGTATCCGCTCATGAGACAATAACCCTGATAAATGCTTCAATAATATTGAAAAAGGAAGAGTATGAGTATTCAACATTTCCGTGTCGCCCTTATTCCCTTTTTTGCGGCATTTTGCCTTCCTGTTTTTGCTCACCCAGAAACGCTGGTGAAAGTAAAAGATGCTGAAGATCAGTTGGGTGCACGAGTGGGTTACATCGAACTGGATCTCAATAGTGGTAAGATCCTTGAGAGTTTTCGCCCCGAAGAACGTTTTCCAATGATGAGCACTTTTAAAGTTCTGCTATGTGGCGCGGTATTATCCCGTATTGACGCCGGGCAAGAGCAACTCGGTCGCCGCATACACTATTCTCAGAATGACTTGGTTGAGTACTCACCAGTCACAGAAAAGCATCTTACGGATGGCATGACAGTAAGAGAA

pAAV-UBC-rtTA4-WPRE3-SV40pA载体的核酸序列(SEQ ID NO:17):

TTATGCAGTGCTGCCATAACCATGAGTGATAACACTGCGGCCAACTTACTTCTGACAACGATCGGAGGACCGAAGGAGCTAACCGCTTTTTTGCACAACATGGGGGATCATGTAACTCGCCTTGATCGTTGGGAACCGGAGCTGAATGAAGCCATACCAAACGACGAGCGTGACACCACGATGCCTGTAGTAATGGTAACAACGTTGCGCAAACTATTAACTGGCGAACTACTTACTCTAGCTTCCCGGCAACAATTAATAGACTGGATGGAGGCGGATAAAGTTGCAGGACCACTTCTGCGCTCGGCCCTTCCGGCTGGCTGGTTTATTGCTGATAAATCTGGAGCCGGTGAGCGTGGGTCTCGCGGTATCATTGCAGCACTGGGGCCAGATGGTAAGCCCTCCCGTATCGTAGTTATCTACACGACGGGGAGTCAGGCAACTATGGATGAACGAAATAGACAGATCGCTGAGATAGGTGCCTCACTGATTAAGCATTGGTAACTGTCAGACCAAGTTTACTCATATATACTTTAGATTGATTTAAAACTTCATTTTTAATTTAAAAGGATCTAGGTGAAGATCCTTTTTGATAATCTCATGACCAAAATCCCTTAACGTGAGTTTTCGTTCCACTGAGCGTCAGACCCCGTAGAAAAGATCAAAGGATCTTCTTGAGATCCTTTTTTTCTGCGCGTAATCTGCTGCTTGCAAACAAAAAAACCACCGCTACCAGCGGTGGTTTGTTTGCCGGATCAAGAGCTACCAACTCTTTTTCCGAAGGTAACTGGCTTCAGCAGAGCGCAGATACCAAATACTGTCCTTCTAGTGTAGCCGTAGTTAGGCCACCACTTCAAGAACTCTGTAGCACCGCCTACATACCTCGCTCTGCTAATCCTGTTACCAGTGGCTGCTGCCAGTGGCGATAAGTCGTGTCTTACCGGGTTGGACTCAAGACGATAGTTACCGGATAAGGCGCAGCGGTCGGGCTGAACGGGGGGTTCGTGCACACAGCCCAGCTTGGAGCGAACGACCTACACCGAACTGAGATACCTACAGCGTGAGCTATGAGAAAGCGCCACGCTTCCCGAAGGGAGAAAGGCGGACAGGTATCCGGTAAGCGGCAGGGTCGGAACAGGAGAGCGCACGAGGGAGCTTCCAGGGGGAAACGCCTGGTATCTTTATAGTCCTGTCGGGTTTCGCCACCTCTGACTTGAGCGTCGATTTTTGTGATGCTCGTCAGGGGGGCGGAGCCTATGGAAAAACGCCAGCAACGCGGCCTTTTTACGGTTCCTGGCCTTTTGCTGGCCTTTTGCTCACATGTTCTTTCCTGCGTTATCCCCTGATTCTGTGGATAACCGTATTACCGCCTTTGAGTGAGCTGATACCGCTCGCCGCAGCCGAACGACCGAGCGCAGCGAGTCAGTGAGCGAGGAAGCGGAAGAGCGCCCAATACGCAAACCGCCTCTCCCCGCGCGTTGGCCGATTCATTAATGCAGCTGGCACGACAGGTTTCCCGACTGGAAAGCGGGCAGTGAGCGCAACGCAATTAATGTGAGTTAGCTCACTCATTAGGCACCCCAGGCTTTACACTTTATGCTTCCGGCTCGTATGTTGTGTGGAATTGTGAGCGGATAACAATTTCACACAGGAAACAGCTATGACCATGATTACGCCAGATTTAATTAAGGCCTTAATTAGGCTGCGCGCTCGCTCGCTCACTGAGGCCGCCCGGGCAAAGCCCGGGCGTCGGGCGACCTTTGGTCGCCCGGCCTCAGTGAGCGAGCGAGCGCGCAGAGAGGGAGTGGCCAACTCCATCACTAGGGGTTCCTTGTAGTTAATGATTAACCCGCCATGCTACTTATCTACGTAGCCATGCTCTAGGAAGATCGGAATTCCTGATCTGGCCTCCGCGCCGGGTTTTGGCGCCTCCCGCGGGCGCCCCCCTCCTCACGGCGAGCGCTGCCACGTCAGACGAAGGGCGCAGCGAGCGTCCTGATCCTTCCGCCCGGACGCTCAGGACAGCGGCCCGCTGCTCATAAGACTCGGCCTTAGAACCCCAGTATCAGCAGAAGGACATTTTAGGACGGGACTTGGGTGACTCTAGGGCACTGGTTTTCTTTCCAGAGAGCGGAACAGGCGAGGAAAAGTAGTCCCTTCTCGGCGATTCTGCGGAGGGATCTCCGTGGGGCGGTGAACGCCGATGATTATATAAGGACGCGCCGGGTGTGGCACAGCTAGTTCCGTCGCAGCCGGGATTTGGGTCGCGGTTCTTGTTTGTGGATCGCTGTGATCGTCACTTGGTGAGTAGCGGGCTGCTGGGCTGGCCGGGGCTTTCGTGGCCGCCGGGCCGCTCGGTGGGACGGAAGCGTGTGGAGAGACCGCCAAGGGCTGTAGTCTGGGTCCGCGAGCAAGGTTGCCCTGAACTGGGGGTTGGGGGGAGCGCAGCAAAATGGCGGCTGTTCCCGAGTCTTGAATGGAAGACGCTTGTGAGGCGGGCTGTGAGGTCGTTGAAACAAGGTGGGGGGCATGGTGGGCGGCAAGAACCCAAGGTCTTGAGGCCTTCGCTAATGCGGGAAAGCTCTTATTCGGGTGAGATGGGCTGGGGCACCATCTGGGGACCCTGACGTGAAGTTTGTCACTGACTGGAGAACTCGGTTTGTCGTCTGTTGCGGGGGCGGCAGTTATGCGGTGCCGTTGGGCAGTGCACCCGTACCTTTGGGAGCGCGCGCCTCGTCGTGTCGTGACGTCACCCGTTCTGTTGGCTTATAATGCAGGGTGGGGCCACCTGCCGGTAGGTGTGCGGTAGGCTTTTCTCCGTCGCAGGACGCAGGGTTCGGGCCTAGGGTAGGCTCTCCTGAATCGACAGGCGCCGGACCTCTGGTGAGGGGAGGGATAAGTGAGGCGTCAGTTTCTTTGGTCGGTTTTATGTACCTATCTTCTTAAGTAGCTGAAGCTCCGGTTTTGAACTATGCGCTCGGGGTTGGCGAGTGTGTTTTGTGAAGTTTTTTAGGCACCTTTTGAAATGTAATCATTTGGGTCAATATGTAATTTTCAGTGTTAGACTAGTAAATTGTCCGCTAAATTCTGGCCGTTTTTGGCTTTTTTGTTAGACGAAGCGGCCGCATTAAACGCCACCATGTCCCGCTTGGATAAGAGCAAGGTAATAAATAGCGCACTCGAACTCCTCAACGGCGTGGGCATCGAAGGTCTGACTACTCGAAAGCTCGCCCAGAAATTGGGTGTGGAGCAACCTACATTGTATTGGCATGTCAAGAACAAAAGAGCCCTGCTGGACGCTCTTCCTATTGAAATGCTTGACAGGCATCACACTCATTCCTGCCCCCTTGAGGTCGAGAGTTGGCAAGATTTTCTCCGAAACAATGCAAAGTCCTACCGCTGCGCACTTTTGTCCCATAGGGATGGAGCAAAAGTGCACCTGGGAACCAGGCCAACAGAGAAACAATACGAGACTCTCGAGAACCAGTTGGCTTTCTTGTGCCAACAGGGGTTCTCACTTGAAAATGCCCTTTACGCACTGTCAGCCGTTGGACATTTTACCCTGGGGTGCGTTCTTGAGGAGCAAGAACATCAGGTTGCTAAGGAGGAGCGCGAGACTCCAACCACTGATTCTATGCCACCTTTGCTGAAACAGGCCATTGAACTTTTCGATAGACAGGGTGCTGAACCTGCCTTTCTCTTCGGGTTGGAGCTGATTATTTGTGGTCTCGAAAAACAGCTGAAATGTGAAAGTGGTGGCCCTACTGACGCCCTCGATGATTTCGACCTGGATATGCTGCCAGCCGATGCACTTGATGATTTCGATTTGGATATGCTTCCAGCCGACGCACTGGACGACTTCGATTTGGACATGCTTCCCGGTTAAACTAGTCTAGCAATCAACCTCTGGATTACAAAATTTGTGAAAGATTGACTGGTATTCTTAACTATGTTGCTCCTTTTACGCTATGTGGATACGCTGCTTTAATGCCTTTGTATCATGCTATTGCTTCCCGTATGGCTTTCATTTTCTCCTCCTTGTATAAATCCTGGTTAGTTCTTGCCACGGCGGAACTCATCGCCGCCTGCCTTGCCCGCTGCTGGACAGGGGCTCGGCTGTTGGGCACTGACAATTCCGTGGTGTTTATTTGTGAAATTTGTGATGCTATTGCTTTATTTGTAACCATTCTAGCTTTATTTGTGAAATTTGTGATGCTATTGCTTTATTTGTAACCATTATAAGCTGCAATAAACAAGTTAACAACAACAATTGCATTCATTTTATGTTTCAGGTTCAGGGGGAGATGTGGGAGGTTTTTTAAAGCGGGGGATCCAAATTCCCGATAAGGATCTTCCTAGAGCATGGCTACGTAGATAAGTAGCATGGCGGGTTAATCATTAACTACAAGGAACCCCTAGTGATGGAGTTGGCCACTCCCTCTCTGCGCGCTCGCTCGCTCACTGAGGCCGGGCGACCAAAGGTCGCCCGACGCCCGGGCTTTGCCCGGGCGGCCTCAGTGAGCGAGCGAGCGCGCAGCCTTAATTAACCTAATTCACTGGCCGTCGTTTTACAACGTCGTGACTGGGAAAACCCTGGCGTTACCCAACTTAATCGCCTTGCAGCACATCCCCCTTTCGCCAGCTGGCGTAATAGCGAAGAGGCCCGCACCGATCGCCCTTCCCAACAGTTGCGCAGCCTGAATGGCGAATGGGACGCGCCCTGTAGCGGCGCATTAAGCGCGGCGGGTGTGGTGGTTACGCGCAGCGTGACCGCTACACTTGCCAGCGCCCTAGCGCCCGCTCCTTTCGCTTTCTTCCCTTCCTTTCTCGCCACGTTCGCCGGCTTTCCCCGTCAAGCTCTAAATCGGGGGCTCCCTTTAGGGTTCCGATTTAGTGCTTTACGGCACCTCGACCCCAAAAAACTTGATTAGGGTGATGGTTCACGTAGTGGGCCATCGCCCTGATAGACGGTTTTTCGCCCTTTGACGTTGGAGTCCACGTTCTTTAATAGTGGACTCTTGTTCCAAACTGGAACAACACTCAACCCTATCTCGGTCTATTCTTTTGATTTATAAGGGATTTTGCCGATTTCGGCCTATTGGTTAAAAAATGAGCTGATTTAACAAAAATTTAACGCGAATTTTAACAAAATATTAACGTTTATAATTTCAGGTGGCATCTTTCGGGGAAATGTGCGCGGAACCCCTATTTGTTTATTTTTCTAAATACATTCAAATATGTATCCGCTCATGAGACAATAACCCTGATAAATGCTTCAATAATATTGAAAAAGGAAGAGTATGAGTATTCAACATTTCCGTGTCGCCCTTATTCCCTTTTTTGCGGCATTTTGCCTTCCTGTTTTTGCTCACCCAGAAACGCTGGTGAAAGTAAAAGATGCTGAAGATCAGTTGGGTGCACGAGTGGGTTACATCGAACTGGATCTCAATAGTGGTAAGATCCTTGAGAGTTTTCGCCCCGAAGAACGTTTTCCAATGATGAGCACTTTTAAAGTTCTGCTATGTGGCGCGGTATTATCCCGTATTGACGCCGGGCAAGAGCAACTCGGTCGCCGCATACACTATTCTCAGAATGACTTGGTTGAGTACTCACCAGTCACAGAAAAGCATCTTACGGATGGCATGACAGTAAGAGAA

UBC启动子序列(SEQ ID NO:18):

GATCTGGCCTCCGCGCCGGGTTTTGGCGCCTCCCGCGGGCGCCCCCCTCCTCACGGCGAGCGCTGCCACGTCAGACGAAGGGCGCAGCGAGCGTCCTGATCCTTCCGCCCGGACGCTCAGGACAGCGGCCCGCTGCTCATAAGACTCGGCCTTAGAACCCCAGTATCAGCAGAAGGACATTTTAGGACGGGACTTGGGTGACTCTAGGGCACTGGTTTTCTTTCCAGAGAGCGGAACAGGCGAGGAAAAGTAGTCCCTTCTCGGCGATTCTGCGGAGGGATCTCCGTGGGGCGGTGAACGCCGATGATTATATAAGGACGCGCCGGGTGTGGCACAGCTAGTTCCGTCGCAGCCGGGATTTGGGTCGCGGTTCTTGTTTGTGGATCGCTGTGATCGTCACTTGGTGAGTAGCGGGCTGCTGGGCTGGCCGGGGCTTTCGTGGCCGCCGGGCCGCTCGGTGGGACGGAAGCGTGTGGAGAGACCGCCAAGGGCTGTAGTCTGGGTCCGCGAGCAAGGTTGCCCTGAACTGGGGGTTGGGGGGAGCGCAGCAAAATGGCGGCTGTTCCCGAGTCTTGAATGGAAGACGCTTGTGAGGCGGGCTGTGAGGTCGTTGAAACAAGGTGGGGGGCATGGTGGGCGGCAAGAACCCAAGGTCTTGAGGCCTTCGCTAATGCGGGAAAGCTCTTATTCGGGTGAGATGGGCTGGGGCACCATCTGGGGACCCTGACGTGAAGTTTGTCACTGACTGGAGAACTCGGTTTGTCGTCTGTTGCGGGGGCGGCAGTTATGCGGTGCCGTTGGGCAGTGCACCCGTACCTTTGGGAGCGCGCGCCTCGTCGTGTCGTGACGTCACCCGTTCTGTTGGCTTATAATGCAGGGTGGGGCCACCTGCCGGTAGGTGTGCGGTAGGCTTTTCTCCGTCGCAGGACGCAGGGTTCGGGCCTAGGGTAGGCTCTCCTGAATCGACAGGCGCCGGACCTCTGGTGAGGGGAGGGATAAGTGAGGCGTCAGTTTCTTTGGTCGGTTTTATGTACCTATCTTCTTAAGTAGCTGAAGCTCCGGTTTTGAACTATGCGCTCGGGGTTGGCGAGTGTGTTTTGTGAAGTTTTTTAGGCACCTTTTGAAATGTAATCATTTGGGTCAATATGTAATTTTCAGTGTTAGACTAGTAAATTGTCCGCTAAATTCTGGCCGTTTTTGGCTTTTTTGTTAGAC

Tet-O序列(SEQ ID NO:19):TCCCTATCAGTGATAGAGA

编码最小CMV启动子的核酸序列(SEQ ID NO:20):

GCTTTAGGCGTGTACGGTGGGCGCCTATAAAAGCAGAGCTCGTTTAGTGAACCGTCAGATCGCCTGGA

编码WPRE的核酸序列(SEQ ID NO:21):

AATCAACCTCTGGATTACAAAATTTGTGAAAGATTGACTGGTATTCTTAACTATGTTGCTCCTTTTACGCTATGTGGATACGCTGCTTTAATGCCTTTGTATCATGCTATTGCTTCCCGTATGGCTTTCATTTTCTCCTCCTTGTATAAATCCTGGTTAGTTCTTGCCACGGCGGAACTCATCGCCGCCTGCCTTGCCCGCTGCTGGACAGGGGCTCGGCTGTTGGGCACTGACAATTCCGTGGTGTT

编码末端反向重复序列的核酸序列(SEQ ID NO:22):

CCTTAATTAGGCTGCGCGCTCGCTCGCTCACTGAGGCCGCCCGGGCAAAGCCCGGGCGTCGGGCGACCTTTGGTCGCCCGGCCTCAGTGAGCGAGCGAGCGCGCAGAGAGGGAGTGGCCAACTCCATCACTAGGGGTTCCT

TRE2启动子的核酸序列(TRE启动子的非限制性实例)(SEQ ID NO:23):

AATTCGTACACGCCTACCTCGACCCATCAAGTGCCACCTGACGTCTCCCTATCAGTGATAGAGAAGTCGACACGTCTCGAGCTCCCTATCAGTGATAGAGAAGGTACGTCTAGAACGTCTCCCTATCAGTGATAGAGAAGTCGACACGTCTCGAGCTCCCTATCAGTGATAGAGAAGGTACGTCTAGAACGTCTCCCTATCAGTGATAGAGAAGTCGACACGTCTCGAGCTCCCTATCAGTGATAGAGAAGGTACGTCTAGAACGTCTCCCTATCAGTGATAGAGAAGTCGACACGTCTCGAGCTCCCTATCAGTGATAGAGAAGGTACCCCCTATATAAGCAGAGCTCGTTTAGTGAACCGTCAGATCGCCTGGAGACGCCATCCACGCTGTTTTGACCTCCATAGAAGACACCGGGACCGATCCAGCCTGGATCGC

P tight启动子的核酸序列(TRE启动子的非限制性实例)(SEQ ID NO:24):

GAGTTTACTCCCTATCAGTGATAGAGAACGTATGTCGAGTTTACTCCCTATCAGTGATAGAGAACGATGTCGAGTTTACTCCCTATCAGTGATAGAGAACGTATGTCGAGTTTACTCCCTATCAGTGATAGAGAACGTATGTCGAGTTTACTCCCTATCAGTGATAGAGAACGTATGTCGAGTTTATCCCTATCAGTGATAGAGAACGTATGTCGAGTTTACTCCCTATCAGTGATAGAGAACGTATGTCGAGGTAGGCGTGTACGGTGGGAGGCCTATATAAGCAGAGCTCGTTTAGTGAACCGTCAGATCGCC

编码TetR的核酸序列(SEQ ID NO:25):

ATGGCTAGATTAGATAAAAGTAAAGTGATTAACAGCGCATTAGAGCTGCTTAATGAGGTCGGAATCGAAGGTTTAACAACCCGTAAACTCGCCCAGAAGCTAGGTGTAGAGCAGCCTACATTGTATTGGCATGTAAAAAATAAGCGGGCTTTGCTCGACGCCTTAGCCATTGAGATGTTAGATAGGCACCATACTCACTTTTGCCCTTTAGAAGGGGAAAGCTGGCAAGATTTTTTACGTAATAACGCTAAAAGTTTTAGATGTGCTTTACTAAGTCATCGCGATGGAGCAAAAGTACATTTAGGTACACGGCCTACAGAAAAACAGTATGAAACTCTCGAAAATCAATTAGCCTTTTTATGCCAACAAGGTTTTTCACTAGAGAATGCATTATATGCACTCAGCGCTGTGGGGCATTTTACTTTAGGTTGCGTATTGGAAGATCAAGAGCATCAAGTCGCTAAAGAAGAAAGGGAAACACCTACTACTGATAGTATGCCGCCATTATTACGACAAGCTATCGAATTATTTGATCACCAAGGTGCAGAGCCAGCCTTCTTATTCGGCCTTGAATTGATCATATGCGGATTAGAAAAACAACTTAAATGTGAAAGTGGG

编码TetR的氨基酸序列(SEQ ID NO:26):

MARLDKSKVINSALELLNEVGIEGLTTRKLAQKLGVEQPTLYWHVKNKRALLDALAIEMLDRHHTHFCPLEGESWQDFLRNNAKSFRCALLSHRDGAKVHLGTRPTEKQYETLENQLAFLCQQGFSLENALYALSAVGHFTLGCVLEDQEHQVAKEERETPTTDSMPPLLRQAIELFDHQGAEPAFLFGLELIICGLEKQLKCESG

编码TetR-Krab的核酸序列(SEQ ID NO:27)

ATGGCTAGATTAGATAAAAGTAAAGTGATTAACAGCGCATTAGAGCTGCTTAATGAGGTCGGAATCGAAGGTTTAACAACCCGTAAACTCGCCCAGAAGCTAGGTGTAGAGCAGCCTACATTGTATTGGCATGTAAAAAATAAGCGGGCTTTGCTCGACGCCTTAGCCATTGAGATGTTAGATAGGCACCATACTCACTTTTGCCCTTTAGAAGGGGAAAGCTGGCAAGATTTTTTACGTAATAACGCTAAAAGTTTTAGATGTGCTTTACTAAGTCATCGCGATGGAGCAAAAGTACATTTAGGTACACGGCCTACAGAAAAACAGTATGAAACTCTCGAAAATCAATTAGCCTTTTTATGCCAACAAGGTTTTTCACTAGAGAATGCATTATATGCACTCAGCGCTGTGGGGCATTTTACTTTAGGTTGCGTATTGGAAGATCAAGAGCATCAAGTCGCTAAAGAAGAAAGGGAAACACCTACTACTGATAGTATGCCGCCATTATTACGACAAGCTATCGAATTATTTGATCACCAAGGTGCAGAGCCAGCCTTCTTATTCGGCCTTGAATTGATCATATGCGGATTAGAAAAACAACTTAAATGTGAAAGTGGGTCGCCAAAAAAGAAGAGAAAGGTCGACGGCGGTGGTGCTTTGTCTCCTCAGCACTCTGCTGTCACTCAAGGAAGTATCATCAAGAACAAGGAGGGCATGGATGCTAAGTCACTAACTGCCTGGTCCCGGACACTGGTGACCTTCAAGGATGTATTTGTGGACTTCACCAGGGAGGAGTGGAAGCTGCTGGACACTGCTCAGCAGATCGTGTACAGAAATGTGATGCTGGAGAACTATAAGAACCTGGTTTCCTTGGGTTATCAGCTTACTAAGCCAGATGTGATCCTCCGGTTGGAGAAGGGAGAAGAGCCCTGGCTGGTGGAGAGAGAAATTCACCAAGAGACCCATCCTGATTCAGAGACTGCATTTGAAATCAAATCATCAGTTTAA

编码TetR-KRAB的氨基酸序列(SEQ ID NO:28):

MARLDKSKVINSALELLNEVGIEGLTTRKLAQKLGVEQPTLYWHVKNKRALLDALAIEMLDRHHTHFCPLEGESWQDFLRNNAKSFRCALLSHRDGAKVHLGTRPTEKQYETLENQLAFLCQQGFSLENALYALSAVGHFTLGCVLEDQEHQVAKEERETPTTDSMPPLLRQAIELFDHQGAEPAFLFGLELIICGLEKQLKCESGSPKKKRKVDGGGALSPQHSAVTQGSIIKNKEGMDAKSLTAWSRTLVTFKDVFVDFTREEWKLLDTAQQIVYRNVMLENYKNLVSLGYQLTKPDVILRLEKGEEPWLVEREIHQETHPDSETAFEIKSSV

结蛋白启动子(SEQ ID NO:29):

ACCTTGCTTCCTAGCTGGGCCTTTCCTTCTCCTCTATAAATACCAGCTCTGGTATTTCGCCTTGGCAGCTGTTGCTGCTAGGGAGACGGCTGGCTTGACATGCATCTCCTGACAAAACACAAACCCGTGGTGTGAGTGGGTGTGGGCGGTGTGAGTAGGGGGATGAATCAGAGAGGGGGCGAGGGAGACAGGGGCGCAGGAGTCAGGCAAAGGCGATGCGGGGGTGCGACTACACGCAGTTGGAAACAGTCGTCAGAAGATTCTGGAAACTATCTTGCTGGCTATAAACTTGAGGGAAGCAGAAGGCCAACATTCCTCCCAAGGGAAACTGAGGCTCAGAGTTAAAACCCAGGTATCAGTGATATGCATGTGCCCCGGCCAGGGTCACTCTCTGACTAACCGGTACCTACCCTACAGGCCTACCTAGAGACTCTTTTGAAAGGATGGTAGAGACCTGTCCGGGCTTTGCCCACAGTCGTTGGAAACCTCAGCATTTTCTAGGCAACTTGTGCGAATAAAACACTTCGGGGGTCCTTCTTGTTCATTCCAATAACCTAAAACCTCTCCTCGGAGAAAATAGGGGGCCTCAAACAAACGAAATTCTCTAGCCCGCTTTCCCCAGGATAAGGCAGGCATCCAAATGGAAAAAAAGGGGCCGGCCGGGGGTCTCCTGTCAGCTCCTTGCCCTGTGAAACCCAGCAGGCCTGCCTGTCTTCTGTCCTCTTGGGGCTGTCCAGGGGCGCAGGCCTCTTGCGGGGGAGCTGGCCTCCCCGCCCCCTCGCCTGTGGCCGCCCTTTTCCTGGCAGGACAGAGGGATCCTGCAGCTGTCAGGGGAGGGGCGCCGGGGGGTGATGTCAGGAGGGCTACAAATAGTGCAGACAGCTAAGGGGCTCCGTCACCCATCTTCACATCCACTCCAGCCGGCTGCCCGCCCGCTGCCTCCTCTGTGCGTCCGCCCAGCCAGCCTCGTCCACGCC

结蛋白-rtTA4载体(SEQ ID NO:30):

TTATGCAGTGCTGCCATAACCATGAGTGATAACACTGCGGCCAACTTACTTCTGACAACGATCGGAGGACCGAAGGAGCTAACCGCTTTTTTGCACAACATGGGGGATCATGTAACTCGCCTTGATCGTTGGGAACCGGAGCTGAATGAAGCCATACCAAACGACGAGCGTGACACCACGATGCCTGTAGTAATGGTAACAACGTTGCGCAAACTATTAACTGGCGAACTACTTACTCTAGCTTCCCGGCAACAATTAATAGACTGGATGGAGGCGGATAAAGTTGCAGGACCACTTCTGCGCTCGGCCCTTCCGGCTGGCTGGTTTATTGCTGATAAATCTGGAGCCGGTGAGCGTGGGTCTCGCGGTATCATTGCAGCACTGGGGCCAGATGGTAAGCCCTCCCGTATCGTAGTTATCTACACGACGGGGAGTCAGGCAACTATGGATGAACGAAATAGACAGATCGCTGAGATAGGTGCCTCACTGATTAAGCATTGGTAACTGTCAGACCAAGTTTACTCATATATACTTTAGATTGATTTAAAACTTCATTTTTAATTTAAAAGGATCTAGGTGAAGATCCTTTTTGATAATCTCATGACCAAAATCCCTTAACGTGAGTTTTCGTTCCACTGAGCGTCAGACCCCGTAGAAAAGATCAAAGGATCTTCTTGAGATCCTTTTTTTCTGCGCGTAATCTGCTGCTTGCAAACAAAAAAACCACCGCTACCAGCGGTGGTTTGTTTGCCGGATCAAGAGCTACCAACTCTTTTTCCGAAGGTAACTGGCTTCAGCAGAGCGCAGATACCAAATACTGTCCTTCTAGTGTAGCCGTAGTTAGGCCACCACTTCAAGAACTCTGTAGCACCGCCTACATACCTCGCTCTGCTAATCCTGTTACCAGTGGCTGCTGCCAGTGGCGATAAGTCGTGTCTTACCGGGTTGGACTCAAGACGATAGTTACCGGATAAGGCGCAGCGGTCGGGCTGAACGGGGGGTTCGTGCACACAGCCCAGCTTGGAGCGAACGACCTACACCGAACTGAGATACCTACAGCGTGAGCTATGAGAAAGCGCCACGCTTCCCGAAGGGAGAAAGGCGGACAGGTATCCGGTAAGCGGCAGGGTCGGAACAGGAGAGCGCACGAGGGAGCTTCCAGGGGGAAACGCCTGGTATCTTTATAGTCCTGTCGGGTTTCGCCACCTCTGACTTGAGCGTCGATTTTTGTGATGCTCGTCAGGGGGGCGGAGCCTATGGAAAAACGCCAGCAACGCGGCCTTTTTACGGTTCCTGGCCTTTTGCTGGCCTTTTGCTCACATGTTCTTTCCTGCGTTATCCCCTGATTCTGTGGATAACCGTATTACCGCCTTTGAGTGAGCTGATACCGCTCGCCGCAGCCGAACGACCGAGCGCAGCGAGTCAGTGAGCGAGGAAGCGGAAGAGCGCCCAATACGCAAACCGCCTCTCCCCGCGCGTTGGCCGATTCATTAATGCAGCTGGCACGACAGGTTTCCCGACTGGAAAGCGGGCAGTGAGCGCAACGCAATTAATGTGAGTTAGCTCACTCATTAGGCACCCCAGGCTTTACACTTTATGCTTCCGGCTCGTATGTTGTGTGGAATTGTGAGCGGATAACAATTTCACACAGGAAACAGCTATGACCATGATTACGCCAGATTTAATTAAGGCCTTAATTAGGCTGCGCGCTCGCTCGCTCACTGAGGCCGCCCGGGCAAAGCCCGGGCGTCGGGCGACCTTTGGTCGCCCGGCCTCAGTGAGCGAGCGAGCGCGCAGAGAGGGAGTGGCCAACTCCATCACTAGGGGTTCCTTGTAGTTAATGATTAACCCGCCATGCTACTTATCTACGTAGCCATGCTCTAGGAAGATCGGAATTCCTAGATCTACCTTGCTTCCTAGCTGGGCCTTTCCTTCTCCTCTATAAATACCAGCTCTGGTATTTCGCCTTGGCAGCTGTTGCTGCTAGGGAGACGGCTGGCTTGACATGCATCTCCTGACAAAACACAAACCCGTGGTGTGAGTGGGTGTGGGCGGTGTGAGTAGGGGGATGAATCAGAGAGGGGGCGAGGGAGACAGGGGCGCAGGAGTCAGGCAAAGGCGATGCGGGGGTGCGACTACACGCAGTTGGAAACAGTCGTCAGAAGATTCTGGAAACTATCTTGCTGGCTATAAACTTGAGGGAAGCAGAAGGCCAACATTCCTCCCAAGGGAAACTGAGGCTCAGAGTTAAAACCCAGGTATCAGTGATATGCATGTGCCCCGGCCAGGGTCACTCTCTGACTAACCGGTACCTACCCTACAGGCCTACCTAGAGACTCTTTTGAAAGGATGGTAGAGACCTGTCCGGGCTTTGCCCACAGTCGTTGGAAACCTCAGCATTTTCTAGGCAACTTGTGCGAATAAAACACTTCGGGGGTCCTTCTTGTTCATTCCAATAACCTAAAACCTCTCCTCGGAGAAAATAGGGGGCCTCAAACAAACGAAATTCTCTAGCCCGCTTTCCCCAGGATAAGGCAGGCATCCAAATGGAAAAAAAGGGGCCGGCCGGGGGTCTCCTGTCAGCTCCTTGCCCTGTGAAACCCAGCAGGCCTGCCTGTCTTCTGTCCTCTTGGGGCTGTCCAGGGGCGCAGGCCTCTTGCGGGGGAGCTGGCCTCCCCGCCCCCTCGCCTGTGGCCGCCCTTTTCCTGGCAGGACAGAGGGATCCTGCAGCTGTCAGGGGAGGGGCGCCGGGGGGTGATGTCAGGAGGGCTACAAATAGTGCAGACAGCTAAGGGGCTCCGTCACCCATCTTCACATCCACTCCAGCCGGCTGCCCGCCCGCTGCCTCCTCTGTGCGTCCGCCCAGCCAGCCTCGTCCACGCCAAGCTTGCGGCCGCATTAAACGCCACCATGTCCCGCTTGGATAAGAGCAAGGTAATAAATAGCGCACTCGAACTCCTCAACGGCGTGGGCATCGAAGGTCTGACTACTCGAAAGCTCGCCCAGAAATTGGGTGTGGAGCAACCTACATTGTATTGGCATGTCAAGAACAAAAGAGCCCTGCTGGACGCTCTTCCTATTGAAATGCTTGACAGGCATCACACTCATTCCTGCCCCCTTGAGGTCGAGAGTTGGCAAGATTTTCTCCGAAACAATGCAAAGTCCTACCGCTGCGCACTTTTGTCCCATAGGGATGGAGCAAAAGTGCACCTGGGAACCAGGCCAACAGAGAAACAATACGAGACTCTCGAGAACCAGTTGGCTTTCTTGTGCCAACAGGGGTTCTCACTTGAAAATGCCCTTTACGCACTGTCAGCCGTTGGACATTTTACCCTGGGGTGCGTTCTTGAGGAGCAAGAACATCAGGTTGCTAAGGAGGAGCGCGAGACTCCAACCACTGATTCTATGCCACCTTTGCTGAAACAGGCCATTGAACTTTTCGATAGACAGGGTGCTGAACCTGCCTTTCTCTTCGGGTTGGAGCTGATTATTTGTGGTCTCGAAAAACAGCTGAAATGTGAAAGTGGTGGCCCTACTGACGCCCTCGATGATTTCGACCTGGATATGCTGCCAGCCGATGCACTTGATGATTTCGATTTGGATATGCTTCCAGCCGACGCACTGGACGACTTCGATTTGGACATGCTTCCCGGTTAAACTAGTCTAGCAATCAACCTCTGGATTACAAAATTTGTGAAAGATTGACTGGTATTCTTAACTATGTTGCTCCTTTTACGCTATGTGGATACGCTGCTTTAATGCCTTTGTATCATGCTATTGCTTCCCGTATGGCTTTCATTTTCTCCTCCTTGTATAAATCCTGGTTAGTTCTTGCCACGGCGGAACTCATCGCCGCCTGCCTTGCCCGCTGCTGGACAGGGGCTCGGCTGTTGGGCACTGACAATTCCGTGGTGTTTATTTGTGAAATTTGTGATGCTATTGCTTTATTTGTAACCATTCTAGCTTTATTTGTGAAATTTGTGATGCTATTGCTTTATTTGTAACCATTATAAGCTGCAATAAACAAGTTAACAACAACAATTGCATTCATTTTATGTTTCAGGTTCAGGGGGAGATGTGGGAGGTTTTTTAAAGCGGGGGATCCAAATTCCCGATAAGGATCTTCCTAGAGCATGGCTACGTAGATAAGTAGCATGGCGGGTTAATCATTAACTACAAGGAACCCCTAGTGATGGAGTTGGCCACTCCCTCTCTGCGCGCTCGCTCGCTCACTGAGGCCGGGCGACCAAAGGTCGCCCGACGCCCGGGCTTTGCCCGGGCGGCCTCAGTGAGCGAGCGAGCGCGCAGCCTTAATTAACCTAATTCACTGGCCGTCGTTTTACAACGTCGTGACTGGGAAAACCCTGGCGTTACCCAACTTAATCGCCTTGCAGCACATCCCCCTTTCGCCAGCTGGCGTAATAGCGAAGAGGCCCGCACCGATCGCCCTTCCCAACAGTTGCGCAGCCTGAATGGCGAATGGGACGCGCCCTGTAGCGGCGCATTAAGCGCGGCGGGTGTGGTGGTTACGCGCAGCGTGACCGCTACACTTGCCAGCGCCCTAGCGCCCGCTCCTTTCGCTTTCTTCCCTTCCTTTCTCGCCACGTTCGCCGGCTTTCCCCGTCAAGCTCTAAATCGGGGGCTCCCTTTAGGGTTCCGATTTAGTGCTTTACGGCACCTCGACCCCAAAAAACTTGATTAGGGTGATGGTTCACGTAGTGGGCCATCGCCCTGATAGACGGTTTTTCGCCCTTTGACGTTGGAGTCCACGTTCTTTAATAGTGGACTCTTGTTCCAAACTGGAACAACACTCAACCCTATCTCGGTCTATTCTTTTGATTTATAAGGGATTTTGCCGATTTCGGCCTATTGGTTAAAAAATGAGCTGATTTAACAAAAATTTAACGCGAATTTTAACAAAATATTAACGTTTATAATTTCAGGTGGCATCTTTCGGGGAAATGTGCGCGGAACCCCTATTTGTTTATTTTTCTAAATACATTCAAATATGTATCCGCTCATGAGACAATAACCCTGATAAATGCTTCAATAATATTGAAAAAGGAAGAGTATGAGTATTCAACATTTCCGTGTCGCCCTTATTCCCTTTTTTGCGGCATTTTGCCTTCCTGTTTTTGCTCACCCAGAAACGCTGGTGAAAGTAAAAGATGCTGAAGATCAGTTGGGTGCACGAGTGGGTTACATCGAACTGGATCTCAATAGTGGTAAGATCCTTGAGAGTTTTCGCCCCGAAGAACGTTTTCCAATGATGAGCACTTTTAAAGTTCTGCTATGTGGCGCGGTATTATCCCGTATTGACGCCGGGCAAGAGCAACTCGGTCGCCGCATACACTATTCTCAGAATGACTTGGTTGAGTACTCACCAGTCACAGAAAAGCATCTTACGGATGGCATGACAGTAAGAGAA

pAAV2_CMV_rtTA(V16)(SEQ ID NO:31):

AAATTGTAAACGTTAATATTTTGTTAAAATTCGCGTTAAATTTTTGTTAAATCAGCTCATTTTTTAACCAATAGGCCGAAATCGGCAAAATCCCTTATAAATCAAAAGAATAGCCCGAGATAGGGTTGAGTGTTGTTCCAGTTTGGAACAAGAGTCCACTATTAAAGAACGTGGACTCCAACGTCAAAGGGCGAAAAACCGTCTATCAGGGCGATGGCCCACTACGTGAACCATCACCCAAATCAAGTTTTTTGGGGTCGAGGTGCCGTAAAGCACTAAATCGGAACCCTAAAGGGAGCCCCCGATTTAGAGCTTGACGGGGAAAGCCGGCGAACGTGGCGAGAAAGGAAGGGAAGAAAGCGAAAGGAGCGGGCGCTAGGGCGCTGGCAAGTGTAGCGGTCACGCTGCGCGTAACCACCACACCCGCCGCGCTTAATGCGCCGCTACAGGGCGCGTACTATGGTTGCTTTGACGTATGCGGTGTGAAATACCGCACAGATGCGTAAGGAGAAAATACCGCATCAGGCGCCCCTGCAGGCAGCTGCGCGCTCGCTCGCTCACTGAGGCCGCCCGGGCAAAGCCCGGGCGTCGGGCGACCTTTGGTCGCCCGGCCTCAGTGAGCGAGCGAGCGCGCAGAGAGGGAGTGGCCAACTCCATCACTAGGGGTTCCTGCGGCCGCTCGGTCCGCACGATCTCAATTCGGCCATTACGGCCGGATCCGGCTCGAGgagcttggcccattgcatacgttgtatccatatcataatatgtacatttatattggctcatgtccaacattaccgccatgttgacattgattattgactagttattaatagtaatcaattacggggtcattagttcatagcccatatatggagttccgcgttacataacttacggtaaatggcccgcctggctgaccgcccaacgacccccgcccattgacgtcaataatgacgtatgttcccatagtaacgccaatagggactttccattgacgtcaatgggtggagtatttacgctaaactgcccacttggcagtacatcaagtgtatcatatgccaagtacgccccctattgacgtcaatgacggtaaatggcccgcctggcattatgcccagtacatgaccttatgggactttcctacttggcagtacatctacgtattagtcatcgctattaccatggtgatgcggttttggcagtacatcaatgggcgtggatagcggtttgactcacggggatttccaagtctccaccccattgacgtcaatgggagtttgttttggcaccaaaatcaacgggactttccaaaatgtcgtaacaactccgccccattgacgcaaatgggcggtaggcgtgtacggtgggaggtctatataagcagagctcgtttagtgaaccgtcagatcgcctggagacgccatccacgctgttttgacctccatagaagacaccgggaccgatccagcctccgcggccccgaattcaccATGTCTAGACTGGACAAGAGCAAAATCATAAACAGCGCTCTGGAATTACTCAATGGAGTCGGTATCGAAGGCCTGACGACAAGGAAACTCGCTCAAAAGCTGGGAGTTGAGCAGCCTACCCTGTACTGGCACGTGAAGAACAAGCGGGCCCTGCTCGATGCCCTGCCAATCGAGATGCTGGACAGGCATCATACCCACAGCTGCCCCCTGGAAGGCGAGTCATGGCAAGACTTTCTGCGGAACAACGCCAAGTCATACCGCTGTGCTCTCCTCTCACATCGCGACGGGGCTAAAGTGCATCTCGGCACCCGCCCAACAGAGAAACAGTACGAAACCCTGGAAAATCAGCTCGCGTTCCTGTGTCAGCAAGGCTTCTCCCTGGAGAACGCACTGTACGCTCTGTCCGCCGTGGGCCACTTTACACTGGGCTGCGTATTGGAGGAACAGGAGCATCAAGTAGCAAAAGAGGAAAGAGAGACACCTACCACCGATTCTATGCCCCCACTTCTGAAGCAAGCAATTGAGCTGTTCGACCGGCAGGGAGCCGAACCTGCCTTCCTTTTCGGCCTGGAACTAATCATATGTGGCCTGGAGAAACAGCTAAAGTGCGAAAGCGGCGGGCCGACCGACGCCCTTGACGATTTTGACTTAGACATGCTCCCAGCCGATGCCCTTGACGACTTTGACCTTGATATGCTGCCTGCTGACGCTCTTGACGATTTTGACCTTGACATGCTCCCCGGGTAActaagtaaggatcATCTTAATTAAATCGATAAGGATCTGGCCGCCTCGGCCtaatcaacctctggattacaaaatttgtgaaagattgactggtattcttaactatgttgctccttttacgctatgtggatacgctgctttaatgcctttgtatcatgctattgcttcccgtatggctttcattttctcctccttgtataaatcctggttgctgtctctttatgaggagttgtggcccgttgtcaggcaacgtggcgtggtgtgcactgtgtttgctgacgcaacccccactggttggggcattgccaccacctgtcagctcctttccgggactttcgctttccccctccctattgccacggcggaactcatcgccgcctgccttgcccgctgctggacaggggctcggctgttgggcactgacaattccgtggtgttgtcggggaaatcatcgtcctttccttggctgctcgcctgtgttgccacctggattctgcgcgggacgtccttctgctacgtcccttcggccctcaatccagcggaccttccttcccgcggcctgctgccggctctgcggcctcttccgcgtcttcgccttcgccctcagacgagtcggatctccctttgggccgcctccccgcCAGACATGATAAGATACATTGATGAGTTTGGACAAACCACAACTAGAATGCAGTGAAAAAAATGCTTTATTTGTGAAATTTGTGATGCTATTGCTTTATTTGTAACCATTATAAGCTGCAATAAACAAGTTAACAACAACAATTGCATTCATTTTATGTTTCAGGTTCAGGGGGAGATGTGGGAGGTTTTTTAAAGCAAGTAAAACCTCTACAAATGTGGTAACTAGCGCGTGCGGCCGCAGGAACCCCTAGTGATGGAGTTGGCCACTCCCTCTCTGCGCGCTCGCTCGCTCACTGAGGCCGGGCGACCAAAGGTCGCCCGACGCCCGGGCTTTGCCCGGGCGGCCTCAGTGAGCGAGCGAGCGCGCAGCTGCCTGCAGGACATGTGAGCAAAAGGCCAGCAAAAGGCCAGGAACCGTAAAAAGGCCGCGTTGCTGGCGTTTTTCCATAGGCTCCGCCCCCCTGACGAGCATCACAAAAATCGACGCTCAAGTCAGAGGTGGCGAAACCCGACAGGACTATAAAGATACCAGGCGTTTCCCCCTGGAAGCTCCCTCGTGCGCTCTCCTGTTCCGACCCTGCCGCTTACCGGATACCTGTCCGCCTTTCTCCCTTCGGGAAGCGTGGCGCTTTCTCATAGCTCACGCTGTAGGTATCTCAGTTCGGTGTAGGTCGTTCGCTCCAAGCTGGGCTGTGTGCACGAACCCCCCGTTCAGCCCGACCGCTGCGCCTTATCCGGTAACTATCGTCTTGAGTCCAACCCGGTAAGACACGACTTATCGCCACTGGCAGCAGCCACTGGTAACAGGATTAGCAGAGCGAGGTATGTAGGCGGTGCTACAGAGTTCTTGAAGTGGTGGCCTAACTACGGCTACACTAGAAGGACAGTATTTGGTATCTGCGCTCTGCTGAAGCCAGTTACCTTCGGAAAAAGAGTTGGTAGCTCTTGATCCGGCAAACAAACCACCGCTGGTAGCGGTGGTTTTTTTGTTTGCAAGCAGCAGATTACGCGCAGAAAAAAAGGATCTCAAGAAGATCCTTTGATCTTTTCTACGGGGTCTGACGCTCAGTGGAACGAAAACTCACGTTAAGGGATTTTGGTCATGAGATTATCAAAAAGGATCTTCACCTAGATCCTTTTAAATTAAAAATGAAGTTTTAAATCAATCTAAAGTATATATGAGTAAACTTGGTCTGACAGTTACCAATGCTTAATCAGTGAGGCACCTATCTCAGCGATCTGTCTATTTCGTTCATCCATAGTTGCCTGACTCCCCGTCGTGTAGATAACTACGATACGGGAGGGCTTACCATCTGGCCCCAGTGCTGCAATGATACCGCGAGACCCACGCTCACCGGCTCCAGATTTATCAGCAATAAACCAGCCAGCCGGAAGGGCCGAGCGCAGAAGTGGTCCTGCAACTTTATCCGCCTCCATCCAGTCTATTAATTGTTGCCGGGAAGCTAGAGTAAGTAGTTCGCCAGTTAATAGTTTGCGCAACGTTGTTGCCATTGCTACAGGCATCGTGGTGTCACGCTCGTCGTTTGGTATGGCTTCATTCAGCTCCGGTTCCCAACGATCAAGGCGAGTTACATGATCCCCCATGTTGTGCAAAAAAGCGGTTAGCTCCTTCGGTCCTCCGATCGTTGTCAGAAGTAAGTTGGCCGCAGTGTTATCACTCATGGTTATGGCAGCACTGCATAATTCTCTTACTGTCATGCCATCCGTAAGATGCTTTTCTGTGACTGGTGAGTACTCAACCAAGTCATTCTGAGAATAGTGTATGCGGCGACCGAGTTGCTCTTGCCCGGCGTCAATACGGGATAATACCGCGCCACATAGCAGAACTTTAAAAGTGCTCATCATTGGAAAACGTTCTTCGGGGCGAAAACTCTCAAGGATCTTACCGCTGTTGAGATCCAGTTCGATGTAACCCACTCGTGCACCCAACTGATCTTCAGCATCTTTTACTTTCACCAGCGTTTCTGGGTGAGCAAAAACAGGAAGGCAAAATGCCGCAAAAAAGGGAATAAGGGCGACACGGAAATGTTGAATACTCATACTCTTCCTTTTTCAATATTATTGAAGCATTTATCAGGGTTATTGTCTCATGAGCGGATACATATTTGAATGTATTTAGAAAAATAAACAAATAGGGGTTCCGCGCACATTTCCCCGAAAAGTGCCACCTGACGTCTAAGAAACCATTATTATCATGACATTAACCTATAAAAATAGGCGTATCACGAGGCCCTTTCGTCTCGCGCGTTTCGGTGATGACGGTGAAAACCTCTGACACATGCAGCTCCCGGAGACGGTCACAGCTTGTCTGTAAGCGGATGCCGGGAGCAGACAAGCCCGTCAGGGCGCGTCAGCGGGTGTTGGCGGGTGTCGGGGCTGGCTTAACTATGCGGCATCAGAGCAGATTGTACTGAGAGTGCACCATA

CAG-tTA(SEQ ID NO:32):

CCTGCAGGCAGCTGCGCGCTCGCTCGCTCACTGAGGCCGCCCGGGCAAAGCCCGGGCGTCGGGCGACCTTTGGTCGCCCGGCCTCAGTGAGCGAGCGAGCGCGCAGAGAGGGAGTGGCCAACTCCATCACTAGGGGTTCCTGCGGCCGCACGCGTGGAGCTAGTTATTAATAGTAATCAATTACGGGGTCATTAGTTCATAGCCCATATATGGAGTTCCGCGTTACATAACTTACGGTAAATGGCCCGCCTGGCTGACCGCCCAACGACCCCCGCCCATTGACGTCAATAATGACGTATGTTCCCATAGTAACGTCAATAGGGACTTTCCATTGACGTCAATGGGTGGAGTATTTACGGTAAACTGCCCACTTGGCAGTACATCAAGTGTATCATATGCCAAGTACGCCCCCTATTGACGTCAATGACGGTAAATGGCCCGCCTGGCATTATGCCCAGTACATGACCTTATGGGACTTTCCTACTTGGCAGTACATCTACGTATTAGTCATCGCTATTACCATGGTGATGCGGTTTTGGCAGTACATCAATGGGCGTGGATAGCGGTTTGACTCACGGGGATTTCCAAGTCTCCACCCCATTGACGTCAATGGGAGTTTGTTTTGCACCAAAATCAACGGGACTTTCCAAAATGTCGTAACAACTCCGCCCCATTGACGCAAATGGGCGGTAGGCGTGTACGGTGGGAGGTCTATATAAGCAGAGCTCGTTTAGTGAACCGTCAGATCGCCTGGAGACGCCATCCACGCTGTTTTGACCTCCATAGAAGACACCGGGACCGATCCAGCCTCCGCGGATTCGAATCCCGGCCGGGAACGGTGCATTGGAACGCGGATTCCCCGTGCCAAGAGTGACGTAAGTACCGCCTATAGAGTCTATAGGCCCACAAAAAATGCTTTCTTCTTTTAATATACTTTTTTGTTTATCTTATTTCTAATACTTTCCCTAATCTCTTTCTTTCAGGGCAATAATGATACAATGTATCATGCCTCTTTGCACCATTCTAAAGAATAACAGTGATAATTTCTGGGTTAAGGCAATAGCAATATTTCTGCATATAAATATTTCTGCATATAAATTGTAACTGATGTAAGAGGTTTCATATTGCTAATAGCAGCTACAATCCAGCTACCATTCTGCTTTTATTTTATGGTTGGGATAAGGCTGGATTATTCTGAGTCCAAGCTAGGCCCTTTTGCTAATCATGTTCATACCTCTTATCTTCCTCCCACAGCTCCTGGGCAACGTGCTGGTCTGTGTGCTGGCCCATCACTTTGGCAAAGAATTGGGATTCGAACATCGATTGAATTCATGTCTAGACTGGACAAGAGCAAAGTCATAAACTCTGCTCTGGAATTACTCAATGAAGTCGGTATCGAAGGCCTGACGACAAGGAAACTCGCTCAAAAGCTGGGAGTTGAGCAGCCTACCCTGTACTGGCACGTGAAGAACAAGCGGGCCCTGCTCGATGCCCTGGCAATCGAGATGCTGGACAGGCATCATACCCACTTCTGCCCCCTGGAAGGCGAGTCATGGCAAGACTTTCTGCGGAACAACGCCAAGTCATTCCGCTGTGCTCTCCTCTCACATCGCGACGGGGCTAAAGTGCATCTCGGCACCCGCCCAACAGAGAAACAGTACGAAACCCTGGAAAATCAGCTCGCGTTCCTGTGTCAGCAAGGCTTCTCCCTGGAGAACGCACTGTACGCTCTGTCCGCCGTGGGCCACTTTACACTGGGCTGCGTATTGGAGGATCAGGAGCATCAAGTAGCAAAAGAGGAAAGAGAGACACCTACCACCGATTCTATGCCCCCACTTCTGAGACAAGCAATTGAGCTGTTCGACCATCAGGGAGCCGAACCTGCCTTCCTTTTCGGCCTGGAACTAATCATATGTGGCCTGGAGAAACAGCTAAAGTGCGAAAGCGGCGGGCCGGCCGACGCCCTTGACGATTTTGACTTAGACATGCTCCCAGCCGATGCCCTTGACGACTTTGACCTTGATATGCTGCCTGCTGACGCTCTTGACGATTTTGACCTTGACATGCTCCCCGGATGAGGATCCTCTAGAGTCGACCTGCAGAAGCTTGCCTCGAGCAGCGCTGCTCGAGAGATCTACGGGTGGCATCCCTGTGACCCCTCCCCAGTGCCTCTCCTGGCCCTGGAAGTTGCCACTCCAGTGCCCACCAGCCTTGTCCTAATAAAATTAAGTTGCATCATTTTGTCTGACTAGGTGTCCTTCTATAATATTATGGGGTGGAGGGGGGTGGTATGGAGCAAGGGGCAAGTTGGGAAGACAACCTGTAGGGCCTGCGGGGTCTATTGGGAACCAAGCTGGAGTGCAGTGGCACAATCTTGGCTCACTGCAATCTCCGCCTCCTGGGTTCAAGCGATTCTCCTGCCTCAGCCTCCCGAGTTGTTGGGATTCCAGGCATGCATGACCAGGCTCAGCTAATTTTTGTTTTTTTGGTAGAGACGGGGTTTCACCATATTGGCCAGGCTGGTCTCCAACTCCTAATCTCAGGTGATCTACCCACCTTGGCCTCCCAAATTGCTGGGATTACAGGCGTGAACCACTGCTCCCTTCCCTGTCCTTCTGATTTTGTAGGTAACCACGTGCGGACCGAGCGGCCGCAGGAACCCCTAGTGATGGAGTTGGCCACTCCCTCTCTGCGCGCTCGCTCGCTCACTGAGGCCGGGCGACCAAAGGTCGCCCGACGCCCGGGCTTTGCCCGGGCGGCCTCAGTGAGCGAGCGAGCGCGCAGCTGCCTGCAGGGGCGCCTGATGCGGTATTTTCTCCTTACGCATCTGTGCGGTATTTCACACCGCATACGTCAAAGCAACCATAGTACGCGCCCTGTAGCGGCGCATTAAGCGCGGCGGGTGTGGTGGTTACGCGCAGCGTGACCGCTACACTTGCCAGCGCCCTAGCGCCCGCTCCTTTCGCTTTCTTCCCTTCCTTTCTCGCCACGTTCGCCGGCTTTCCCCGTCAAGCTCTAAATCGGGGGCTCCCTTTAGGGTTCCGATTTAGTGCTTTACGGCACCTCGACCCCAAAAAACTTGATTTGGGTGATGGTTCACGTAGTGGGCCATCGCCCTGATAGACGGTTTTTCGCCCTTTGACGTTGGAGTCCACGTTCTTTAATAGTGGACTCTTGTTCCAAACTGGAACAACACTCAACCCTATCTCGGGCTATTCTTTTGATTTATAAGGGATTTTGCCGATTTCGGCCTATTGGTTAAAAAATGAGCTGATTTAACAAAAATTTAACGCGAATTTTAACAAAATATTAACGTTTACAATTTTATGGTGCACTCTCAGTACAATCTGCTCTGATGCCGCATAGTTAAGCCAGCCCCGACACCCGCCAACACCCGCTGACGCGCCCTGACGGGCTTGTCTGCTCCCGGCATCCGCTTACAGACAAGCTGTGACCGTCTCCGGGAGCTGCATGTGTCAGAGGTTTTCACCGTCATCACCGAAACGCGCGAGACGAAAGGGCCTCGTGATACGCCTATTTTTATAGGTTAATGTCATGATAATAATGGTTTCTTAGACGTCAGGTGGCACTTTTCGGGGAAATGTGCGCGGAACCCCTATTTGTTTATTTTTCTAAATACATTCAAATATGTATCCGCTCATGAGACAATAACCCTGATAAATGCTTCAATAATATTGAAAAAGGAAGAGTATGAGTATTCAACATTTCCGTGTCGCCCTTATTCCCTTTTTTGCGGCATTTTGCCTTCCTGTTTTTGCTCACCCAGAAACGCTGGTGAAAGTAAAAGATGCTGAAGATCAGTTGGGTGCACGAGTGGGTTACATCGAACTGGATCTCAACAGCGGTAAGATCCTTGAGAGTTTTCGCCCCGAAGAACGTTTTCCAATGATGAGCACTTTTAAAGTTCTGCTATGTGGCGCGGTATTATCCCGTATTGACGCCGGGCAAGAGCAACTCGGTCGCCGCATACACTATTCTCAGAATGACTTGGTTGAGTACTCACCAGTCACAGAAAAGCATCTTACGGATGGCATGACAGTAAGAGAATTATGCAGTGCTGCCATAACCATGAGTGATAACACTGCGGCCAACTTACTTCTGACAACGATCGGAGGACCGAAGGAGCTAACCGCTTTTTTGCACAACATGGGGGATCATGTAACTCGCCTTGATCGTTGGGAACCGGAGCTGAATGAAGCCATACCAAACGACGAGCGTGACACCACGATGCCTGTAGCAATGGCAACAACGTTGCGCAAACTATTAACTGGCGAACTACTTACTCTAGCTTCCCGGCAACAATTAATAGACTGGATGGAGGCGGATAAAGTTGCAGGACCACTTCTGCGCTCGGCCCTTCCGGCTGGCTGGTTTATTGCTGATAAATCTGGAGCCGGTGAGCGTGGGTCTCGCGGTATCATTGCAGCACTGGGGCCAGATGGTAAGCCCTCCCGTATCGTAGTTATCTACACGACGGGGAGTCAGGCAACTATGGATGAACGAAATAGACAGATCGCTGAGATAGGTGCCTCACTGATTAAGCATTGGTAACTGTCAGACCAAGTTTACTCATATATACTTTAGATTGATTTAAAACTTCATTTTTAATTTAAAAGGATCTAGGTGAAGATCCTTTTTGATAATCTCATGACCAAAATCCCTTAACGTGAGTTTTCGTTCCACTGAGCGTCAGACCCCGTAGAAAAGATCAAAGGATCTTCTTGAGATCCTTTTTTTCTGCGCGTAATCTGCTGCTTGCAAACAAAAAAACCACCGCTACCAGCGGTGGTTTGTTTGCCGGATCAAGAGCTACCAACTCTTTTTCCGAAGGTAACTGGCTTCAGCAGAGCGCAGATACCAAATACTGTCCTTCTAGTGTAGCCGTAGTTAGGCCACCACTTCAAGAACTCTGTAGCACCGCCTACATACCTCGCTCTGCTAATCCTGTTACCAGTGGCTGCTGCCAGTGGCGATAAGTCGTGTCTTACCGGGTTGGACTCAAGACGATAGTTACCGGATAAGGCGCAGCGGTCGGGCTGAACGGGGGGTTCGTGCACACAGCCCAGCTTGGAGCGAACGACCTACACCGAACTGAGATACCTACAGCGTGAGCTATGAGAAAGCGCCACGCTTCCCGAAGGGAGAAAGGCGGACAGGTATCCGGTAAGCGGCAGGGTCGGAACAGGAGAGCGCACGAGGGAGCTTCCAGGGGGAAACGCCTGGTATCTTTATAGTCCTGTCGGGTTTCGCCACCTCTGACTTGAGCGTCGATTTTTGTGATGCTCGTCAGGGGGGCGGAGCCTATGGAAAAACGCCAGCAACGCGGCCTTTTTACGGTTCCTGGCCTTTTGCTGGCCTTTTGCTCACATGT

pAAV-Tet-O-OSK-SV40LpA(或pAAV-TRE2-OSK-SV40LpA)(SEQ ID NO:33):

ttatgcagtgctgccataaccatgagtgataacactgcggccaacttacttctgacaacgatcggaggaccgaaggagctaaccgcttttttgcacaacatgggggatcatgtaactcgccttgatcgttgggaaccggagctgaatgaagccataccaaacgacgagcgtgacaccacgatgcctgtagtaatggtaacaacgttgcgcaaactattaactggcgaactacttactctagcttcccggcaacaattaatagactggatggaggcggataaagttgcaggaccacttctgcgctcggcccttccggctggctggtttattgctgataaatctggagccggtgagcgtgggtctcgcggtatcattgcagcactggggccagatggtaagccctcccgtatcgtagttatctacacgacggggagtcaggcaactatggatgaacgaaatagacagatcgctgagataggtgcctcactgattaagcattggtaactgtcagaccaagtttactcatatatactttagattgatttaaaacttcatttttaatttaaaaggatctaggtgaagatcctttttgataatctcatgaccaaaatcccttaacgtgagttttcgttccactgagcgtcagaccccgtagaaaagatcaaaggatcttcttgagatcctttttttctgcgcgtaatctgctgcttgcaaacaaaaaaaccaccgctaccagcggtggtttgtttgccggatcaagagctaccaactctttttccgaaggtaactggcttcagcagagcgcagataccaaatactgtccttctagtgtagccgtagttaggccaccacttcaagaactctgtagcaccgcctacatacctcgctctgctaatcctgttaccagtggctgctgccagtggcgataagtcgtgtcttaccgggttggactcaagacgatagttaccggataaggcgcagcggtcgggctgaacggggggttcgtgcacacagcccagcttggagcgaacgacctacaccgaactgagatacctacagcgtgagctatgagaaagcgccacgcttcccgaagggagaaaggcggacaggtatccggtaagcggcagggtcggaacaggagagcgcacgagggagcttccagggggaaacgcctggtatctttatagtcctgtcgggtttcgccacctctgacttgagcgtcgatttttgtgatgctcgtcaggggggcggagcctatggaaaaacgccagcaacgcggcctttttacggttcctggccttttgctggccttttgctcacatgttctttcctgcgttatcccctgattctgtggataaccgtattaccgcctttgagtgagctgataccgctcgccgcagccgaacgaccgagcgcagcgagtcagtgagcgaggaagcggaagagcgcccaatacgcaaaccgcctctccccgcgcgttggccgattcattaatgcagctggcacgacaggtttcccgactggaaagcgggcagtgagcgcaacgcaattaatgtgagttagctcactcattaggcaccccaggctttacactttatgcttccggctcgtatgttgtgtggaattgtgagcggataacaatttcacacaggaaacagctatgaccatgattacgccagatttaattaaggccttaattaggctgcgcgctcgctcgctcactgaggccgcccgggcaaagcccgggcgtcgggcgacctttggtcgcccggcctcagtgagcgagcgagcgcgcagagagggagtggccaactccatcactaggggttccttgtagttaatgattaacccgccatgctacttatctacgtagccatgctctaggaagatcggaattcgtacacgcctacctcgacccatcaagtgccacctgacgtctccctatcagtgatagagaagtcgacacgtctcgagctccctatcagtgatagagaaggtacgtctagaacgtctccctatcagtgatagagaagtcgacacgtctcgagctccctatcagtgatagagaaggtacgtctagaacgtctccctatcagtgatagagaagtcgacacgtctcgagctccctatcagtgatagagaaggtacgtctagaacgtctccctatcagtgatagagaagtcgacacgtctcgagctccctatcagtgatagagaaggtaccccctatataagcagagctcgtttagtgaaccgtcagatcgcctggagacgccatccacgctgttttgacctccatagaagacaccgggaccgatccagcctggatcgcggccgcgccaccatggctggacacctggcttcagacttcgccttctcacccccaccaggtgggggtgatgggtcagcagggctggagccgggctgggtggatcctcgaacctggctaagcttccaagggcctccaggtgggcctggaatcggaccaggctcagaggtattggggatctccccatgtccgcccgcatacgagttctgcggagggatggcatactgtggacctcaggttggactgggcctagtcccccaagttggcgtggagactttgcagcctgagggccaggcaggagcacgagtggaaagcaactcagagggaacctcctctgagccctgtgccgaccgccccaatgccgtgaagttggagaaggtggaaccaactcccgaggagtcccaggacatgaaagccctgcagaaggagctagaacagtttgccaagctgctgaagcagaagaggatcaccttggggtacacccaggccgacgtggggctcaccctgggcgttctctttggaaaggtgttcagccagaccaccatctgtcgcttcgaggccttgcagctcagccttaagaacatgtgtaagctgcggcccctgctggagaagtgggtggaggaagccgacaacaatgagaaccttcaggagatatgcaaatcggagaccctggtgcaggcccggaagagaaagcgaactagcattgagaaccgtgtgaggtggagtctggagaccatgtttctgaagtgcccgaagccctccctacagcagatcactcacatcgccaatcagcttgggctagagaaggatgtggttcgagtatggttctgtaaccggcgccagaagggcaaaagatcaagtattgagtattcccaacgagaagagtatgaggctacagggacacctttcccagggggggctgtatcctttcctctgcccccaggtccccactttggcaccccaggctatggaagcccccacttcaccacactctactcagtcccttttcctgagggcgaggcctttccctctgttcccgtcactgctctgggctctcccatgcattcaaacgctagcggcagcggcgccacgaacttctctctgttaaagcaagcaggagatgttgaagaaaaccccgggcctgcatgcatgtataacatgatggagacggagctgaagccgccgggcccgcagcaagcttcggggggcggcggcggaggaggcaacgccacggcggcggcgaccggcggcaaccagaagaacagcccggaccgcgtcaagaggcccatgaacgccttcatggtatggtcccgggggcagcggcgtaagatggcccaggagaaccccaagatgcacaactcggagatcagcaagcgcctgggcgcggagtggaaacttttgtccgagaccgagaagcggccgttcatcgacgaggccaagcggctgcgcgctctgcacatgaaggagcacccggattataaataccggccgcggcggaaaaccaagacgctcatgaagaaggataagtacacgcttcccggaggcttgctggcccccggcgggaacagcatggcgagcggggttggggtgggcgccggcctgggtgcgggcgtgaaccagcgcatggacagctacgcgcacatgaacggctggagcaacggcagctacagcatgatgcaggagcagctgggctacccgcagcacccgggcctcaacgctcacggcgcggcacagatgcaaccgatgcaccgctacgacgtcagcgccctgcagtacaactccatgaccagctcgcagacctacatgaacggctcgcccacctacagcatgtcctactcgcagcagggcacccccggtatggcgctgggctccatgggctctgtggtcaagtccgaggccagctccagcccccccgtggttacctcttcctcccactccagggcgccctgccaggccggggacctccgggacatgatcagcatgtacctccccggcgccgaggtgccggagcccgctgcgcccagtagactgcacatggcccagcactaccagagcggcccggtgcccggcacggccattaacggcacactgcccctgtcgcacatggcatgcggctccggcgagggcaggggaagtcttctaacatgcggggacgtggaggaaaatcccggcccactcgagatgaggcagccacctggcgagtctgacatggctgtcagcgacgctctgctcccgtccttctccacgttcgcgtccggcccggcgggaagggagaagacactgcgtccagcaggtgccccgactaaccgttggcgtgaggaactctctcacatgaagcgacttcccccacttcccggccgcccctacgacctggcggcgacggtggccacagacctggagagtggcggagctggtgcagcttgcagcagtaacaacccggccctcctagcccggagggagaccgaggagttcaacgacctcctggacctagactttatcctttccaactcgctaacccaccaggaatcggtggccgccaccgtgaccacctcggcgtcagcttcatcctcgtcttccccagcgagcagcggccctgccagcgcgccctccacctgcagcttcagctatccgatccgggccgggggtgacccgggcgtggctgccagcaacacaggtggagggctcctctacagccgagaatctgcgccacctcccacggcccccttcaacctggcggacatcaatgacgtgagcccctcgggcggcttcgtggctgagctcctgcggccggagttggacccagtatacattccgccacagcagcctcagccgccaggtggcgggctgatgggcaagtttgtgctgaaggcgtctctgaccacccctggcagcgagtacagcagcccttcggtcatcagtgttagcaaaggaagcccagacggcagccaccccgtggtagtggcgccctacagcggtggcccgccgcgcatgtgccccaagattaagcaagaggcggtcccgtcctgcacggtcagccggtccctagaggcccatttgagcgctggaccccagctcagcaacggccaccggcccaacacacacgacttccccctggggcggcagctccccaccaggactacccctacactgagtcccgaggaactgctgaacagcagggactgtcaccctggcctgcctcttcccccaggattccatccccatccggggcccaactaccctcctttcctgccagaccagatgcagtcacaagtcccctctctccattatcaagagctcatgccaccgggttcctgcctgccagaggagcccaagccaaagaggggaagaaggtcgtggccccggaaaagaacagccacccacacttgtgactatgcaggctgtggcaaaacctataccaagagttctcatctcaaggcacacctgcgaactcacacaggcgagaaaccttaccactgtgactgggacggctgtgggtggaaattcgcccgctccgatgaactgaccaggcactaccgcaaacacacagggcaccggccctttcagtgccagaagtgcgacagggccttttccaggtcggaccaccttgccttacacatgaagaggcactaaatgactagtctagcaatcaacctctggattacaaaatttgtgaaagattgactggtattcttaactatgttgctccttttacgctatgtggatacgctgctttaatgcctttgtatcatgctattgcttcccgtatggctttcattttctcctccttgtataaatcctggttagttcttgccacggcggaactcatcgccgcctgccttgcccgctgctggacaggggctcggctgttgggcactgacaattccgtggtgtttatttgtgaaatttgtgatgctattgctttatttgtaaccattctagctttatttgtgaaatttgtgatgctattgctttatttgtaaccattataagctgcaataaacaagttaacaacaacaattgcattcattttatgtttcaggttcagggggagatgtgggaggttttttaaagcgggggatccaaattcccgataaggatcttcctagagcatggctacgtagataagtagcatggcgggttaatcattaactacaaggaacccctagtgatggagttggccactccctctctgcgcgctcgctcgctcactgaggccgggcgaccaaaggtcgcccgacgcccgggctttgcccgggcggcctcagtgagcgagcgagcgcgcagccttaattaacctaattcactggccgtcgttttacaacgtcgtgactgggaaaaccctggcgttacccaacttaatcgccttgcagcacatccccctttcgccagctggcgtaatagcgaagaggcccgcaccgatcgcccttcccaacagttgcgcagcctgaatggcgaatgggacgcgccctgtagcggcgcattaagcgcggcgggtgtggtggttacgcgcagcgtgaccgctacacttgccagcgccctagcgcccgctcctttcgctttcttcccttcctttctcgccacgttcgccggctttccccgtcaagctctaaatcgggggctccctttagggttccgatttagtgctttacggcacctcgaccccaaaaaacttgattagggtgatggttcacgtagtgggccatcgccctgatagacggtttttcgccctttgacgttggagtccacgttctttaatagtggactcttgttccaaactggaacaacactcaaccctatctcggtctattcttttgatttataagggattttgccgatttcggcctattggttaaaaaatgagctgatttaacaaaaatttaacgcgaattttaacaaaatattaacgtttataatttcaggtggcatctttcggggaaatgtgcgcggaacccctatttgtttatttttctaaatacattcaaatatgtatccgctcatgagacaataaccctgataaatgcttcaataatattgaaaaaggaagagtatgagtattcaacatttccgtgtcgcccttattcccttttttgcggcattttgccttcctgtttttgctcacccagaaacgctggtgaaagtaaaagatgctgaagatcagttgggtgcacgagtgggttacatcgaactggatctcaatagtggtaagatccttgagagttttcgccccgaagaacgttttccaatgatgagcacttttaaagttctgctatgtggcgcggtattatcccgtattgacgccgggcaagagcaactcggtcgccgcatacactattctcagaatgacttggttgagtactcaccagtcacagaaaagcatcttacggatggcatgacagtaagagaa

VP64,4个VP16的重复序列(SEQ ID NO:34)(反式激活结构域的非限制性实例):

GAGGCCAGCGGTTCCGGACGGGCTGACGCATTGGACGATTTTGATCTGGATATGCTGGGAAGTGACGCCCTCGATGATTTTGACCTTGACATGCTTGGTTCGGATGCCCTTGATGACTTTGACCTCGACATGCTCGGCAGTGACGCCCTTGATGATTTCGACCTGGACATGCTGATTAACTCTAGA

P65(SEQ ID NO:35)(反式激活结构域的非限制性实例):

AGCCAGTACCTGCCCGACACCGACGACCGGCACCGGATCGAGGAAAAGCGGAAGCGGACCTACGAGACATTCAAGAGCATCATGAAGAAGTCCCCCTTCAGCGGCCCCACCGACCCTAGACCTCCACCTAGAAGAATCGCCGTGCCCAGCAGATCCAGCGCCAGCGTGCCAAAACCTGCCCCCCAGCCTTACCCCTTCACCAGCAGCCTGAGCACCATCAACTACGACGAGTTCCCTACCATGGTGTTCCCCAGCGGCCAGATCTCTCAGGCCTCTGCTCTGGCTCCAGCCCCTCCTCAGGTGCTGCCTCAGGCTCCTGCTCCTGCACCAGCTCCAGCCATGGTGTCTGCACTGGCTCAGGCACCAGCACCCGTGCCTGTGCTGGCTCCTGGACCTCCACAGGCTGTGGCTCCACCAGCCCCTAAACCTACACAGGCCGGCGAGGGCACACTGTCTGAAGCTCTGCTGCAGCTGCAGTTCGACGACGAGGATCTGGGAGCCCTGCTGGGAAACAGCACCGATCCTGCCGTGTTCACCGACCTGGCCAGCGTGGACAACAGCGAGTTCCAGCAGCTGCTGAACCAGGGCATCCCTGTGGCCCCTCACACCACCGAGCCCATGCTGATGGAATACCCCGAGGCCATCACCCGGCTCGTGACAGGCGCTCAGAGGCCTCCTGATCCAGCTCCTGCCCCTCTGGGAGCACCAGGCCTGCCTAATGGACTGCTGTCTGGCGACGAGGACTTCAGCTCTATCGCCGATATGGATTTCTCAGCCTTGCTG

RTA(SEQ ID NO:36)(反式激活结构域的非限制性实例):

CGGGATTCCAGGGAAGGGATGTTTTTGCCGAAGCCTGAGGCCGGCTCCGCTATTAGTGACGTGTTTGAGGGCCGCGAGGTGTGCCAGCCAAAACGAATCCGGCCA

TTTCATCCTCCAGGAAGTCCATGGGCCAACCGCCCACTCCCCGCCAGCCTCGCACCAACACCAACCGGTCCAGTACATGAGCCAGTCGGGTCACTGACCCCGGCACCAGTCCCTCAGCCACTGGATCCAGCGCCCGCAGTGACTCCCGAGGCCAGTCACCTGTTGGAGGATCCCGATGAAGAGACGAGCCAGGCTGTCAAAGCCCTTCGGGAGATGGCCGATACTGTGATTCCCCAGAAGGAAGAGGCTGCAATCTGTGGCCAAATGGACCTTTCCCATCCGCCCCCAAGGGGCCATCTGGATGAGCTGACAACCACACTTGAGTCCA

TGACCGAGGATCTGAACCTGGACTCACCCCTGACCCCGGAATTGAACGAGATTCTGGATACCTTCCTGAACGACGAGTGCCTCTTGCATGCCATGCATATCAGCACAGGAC TGTCCA TCTTCGACACA TCTCTGTTT

MPH MS2-P65-HSF1(SEQ ID NO:37)(反式激活结构域的非限制性实例):

GCTTCAAACTTTACTCAGTTCGTGCTCGTGGACAATGGTGGGACAGGGGATGTGACAGTGGCTCCTTCTAATTTCGCTAATGGGGTGGCAGAGTGGATCAGCTCCAACTCACGGAGCCAGGCCTACAAGGTGACATGCAGCGTCAGGCAGTCTAGTGCCCAGAAGAGAAAGTATACCATCAAGGTGGAGGTCCCCAAAGTGGCTACCCAGACAGTGGGCGGAGTCGAACTGCCTGTCGCCGCTTGGAGGTCCTACCTGAACATGGAGCTCACTATCCCAATTTTCGCTACCAATTCTGACTGTGAACTCATCGTGAAGGCAATGCAGGGGCTCCTCAAAGACGGTAATCCTATCCCTTCCGCCATCGCCGCTAACTCAGGTATCTACAGCGCTGGAGGAGGTGGAAGCGGAGGAGGAGGAAGCGGAGGAGGAGGTAGCGGACCTAAGAAAAAGAGGAAGGTGGCGGCCGCTGGATCCCCTTCAGGGCAGATCAGCAACCAGGCCCTGGCTCTGGCCCCTAGCTCCGCTCCAGTGCTGGCCCAGACTATGGTGCCCTCTAGTGCTATGGTGCCTCTGGCCCAGCCACCTGCTCCAGCCCCTGTGCTGACCCCAGGACCACCCCAGTCACTGAGCGCTCCAGTGCCCAAGTCTACACAGGCCGGCGAGGGGACTCTGAGTGAAGCTCTGCTGCACCTGCAGTTCGACGCTGATGAGGACCTGGGAGCTCTGCTGGGGAACAGCACCGATCCCGGAGTGTTCACAGATCTGGCCTCCGTGGACAACTCTGAGTTTCAGCAGCTGCTGAATCAGGGCGTGTCCATGTCTCATAGTACAGCCGAACCAATGCTGATGGAGTACCCCGAAGCCATTACCCGGCTGGTGACCGGCAGCCAGCGGCCCCCCGACCCCGCTCCAACTCCCCTGGGAACCAGCGGCCTGCCTAATGGGCTGTCCGGAGATGAAGACTTCTCAAGCATCGCTGATATGGACTTTAGTGCCCTGCTGTCACAGATTTCCTCTAGTGGGCAGGGAGGAGGTGGAAGCGGCTTCAGCGTGGACACCAGTGCCCTGCTGGACCTGTTCAGCCCCTCGGTGACCGTGCCCGACATGAGCCTGCCTGACCTTGACAGCAGCCTGGCCAGTATCCAAGAGCTCCTGTCTCCCCAGGAGCCCCCCAGGCCTCCCGAGGCAGAGAACAGCAGCCCGGATTCAGGGAAGCAGCTGGTGCACTACACAGCGCAGCCGCTGTTCCTGCTGGACCCCGGCTCCGTGGACACCGGGAGCAACGACCTGCCGGTGCTGTTTGAGCTGGGAGAGGGCTCCTACTTCTCCGAAGGGGACGGCTTCGCCGAGGACCCCACCATCTCCCTGCTGACAGGCTCGGAGCCTCCCAAAGCCAAGGACCCCACTGTCTCC

等效物和范围

在权利要求中,冠词诸如“一种”、“一个”和“所述”可意指一个或超过一个,除非相反地指出或以其它方式从上下文中显而易见。如果一个、超过一个或所有组成员存在于、用于或以其他方式与给定产物或方法相关,则在组的一个或多个成员之间包括“或”的权利要求或描述被认为是令人满意的,除非相反地指出或以其他方式从上下文中显而易见。本公开包括其中该组中的正好一个成员存在于、用于或以其他方式与给定产物或方法相关的实施方案。本公开包括其中超过一个或所有组成员存在于、用于或以其他方式与给定产物或方法相关的实施方案。

此外,本公开涵盖其中将来自一个或多个所列权利要求的一个或多个限制、要素、条款和描述性术语引入到另一权利要求中的所有变型形式、组合和排列。例如,附属于另一权利要求的任何权利要求可经修改以包括附属于同一基本权利要求的任何其他权利要求中所见的一个或多个限制。在元素以马库什组格式呈现为列表的情况下,还公开了元素的每个子组,并且可从组中移除任何元素。应当理解,通常,在本文描述的公开或方面被称为包含特定要素和/或特征的情况下,本文描述的某些实施方案或本文描述的方面由或基本上由此类要素和/或特征组成。为了简单起见,本文中未具体地陈述关于此方面的那些实施方案。还要注意的是,术语“包含”和“含有”旨在是开放的并且允许包括附加的要素或步骤。当给出范围时,端点包括在内。此外,除非另外指明或以其他方式从上下文和本领域普通技术人员的理解显而易见,否则表示为范围的值可以假定在本文所述的不同实施方案中的所述范围内的任何具体值或子范围,至范围下限的单位的十分之一,除非上下文另外明确指出。

本申请涉及各种授权的专利、公布的专利申请、期刊文章和其他出版物,所有这些均以引用方式并入本文。如果任何引入的参考文献与本说明书存在冲突,以本说明书为准。此外,落入现有技术内的本公开的任何特定实施方案可以被明确地排除在权利要求的任何一项或多项之外。因为此类实施方案被认为是本领域的普通技术人员已知的,即使在此没有明确阐述该排除,也可以将它们排除。本文所述的任何特定实施方案可以出于任何原因而被排除在任何权利要求之外,而不管是否与现有技术的存在相关。

本领域的技术人员将认识到或者能够使用不超过常规实验确定本文所述的特定实施方案的许多等效物。本文所述的本发明实施方案的范围不旨在限于以上描述,而是如在所附权利要求书中阐述的。本领域的普通技术人员将理解,在不脱离如以下权利要求所限定的本公开的精神或范围的情况下,可以对本说明书进行各种改变和修改。

序列表

<110> 哈佛大学的校长及成员们

<120> 用于基因表达的突变体反向四环素反式激活因子

<130> H0824.70300WO00

<140> 尚未分配

<141> 2019-09-27

<150> US 62/738,894

<151> 2018-09-28

<160> 37

<170> PatentIn 3.5版本

<210> 1

<211> 1056

<212> DNA

<213> 小家鼠

<400> 1

atggctggac acctggcttc agacttcgcc ttctcacccc caccaggtgg gggtgatggg 60

tcagcagggc tggagccggg ctgggtggat cctcgaacct ggctaagctt ccaagggcct 120

ccaggtgggc ctggaatcgg accaggctca gaggtattgg ggatctcccc atgtccgccc 180

gcatacgagt tctgcggagg gatggcatac tgtggacctc aggttggact gggcctagtc 240

ccccaagttg gcgtggagac tttgcagcct gagggccagg caggagcacg agtggaaagc 300

aactcagagg gaacctcctc tgagccctgt gccgaccgcc ccaatgccgt gaagttggag 360

aaggtggaac caactcccga ggagtcccag gacatgaaag ccctgcagaa ggagctagaa 420

cagtttgcca agctgctgaa gcagaagagg atcaccttgg ggtacaccca ggccgacgtg 480

gggctcaccc tgggcgttct ctttggaaag gtgttcagcc agaccaccat ctgtcgcttc 540

gaggccttgc agctcagcct taagaacatg tgtaagctgc ggcccctgct ggagaagtgg 600

gtggaggaag ccgacaacaa tgagaacctt caggagatat gcaaatcgga gaccctggtg 660

caggcccgga agagaaagcg aactagcatt gagaaccgtg tgaggtggag tctggagacc 720

atgtttctga agtgcccgaa gccctcccta cagcagatca ctcacatcgc caatcagctt 780

gggctagaga aggatgtggt tcgagtatgg ttctgtaacc ggcgccagaa gggcaaaaga 840

tcaagtattg agtattccca acgagaagag tatgaggcta cagggacacc tttcccaggg 900

ggggctgtat cctttcctct gcccccaggt ccccactttg gcaccccagg ctatggaagc 960

ccccacttca ccacactcta ctcagtccct tttcctgagg gcgaggcctt tccctctgtt 1020

cccgtcactg ctctgggctc tcccatgcat tcaaac 1056

<210> 2

<211> 352

<212> PRT

<213> 小家鼠

<400> 2

Met Ala Gly His Leu Ala Ser Asp Phe Ala Phe Ser Pro Pro Pro Gly

1 5 10 15

Gly Gly Asp Gly Ser Ala Gly Leu Glu Pro Gly Trp Val Asp Pro Arg

20 25 30

Thr Trp Leu Ser Phe Gln Gly Pro Pro Gly Gly Pro Gly Ile Gly Pro

35 40 45

Gly Ser Glu Val Leu Gly Ile Ser Pro Cys Pro Pro Ala Tyr Glu Phe

50 55 60

Cys Gly Gly Met Ala Tyr Cys Gly Pro Gln Val Gly Leu Gly Leu Val

65 70 75 80

Pro Gln Val Gly Val Glu Thr Leu Gln Pro Glu Gly Gln Ala Gly Ala

85 90 95

Arg Val Glu Ser Asn Ser Glu Gly Thr Ser Ser Glu Pro Cys Ala Asp

100 105 110

Arg Pro Asn Ala Val Lys Leu Glu Lys Val Glu Pro Thr Pro Glu Glu

115 120 125

Ser Gln Asp Met Lys Ala Leu Gln Lys Glu Leu Glu Gln Phe Ala Lys

130 135 140

Leu Leu Lys Gln Lys Arg Ile Thr Leu Gly Tyr Thr Gln Ala Asp Val

145 150 155 160

Gly Leu Thr Leu Gly Val Leu Phe Gly Lys Val Phe Ser Gln Thr Thr

165 170 175

Ile Cys Arg Phe Glu Ala Leu Gln Leu Ser Leu Lys Asn Met Cys Lys

180 185 190

Leu Arg Pro Leu Leu Glu Lys Trp Val Glu Glu Ala Asp Asn Asn Glu

195 200 205

Asn Leu Gln Glu Ile Cys Lys Ser Glu Thr Leu Val Gln Ala Arg Lys

210 215 220

Arg Lys Arg Thr Ser Ile Glu Asn Arg Val Arg Trp Ser Leu Glu Thr

225 230 235 240

Met Phe Leu Lys Cys Pro Lys Pro Ser Leu Gln Gln Ile Thr His Ile

245 250 255

Ala Asn Gln Leu Gly Leu Glu Lys Asp Val Val Arg Val Trp Phe Cys

260 265 270

Asn Arg Arg Gln Lys Gly Lys Arg Ser Ser Ile Glu Tyr Ser Gln Arg

275 280 285

Glu Glu Tyr Glu Ala Thr Gly Thr Pro Phe Pro Gly Gly Ala Val Ser

290 295 300

Phe Pro Leu Pro Pro Gly Pro His Phe Gly Thr Pro Gly Tyr Gly Ser

305 310 315 320

Pro His Phe Thr Thr Leu Tyr Ser Val Pro Phe Pro Glu Gly Glu Ala

325 330 335

Phe Pro Ser Val Pro Val Thr Ala Leu Gly Ser Pro Met His Ser Asn

340 345 350

<210> 3

<211> 957

<212> DNA

<213> 小家鼠

<400> 3

atgtataaca tgatggagac ggagctgaag ccgccgggcc cgcagcaagc ttcggggggc 60

ggcggcggag gaggcaacgc cacggcggcg gcgaccggcg gcaaccagaa gaacagcccg 120

gaccgcgtca agaggcccat gaacgccttc atggtatggt cccgggggca gcggcgtaag 180

atggcccagg agaaccccaa gatgcacaac tcggagatca gcaagcgcct gggcgcggag 240

tggaaacttt tgtccgagac cgagaagcgg ccgttcatcg acgaggccaa gcggctgcgc 300

gctctgcaca tgaaggagca cccggattat aaataccggc cgcggcggaa aaccaagacg 360

ctcatgaaga aggataagta cacgcttccc ggaggcttgc tggcccccgg cgggaacagc 420

atggcgagcg gggttggggt gggcgccggc ctgggtgcgg gcgtgaacca gcgcatggac 480

agctacgcgc acatgaacgg ctggagcaac ggcagctaca gcatgatgca ggagcagctg 540

ggctacccgc agcacccggg cctcaacgct cacggcgcgg cacagatgca accgatgcac 600

cgctacgacg tcagcgccct gcagtacaac tccatgacca gctcgcagac ctacatgaac 660

ggctcgccca cctacagcat gtcctactcg cagcagggca cccccggtat ggcgctgggc 720

tccatgggct ctgtggtcaa gtccgaggcc agctccagcc cccccgtggt tacctcttcc 780

tcccactcca gggcgccctg ccaggccggg gacctccggg acatgatcag catgtacctc 840

cccggcgccg aggtgccgga gcccgctgcg cccagtagac tgcacatggc ccagcactac 900

cagagcggcc cggtgcccgg cacggccatt aacggcacac tgcccctgtc gcacatg 957

<210> 4

<211> 319

<212> PRT

<213> 小家鼠

<400> 4

Met Tyr Asn Met Met Glu Thr Glu Leu Lys Pro Pro Gly Pro Gln Gln

1 5 10 15

Ala Ser Gly Gly Gly Gly Gly Gly Gly Asn Ala Thr Ala Ala Ala Thr

20 25 30

Gly Gly Asn Gln Lys Asn Ser Pro Asp Arg Val Lys Arg Pro Met Asn

35 40 45

Ala Phe Met Val Trp Ser Arg Gly Gln Arg Arg Lys Met Ala Gln Glu

50 55 60

Asn Pro Lys Met His Asn Ser Glu Ile Ser Lys Arg Leu Gly Ala Glu

65 70 75 80

Trp Lys Leu Leu Ser Glu Thr Glu Lys Arg Pro Phe Ile Asp Glu Ala

85 90 95

Lys Arg Leu Arg Ala Leu His Met Lys Glu His Pro Asp Tyr Lys Tyr

100 105 110

Arg Pro Arg Arg Lys Thr Lys Thr Leu Met Lys Lys Asp Lys Tyr Thr

115 120 125

Leu Pro Gly Gly Leu Leu Ala Pro Gly Gly Asn Ser Met Ala Ser Gly

130 135 140

Val Gly Val Gly Ala Gly Leu Gly Ala Gly Val Asn Gln Arg Met Asp

145 150 155 160

Ser Tyr Ala His Met Asn Gly Trp Ser Asn Gly Ser Tyr Ser Met Met

165 170 175

Gln Glu Gln Leu Gly Tyr Pro Gln His Pro Gly Leu Asn Ala His Gly

180 185 190

Ala Ala Gln Met Gln Pro Met His Arg Tyr Asp Val Ser Ala Leu Gln

195 200 205

Tyr Asn Ser Met Thr Ser Ser Gln Thr Tyr Met Asn Gly Ser Pro Thr

210 215 220

Tyr Ser Met Ser Tyr Ser Gln Gln Gly Thr Pro Gly Met Ala Leu Gly

225 230 235 240

Ser Met Gly Ser Val Val Lys Ser Glu Ala Ser Ser Ser Pro Pro Val

245 250 255

Val Thr Ser Ser Ser His Ser Arg Ala Pro Cys Gln Ala Gly Asp Leu

260 265 270

Arg Asp Met Ile Ser Met Tyr Leu Pro Gly Ala Glu Val Pro Glu Pro

275 280 285

Ala Ala Pro Ser Arg Leu His Met Ala Gln His Tyr Gln Ser Gly Pro

290 295 300

Val Pro Gly Thr Ala Ile Asn Gly Thr Leu Pro Leu Ser His Met

305 310 315

<210> 5

<211> 1446

<212> DNA

<213> 小家鼠

<400> 5

atgaggcagc cacctggcga gtctgacatg gctgtcagcg acgctctgct cccgtccttc 60

tccacgttcg cgtccggccc ggcgggaagg gagaagacac tgcgtccagc aggtgccccg 120

actaaccgtt ggcgtgagga actctctcac atgaagcgac ttcccccact tcccggccgc 180

ccctacgacc tggcggcgac ggtggccaca gacctggaga gtggcggagc tggtgcagct 240

tgcagcagta acaacccggc cctcctagcc cggagggaga ccgaggagtt caacgacctc 300

ctggacctag actttatcct ttccaactcg ctaacccacc aggaatcggt ggccgccacc 360

gtgaccacct cggcgtcagc ttcatcctcg tcttccccag cgagcagcgg ccctgccagc 420

gcgccctcca cctgcagctt cagctatccg atccgggccg ggggtgaccc gggcgtggct 480

gccagcaaca caggtggagg gctcctctac agccgagaat ctgcgccacc tcccacggcc 540

cccttcaacc tggcggacat caatgacgtg agcccctcgg gcggcttcgt ggctgagctc 600

ctgcggccgg agttggaccc agtatacatt ccgccacagc agcctcagcc gccaggtggc 660

gggctgatgg gcaagtttgt gctgaaggcg tctctgacca cccctggcag cgagtacagc 720

agcccttcgg tcatcagtgt tagcaaagga agcccagacg gcagccaccc cgtggtagtg 780

gcgccctaca gcggtggccc gccgcgcatg tgccccaaga ttaagcaaga ggcggtcccg 840

tcctgcacgg tcagccggtc cctagaggcc catttgagcg ctggacccca gctcagcaac 900

ggccaccggc ccaacacaca cgacttcccc ctggggcggc agctccccac caggactacc 960

cctacactga gtcccgagga actgctgaac agcagggact gtcaccctgg cctgcctctt 1020

cccccaggat tccatcccca tccggggccc aactaccctc ctttcctgcc agaccagatg 1080

cagtcacaag tcccctctct ccattatcaa gagctcatgc caccgggttc ctgcctgcca 1140

gaggagccca agccaaagag gggaagaagg tcgtggcccc ggaaaagaac agccacccac 1200

acttgtgact atgcaggctg tggcaaaacc tataccaaga gttctcatct caaggcacac 1260

ctgcgaactc acacaggcga gaaaccttac cactgtgact gggacggctg tgggtggaaa 1320

ttcgcccgct ccgatgaact gaccaggcac taccgcaaac acacagggca ccggcccttt 1380

cagtgccaga agtgcgacag ggccttttcc aggtcggacc accttgcctt acacatgaag 1440

aggcac 1446

<210> 6

<211> 482

<212> PRT

<213> 小家鼠

<400> 6

Met Arg Gln Pro Pro Gly Glu Ser Asp Met Ala Val Ser Asp Ala Leu

1 5 10 15

Leu Pro Ser Phe Ser Thr Phe Ala Ser Gly Pro Ala Gly Arg Glu Lys

20 25 30

Thr Leu Arg Pro Ala Gly Ala Pro Thr Asn Arg Trp Arg Glu Glu Leu

35 40 45

Ser His Met Lys Arg Leu Pro Pro Leu Pro Gly Arg Pro Tyr Asp Leu

50 55 60

Ala Ala Thr Val Ala Thr Asp Leu Glu Ser Gly Gly Ala Gly Ala Ala

65 70 75 80

Cys Ser Ser Asn Asn Pro Ala Leu Leu Ala Arg Arg Glu Thr Glu Glu

85 90 95

Phe Asn Asp Leu Leu Asp Leu Asp Phe Ile Leu Ser Asn Ser Leu Thr

100 105 110

His Gln Glu Ser Val Ala Ala Thr Val Thr Thr Ser Ala Ser Ala Ser

115 120 125

Ser Ser Ser Ser Pro Ala Ser Ser Gly Pro Ala Ser Ala Pro Ser Thr

130 135 140

Cys Ser Phe Ser Tyr Pro Ile Arg Ala Gly Gly Asp Pro Gly Val Ala

145 150 155 160

Ala Ser Asn Thr Gly Gly Gly Leu Leu Tyr Ser Arg Glu Ser Ala Pro

165 170 175

Pro Pro Thr Ala Pro Phe Asn Leu Ala Asp Ile Asn Asp Val Ser Pro

180 185 190

Ser Gly Gly Phe Val Ala Glu Leu Leu Arg Pro Glu Leu Asp Pro Val

195 200 205

Tyr Ile Pro Pro Gln Gln Pro Gln Pro Pro Gly Gly Gly Leu Met Gly

210 215 220

Lys Phe Val Leu Lys Ala Ser Leu Thr Thr Pro Gly Ser Glu Tyr Ser

225 230 235 240

Ser Pro Ser Val Ile Ser Val Ser Lys Gly Ser Pro Asp Gly Ser His

245 250 255

Pro Val Val Val Ala Pro Tyr Ser Gly Gly Pro Pro Arg Met Cys Pro

260 265 270

Lys Ile Lys Gln Glu Ala Val Pro Ser Cys Thr Val Ser Arg Ser Leu

275 280 285

Glu Ala His Leu Ser Ala Gly Pro Gln Leu Ser Asn Gly His Arg Pro

290 295 300

Asn Thr His Asp Phe Pro Leu Gly Arg Gln Leu Pro Thr Arg Thr Thr

305 310 315 320

Pro Thr Leu Ser Pro Glu Glu Leu Leu Asn Ser Arg Asp Cys His Pro

325 330 335

Gly Leu Pro Leu Pro Pro Gly Phe His Pro His Pro Gly Pro Asn Tyr

340 345 350

Pro Pro Phe Leu Pro Asp Gln Met Gln Ser Gln Val Pro Ser Leu His

355 360 365

Tyr Gln Glu Leu Met Pro Pro Gly Ser Cys Leu Pro Glu Glu Pro Lys

370 375 380

Pro Lys Arg Gly Arg Arg Ser Trp Pro Arg Lys Arg Thr Ala Thr His

385 390 395 400

Thr Cys Asp Tyr Ala Gly Cys Gly Lys Thr Tyr Thr Lys Ser Ser His

405 410 415

Leu Lys Ala His Leu Arg Thr His Thr Gly Glu Lys Pro Tyr His Cys

420 425 430

Asp Trp Asp Gly Cys Gly Trp Lys Phe Ala Arg Ser Asp Glu Leu Thr

435 440 445

Arg His Tyr Arg Lys His Thr Gly His Arg Pro Phe Gln Cys Gln Lys

450 455 460

Cys Asp Arg Ala Phe Ser Arg Ser Asp His Leu Ala Leu His Met Lys

465 470 475 480

Arg His

<210> 7

<211> 376

<212> DNA

<213> 人工序列

<220>

<223> 合成多核苷酸

<400> 7

tttactccct atcagtgata gagaacgtat gaagagttta ctccctatca gtgatagaga 60

acgtatgcag actttactcc ctatcagtga tagagaacgt ataaggagtt tactccctat 120

cagtgataga gaacgtatga ccagtttact ccctatcagt gatagagaac gtatctacag 180

tttactccct atcagtgata gagaacgtat atccagttta ctccctatca gtgatagaga 240

acgtataagc tttaggcgtg tacggtgggc gcctataaaa gcagagctcg tttagtgaac 300

cgtcagatcg cctggagcaa ttccacaaca cttttgtctt ataccaactt tccgtaccac 360

ttcctaccct cgtaaa 376

<210> 8

<211> 169

<212> DNA

<213> 人工序列

<220>

<223> 合成多核苷酸

<400> 8

tgcgcgcagc ggccgaccat ggcccaactt gtttattgca gcttataatg gttacaaata 60

aagcaatagc atcacaaatt tcacaaataa agcatttttt tcactgcatt ctagttgtgg 120

tttgtccaaa ctcatcaatg tatcttatca tgtctggatc tcggtaccg 169

<210> 9

<211> 21

<212> PRT

<213> 人工序列

<220>

<223> 合成多肽

<400> 9

Gly Ser Gly Glu Gly Arg Gly Ser Leu Leu Thr Cys Gly Asp Val Glu

1 5 10 15

Glu Asn Pro Gly Pro

20

<210> 10

<211> 708

<212> DNA

<213> 人工序列

<220>

<223> 合成多核苷酸

<400> 10

atgtctaggc tggacaagag caaagtcata aacggagctc tggaattact caatggtgtc 60

ggtatcgaag gcctgacgac aaggaaactc gctcaaaagc tgggagttga gcagcctacc 120

ctgtactggc acgtgaagaa caagcgggcc ctgctcgatg ccctgccaat cgagatgctg 180

gacaggcatc atacccactt ctgccccctg gaaggcgagt catggcaaga ctttctgcgg 240

aacaacgcca agtcataccg ctgtgctctc ctctcacatc gcgacggggc taaagtgcat 300

ctcggcaccc gcccaacaga gaaacagtac gaaaccctgg aaaatcagct cgcgttcctg 360

tgtcagcaag gcttctccct ggagaacgca ctgtacgctc tgtccgccgt gggccacttt 420

acactgggct gcgtattgga ggaacaggag catcaagtag caaaagagga aagagagaca 480

cctaccaccg attctatgcc cccacttctg agacaagcaa ttgagctgtt cgaccggcag 540

ggagccgaac ctgccttcct tttcggcctg gaactaatca tatgtggcct ggagaaacag 600

ctaaagtgcg aaagcggcgg gccgaccgac gcccttgacg attttgactt agacatgctc 660

ccagccgatg cccttgacga ttttgacctt gacatgctcc ccgggtaa 708

<210> 11

<211> 235

<212> PRT

<213> 人工序列

<220>

<223> 合成多肽

<400> 11

Met Ser Arg Leu Asp Lys Ser Lys Val Ile Asn Gly Ala Leu Glu Leu

1 5 10 15

Leu Asn Gly Val Gly Ile Glu Gly Leu Thr Thr Arg Lys Leu Ala Gln

20 25 30

Lys Leu Gly Val Glu Gln Pro Thr Leu Tyr Trp His Val Lys Asn Lys

35 40 45

Arg Ala Leu Leu Asp Ala Leu Pro Ile Glu Met Leu Asp Arg His His

50 55 60

Thr His Phe Cys Pro Leu Glu Gly Glu Ser Trp Gln Asp Phe Leu Arg

65 70 75 80

Asn Asn Ala Lys Ser Tyr Arg Cys Ala Leu Leu Ser His Arg Asp Gly

85 90 95

Ala Lys Val His Leu Gly Thr Arg Pro Thr Glu Lys Gln Tyr Glu Thr

100 105 110

Leu Glu Asn Gln Leu Ala Phe Leu Cys Gln Gln Gly Phe Ser Leu Glu

115 120 125

Asn Ala Leu Tyr Ala Leu Ser Ala Val Gly His Phe Thr Leu Gly Cys

130 135 140

Val Leu Glu Glu Gln Glu His Gln Val Ala Lys Glu Glu Arg Glu Thr

145 150 155 160

Pro Thr Thr Asp Ser Met Pro Pro Leu Leu Arg Gln Ala Ile Glu Leu

165 170 175

Phe Asp Arg Gln Gly Ala Glu Pro Ala Phe Leu Phe Gly Leu Glu Leu

180 185 190

Ile Ile Cys Gly Leu Glu Lys Gln Leu Lys Cys Glu Ser Gly Gly Pro

195 200 205

Thr Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Pro Ala Asp Ala

210 215 220

Leu Asp Asp Phe Asp Leu Asp Met Leu Pro Gly

225 230 235

<210> 12

<211> 747

<212> DNA

<213> 人工序列

<220>

<223> 合成多核苷酸

<400> 12

atgtcccgct tggataagag caaggtaata aatagcgcac tcgaactcct caacggcgtg 60

ggcatcgaag gtctgactac tcgaaagctc gcccagaaat tgggtgtgga gcaacctaca 120

ttgtattggc atgtcaagaa caaaagagcc ctgctggacg ctcttcctat tgaaatgctt 180

gacaggcatc acactcattc ctgccccctt gaggtcgaga gttggcaaga ttttctccga 240

aacaatgcaa agtcctaccg ctgcgcactt ttgtcccata gggatggagc aaaagtgcac 300

ctgggaacca ggccaacaga gaaacaatac gagactctcg agaaccagtt ggctttcttg 360

tgccaacagg ggttctcact tgaaaatgcc ctttacgcac tgtcagccgt tggacatttt 420

accctggggt gcgttcttga ggagcaagaa catcaggttg ctaaggagga gcgcgagact 480

ccaaccactg attctatgcc acctttgctg aaacaggcca ttgaactttt cgatagacag 540

ggtgctgaac ctgcctttct cttcgggttg gagctgatta tttgtggtct cgaaaaacag 600

ctgaaatgtg aaagtggtgg ccctactgac gccctcgatg atttcgacct ggatatgctg 660

ccagccgatg cacttgatga tttcgatttg gatatgcttc cagccgacgc actggacgac 720

ttcgatttgg acatgcttcc cggttaa 747

<210> 13

<211> 248

<212> PRT

<213> 人工序列

<220>

<223> 合成多肽

<400> 13

Met Ser Arg Leu Asp Lys Ser Lys Val Ile Asn Ser Ala Leu Glu Leu

1 5 10 15

Leu Asn Gly Val Gly Ile Glu Gly Leu Thr Thr Arg Lys Leu Ala Gln

20 25 30

Lys Leu Gly Val Glu Gln Pro Thr Leu Tyr Trp His Val Lys Asn Lys

35 40 45

Arg Ala Leu Leu Asp Ala Leu Pro Ile Glu Met Leu Asp Arg His His

50 55 60

Thr His Ser Cys Pro Leu Glu Val Glu Ser Trp Gln Asp Phe Leu Arg

65 70 75 80

Asn Asn Ala Lys Ser Tyr Arg Cys Ala Leu Leu Ser His Arg Asp Gly

85 90 95

Ala Lys Val His Leu Gly Thr Arg Pro Thr Glu Lys Gln Tyr Glu Thr

100 105 110

Leu Glu Asn Gln Leu Ala Phe Leu Cys Gln Gln Gly Phe Ser Leu Glu

115 120 125

Asn Ala Leu Tyr Ala Leu Ser Ala Val Gly His Phe Thr Leu Gly Cys

130 135 140

Val Leu Glu Glu Gln Glu His Gln Val Ala Lys Glu Glu Arg Glu Thr

145 150 155 160

Pro Thr Thr Asp Ser Met Pro Pro Leu Leu Lys Gln Ala Ile Glu Leu

165 170 175

Phe Asp Arg Gln Gly Ala Glu Pro Ala Phe Leu Phe Gly Leu Glu Leu

180 185 190

Ile Ile Cys Gly Leu Glu Lys Gln Leu Lys Cys Glu Ser Gly Gly Pro

195 200 205

Thr Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Pro Ala Asp Ala

210 215 220

Leu Asp Asp Phe Asp Leu Asp Met Leu Pro Ala Asp Ala Leu Asp Asp

225 230 235 240

Phe Asp Leu Asp Met Leu Pro Gly

245

<210> 14

<211> 1050

<212> DNA

<213> 人工序列

<220>

<223> 合成多核苷酸

<400> 14

atgcctttgt atcatgctat tgcttcccgt atggctttca ttttctcctc cttgtataaa 60

tcctggttgc tgtctcttta tgaggagttg tggcccgttg tcaggcaacg tggcgtggtg 120

tgcactgtgt ttgctgacgc aacccccact ggttggggca ttgccaccac ctgtcagctc 180

ctttccggga ctttcgcttt ccccctccct attgccacgg cggaactcat cgccgcctgc 240

cttgcccgct gctggacagg ggctcggctg ttgggcactg acaattccgt ggtgttgtcg 300

gggaaatcat cgtcctttcc ttggctgctc gcctgtgttg ccacctggat tctgcgcggg 360

acgtccttct gctacgtccc ttcggccctc aatccagcgg accttccttc ccgcggcctg 420

ctgccggctc tgcggcctct tccgcgtctt cgccttcgcc ctcagacgag tcggatctcc 480

ctttgggccg cctccccgca tcgataccgt cgacctcgag acctagaaaa acatggagca 540

atcacaagta gcaatacagc agctaccaat gctgattgtg cctggctaga agcacaagag 600

gaggaggagg tgggttttcc agtcacacct caggtacctt taagaccaat gacttacaag 660

gcagctgtag atcttagcca ctttttaaaa gaaaaggggg gactggaagg gctaattcac 720

tcccaacgaa gacaagatat ccttgatctg tggatctacc acacacaagg ctacttccct 780

gattggcaga actacacacc agggccaggg atcagatatc cactgacctt tggatggtgc 840

tacaagctag taccagttga gcaagagaag gtagaagaag ccaatgaagg agagaacacc 900

cgcttgttac accctgtgag cctgcatggg atggatgacc cggagagaga agtattagag 960

tggaggtttg acagccgcct agcatttcat cacatggccc gagagctgca tccggactgt 1020

actgggtctc tctggttaga ccagatctga 1050

<210> 15

<211> 349

<212> PRT

<213> 人工序列

<220>

<223> 合成多肽

<400> 15

Met Pro Leu Tyr His Ala Ile Ala Ser Arg Met Ala Phe Ile Phe Ser

1 5 10 15

Ser Leu Tyr Lys Ser Trp Leu Leu Ser Leu Tyr Glu Glu Leu Trp Pro

20 25 30

Val Val Arg Gln Arg Gly Val Val Cys Thr Val Phe Ala Asp Ala Thr

35 40 45

Pro Thr Gly Trp Gly Ile Ala Thr Thr Cys Gln Leu Leu Ser Gly Thr

50 55 60

Phe Ala Phe Pro Leu Pro Ile Ala Thr Ala Glu Leu Ile Ala Ala Cys

65 70 75 80

Leu Ala Arg Cys Trp Thr Gly Ala Arg Leu Leu Gly Thr Asp Asn Ser

85 90 95

Val Val Leu Ser Gly Lys Ser Ser Ser Phe Pro Trp Leu Leu Ala Cys

100 105 110

Val Ala Thr Trp Ile Leu Arg Gly Thr Ser Phe Cys Tyr Val Pro Ser

115 120 125

Ala Leu Asn Pro Ala Asp Leu Pro Ser Arg Gly Leu Leu Pro Ala Leu

130 135 140

Arg Pro Leu Pro Arg Leu Arg Leu Arg Pro Gln Thr Ser Arg Ile Ser

145 150 155 160

Leu Trp Ala Ala Ser Pro His Arg Tyr Arg Arg Pro Arg Asp Leu Glu

165 170 175

Lys His Gly Ala Ile Thr Ser Ser Asn Thr Ala Ala Thr Asn Ala Asp

180 185 190

Cys Ala Trp Leu Glu Ala Gln Glu Glu Glu Glu Val Gly Phe Pro Val

195 200 205

Thr Pro Gln Val Pro Leu Arg Pro Met Thr Tyr Lys Ala Ala Val Asp

210 215 220

Leu Ser His Phe Leu Lys Glu Lys Gly Gly Leu Glu Gly Leu Ile His

225 230 235 240

Ser Gln Arg Arg Gln Asp Ile Leu Asp Leu Trp Ile Tyr His Thr Gln

245 250 255

Gly Tyr Phe Pro Asp Trp Gln Asn Tyr Thr Pro Gly Pro Gly Ile Arg

260 265 270

Tyr Pro Leu Thr Phe Gly Trp Cys Tyr Lys Leu Val Pro Val Glu Gln

275 280 285

Glu Lys Val Glu Glu Ala Asn Glu Gly Glu Asn Thr Arg Leu Leu His

290 295 300

Pro Val Ser Leu His Gly Met Asp Asp Pro Glu Arg Glu Val Leu Glu

305 310 315 320

Trp Arg Phe Asp Ser Arg Leu Ala Phe His His Met Ala Arg Glu Leu

325 330 335

His Pro Asp Cys Thr Gly Ser Leu Trp Leu Asp Gln Ile

340 345

<210> 16

<211> 7408

<212> DNA

<213> 人工序列

<220>

<223> 合成多核苷酸

<400> 16

ttatgcagtg ctgccataac catgagtgat aacactgcgg ccaacttact tctgacaacg 60

atcggaggac cgaaggagct aaccgctttt ttgcacaaca tgggggatca tgtaactcgc 120

cttgatcgtt gggaaccgga gctgaatgaa gccataccaa acgacgagcg tgacaccacg 180

atgcctgtag taatggtaac aacgttgcgc aaactattaa ctggcgaact acttactcta 240

gcttcccggc aacaattaat agactggatg gaggcggata aagttgcagg accacttctg 300

cgctcggccc ttccggctgg ctggtttatt gctgataaat ctggagccgg tgagcgtggg 360

tctcgcggta tcattgcagc actggggcca gatggtaagc cctcccgtat cgtagttatc 420

tacacgacgg ggagtcaggc aactatggat gaacgaaata gacagatcgc tgagataggt 480

gcctcactga ttaagcattg gtaactgtca gaccaagttt actcatatat actttagatt 540

gatttaaaac ttcattttta atttaaaagg atctaggtga agatcctttt tgataatctc 600

atgaccaaaa tcccttaacg tgagttttcg ttccactgag cgtcagaccc cgtagaaaag 660

atcaaaggat cttcttgaga tccttttttt ctgcgcgtaa tctgctgctt gcaaacaaaa 720

aaaccaccgc taccagcggt ggtttgtttg ccggatcaag agctaccaac tctttttccg 780

aaggtaactg gcttcagcag agcgcagata ccaaatactg tccttctagt gtagccgtag 840

ttaggccacc acttcaagaa ctctgtagca ccgcctacat acctcgctct gctaatcctg 900

ttaccagtgg ctgctgccag tggcgataag tcgtgtctta ccgggttgga ctcaagacga 960

tagttaccgg ataaggcgca gcggtcgggc tgaacggggg gttcgtgcac acagcccagc 1020

ttggagcgaa cgacctacac cgaactgaga tacctacagc gtgagctatg agaaagcgcc 1080

acgcttcccg aagggagaaa ggcggacagg tatccggtaa gcggcagggt cggaacagga 1140

gagcgcacga gggagcttcc agggggaaac gcctggtatc tttatagtcc tgtcgggttt 1200

cgccacctct gacttgagcg tcgatttttg tgatgctcgt caggggggcg gagcctatgg 1260

aaaaacgcca gcaacgcggc ctttttacgg ttcctggcct tttgctggcc ttttgctcac 1320

atgttctttc ctgcgttatc ccctgattct gtggataacc gtattaccgc ctttgagtga 1380

gctgataccg ctcgccgcag ccgaacgacc gagcgcagcg agtcagtgag cgaggaagcg 1440

gaagagcgcc caatacgcaa accgcctctc cccgcgcgtt ggccgattca ttaatgcagc 1500

tggcacgaca ggtttcccga ctggaaagcg ggcagtgagc gcaacgcaat taatgtgagt 1560

tagctcactc attaggcacc ccaggcttta cactttatgc ttccggctcg tatgttgtgt 1620

ggaattgtga gcggataaca atttcacaca ggaaacagct atgaccatga ttacgccaga 1680

tttaattaag gccttaatta ggctgcgcgc tcgctcgctc actgaggccg cccgggcaaa 1740

gcccgggcgt cgggcgacct ttggtcgccc ggcctcagtg agcgagcgag cgcgcagaga 1800

gggagtggcc aactccatca ctaggggttc cttgtagtta atgattaacc cgccatgcta 1860

cttatctacg tagccatgct ctaggaagat cggaattctt tactccctat cagtgataga 1920

gaacgtatga agagtttact ccctatcagt gatagagaac gtatgcagac tttactccct 1980

atcagtgata gagaacgtat aaggagttta ctccctatca gtgatagaga acgtatgacc 2040

agtttactcc ctatcagtga tagagaacgt atctacagtt tactccctat cagtgataga 2100

gaacgtatat ccagtttact ccctatcagt gatagagaac gtataagctt taggcgtgta 2160

cggtgggcgc ctataaaagc agagctcgtt tagtgaaccg tcagatcgcc tggagcaatt 2220

ccacaacact tttgtcttat accaactttc cgtaccactt cctaccctcg taaagcggcc 2280

gcgccaccat ggctggacac ctggcttcag acttcgcctt ctcaccccca ccaggtgggg 2340

gtgatgggtc agcagggctg gagccgggct gggtggatcc tcgaacctgg ctaagcttcc 2400

aagggcctcc aggtgggcct ggaatcggac caggctcaga ggtattgggg atctccccat 2460

gtccgcccgc atacgagttc tgcggaggga tggcatactg tggacctcag gttggactgg 2520

gcctagtccc ccaagttggc gtggagactt tgcagcctga gggccaggca ggagcacgag 2580

tggaaagcaa ctcagaggga acctcctctg agccctgtgc cgaccgcccc aatgccgtga 2640

agttggagaa ggtggaacca actcccgagg agtcccagga catgaaagcc ctgcagaagg 2700

agctagaaca gtttgccaag ctgctgaagc agaagaggat caccttgggg tacacccagg 2760

ccgacgtggg gctcaccctg ggcgttctct ttggaaaggt gttcagccag accaccatct 2820

gtcgcttcga ggccttgcag ctcagcctta agaacatgtg taagctgcgg cccctgctgg 2880

agaagtgggt ggaggaagcc gacaacaatg agaaccttca ggagatatgc aaatcggaga 2940

ccctggtgca ggcccggaag agaaagcgaa ctagcattga gaaccgtgtg aggtggagtc 3000

tggagaccat gtttctgaag tgcccgaagc cctccctaca gcagatcact cacatcgcca 3060

atcagcttgg gctagagaag gatgtggttc gagtatggtt ctgtaaccgg cgccagaagg 3120

gcaaaagatc aagtattgag tattcccaac gagaagagta tgaggctaca gggacacctt 3180

tcccaggggg ggctgtatcc tttcctctgc ccccaggtcc ccactttggc accccaggct 3240

atggaagccc ccacttcacc acactctact cagtcccttt tcctgagggc gaggcctttc 3300

cctctgttcc cgtcactgct ctgggctctc ccatgcattc aaacgctagc ggcagcggcg 3360

ccacgaactt ctctctgtta aagcaagcag gagatgttga agaaaacccc gggcctgcat 3420

gcatgtataa catgatggag acggagctga agccgccggg cccgcagcaa gcttcggggg 3480

gcggcggcgg aggaggcaac gccacggcgg cggcgaccgg cggcaaccag aagaacagcc 3540

cggaccgcgt caagaggccc atgaacgcct tcatggtatg gtcccggggg cagcggcgta 3600

agatggccca ggagaacccc aagatgcaca actcggagat cagcaagcgc ctgggcgcgg 3660

agtggaaact tttgtccgag accgagaagc ggccgttcat cgacgaggcc aagcggctgc 3720

gcgctctgca catgaaggag cacccggatt ataaataccg gccgcggcgg aaaaccaaga 3780

cgctcatgaa gaaggataag tacacgcttc ccggaggctt gctggccccc ggcgggaaca 3840

gcatggcgag cggggttggg gtgggcgccg gcctgggtgc gggcgtgaac cagcgcatgg 3900

acagctacgc gcacatgaac ggctggagca acggcagcta cagcatgatg caggagcagc 3960

tgggctaccc gcagcacccg ggcctcaacg ctcacggcgc ggcacagatg caaccgatgc 4020

accgctacga cgtcagcgcc ctgcagtaca actccatgac cagctcgcag acctacatga 4080

acggctcgcc cacctacagc atgtcctact cgcagcaggg cacccccggt atggcgctgg 4140

gctccatggg ctctgtggtc aagtccgagg ccagctccag cccccccgtg gttacctctt 4200

cctcccactc cagggcgccc tgccaggccg gggacctccg ggacatgatc agcatgtacc 4260

tccccggcgc cgaggtgccg gagcccgctg cgcccagtag actgcacatg gcccagcact 4320

accagagcgg cccggtgccc ggcacggcca ttaacggcac actgcccctg tcgcacatgg 4380

catgcggctc cggcgagggc aggggaagtc ttctaacatg cggggacgtg gaggaaaatc 4440

ccggcccact cgagatgagg cagccacctg gcgagtctga catggctgtc agcgacgctc 4500

tgctcccgtc cttctccacg ttcgcgtccg gcccggcggg aagggagaag acactgcgtc 4560

cagcaggtgc cccgactaac cgttggcgtg aggaactctc tcacatgaag cgacttcccc 4620

cacttcccgg ccgcccctac gacctggcgg cgacggtggc cacagacctg gagagtggcg 4680

gagctggtgc agcttgcagc agtaacaacc cggccctcct agcccggagg gagaccgagg 4740

agttcaacga cctcctggac ctagacttta tcctttccaa ctcgctaacc caccaggaat 4800

cggtggccgc caccgtgacc acctcggcgt cagcttcatc ctcgtcttcc ccagcgagca 4860

gcggccctgc cagcgcgccc tccacctgca gcttcagcta tccgatccgg gccgggggtg 4920

acccgggcgt ggctgccagc aacacaggtg gagggctcct ctacagccga gaatctgcgc 4980

cacctcccac ggcccccttc aacctggcgg acatcaatga cgtgagcccc tcgggcggct 5040

tcgtggctga gctcctgcgg ccggagttgg acccagtata cattccgcca cagcagcctc 5100

agccgccagg tggcgggctg atgggcaagt ttgtgctgaa ggcgtctctg accacccctg 5160

gcagcgagta cagcagccct tcggtcatca gtgttagcaa aggaagccca gacggcagcc 5220

accccgtggt agtggcgccc tacagcggtg gcccgccgcg catgtgcccc aagattaagc 5280

aagaggcggt cccgtcctgc acggtcagcc ggtccctaga ggcccatttg agcgctggac 5340

cccagctcag caacggccac cggcccaaca cacacgactt ccccctgggg cggcagctcc 5400

ccaccaggac tacccctaca ctgagtcccg aggaactgct gaacagcagg gactgtcacc 5460

ctggcctgcc tcttccccca ggattccatc cccatccggg gcccaactac cctcctttcc 5520

tgccagacca gatgcagtca caagtcccct ctctccatta tcaagagctc atgccaccgg 5580

gttcctgcct gccagaggag cccaagccaa agaggggaag aaggtcgtgg ccccggaaaa 5640

gaacagccac ccacacttgt gactatgcag gctgtggcaa aacctatacc aagagttctc 5700

atctcaaggc acacctgcga actcacacag gcgagaaacc ttaccactgt gactgggacg 5760

gctgtgggtg gaaattcgcc cgctccgatg aactgaccag gcactaccgc aaacacacag 5820

ggcaccggcc ctttcagtgc cagaagtgcg acagggcctt ttccaggtcg gaccaccttg 5880

ccttacacat gaagaggcac taaatgacta gtgcgcgcag cggccgacca tggcccaact 5940

tgtttattgc agcttataat ggttacaaat aaagcaatag catcacaaat ttcacaaata 6000

aagcattttt ttcactgcat tctagttgtg gtttgtccaa actcatcaat gtatcttatc 6060

atgtctggat ctcggtaccg gatccaaatt cccgataagg atcttcctag agcatggcta 6120

cgtagataag tagcatggcg ggttaatcat taactacaag gaacccctag tgatggagtt 6180

ggccactccc tctctgcgcg ctcgctcgct cactgaggcc gggcgaccaa aggtcgcccg 6240

acgcccgggc tttgcccggg cggcctcagt gagcgagcga gcgcgcagcc ttaattaacc 6300

taattcactg gccgtcgttt tacaacgtcg tgactgggaa aaccctggcg ttacccaact 6360

taatcgcctt gcagcacatc cccctttcgc cagctggcgt aatagcgaag aggcccgcac 6420

cgatcgccct tcccaacagt tgcgcagcct gaatggcgaa tgggacgcgc cctgtagcgg 6480

cgcattaagc gcggcgggtg tggtggttac gcgcagcgtg accgctacac ttgccagcgc 6540

cctagcgccc gctcctttcg ctttcttccc ttcctttctc gccacgttcg ccggctttcc 6600

ccgtcaagct ctaaatcggg ggctcccttt agggttccga tttagtgctt tacggcacct 6660

cgaccccaaa aaacttgatt agggtgatgg ttcacgtagt gggccatcgc cctgatagac 6720

ggtttttcgc cctttgacgt tggagtccac gttctttaat agtggactct tgttccaaac 6780

tggaacaaca ctcaacccta tctcggtcta ttcttttgat ttataaggga ttttgccgat 6840

ttcggcctat tggttaaaaa atgagctgat ttaacaaaaa tttaacgcga attttaacaa 6900

aatattaacg tttataattt caggtggcat ctttcgggga aatgtgcgcg gaacccctat 6960

ttgtttattt ttctaaatac attcaaatat gtatccgctc atgagacaat aaccctgata 7020

aatgcttcaa taatattgaa aaaggaagag tatgagtatt caacatttcc gtgtcgccct 7080

tattcccttt tttgcggcat tttgccttcc tgtttttgct cacccagaaa cgctggtgaa 7140

agtaaaagat gctgaagatc agttgggtgc acgagtgggt tacatcgaac tggatctcaa 7200

tagtggtaag atccttgaga gttttcgccc cgaagaacgt tttccaatga tgagcacttt 7260

taaagttctg ctatgtggcg cggtattatc ccgtattgac gccgggcaag agcaactcgg 7320

tcgccgcata cactattctc agaatgactt ggttgagtac tcaccagtca cagaaaagca 7380

tcttacggat ggcatgacag taagagaa 7408

<210> 17

<211> 5657

<212> DNA

<213> 人工序列

<220>

<223> 合成多核苷酸

<400> 17

ttatgcagtg ctgccataac catgagtgat aacactgcgg ccaacttact tctgacaacg 60

atcggaggac cgaaggagct aaccgctttt ttgcacaaca tgggggatca tgtaactcgc 120

cttgatcgtt gggaaccgga gctgaatgaa gccataccaa acgacgagcg tgacaccacg 180

atgcctgtag taatggtaac aacgttgcgc aaactattaa ctggcgaact acttactcta 240

gcttcccggc aacaattaat agactggatg gaggcggata aagttgcagg accacttctg 300

cgctcggccc ttccggctgg ctggtttatt gctgataaat ctggagccgg tgagcgtggg 360

tctcgcggta tcattgcagc actggggcca gatggtaagc cctcccgtat cgtagttatc 420

tacacgacgg ggagtcaggc aactatggat gaacgaaata gacagatcgc tgagataggt 480

gcctcactga ttaagcattg gtaactgtca gaccaagttt actcatatat actttagatt 540

gatttaaaac ttcattttta atttaaaagg atctaggtga agatcctttt tgataatctc 600

atgaccaaaa tcccttaacg tgagttttcg ttccactgag cgtcagaccc cgtagaaaag 660

atcaaaggat cttcttgaga tccttttttt ctgcgcgtaa tctgctgctt gcaaacaaaa 720

aaaccaccgc taccagcggt ggtttgtttg ccggatcaag agctaccaac tctttttccg 780

aaggtaactg gcttcagcag agcgcagata ccaaatactg tccttctagt gtagccgtag 840

ttaggccacc acttcaagaa ctctgtagca ccgcctacat acctcgctct gctaatcctg 900

ttaccagtgg ctgctgccag tggcgataag tcgtgtctta ccgggttgga ctcaagacga 960

tagttaccgg ataaggcgca gcggtcgggc tgaacggggg gttcgtgcac acagcccagc 1020

ttggagcgaa cgacctacac cgaactgaga tacctacagc gtgagctatg agaaagcgcc 1080

acgcttcccg aagggagaaa ggcggacagg tatccggtaa gcggcagggt cggaacagga 1140

gagcgcacga gggagcttcc agggggaaac gcctggtatc tttatagtcc tgtcgggttt 1200

cgccacctct gacttgagcg tcgatttttg tgatgctcgt caggggggcg gagcctatgg 1260

aaaaacgcca gcaacgcggc ctttttacgg ttcctggcct tttgctggcc ttttgctcac 1320

atgttctttc ctgcgttatc ccctgattct gtggataacc gtattaccgc ctttgagtga 1380

gctgataccg ctcgccgcag ccgaacgacc gagcgcagcg agtcagtgag cgaggaagcg 1440

gaagagcgcc caatacgcaa accgcctctc cccgcgcgtt ggccgattca ttaatgcagc 1500

tggcacgaca ggtttcccga ctggaaagcg ggcagtgagc gcaacgcaat taatgtgagt 1560

tagctcactc attaggcacc ccaggcttta cactttatgc ttccggctcg tatgttgtgt 1620

ggaattgtga gcggataaca atttcacaca ggaaacagct atgaccatga ttacgccaga 1680

tttaattaag gccttaatta ggctgcgcgc tcgctcgctc actgaggccg cccgggcaaa 1740

gcccgggcgt cgggcgacct ttggtcgccc ggcctcagtg agcgagcgag cgcgcagaga 1800

gggagtggcc aactccatca ctaggggttc cttgtagtta atgattaacc cgccatgcta 1860

cttatctacg tagccatgct ctaggaagat cggaattcct gatctggcct ccgcgccggg 1920

ttttggcgcc tcccgcgggc gcccccctcc tcacggcgag cgctgccacg tcagacgaag 1980

ggcgcagcga gcgtcctgat ccttccgccc ggacgctcag gacagcggcc cgctgctcat 2040

aagactcggc cttagaaccc cagtatcagc agaaggacat tttaggacgg gacttgggtg 2100

actctagggc actggttttc tttccagaga gcggaacagg cgaggaaaag tagtcccttc 2160

tcggcgattc tgcggaggga tctccgtggg gcggtgaacg ccgatgatta tataaggacg 2220

cgccgggtgt ggcacagcta gttccgtcgc agccgggatt tgggtcgcgg ttcttgtttg 2280

tggatcgctg tgatcgtcac ttggtgagta gcgggctgct gggctggccg gggctttcgt 2340

ggccgccggg ccgctcggtg ggacggaagc gtgtggagag accgccaagg gctgtagtct 2400

gggtccgcga gcaaggttgc cctgaactgg gggttggggg gagcgcagca aaatggcggc 2460

tgttcccgag tcttgaatgg aagacgcttg tgaggcgggc tgtgaggtcg ttgaaacaag 2520

gtggggggca tggtgggcgg caagaaccca aggtcttgag gccttcgcta atgcgggaaa 2580

gctcttattc gggtgagatg ggctggggca ccatctgggg accctgacgt gaagtttgtc 2640

actgactgga gaactcggtt tgtcgtctgt tgcgggggcg gcagttatgc ggtgccgttg 2700

ggcagtgcac ccgtaccttt gggagcgcgc gcctcgtcgt gtcgtgacgt cacccgttct 2760

gttggcttat aatgcagggt ggggccacct gccggtaggt gtgcggtagg cttttctccg 2820

tcgcaggacg cagggttcgg gcctagggta ggctctcctg aatcgacagg cgccggacct 2880

ctggtgaggg gagggataag tgaggcgtca gtttctttgg tcggttttat gtacctatct 2940

tcttaagtag ctgaagctcc ggttttgaac tatgcgctcg gggttggcga gtgtgttttg 3000

tgaagttttt taggcacctt ttgaaatgta atcatttggg tcaatatgta attttcagtg 3060

ttagactagt aaattgtccg ctaaattctg gccgtttttg gcttttttgt tagacgaagc 3120

ggccgcatta aacgccacca tgtcccgctt ggataagagc aaggtaataa atagcgcact 3180

cgaactcctc aacggcgtgg gcatcgaagg tctgactact cgaaagctcg cccagaaatt 3240

gggtgtggag caacctacat tgtattggca tgtcaagaac aaaagagccc tgctggacgc 3300

tcttcctatt gaaatgcttg acaggcatca cactcattcc tgcccccttg aggtcgagag 3360

ttggcaagat tttctccgaa acaatgcaaa gtcctaccgc tgcgcacttt tgtcccatag 3420

ggatggagca aaagtgcacc tgggaaccag gccaacagag aaacaatacg agactctcga 3480

gaaccagttg gctttcttgt gccaacaggg gttctcactt gaaaatgccc tttacgcact 3540

gtcagccgtt ggacatttta ccctggggtg cgttcttgag gagcaagaac atcaggttgc 3600

taaggaggag cgcgagactc caaccactga ttctatgcca cctttgctga aacaggccat 3660

tgaacttttc gatagacagg gtgctgaacc tgcctttctc ttcgggttgg agctgattat 3720

ttgtggtctc gaaaaacagc tgaaatgtga aagtggtggc cctactgacg ccctcgatga 3780

tttcgacctg gatatgctgc cagccgatgc acttgatgat ttcgatttgg atatgcttcc 3840

agccgacgca ctggacgact tcgatttgga catgcttccc ggttaaacta gtctagcaat 3900

caacctctgg attacaaaat ttgtgaaaga ttgactggta ttcttaacta tgttgctcct 3960

tttacgctat gtggatacgc tgctttaatg cctttgtatc atgctattgc ttcccgtatg 4020

gctttcattt tctcctcctt gtataaatcc tggttagttc ttgccacggc ggaactcatc 4080

gccgcctgcc ttgcccgctg ctggacaggg gctcggctgt tgggcactga caattccgtg 4140

gtgtttattt gtgaaatttg tgatgctatt gctttatttg taaccattct agctttattt 4200

gtgaaatttg tgatgctatt gctttatttg taaccattat aagctgcaat aaacaagtta 4260

acaacaacaa ttgcattcat tttatgtttc aggttcaggg ggagatgtgg gaggtttttt 4320

aaagcggggg atccaaattc ccgataagga tcttcctaga gcatggctac gtagataagt 4380

agcatggcgg gttaatcatt aactacaagg aacccctagt gatggagttg gccactccct 4440

ctctgcgcgc tcgctcgctc actgaggccg ggcgaccaaa ggtcgcccga cgcccgggct 4500

ttgcccgggc ggcctcagtg agcgagcgag cgcgcagcct taattaacct aattcactgg 4560

ccgtcgtttt acaacgtcgt gactgggaaa accctggcgt tacccaactt aatcgccttg 4620

cagcacatcc ccctttcgcc agctggcgta atagcgaaga ggcccgcacc gatcgccctt 4680

cccaacagtt gcgcagcctg aatggcgaat gggacgcgcc ctgtagcggc gcattaagcg 4740

cggcgggtgt ggtggttacg cgcagcgtga ccgctacact tgccagcgcc ctagcgcccg 4800

ctcctttcgc tttcttccct tcctttctcg ccacgttcgc cggctttccc cgtcaagctc 4860

taaatcgggg gctcccttta gggttccgat ttagtgcttt acggcacctc gaccccaaaa 4920

aacttgatta gggtgatggt tcacgtagtg ggccatcgcc ctgatagacg gtttttcgcc 4980

ctttgacgtt ggagtccacg ttctttaata gtggactctt gttccaaact ggaacaacac 5040

tcaaccctat ctcggtctat tcttttgatt tataagggat tttgccgatt tcggcctatt 5100

ggttaaaaaa tgagctgatt taacaaaaat ttaacgcgaa ttttaacaaa atattaacgt 5160

ttataatttc aggtggcatc tttcggggaa atgtgcgcgg aacccctatt tgtttatttt 5220

tctaaataca ttcaaatatg tatccgctca tgagacaata accctgataa atgcttcaat 5280

aatattgaaa aaggaagagt atgagtattc aacatttccg tgtcgccctt attccctttt 5340

ttgcggcatt ttgccttcct gtttttgctc acccagaaac gctggtgaaa gtaaaagatg 5400

ctgaagatca gttgggtgca cgagtgggtt acatcgaact ggatctcaat agtggtaaga 5460

tccttgagag ttttcgcccc gaagaacgtt ttccaatgat gagcactttt aaagttctgc 5520

tatgtggcgc ggtattatcc cgtattgacg ccgggcaaga gcaactcggt cgccgcatac 5580

actattctca gaatgacttg gttgagtact caccagtcac agaaaagcat cttacggatg 5640

gcatgacagt aagagaa 5657

<210> 18

<211> 1215

<212> DNA

<213> 人工序列

<220>

<223> 合成多核苷酸

<400> 18

gatctggcct ccgcgccggg ttttggcgcc tcccgcgggc gcccccctcc tcacggcgag 60

cgctgccacg tcagacgaag ggcgcagcga gcgtcctgat ccttccgccc ggacgctcag 120

gacagcggcc cgctgctcat aagactcggc cttagaaccc cagtatcagc agaaggacat 180

tttaggacgg gacttgggtg actctagggc actggttttc tttccagaga gcggaacagg 240

cgaggaaaag tagtcccttc tcggcgattc tgcggaggga tctccgtggg gcggtgaacg 300

ccgatgatta tataaggacg cgccgggtgt ggcacagcta gttccgtcgc agccgggatt 360

tgggtcgcgg ttcttgtttg tggatcgctg tgatcgtcac ttggtgagta gcgggctgct 420

gggctggccg gggctttcgt ggccgccggg ccgctcggtg ggacggaagc gtgtggagag 480

accgccaagg gctgtagtct gggtccgcga gcaaggttgc cctgaactgg gggttggggg 540

gagcgcagca aaatggcggc tgttcccgag tcttgaatgg aagacgcttg tgaggcgggc 600

tgtgaggtcg ttgaaacaag gtggggggca tggtgggcgg caagaaccca aggtcttgag 660

gccttcgcta atgcgggaaa gctcttattc gggtgagatg ggctggggca ccatctgggg 720

accctgacgt gaagtttgtc actgactgga gaactcggtt tgtcgtctgt tgcgggggcg 780

gcagttatgc ggtgccgttg ggcagtgcac ccgtaccttt gggagcgcgc gcctcgtcgt 840

gtcgtgacgt cacccgttct gttggcttat aatgcagggt ggggccacct gccggtaggt 900

gtgcggtagg cttttctccg tcgcaggacg cagggttcgg gcctagggta ggctctcctg 960

aatcgacagg cgccggacct ctggtgaggg gagggataag tgaggcgtca gtttctttgg 1020

tcggttttat gtacctatct tcttaagtag ctgaagctcc ggttttgaac tatgcgctcg 1080

gggttggcga gtgtgttttg tgaagttttt taggcacctt ttgaaatgta atcatttggg 1140

tcaatatgta attttcagtg ttagactagt aaattgtccg ctaaattctg gccgtttttg 1200

gcttttttgt tagac 1215

<210> 19

<211> 19

<212> DNA

<213> 人工序列

<220>

<223> 合成多核苷酸

<400> 19

tccctatcag tgatagaga 19

<210> 20

<211> 68

<212> DNA

<213> 人工序列

<220>

<223> 合成多核苷酸

<400> 20

gctttaggcg tgtacggtgg gcgcctataa aagcagagct cgtttagtga accgtcagat 60

cgcctgga 68

<210> 21

<211> 248

<212> DNA

<213> 人工序列

<220>

<223> 合成多核苷酸

<400> 21

aatcaacctc tggattacaa aatttgtgaa agattgactg gtattcttaa ctatgttgct 60

ccttttacgc tatgtggata cgctgcttta atgcctttgt atcatgctat tgcttcccgt 120

atggctttca ttttctcctc cttgtataaa tcctggttag ttcttgccac ggcggaactc 180

atcgccgcct gccttgcccg ctgctggaca ggggctcggc tgttgggcac tgacaattcc 240

gtggtgtt 248

<210> 22

<211> 141

<212> DNA

<213> 人工序列

<220>

<223> 合成多核苷酸

<400> 22

ccttaattag gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60

gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120

actccatcac taggggttcc t 141

<210> 23

<211> 438

<212> DNA

<213> 人工序列

<220>

<223> 合成多核苷酸

<400> 23

aattcgtaca cgcctacctc gacccatcaa gtgccacctg acgtctccct atcagtgata 60

gagaagtcga cacgtctcga gctccctatc agtgatagag aaggtacgtc tagaacgtct 120

ccctatcagt gatagagaag tcgacacgtc tcgagctccc tatcagtgat agagaaggta 180

cgtctagaac gtctccctat cagtgataga gaagtcgaca cgtctcgagc tccctatcag 240

tgatagagaa ggtacgtcta gaacgtctcc ctatcagtga tagagaagtc gacacgtctc 300

gagctcccta tcagtgatag agaaggtacc ccctatataa gcagagctcg tttagtgaac 360

cgtcagatcg cctggagacg ccatccacgc tgttttgacc tccatagaag acaccgggac 420

cgatccagcc tggatcgc 438

<210> 24

<211> 315

<212> DNA

<213> 人工序列

<220>

<223> 合成多核苷酸

<400> 24

gagtttactc cctatcagtg atagagaacg tatgtcgagt ttactcccta tcagtgatag 60

agaacgatgt cgagtttact ccctatcagt gatagagaac gtatgtcgag tttactccct 120

atcagtgata gagaacgtat gtcgagttta ctccctatca gtgatagaga acgtatgtcg 180

agtttatccc tatcagtgat agagaacgta tgtcgagttt actccctatc agtgatagag 240

aacgtatgtc gaggtaggcg tgtacggtgg gaggcctata taagcagagc tcgtttagtg 300

aaccgtcaga tcgcc 315

<210> 25

<211> 618

<212> DNA

<213> 人工序列

<220>

<223> 合成多核苷酸

<400> 25

atggctagat tagataaaag taaagtgatt aacagcgcat tagagctgct taatgaggtc 60

ggaatcgaag gtttaacaac ccgtaaactc gcccagaagc taggtgtaga gcagcctaca 120

ttgtattggc atgtaaaaaa taagcgggct ttgctcgacg ccttagccat tgagatgtta 180

gataggcacc atactcactt ttgcccttta gaaggggaaa gctggcaaga ttttttacgt 240

aataacgcta aaagttttag atgtgcttta ctaagtcatc gcgatggagc aaaagtacat 300

ttaggtacac ggcctacaga aaaacagtat gaaactctcg aaaatcaatt agccttttta 360

tgccaacaag gtttttcact agagaatgca ttatatgcac tcagcgctgt ggggcatttt 420

actttaggtt gcgtattgga agatcaagag catcaagtcg ctaaagaaga aagggaaaca 480

cctactactg atagtatgcc gccattatta cgacaagcta tcgaattatt tgatcaccaa 540

ggtgcagagc cagccttctt attcggcctt gaattgatca tatgcggatt agaaaaacaa 600

cttaaatgtg aaagtggg 618

<210> 26

<211> 206

<212> PRT

<213> 人工序列

<220>

<223> 合成多肽

<400> 26

Met Ala Arg Leu Asp Lys Ser Lys Val Ile Asn Ser Ala Leu Glu Leu

1 5 10 15

Leu Asn Glu Val Gly Ile Glu Gly Leu Thr Thr Arg Lys Leu Ala Gln

20 25 30

Lys Leu Gly Val Glu Gln Pro Thr Leu Tyr Trp His Val Lys Asn Lys

35 40 45

Arg Ala Leu Leu Asp Ala Leu Ala Ile Glu Met Leu Asp Arg His His

50 55 60

Thr His Phe Cys Pro Leu Glu Gly Glu Ser Trp Gln Asp Phe Leu Arg

65 70 75 80

Asn Asn Ala Lys Ser Phe Arg Cys Ala Leu Leu Ser His Arg Asp Gly

85 90 95

Ala Lys Val His Leu Gly Thr Arg Pro Thr Glu Lys Gln Tyr Glu Thr

100 105 110

Leu Glu Asn Gln Leu Ala Phe Leu Cys Gln Gln Gly Phe Ser Leu Glu

115 120 125

Asn Ala Leu Tyr Ala Leu Ser Ala Val Gly His Phe Thr Leu Gly Cys

130 135 140

Val Leu Glu Asp Gln Glu His Gln Val Ala Lys Glu Glu Arg Glu Thr

145 150 155 160

Pro Thr Thr Asp Ser Met Pro Pro Leu Leu Arg Gln Ala Ile Glu Leu

165 170 175

Phe Asp His Gln Gly Ala Glu Pro Ala Phe Leu Phe Gly Leu Glu Leu

180 185 190

Ile Ile Cys Gly Leu Glu Lys Gln Leu Lys Cys Glu Ser Gly

195 200 205

<210> 27

<211> 1008

<212> DNA

<213> 人工序列

<220>

<223> 合成多核苷酸

<400> 27

atggctagat tagataaaag taaagtgatt aacagcgcat tagagctgct taatgaggtc 60

ggaatcgaag gtttaacaac ccgtaaactc gcccagaagc taggtgtaga gcagcctaca 120

ttgtattggc atgtaaaaaa taagcgggct ttgctcgacg ccttagccat tgagatgtta 180

gataggcacc atactcactt ttgcccttta gaaggggaaa gctggcaaga ttttttacgt 240

aataacgcta aaagttttag atgtgcttta ctaagtcatc gcgatggagc aaaagtacat 300

ttaggtacac ggcctacaga aaaacagtat gaaactctcg aaaatcaatt agccttttta 360

tgccaacaag gtttttcact agagaatgca ttatatgcac tcagcgctgt ggggcatttt 420

actttaggtt gcgtattgga agatcaagag catcaagtcg ctaaagaaga aagggaaaca 480

cctactactg atagtatgcc gccattatta cgacaagcta tcgaattatt tgatcaccaa 540

ggtgcagagc cagccttctt attcggcctt gaattgatca tatgcggatt agaaaaacaa 600

cttaaatgtg aaagtgggtc gccaaaaaag aagagaaagg tcgacggcgg tggtgctttg 660

tctcctcagc actctgctgt cactcaagga agtatcatca agaacaagga gggcatggat 720

gctaagtcac taactgcctg gtcccggaca ctggtgacct tcaaggatgt atttgtggac 780

ttcaccaggg aggagtggaa gctgctggac actgctcagc agatcgtgta cagaaatgtg 840

atgctggaga actataagaa cctggtttcc ttgggttatc agcttactaa gccagatgtg 900

atcctccggt tggagaaggg agaagagccc tggctggtgg agagagaaat tcaccaagag 960

acccatcctg attcagagac tgcatttgaa atcaaatcat cagtttaa 1008

<210> 28

<211> 335

<212> PRT

<213> 人工序列

<220>

<223> 合成多肽

<400> 28

Met Ala Arg Leu Asp Lys Ser Lys Val Ile Asn Ser Ala Leu Glu Leu

1 5 10 15

Leu Asn Glu Val Gly Ile Glu Gly Leu Thr Thr Arg Lys Leu Ala Gln

20 25 30

Lys Leu Gly Val Glu Gln Pro Thr Leu Tyr Trp His Val Lys Asn Lys

35 40 45

Arg Ala Leu Leu Asp Ala Leu Ala Ile Glu Met Leu Asp Arg His His

50 55 60

Thr His Phe Cys Pro Leu Glu Gly Glu Ser Trp Gln Asp Phe Leu Arg

65 70 75 80

Asn Asn Ala Lys Ser Phe Arg Cys Ala Leu Leu Ser His Arg Asp Gly

85 90 95

Ala Lys Val His Leu Gly Thr Arg Pro Thr Glu Lys Gln Tyr Glu Thr

100 105 110

Leu Glu Asn Gln Leu Ala Phe Leu Cys Gln Gln Gly Phe Ser Leu Glu

115 120 125

Asn Ala Leu Tyr Ala Leu Ser Ala Val Gly His Phe Thr Leu Gly Cys

130 135 140

Val Leu Glu Asp Gln Glu His Gln Val Ala Lys Glu Glu Arg Glu Thr

145 150 155 160

Pro Thr Thr Asp Ser Met Pro Pro Leu Leu Arg Gln Ala Ile Glu Leu

165 170 175

Phe Asp His Gln Gly Ala Glu Pro Ala Phe Leu Phe Gly Leu Glu Leu

180 185 190

Ile Ile Cys Gly Leu Glu Lys Gln Leu Lys Cys Glu Ser Gly Ser Pro

195 200 205

Lys Lys Lys Arg Lys Val Asp Gly Gly Gly Ala Leu Ser Pro Gln His

210 215 220

Ser Ala Val Thr Gln Gly Ser Ile Ile Lys Asn Lys Glu Gly Met Asp

225 230 235 240

Ala Lys Ser Leu Thr Ala Trp Ser Arg Thr Leu Val Thr Phe Lys Asp

245 250 255

Val Phe Val Asp Phe Thr Arg Glu Glu Trp Lys Leu Leu Asp Thr Ala

260 265 270

Gln Gln Ile Val Tyr Arg Asn Val Met Leu Glu Asn Tyr Lys Asn Leu

275 280 285

Val Ser Leu Gly Tyr Gln Leu Thr Lys Pro Asp Val Ile Leu Arg Leu

290 295 300

Glu Lys Gly Glu Glu Pro Trp Leu Val Glu Arg Glu Ile His Gln Glu

305 310 315 320

Thr His Pro Asp Ser Glu Thr Ala Phe Glu Ile Lys Ser Ser Val

325 330 335

<210> 29

<211> 977

<212> DNA

<213> 人工序列

<220>

<223> 合成多核苷酸

<400> 29

accttgcttc ctagctgggc ctttccttct cctctataaa taccagctct ggtatttcgc 60

cttggcagct gttgctgcta gggagacggc tggcttgaca tgcatctcct gacaaaacac 120

aaacccgtgg tgtgagtggg tgtgggcggt gtgagtaggg ggatgaatca gagagggggc 180

gagggagaca ggggcgcagg agtcaggcaa aggcgatgcg ggggtgcgac tacacgcagt 240

tggaaacagt cgtcagaaga ttctggaaac tatcttgctg gctataaact tgagggaagc 300

agaaggccaa cattcctccc aagggaaact gaggctcaga gttaaaaccc aggtatcagt 360

gatatgcatg tgccccggcc agggtcactc tctgactaac cggtacctac cctacaggcc 420

tacctagaga ctcttttgaa aggatggtag agacctgtcc gggctttgcc cacagtcgtt 480

ggaaacctca gcattttcta ggcaacttgt gcgaataaaa cacttcgggg gtccttcttg 540

ttcattccaa taacctaaaa cctctcctcg gagaaaatag ggggcctcaa acaaacgaaa 600

ttctctagcc cgctttcccc aggataaggc aggcatccaa atggaaaaaa aggggccggc 660

cgggggtctc ctgtcagctc cttgccctgt gaaacccagc aggcctgcct gtcttctgtc 720

ctcttggggc tgtccagggg cgcaggcctc ttgcggggga gctggcctcc ccgccccctc 780

gcctgtggcc gcccttttcc tggcaggaca gagggatcct gcagctgtca ggggaggggc 840

gccggggggt gatgtcagga gggctacaaa tagtgcagac agctaagggg ctccgtcacc 900

catcttcaca tccactccag ccggctgccc gcccgctgcc tcctctgtgc gtccgcccag 960

ccagcctcgt ccacgcc 977

<210> 30

<211> 5428

<212> DNA

<213> 人工序列

<220>

<223> 合成多核苷酸

<400> 30

ttatgcagtg ctgccataac catgagtgat aacactgcgg ccaacttact tctgacaacg 60

atcggaggac cgaaggagct aaccgctttt ttgcacaaca tgggggatca tgtaactcgc 120

cttgatcgtt gggaaccgga gctgaatgaa gccataccaa acgacgagcg tgacaccacg 180

atgcctgtag taatggtaac aacgttgcgc aaactattaa ctggcgaact acttactcta 240

gcttcccggc aacaattaat agactggatg gaggcggata aagttgcagg accacttctg 300

cgctcggccc ttccggctgg ctggtttatt gctgataaat ctggagccgg tgagcgtggg 360

tctcgcggta tcattgcagc actggggcca gatggtaagc cctcccgtat cgtagttatc 420

tacacgacgg ggagtcaggc aactatggat gaacgaaata gacagatcgc tgagataggt 480

gcctcactga ttaagcattg gtaactgtca gaccaagttt actcatatat actttagatt 540

gatttaaaac ttcattttta atttaaaagg atctaggtga agatcctttt tgataatctc 600

atgaccaaaa tcccttaacg tgagttttcg ttccactgag cgtcagaccc cgtagaaaag 660

atcaaaggat cttcttgaga tccttttttt ctgcgcgtaa tctgctgctt gcaaacaaaa 720

aaaccaccgc taccagcggt ggtttgtttg ccggatcaag agctaccaac tctttttccg 780

aaggtaactg gcttcagcag agcgcagata ccaaatactg tccttctagt gtagccgtag 840

ttaggccacc acttcaagaa ctctgtagca ccgcctacat acctcgctct gctaatcctg 900

ttaccagtgg ctgctgccag tggcgataag tcgtgtctta ccgggttgga ctcaagacga 960

tagttaccgg ataaggcgca gcggtcgggc tgaacggggg gttcgtgcac acagcccagc 1020

ttggagcgaa cgacctacac cgaactgaga tacctacagc gtgagctatg agaaagcgcc 1080

acgcttcccg aagggagaaa ggcggacagg tatccggtaa gcggcagggt cggaacagga 1140

gagcgcacga gggagcttcc agggggaaac gcctggtatc tttatagtcc tgtcgggttt 1200

cgccacctct gacttgagcg tcgatttttg tgatgctcgt caggggggcg gagcctatgg 1260

aaaaacgcca gcaacgcggc ctttttacgg ttcctggcct tttgctggcc ttttgctcac 1320

atgttctttc ctgcgttatc ccctgattct gtggataacc gtattaccgc ctttgagtga 1380

gctgataccg ctcgccgcag ccgaacgacc gagcgcagcg agtcagtgag cgaggaagcg 1440

gaagagcgcc caatacgcaa accgcctctc cccgcgcgtt ggccgattca ttaatgcagc 1500

tggcacgaca ggtttcccga ctggaaagcg ggcagtgagc gcaacgcaat taatgtgagt 1560

tagctcactc attaggcacc ccaggcttta cactttatgc ttccggctcg tatgttgtgt 1620

ggaattgtga gcggataaca atttcacaca ggaaacagct atgaccatga ttacgccaga 1680

tttaattaag gccttaatta ggctgcgcgc tcgctcgctc actgaggccg cccgggcaaa 1740

gcccgggcgt cgggcgacct ttggtcgccc ggcctcagtg agcgagcgag cgcgcagaga 1800

gggagtggcc aactccatca ctaggggttc cttgtagtta atgattaacc cgccatgcta 1860

cttatctacg tagccatgct ctaggaagat cggaattcct agatctacct tgcttcctag 1920

ctgggccttt ccttctcctc tataaatacc agctctggta tttcgccttg gcagctgttg 1980

ctgctaggga gacggctggc ttgacatgca tctcctgaca aaacacaaac ccgtggtgtg 2040

agtgggtgtg ggcggtgtga gtagggggat gaatcagaga gggggcgagg gagacagggg 2100

cgcaggagtc aggcaaaggc gatgcggggg tgcgactaca cgcagttgga aacagtcgtc 2160

agaagattct ggaaactatc ttgctggcta taaacttgag ggaagcagaa ggccaacatt 2220

cctcccaagg gaaactgagg ctcagagtta aaacccaggt atcagtgata tgcatgtgcc 2280

ccggccaggg tcactctctg actaaccggt acctacccta caggcctacc tagagactct 2340

tttgaaagga tggtagagac ctgtccgggc tttgcccaca gtcgttggaa acctcagcat 2400

tttctaggca acttgtgcga ataaaacact tcgggggtcc ttcttgttca ttccaataac 2460

ctaaaacctc tcctcggaga aaataggggg cctcaaacaa acgaaattct ctagcccgct 2520

ttccccagga taaggcaggc atccaaatgg aaaaaaaggg gccggccggg ggtctcctgt 2580

cagctccttg ccctgtgaaa cccagcaggc ctgcctgtct tctgtcctct tggggctgtc 2640

caggggcgca ggcctcttgc gggggagctg gcctccccgc cccctcgcct gtggccgccc 2700

ttttcctggc aggacagagg gatcctgcag ctgtcagggg aggggcgccg gggggtgatg 2760

tcaggagggc tacaaatagt gcagacagct aaggggctcc gtcacccatc ttcacatcca 2820

ctccagccgg ctgcccgccc gctgcctcct ctgtgcgtcc gcccagccag cctcgtccac 2880

gccaagcttg cggccgcatt aaacgccacc atgtcccgct tggataagag caaggtaata 2940

aatagcgcac tcgaactcct caacggcgtg ggcatcgaag gtctgactac tcgaaagctc 3000

gcccagaaat tgggtgtgga gcaacctaca ttgtattggc atgtcaagaa caaaagagcc 3060

ctgctggacg ctcttcctat tgaaatgctt gacaggcatc acactcattc ctgccccctt 3120

gaggtcgaga gttggcaaga ttttctccga aacaatgcaa agtcctaccg ctgcgcactt 3180

ttgtcccata gggatggagc aaaagtgcac ctgggaacca ggccaacaga gaaacaatac 3240

gagactctcg agaaccagtt ggctttcttg tgccaacagg ggttctcact tgaaaatgcc 3300

ctttacgcac tgtcagccgt tggacatttt accctggggt gcgttcttga ggagcaagaa 3360

catcaggttg ctaaggagga gcgcgagact ccaaccactg attctatgcc acctttgctg 3420

aaacaggcca ttgaactttt cgatagacag ggtgctgaac ctgcctttct cttcgggttg 3480

gagctgatta tttgtggtct cgaaaaacag ctgaaatgtg aaagtggtgg ccctactgac 3540

gccctcgatg atttcgacct ggatatgctg ccagccgatg cacttgatga tttcgatttg 3600

gatatgcttc cagccgacgc actggacgac ttcgatttgg acatgcttcc cggttaaact 3660

agtctagcaa tcaacctctg gattacaaaa tttgtgaaag attgactggt attcttaact 3720

atgttgctcc ttttacgcta tgtggatacg ctgctttaat gcctttgtat catgctattg 3780

cttcccgtat ggctttcatt ttctcctcct tgtataaatc ctggttagtt cttgccacgg 3840

cggaactcat cgccgcctgc cttgcccgct gctggacagg ggctcggctg ttgggcactg 3900

acaattccgt ggtgtttatt tgtgaaattt gtgatgctat tgctttattt gtaaccattc 3960

tagctttatt tgtgaaattt gtgatgctat tgctttattt gtaaccatta taagctgcaa 4020

taaacaagtt aacaacaaca attgcattca ttttatgttt caggttcagg gggagatgtg 4080

ggaggttttt taaagcgggg gatccaaatt cccgataagg atcttcctag agcatggcta 4140

cgtagataag tagcatggcg ggttaatcat taactacaag gaacccctag tgatggagtt 4200

ggccactccc tctctgcgcg ctcgctcgct cactgaggcc gggcgaccaa aggtcgcccg 4260

acgcccgggc tttgcccggg cggcctcagt gagcgagcga gcgcgcagcc ttaattaacc 4320

taattcactg gccgtcgttt tacaacgtcg tgactgggaa aaccctggcg ttacccaact 4380

taatcgcctt gcagcacatc cccctttcgc cagctggcgt aatagcgaag aggcccgcac 4440

cgatcgccct tcccaacagt tgcgcagcct gaatggcgaa tgggacgcgc cctgtagcgg 4500

cgcattaagc gcggcgggtg tggtggttac gcgcagcgtg accgctacac ttgccagcgc 4560

cctagcgccc gctcctttcg ctttcttccc ttcctttctc gccacgttcg ccggctttcc 4620

ccgtcaagct ctaaatcggg ggctcccttt agggttccga tttagtgctt tacggcacct 4680

cgaccccaaa aaacttgatt agggtgatgg ttcacgtagt gggccatcgc cctgatagac 4740

ggtttttcgc cctttgacgt tggagtccac gttctttaat agtggactct tgttccaaac 4800

tggaacaaca ctcaacccta tctcggtcta ttcttttgat ttataaggga ttttgccgat 4860

ttcggcctat tggttaaaaa atgagctgat ttaacaaaaa tttaacgcga attttaacaa 4920

aatattaacg tttataattt caggtggcat ctttcgggga aatgtgcgcg gaacccctat 4980

ttgtttattt ttctaaatac attcaaatat gtatccgctc atgagacaat aaccctgata 5040

aatgcttcaa taatattgaa aaaggaagag tatgagtatt caacatttcc gtgtcgccct 5100

tattcccttt tttgcggcat tttgccttcc tgtttttgct cacccagaaa cgctggtgaa 5160

agtaaaagat gctgaagatc agttgggtgc acgagtgggt tacatcgaac tggatctcaa 5220

tagtggtaag atccttgaga gttttcgccc cgaagaacgt tttccaatga tgagcacttt 5280

taaagttctg ctatgtggcg cggtattatc ccgtattgac gccgggcaag agcaactcgg 5340

tcgccgcata cactattctc agaatgactt ggttgagtac tcaccagtca cagaaaagca 5400

tcttacggat ggcatgacag taagagaa 5428

<210> 31

<211> 5332

<212> DNA

<213> 人工序列

<220>

<223> 合成多核苷酸

<400> 31

aaattgtaaa cgttaatatt ttgttaaaat tcgcgttaaa tttttgttaa atcagctcat 60

tttttaacca ataggccgaa atcggcaaaa tcccttataa atcaaaagaa tagcccgaga 120

tagggttgag tgttgttcca gtttggaaca agagtccact attaaagaac gtggactcca 180

acgtcaaagg gcgaaaaacc gtctatcagg gcgatggccc actacgtgaa ccatcaccca 240

aatcaagttt tttggggtcg aggtgccgta aagcactaaa tcggaaccct aaagggagcc 300

cccgatttag agcttgacgg ggaaagccgg cgaacgtggc gagaaaggaa gggaagaaag 360

cgaaaggagc gggcgctagg gcgctggcaa gtgtagcggt cacgctgcgc gtaaccacca 420

cacccgccgc gcttaatgcg ccgctacagg gcgcgtacta tggttgcttt gacgtatgcg 480

gtgtgaaata ccgcacagat gcgtaaggag aaaataccgc atcaggcgcc cctgcaggca 540

gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc gggcgacctt 600

tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca actccatcac 660

taggggttcc tgcggccgct cggtccgcac gatctcaatt cggccattac ggccggatcc 720

ggctcgagga gcttggccca ttgcatacgt tgtatccata tcataatatg tacatttata 780

ttggctcatg tccaacatta ccgccatgtt gacattgatt attgactagt tattaatagt 840

aatcaattac ggggtcatta gttcatagcc catatatgga gttccgcgtt acataactta 900

cggtaaatgg cccgcctggc tgaccgccca acgacccccg cccattgacg tcaataatga 960

cgtatgttcc catagtaacg ccaataggga ctttccattg acgtcaatgg gtggagtatt 1020

tacgctaaac tgcccacttg gcagtacatc aagtgtatca tatgccaagt acgcccccta 1080

ttgacgtcaa tgacggtaaa tggcccgcct ggcattatgc ccagtacatg accttatggg 1140

actttcctac ttggcagtac atctacgtat tagtcatcgc tattaccatg gtgatgcggt 1200

tttggcagta catcaatggg cgtggatagc ggtttgactc acggggattt ccaagtctcc 1260

accccattga cgtcaatggg agtttgtttt ggcaccaaaa tcaacgggac tttccaaaat 1320

gtcgtaacaa ctccgcccca ttgacgcaaa tgggcggtag gcgtgtacgg tgggaggtct 1380

atataagcag agctcgttta gtgaaccgtc agatcgcctg gagacgccat ccacgctgtt 1440

ttgacctcca tagaagacac cgggaccgat ccagcctccg cggccccgaa ttcaccatgt 1500

ctagactgga caagagcaaa atcataaaca gcgctctgga attactcaat ggagtcggta 1560

tcgaaggcct gacgacaagg aaactcgctc aaaagctggg agttgagcag cctaccctgt 1620

actggcacgt gaagaacaag cgggccctgc tcgatgccct gccaatcgag atgctggaca 1680

ggcatcatac ccacagctgc cccctggaag gcgagtcatg gcaagacttt ctgcggaaca 1740

acgccaagtc ataccgctgt gctctcctct cacatcgcga cggggctaaa gtgcatctcg 1800

gcacccgccc aacagagaaa cagtacgaaa ccctggaaaa tcagctcgcg ttcctgtgtc 1860

agcaaggctt ctccctggag aacgcactgt acgctctgtc cgccgtgggc cactttacac 1920

tgggctgcgt attggaggaa caggagcatc aagtagcaaa agaggaaaga gagacaccta 1980

ccaccgattc tatgccccca cttctgaagc aagcaattga gctgttcgac cggcagggag 2040

ccgaacctgc cttccttttc ggcctggaac taatcatatg tggcctggag aaacagctaa 2100

agtgcgaaag cggcgggccg accgacgccc ttgacgattt tgacttagac atgctcccag 2160

ccgatgccct tgacgacttt gaccttgata tgctgcctgc tgacgctctt gacgattttg 2220

accttgacat gctccccggg taactaagta aggatcatct taattaaatc gataaggatc 2280

tggccgcctc ggcctaatca acctctggat tacaaaattt gtgaaagatt gactggtatt 2340

cttaactatg ttgctccttt tacgctatgt ggatacgctg ctttaatgcc tttgtatcat 2400

gctattgctt cccgtatggc tttcattttc tcctccttgt ataaatcctg gttgctgtct 2460

ctttatgagg agttgtggcc cgttgtcagg caacgtggcg tggtgtgcac tgtgtttgct 2520

gacgcaaccc ccactggttg gggcattgcc accacctgtc agctcctttc cgggactttc 2580

gctttccccc tccctattgc cacggcggaa ctcatcgccg cctgccttgc ccgctgctgg 2640

acaggggctc ggctgttggg cactgacaat tccgtggtgt tgtcggggaa atcatcgtcc 2700

tttccttggc tgctcgcctg tgttgccacc tggattctgc gcgggacgtc cttctgctac 2760

gtcccttcgg ccctcaatcc agcggacctt ccttcccgcg gcctgctgcc ggctctgcgg 2820

cctcttccgc gtcttcgcct tcgccctcag acgagtcgga tctccctttg ggccgcctcc 2880

ccgccagaca tgataagata cattgatgag tttggacaaa ccacaactag aatgcagtga 2940

aaaaaatgct ttatttgtga aatttgtgat gctattgctt tatttgtaac cattataagc 3000

tgcaataaac aagttaacaa caacaattgc attcatttta tgtttcaggt tcagggggag 3060

atgtgggagg ttttttaaag caagtaaaac ctctacaaat gtggtaacta gcgcgtgcgg 3120

ccgcaggaac ccctagtgat ggagttggcc actccctctc tgcgcgctcg ctcgctcact 3180

gaggccgggc gaccaaaggt cgcccgacgc ccgggctttg cccgggcggc ctcagtgagc 3240

gagcgagcgc gcagctgcct gcaggacatg tgagcaaaag gccagcaaaa ggccaggaac 3300

cgtaaaaagg ccgcgttgct ggcgtttttc cataggctcc gcccccctga cgagcatcac 3360

aaaaatcgac gctcaagtca gaggtggcga aacccgacag gactataaag ataccaggcg 3420

tttccccctg gaagctccct cgtgcgctct cctgttccga ccctgccgct taccggatac 3480

ctgtccgcct ttctcccttc gggaagcgtg gcgctttctc atagctcacg ctgtaggtat 3540

ctcagttcgg tgtaggtcgt tcgctccaag ctgggctgtg tgcacgaacc ccccgttcag 3600

cccgaccgct gcgccttatc cggtaactat cgtcttgagt ccaacccggt aagacacgac 3660

ttatcgccac tggcagcagc cactggtaac aggattagca gagcgaggta tgtaggcggt 3720

gctacagagt tcttgaagtg gtggcctaac tacggctaca ctagaaggac agtatttggt 3780

atctgcgctc tgctgaagcc agttaccttc ggaaaaagag ttggtagctc ttgatccggc 3840

aaacaaacca ccgctggtag cggtggtttt tttgtttgca agcagcagat tacgcgcaga 3900

aaaaaaggat ctcaagaaga tcctttgatc ttttctacgg ggtctgacgc tcagtggaac 3960

gaaaactcac gttaagggat tttggtcatg agattatcaa aaaggatctt cacctagatc 4020

cttttaaatt aaaaatgaag ttttaaatca atctaaagta tatatgagta aacttggtct 4080

gacagttacc aatgcttaat cagtgaggca cctatctcag cgatctgtct atttcgttca 4140

tccatagttg cctgactccc cgtcgtgtag ataactacga tacgggaggg cttaccatct 4200

ggccccagtg ctgcaatgat accgcgagac ccacgctcac cggctccaga tttatcagca 4260

ataaaccagc cagccggaag ggccgagcgc agaagtggtc ctgcaacttt atccgcctcc 4320

atccagtcta ttaattgttg ccgggaagct agagtaagta gttcgccagt taatagtttg 4380

cgcaacgttg ttgccattgc tacaggcatc gtggtgtcac gctcgtcgtt tggtatggct 4440

tcattcagct ccggttccca acgatcaagg cgagttacat gatcccccat gttgtgcaaa 4500

aaagcggtta gctccttcgg tcctccgatc gttgtcagaa gtaagttggc cgcagtgtta 4560

tcactcatgg ttatggcagc actgcataat tctcttactg tcatgccatc cgtaagatgc 4620

ttttctgtga ctggtgagta ctcaaccaag tcattctgag aatagtgtat gcggcgaccg 4680

agttgctctt gcccggcgtc aatacgggat aataccgcgc cacatagcag aactttaaaa 4740

gtgctcatca ttggaaaacg ttcttcgggg cgaaaactct caaggatctt accgctgttg 4800

agatccagtt cgatgtaacc cactcgtgca cccaactgat cttcagcatc ttttactttc 4860

accagcgttt ctgggtgagc aaaaacagga aggcaaaatg ccgcaaaaaa gggaataagg 4920

gcgacacgga aatgttgaat actcatactc ttcctttttc aatattattg aagcatttat 4980

cagggttatt gtctcatgag cggatacata tttgaatgta tttagaaaaa taaacaaata 5040

ggggttccgc gcacatttcc ccgaaaagtg ccacctgacg tctaagaaac cattattatc 5100

atgacattaa cctataaaaa taggcgtatc acgaggccct ttcgtctcgc gcgtttcggt 5160

gatgacggtg aaaacctctg acacatgcag ctcccggaga cggtcacagc ttgtctgtaa 5220

gcggatgccg ggagcagaca agcccgtcag ggcgcgtcag cgggtgttgg cgggtgtcgg 5280

ggctggctta actatgcggc atcagagcag attgtactga gagtgcacca ta 5332

<210> 32

<211> 5392

<212> DNA

<213> 人工序列

<220>

<223> 合成多核苷酸

<400> 32

cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60

gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120

actccatcac taggggttcc tgcggccgca cgcgtggagc tagttattaa tagtaatcaa 180

ttacggggtc attagttcat agcccatata tggagttccg cgttacataa cttacggtaa 240

atggcccgcc tggctgaccg cccaacgacc cccgcccatt gacgtcaata atgacgtatg 300

ttcccatagt aacgtcaata gggactttcc attgacgtca atgggtggag tatttacggt 360

aaactgccca cttggcagta catcaagtgt atcatatgcc aagtacgccc cctattgacg 420

tcaatgacgg taaatggccc gcctggcatt atgcccagta catgacctta tgggactttc 480

ctacttggca gtacatctac gtattagtca tcgctattac catggtgatg cggttttggc 540

agtacatcaa tgggcgtgga tagcggtttg actcacgggg atttccaagt ctccacccca 600

ttgacgtcaa tgggagtttg ttttgcacca aaatcaacgg gactttccaa aatgtcgtaa 660

caactccgcc ccattgacgc aaatgggcgg taggcgtgta cggtgggagg tctatataag 720

cagagctcgt ttagtgaacc gtcagatcgc ctggagacgc catccacgct gttttgacct 780

ccatagaaga caccgggacc gatccagcct ccgcggattc gaatcccggc cgggaacggt 840

gcattggaac gcggattccc cgtgccaaga gtgacgtaag taccgcctat agagtctata 900

ggcccacaaa aaatgctttc ttcttttaat atactttttt gtttatctta tttctaatac 960

tttccctaat ctctttcttt cagggcaata atgatacaat gtatcatgcc tctttgcacc 1020

attctaaaga ataacagtga taatttctgg gttaaggcaa tagcaatatt tctgcatata 1080

aatatttctg catataaatt gtaactgatg taagaggttt catattgcta atagcagcta 1140

caatccagct accattctgc ttttatttta tggttgggat aaggctggat tattctgagt 1200

ccaagctagg cccttttgct aatcatgttc atacctctta tcttcctccc acagctcctg 1260

ggcaacgtgc tggtctgtgt gctggcccat cactttggca aagaattggg attcgaacat 1320

cgattgaatt catgtctaga ctggacaaga gcaaagtcat aaactctgct ctggaattac 1380

tcaatgaagt cggtatcgaa ggcctgacga caaggaaact cgctcaaaag ctgggagttg 1440

agcagcctac cctgtactgg cacgtgaaga acaagcgggc cctgctcgat gccctggcaa 1500

tcgagatgct ggacaggcat catacccact tctgccccct ggaaggcgag tcatggcaag 1560

actttctgcg gaacaacgcc aagtcattcc gctgtgctct cctctcacat cgcgacgggg 1620

ctaaagtgca tctcggcacc cgcccaacag agaaacagta cgaaaccctg gaaaatcagc 1680

tcgcgttcct gtgtcagcaa ggcttctccc tggagaacgc actgtacgct ctgtccgccg 1740

tgggccactt tacactgggc tgcgtattgg aggatcagga gcatcaagta gcaaaagagg 1800

aaagagagac acctaccacc gattctatgc ccccacttct gagacaagca attgagctgt 1860

tcgaccatca gggagccgaa cctgccttcc ttttcggcct ggaactaatc atatgtggcc 1920

tggagaaaca gctaaagtgc gaaagcggcg ggccggccga cgcccttgac gattttgact 1980

tagacatgct cccagccgat gcccttgacg actttgacct tgatatgctg cctgctgacg 2040

ctcttgacga ttttgacctt gacatgctcc ccggatgagg atcctctaga gtcgacctgc 2100

agaagcttgc ctcgagcagc gctgctcgag agatctacgg gtggcatccc tgtgacccct 2160

ccccagtgcc tctcctggcc ctggaagttg ccactccagt gcccaccagc cttgtcctaa 2220

taaaattaag ttgcatcatt ttgtctgact aggtgtcctt ctataatatt atggggtgga 2280

ggggggtggt atggagcaag gggcaagttg ggaagacaac ctgtagggcc tgcggggtct 2340

attgggaacc aagctggagt gcagtggcac aatcttggct cactgcaatc tccgcctcct 2400

gggttcaagc gattctcctg cctcagcctc ccgagttgtt gggattccag gcatgcatga 2460

ccaggctcag ctaatttttg tttttttggt agagacgggg tttcaccata ttggccaggc 2520

tggtctccaa ctcctaatct caggtgatct acccaccttg gcctcccaaa ttgctgggat 2580

tacaggcgtg aaccactgct cccttccctg tccttctgat tttgtaggta accacgtgcg 2640

gaccgagcgg ccgcaggaac ccctagtgat ggagttggcc actccctctc tgcgcgctcg 2700

ctcgctcact gaggccgggc gaccaaaggt cgcccgacgc ccgggctttg cccgggcggc 2760

ctcagtgagc gagcgagcgc gcagctgcct gcaggggcgc ctgatgcggt attttctcct 2820

tacgcatctg tgcggtattt cacaccgcat acgtcaaagc aaccatagta cgcgccctgt 2880

agcggcgcat taagcgcggc gggtgtggtg gttacgcgca gcgtgaccgc tacacttgcc 2940

agcgccctag cgcccgctcc tttcgctttc ttcccttcct ttctcgccac gttcgccggc 3000

tttccccgtc aagctctaaa tcgggggctc cctttagggt tccgatttag tgctttacgg 3060

cacctcgacc ccaaaaaact tgatttgggt gatggttcac gtagtgggcc atcgccctga 3120

tagacggttt ttcgcccttt gacgttggag tccacgttct ttaatagtgg actcttgttc 3180

caaactggaa caacactcaa ccctatctcg ggctattctt ttgatttata agggattttg 3240

ccgatttcgg cctattggtt aaaaaatgag ctgatttaac aaaaatttaa cgcgaatttt 3300

aacaaaatat taacgtttac aattttatgg tgcactctca gtacaatctg ctctgatgcc 3360

gcatagttaa gccagccccg acacccgcca acacccgctg acgcgccctg acgggcttgt 3420

ctgctcccgg catccgctta cagacaagct gtgaccgtct ccgggagctg catgtgtcag 3480

aggttttcac cgtcatcacc gaaacgcgcg agacgaaagg gcctcgtgat acgcctattt 3540

ttataggtta atgtcatgat aataatggtt tcttagacgt caggtggcac ttttcgggga 3600

aatgtgcgcg gaacccctat ttgtttattt ttctaaatac attcaaatat gtatccgctc 3660

atgagacaat aaccctgata aatgcttcaa taatattgaa aaaggaagag tatgagtatt 3720

caacatttcc gtgtcgccct tattcccttt tttgcggcat tttgccttcc tgtttttgct 3780

cacccagaaa cgctggtgaa agtaaaagat gctgaagatc agttgggtgc acgagtgggt 3840

tacatcgaac tggatctcaa cagcggtaag atccttgaga gttttcgccc cgaagaacgt 3900

tttccaatga tgagcacttt taaagttctg ctatgtggcg cggtattatc ccgtattgac 3960

gccgggcaag agcaactcgg tcgccgcata cactattctc agaatgactt ggttgagtac 4020

tcaccagtca cagaaaagca tcttacggat ggcatgacag taagagaatt atgcagtgct 4080

gccataacca tgagtgataa cactgcggcc aacttacttc tgacaacgat cggaggaccg 4140

aaggagctaa ccgctttttt gcacaacatg ggggatcatg taactcgcct tgatcgttgg 4200

gaaccggagc tgaatgaagc cataccaaac gacgagcgtg acaccacgat gcctgtagca 4260

atggcaacaa cgttgcgcaa actattaact ggcgaactac ttactctagc ttcccggcaa 4320

caattaatag actggatgga ggcggataaa gttgcaggac cacttctgcg ctcggccctt 4380

ccggctggct ggtttattgc tgataaatct ggagccggtg agcgtgggtc tcgcggtatc 4440

attgcagcac tggggccaga tggtaagccc tcccgtatcg tagttatcta cacgacgggg 4500

agtcaggcaa ctatggatga acgaaataga cagatcgctg agataggtgc ctcactgatt 4560

aagcattggt aactgtcaga ccaagtttac tcatatatac tttagattga tttaaaactt 4620

catttttaat ttaaaaggat ctaggtgaag atcctttttg ataatctcat gaccaaaatc 4680

ccttaacgtg agttttcgtt ccactgagcg tcagaccccg tagaaaagat caaaggatct 4740

tcttgagatc ctttttttct gcgcgtaatc tgctgcttgc aaacaaaaaa accaccgcta 4800

ccagcggtgg tttgtttgcc ggatcaagag ctaccaactc tttttccgaa ggtaactggc 4860

ttcagcagag cgcagatacc aaatactgtc cttctagtgt agccgtagtt aggccaccac 4920

ttcaagaact ctgtagcacc gcctacatac ctcgctctgc taatcctgtt accagtggct 4980

gctgccagtg gcgataagtc gtgtcttacc gggttggact caagacgata gttaccggat 5040

aaggcgcagc ggtcgggctg aacggggggt tcgtgcacac agcccagctt ggagcgaacg 5100

acctacaccg aactgagata cctacagcgt gagctatgag aaagcgccac gcttcccgaa 5160

gggagaaagg cggacaggta tccggtaagc ggcagggtcg gaacaggaga gcgcacgagg 5220

gagcttccag ggggaaacgc ctggtatctt tatagtcctg tcgggtttcg ccacctctga 5280

cttgagcgtc gatttttgtg atgctcgtca ggggggcgga gcctatggaa aaacgccagc 5340

aacgcggcct ttttacggtt cctggccttt tgctggcctt ttgctcacat gt 5392

<210> 33

<211> 7732

<212> DNA

<213> 人工序列

<220>

<223> 合成多核苷酸

<400> 33

ttatgcagtg ctgccataac catgagtgat aacactgcgg ccaacttact tctgacaacg 60

atcggaggac cgaaggagct aaccgctttt ttgcacaaca tgggggatca tgtaactcgc 120

cttgatcgtt gggaaccgga gctgaatgaa gccataccaa acgacgagcg tgacaccacg 180

atgcctgtag taatggtaac aacgttgcgc aaactattaa ctggcgaact acttactcta 240

gcttcccggc aacaattaat agactggatg gaggcggata aagttgcagg accacttctg 300

cgctcggccc ttccggctgg ctggtttatt gctgataaat ctggagccgg tgagcgtggg 360

tctcgcggta tcattgcagc actggggcca gatggtaagc cctcccgtat cgtagttatc 420

tacacgacgg ggagtcaggc aactatggat gaacgaaata gacagatcgc tgagataggt 480

gcctcactga ttaagcattg gtaactgtca gaccaagttt actcatatat actttagatt 540

gatttaaaac ttcattttta atttaaaagg atctaggtga agatcctttt tgataatctc 600

atgaccaaaa tcccttaacg tgagttttcg ttccactgag cgtcagaccc cgtagaaaag 660

atcaaaggat cttcttgaga tccttttttt ctgcgcgtaa tctgctgctt gcaaacaaaa 720

aaaccaccgc taccagcggt ggtttgtttg ccggatcaag agctaccaac tctttttccg 780

aaggtaactg gcttcagcag agcgcagata ccaaatactg tccttctagt gtagccgtag 840

ttaggccacc acttcaagaa ctctgtagca ccgcctacat acctcgctct gctaatcctg 900

ttaccagtgg ctgctgccag tggcgataag tcgtgtctta ccgggttgga ctcaagacga 960

tagttaccgg ataaggcgca gcggtcgggc tgaacggggg gttcgtgcac acagcccagc 1020

ttggagcgaa cgacctacac cgaactgaga tacctacagc gtgagctatg agaaagcgcc 1080

acgcttcccg aagggagaaa ggcggacagg tatccggtaa gcggcagggt cggaacagga 1140

gagcgcacga gggagcttcc agggggaaac gcctggtatc tttatagtcc tgtcgggttt 1200

cgccacctct gacttgagcg tcgatttttg tgatgctcgt caggggggcg gagcctatgg 1260

aaaaacgcca gcaacgcggc ctttttacgg ttcctggcct tttgctggcc ttttgctcac 1320

atgttctttc ctgcgttatc ccctgattct gtggataacc gtattaccgc ctttgagtga 1380

gctgataccg ctcgccgcag ccgaacgacc gagcgcagcg agtcagtgag cgaggaagcg 1440

gaagagcgcc caatacgcaa accgcctctc cccgcgcgtt ggccgattca ttaatgcagc 1500

tggcacgaca ggtttcccga ctggaaagcg ggcagtgagc gcaacgcaat taatgtgagt 1560

tagctcactc attaggcacc ccaggcttta cactttatgc ttccggctcg tatgttgtgt 1620

ggaattgtga gcggataaca atttcacaca ggaaacagct atgaccatga ttacgccaga 1680

tttaattaag gccttaatta ggctgcgcgc tcgctcgctc actgaggccg cccgggcaaa 1740

gcccgggcgt cgggcgacct ttggtcgccc ggcctcagtg agcgagcgag cgcgcagaga 1800

gggagtggcc aactccatca ctaggggttc cttgtagtta atgattaacc cgccatgcta 1860

cttatctacg tagccatgct ctaggaagat cggaattcgt acacgcctac ctcgacccat 1920

caagtgccac ctgacgtctc cctatcagtg atagagaagt cgacacgtct cgagctccct 1980

atcagtgata gagaaggtac gtctagaacg tctccctatc agtgatagag aagtcgacac 2040

gtctcgagct ccctatcagt gatagagaag gtacgtctag aacgtctccc tatcagtgat 2100

agagaagtcg acacgtctcg agctccctat cagtgataga gaaggtacgt ctagaacgtc 2160

tccctatcag tgatagagaa gtcgacacgt ctcgagctcc ctatcagtga tagagaaggt 2220

accccctata taagcagagc tcgtttagtg aaccgtcaga tcgcctggag acgccatcca 2280

cgctgttttg acctccatag aagacaccgg gaccgatcca gcctggatcg cggccgcgcc 2340

accatggctg gacacctggc ttcagacttc gccttctcac ccccaccagg tgggggtgat 2400

gggtcagcag ggctggagcc gggctgggtg gatcctcgaa cctggctaag cttccaaggg 2460

cctccaggtg ggcctggaat cggaccaggc tcagaggtat tggggatctc cccatgtccg 2520

cccgcatacg agttctgcgg agggatggca tactgtggac ctcaggttgg actgggccta 2580

gtcccccaag ttggcgtgga gactttgcag cctgagggcc aggcaggagc acgagtggaa 2640

agcaactcag agggaacctc ctctgagccc tgtgccgacc gccccaatgc cgtgaagttg 2700

gagaaggtgg aaccaactcc cgaggagtcc caggacatga aagccctgca gaaggagcta 2760

gaacagtttg ccaagctgct gaagcagaag aggatcacct tggggtacac ccaggccgac 2820

gtggggctca ccctgggcgt tctctttgga aaggtgttca gccagaccac catctgtcgc 2880

ttcgaggcct tgcagctcag ccttaagaac atgtgtaagc tgcggcccct gctggagaag 2940

tgggtggagg aagccgacaa caatgagaac cttcaggaga tatgcaaatc ggagaccctg 3000

gtgcaggccc ggaagagaaa gcgaactagc attgagaacc gtgtgaggtg gagtctggag 3060

accatgtttc tgaagtgccc gaagccctcc ctacagcaga tcactcacat cgccaatcag 3120

cttgggctag agaaggatgt ggttcgagta tggttctgta accggcgcca gaagggcaaa 3180

agatcaagta ttgagtattc ccaacgagaa gagtatgagg ctacagggac acctttccca 3240

gggggggctg tatcctttcc tctgccccca ggtccccact ttggcacccc aggctatgga 3300

agcccccact tcaccacact ctactcagtc ccttttcctg agggcgaggc ctttccctct 3360

gttcccgtca ctgctctggg ctctcccatg cattcaaacg ctagcggcag cggcgccacg 3420

aacttctctc tgttaaagca agcaggagat gttgaagaaa accccgggcc tgcatgcatg 3480

tataacatga tggagacgga gctgaagccg ccgggcccgc agcaagcttc ggggggcggc 3540

ggcggaggag gcaacgccac ggcggcggcg accggcggca accagaagaa cagcccggac 3600

cgcgtcaaga ggcccatgaa cgccttcatg gtatggtccc gggggcagcg gcgtaagatg 3660

gcccaggaga accccaagat gcacaactcg gagatcagca agcgcctggg cgcggagtgg 3720

aaacttttgt ccgagaccga gaagcggccg ttcatcgacg aggccaagcg gctgcgcgct 3780

ctgcacatga aggagcaccc ggattataaa taccggccgc ggcggaaaac caagacgctc 3840

atgaagaagg ataagtacac gcttcccgga ggcttgctgg cccccggcgg gaacagcatg 3900

gcgagcgggg ttggggtggg cgccggcctg ggtgcgggcg tgaaccagcg catggacagc 3960

tacgcgcaca tgaacggctg gagcaacggc agctacagca tgatgcagga gcagctgggc 4020

tacccgcagc acccgggcct caacgctcac ggcgcggcac agatgcaacc gatgcaccgc 4080

tacgacgtca gcgccctgca gtacaactcc atgaccagct cgcagaccta catgaacggc 4140

tcgcccacct acagcatgtc ctactcgcag cagggcaccc ccggtatggc gctgggctcc 4200

atgggctctg tggtcaagtc cgaggccagc tccagccccc ccgtggttac ctcttcctcc 4260

cactccaggg cgccctgcca ggccggggac ctccgggaca tgatcagcat gtacctcccc 4320

ggcgccgagg tgccggagcc cgctgcgccc agtagactgc acatggccca gcactaccag 4380

agcggcccgg tgcccggcac ggccattaac ggcacactgc ccctgtcgca catggcatgc 4440

ggctccggcg agggcagggg aagtcttcta acatgcgggg acgtggagga aaatcccggc 4500

ccactcgaga tgaggcagcc acctggcgag tctgacatgg ctgtcagcga cgctctgctc 4560

ccgtccttct ccacgttcgc gtccggcccg gcgggaaggg agaagacact gcgtccagca 4620

ggtgccccga ctaaccgttg gcgtgaggaa ctctctcaca tgaagcgact tcccccactt 4680

cccggccgcc cctacgacct ggcggcgacg gtggccacag acctggagag tggcggagct 4740

ggtgcagctt gcagcagtaa caacccggcc ctcctagccc ggagggagac cgaggagttc 4800

aacgacctcc tggacctaga ctttatcctt tccaactcgc taacccacca ggaatcggtg 4860

gccgccaccg tgaccacctc ggcgtcagct tcatcctcgt cttccccagc gagcagcggc 4920

cctgccagcg cgccctccac ctgcagcttc agctatccga tccgggccgg gggtgacccg 4980

ggcgtggctg ccagcaacac aggtggaggg ctcctctaca gccgagaatc tgcgccacct 5040

cccacggccc ccttcaacct ggcggacatc aatgacgtga gcccctcggg cggcttcgtg 5100

gctgagctcc tgcggccgga gttggaccca gtatacattc cgccacagca gcctcagccg 5160

ccaggtggcg ggctgatggg caagtttgtg ctgaaggcgt ctctgaccac ccctggcagc 5220

gagtacagca gcccttcggt catcagtgtt agcaaaggaa gcccagacgg cagccacccc 5280

gtggtagtgg cgccctacag cggtggcccg ccgcgcatgt gccccaagat taagcaagag 5340

gcggtcccgt cctgcacggt cagccggtcc ctagaggccc atttgagcgc tggaccccag 5400

ctcagcaacg gccaccggcc caacacacac gacttccccc tggggcggca gctccccacc 5460

aggactaccc ctacactgag tcccgaggaa ctgctgaaca gcagggactg tcaccctggc 5520

ctgcctcttc ccccaggatt ccatccccat ccggggccca actaccctcc tttcctgcca 5580

gaccagatgc agtcacaagt cccctctctc cattatcaag agctcatgcc accgggttcc 5640

tgcctgccag aggagcccaa gccaaagagg ggaagaaggt cgtggccccg gaaaagaaca 5700

gccacccaca cttgtgacta tgcaggctgt ggcaaaacct ataccaagag ttctcatctc 5760

aaggcacacc tgcgaactca cacaggcgag aaaccttacc actgtgactg ggacggctgt 5820

gggtggaaat tcgcccgctc cgatgaactg accaggcact accgcaaaca cacagggcac 5880

cggccctttc agtgccagaa gtgcgacagg gccttttcca ggtcggacca ccttgcctta 5940

cacatgaaga ggcactaaat gactagtcta gcaatcaacc tctggattac aaaatttgtg 6000

aaagattgac tggtattctt aactatgttg ctccttttac gctatgtgga tacgctgctt 6060

taatgccttt gtatcatgct attgcttccc gtatggcttt cattttctcc tccttgtata 6120

aatcctggtt agttcttgcc acggcggaac tcatcgccgc ctgccttgcc cgctgctgga 6180

caggggctcg gctgttgggc actgacaatt ccgtggtgtt tatttgtgaa atttgtgatg 6240

ctattgcttt atttgtaacc attctagctt tatttgtgaa atttgtgatg ctattgcttt 6300

atttgtaacc attataagct gcaataaaca agttaacaac aacaattgca ttcattttat 6360

gtttcaggtt cagggggaga tgtgggaggt tttttaaagc gggggatcca aattcccgat 6420

aaggatcttc ctagagcatg gctacgtaga taagtagcat ggcgggttaa tcattaacta 6480

caaggaaccc ctagtgatgg agttggccac tccctctctg cgcgctcgct cgctcactga 6540

ggccgggcga ccaaaggtcg cccgacgccc gggctttgcc cgggcggcct cagtgagcga 6600

gcgagcgcgc agccttaatt aacctaattc actggccgtc gttttacaac gtcgtgactg 6660

ggaaaaccct ggcgttaccc aacttaatcg ccttgcagca catccccctt tcgccagctg 6720

gcgtaatagc gaagaggccc gcaccgatcg cccttcccaa cagttgcgca gcctgaatgg 6780

cgaatgggac gcgccctgta gcggcgcatt aagcgcggcg ggtgtggtgg ttacgcgcag 6840

cgtgaccgct acacttgcca gcgccctagc gcccgctcct ttcgctttct tcccttcctt 6900

tctcgccacg ttcgccggct ttccccgtca agctctaaat cgggggctcc ctttagggtt 6960

ccgatttagt gctttacggc acctcgaccc caaaaaactt gattagggtg atggttcacg 7020

tagtgggcca tcgccctgat agacggtttt tcgccctttg acgttggagt ccacgttctt 7080

taatagtgga ctcttgttcc aaactggaac aacactcaac cctatctcgg tctattcttt 7140

tgatttataa gggattttgc cgatttcggc ctattggtta aaaaatgagc tgatttaaca 7200

aaaatttaac gcgaatttta acaaaatatt aacgtttata atttcaggtg gcatctttcg 7260

gggaaatgtg cgcggaaccc ctatttgttt atttttctaa atacattcaa atatgtatcc 7320

gctcatgaga caataaccct gataaatgct tcaataatat tgaaaaagga agagtatgag 7380

tattcaacat ttccgtgtcg cccttattcc cttttttgcg gcattttgcc ttcctgtttt 7440

tgctcaccca gaaacgctgg tgaaagtaaa agatgctgaa gatcagttgg gtgcacgagt 7500

gggttacatc gaactggatc tcaatagtgg taagatcctt gagagttttc gccccgaaga 7560

acgttttcca atgatgagca cttttaaagt tctgctatgt ggcgcggtat tatcccgtat 7620

tgacgccggg caagagcaac tcggtcgccg catacactat tctcagaatg acttggttga 7680

gtactcacca gtcacagaaa agcatcttac ggatggcatg acagtaagag aa 7732

<210> 34

<211> 186

<212> DNA

<213> 人工序列

<220>

<223> 合成多核苷酸

<400> 34

gaggccagcg gttccggacg ggctgacgca ttggacgatt ttgatctgga tatgctggga 60

agtgacgccc tcgatgattt tgaccttgac atgcttggtt cggatgccct tgatgacttt 120

gacctcgaca tgctcggcag tgacgccctt gatgatttcg acctggacat gctgattaac 180

tctaga 186

<210> 35

<211> 783

<212> DNA

<213> 人工序列

<220>

<223> 合成多核苷酸

<400> 35

agccagtacc tgcccgacac cgacgaccgg caccggatcg aggaaaagcg gaagcggacc 60

tacgagacat tcaagagcat catgaagaag tcccccttca gcggccccac cgaccctaga 120

cctccaccta gaagaatcgc cgtgcccagc agatccagcg ccagcgtgcc aaaacctgcc 180

ccccagcctt accccttcac cagcagcctg agcaccatca actacgacga gttccctacc 240

atggtgttcc ccagcggcca gatctctcag gcctctgctc tggctccagc ccctcctcag 300

gtgctgcctc aggctcctgc tcctgcacca gctccagcca tggtgtctgc actggctcag 360

gcaccagcac ccgtgcctgt gctggctcct ggacctccac aggctgtggc tccaccagcc 420

cctaaaccta cacaggccgg cgagggcaca ctgtctgaag ctctgctgca gctgcagttc 480

gacgacgagg atctgggagc cctgctggga aacagcaccg atcctgccgt gttcaccgac 540

ctggccagcg tggacaacag cgagttccag cagctgctga accagggcat ccctgtggcc 600

cctcacacca ccgagcccat gctgatggaa taccccgagg ccatcacccg gctcgtgaca 660

ggcgctcaga ggcctcctga tccagctcct gcccctctgg gagcaccagg cctgcctaat 720

ggactgctgt ctggcgacga ggacttcagc tctatcgccg atatggattt ctcagccttg 780

ctg 783

<210> 36

<211> 570

<212> DNA

<213> 人工序列

<220>

<223> 合成多核苷酸

<400> 36

cgggattcca gggaagggat gtttttgccg aagcctgagg ccggctccgc tattagtgac 60

gtgtttgagg gccgcgaggt gtgccagcca aaacgaatcc ggccatttca tcctccagga 120

agtccatggg ccaaccgccc actccccgcc agcctcgcac caacaccaac cggtccagta 180

catgagccag tcgggtcact gaccccggca ccagtccctc agccactgga tccagcgccc 240

gcagtgactc ccgaggccag tcacctgttg gaggatcccg atgaagagac gagccaggct 300

gtcaaagccc ttcgggagat ggccgatact gtgattcccc agaaggaaga ggctgcaatc 360

tgtggccaaa tggacctttc ccatccgccc ccaaggggcc atctggatga gctgacaacc 420

acacttgagt ccatgaccga ggatctgaac ctggactcac ccctgacccc ggaattgaac 480

gagattctgg ataccttcct gaacgacgag tgcctcttgc atgccatgca tatcagcaca 540

ggactgtcca tcttcgacac atctctgttt 570

<210> 37

<211> 1416

<212> DNA

<213> 人工序列

<220>

<223> 合成多核苷酸

<400> 37

gcttcaaact ttactcagtt cgtgctcgtg gacaatggtg ggacagggga tgtgacagtg 60

gctccttcta atttcgctaa tggggtggca gagtggatca gctccaactc acggagccag 120

gcctacaagg tgacatgcag cgtcaggcag tctagtgccc agaagagaaa gtataccatc 180

aaggtggagg tccccaaagt ggctacccag acagtgggcg gagtcgaact gcctgtcgcc 240

gcttggaggt cctacctgaa catggagctc actatcccaa ttttcgctac caattctgac 300

tgtgaactca tcgtgaaggc aatgcagggg ctcctcaaag acggtaatcc tatcccttcc 360

gccatcgccg ctaactcagg tatctacagc gctggaggag gtggaagcgg aggaggagga 420

agcggaggag gaggtagcgg acctaagaaa aagaggaagg tggcggccgc tggatcccct 480

tcagggcaga tcagcaacca ggccctggct ctggccccta gctccgctcc agtgctggcc 540

cagactatgg tgccctctag tgctatggtg cctctggccc agccacctgc tccagcccct 600

gtgctgaccc caggaccacc ccagtcactg agcgctccag tgcccaagtc tacacaggcc 660

ggcgagggga ctctgagtga agctctgctg cacctgcagt tcgacgctga tgaggacctg 720

ggagctctgc tggggaacag caccgatccc ggagtgttca cagatctggc ctccgtggac 780

aactctgagt ttcagcagct gctgaatcag ggcgtgtcca tgtctcatag tacagccgaa 840

ccaatgctga tggagtaccc cgaagccatt acccggctgg tgaccggcag ccagcggccc 900

cccgaccccg ctccaactcc cctgggaacc agcggcctgc ctaatgggct gtccggagat 960

gaagacttct caagcatcgc tgatatggac tttagtgccc tgctgtcaca gatttcctct 1020

agtgggcagg gaggaggtgg aagcggcttc agcgtggaca ccagtgccct gctggacctg 1080

ttcagcccct cggtgaccgt gcccgacatg agcctgcctg accttgacag cagcctggcc 1140

agtatccaag agctcctgtc tccccaggag ccccccaggc ctcccgaggc agagaacagc 1200

agcccggatt cagggaagca gctggtgcac tacacagcgc agccgctgtt cctgctggac 1260

cccggctccg tggacaccgg gagcaacgac ctgccggtgc tgtttgagct gggagagggc 1320

tcctacttct ccgaagggga cggcttcgcc gaggacccca ccatctccct gctgacaggc 1380

tcggagcctc ccaaagccaa ggaccccact gtctcc 1416

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号