首页> 中国专利> 治疗DANON病的基因治疗载体

治疗DANON病的基因治疗载体

摘要

本发明一般涉及与溶酶体相关膜蛋白2(LAMP‑2,也称为CD107b)突变有关的疾病的基因治疗。一方面,本公开提供了一种基因治疗载体,其包含表达盒,该表达盒包含编码LAMP‑2异构体或其功能性变体的转基因,其中该转基因被密码子优化以在人宿主细胞中表达。另一方面,本公开提供了预防、减轻、改善、减少、抑制、消除和/或逆转在有此需要的受试者体内的Danon病或另一种自噬障碍的一种或多种症状的方法,该方法包含向受试者施用本公开的基因治疗载体。

著录项

  • 公开/公告号CN112512596A

    专利类型发明专利

  • 公开/公告日2021-03-16

    原文格式PDF

  • 申请/专利权人 火箭制药有限公司;

    申请/专利号CN201980049274.0

  • 发明设计人 A·喀拉瓦拉;S·摩尔;D·里克斯;

    申请日2019-07-11

  • 分类号A61K48/00(20060101);C07K14/47(20060101);C12N15/09(20060101);C12N15/63(20060101);C12N15/79(20060101);

  • 代理机构11038 中国贸促会专利商标事务所有限公司;

  • 代理人李程达

  • 地址 美国纽约

  • 入库时间 2023-06-19 10:14:56

说明书

本申请要求于2018年7月12日提交的美国临时专利申请第62/697,302号的优先权,其整体通过引用并入本文。

本申请经由EFS-Web电子提交,包括以.txt格式电子提交的序列表。.txt文件含有一个序列表,名称为“ROPA_011_01WO_SeqList_ST25.txt”,创建于2019年7月11日,大小为约62千字节。该.txt文件中含有的序列表是说明书的一部分,其整体通过引用并入本文。

技术领域

本发明一般涉及与溶酶体相关膜蛋白2(LAMP-2,也称为CD107b)突变有关的疾病的基因治疗。

背景技术

溶酶体相关膜蛋白2(LAMP-2,也称为CD107b)是编码溶酶体相关膜蛋白的基因。基因的选择性剪接产生三种异构体:LAMP-2A、LAMP-2B和LAMP-2C。LAMP-2的功能丧失突变与人类疾病有关,包括Danon病,一种与自噬受损有关的家族性心肌病。

如Hashem等人的《干细胞(Stem Cells)》,2015年7月;33(7):2343-50中所述,国际专利申请公开第WO2017127565A1号公开了LAMP-2在来源于LAMP-2突变患者的人诱导多能干细胞(hiPSCs)中的过表达,引起氧化应激水平降低和凋亡细胞死亡,从而证实了LAMP-2B在疾病病理生理学中的重要性。

在本领域中仍然需要用于LAMP-2的基因治疗载体。本公开提供了此类基因治疗载体、其使用方法、药物组合物等。

发明内容

本公开提供了包含编码LAMP-2多肽的多核苷酸序列的改进的基因治疗载体、其使用方法、药物组合物等。

一方面,本公开提供了一种基因治疗载体,其包含表达盒,该表达盒包含编码溶酶体相关膜蛋白2(LAMP-2)异构体或其功能性变体的转基因,其中该转基因被密码子优化以在人宿主细胞中表达。

在一个实施例中,表达盒含有比SEQ ID:2少的CpG位点。

在一个实施例中,表达盒含有比SEQ ID:2少的隐蔽剪接位点。

在一个实施例中,表达盒编码比SEQ ID:2少的选择性开放阅读框。

在一个实施例中,转基因与选自SEQ ID NO:3至SEQ ID NO:5的序列具有至少95%的同一性。

在一个实施例中,转基因与选自SEQ ID NO:3至SEQ ID NO:5的序列具有至少99%的同一性。

在一个实施例中,转基因包含选自SEQ ID NO:3至SEQ ID NO:5的序列。

在一个实施例中,转基因与选自SEQ ID NO:3的序列具有至少95%的同一性。

在一个实施例中,转基因与选自SEQ ID NO:3的序列具有至少99%的同一性。

在一个实施例中,转基因包含选自SEQ ID NO:3的序列。

在一个实施例中,表达盒包含与转基因可操作地连接的共有最优Kozak序列,其中任选地,共有最优Kozak序列包含SEQ ID NO:6。

在一个实施例中,表达盒包含与转基因可操作地连接的全长polyA序列,其中任选地,全长polyA序列包含SEQ ID NO:7。

在一个实施例中,表达盒不包含处于能够产生选择性mRNA的转基因5'端的起始位点。

在一个实施例中,表达盒在5'至3'方向上包含可操作地连接的第一反向末端重复序列、增强子/启动子区、共有最优Kozak序列、转基因、包括全长polyA序列的3'非转译区和第二反向末端重复序列。

在一个实施例中,增强子/启动子区在5'至3'方向上包含CMV IE增强子和鸡β-肌动蛋白启动子。

在一个实施例中,表达盒与选自SEQ ID NO:8至SEQ ID NO:10的序列具有至少95%的同一性。

在一个实施例中,表达盒与选自SEQ ID NO:8至SEQ ID NO:10的序列具有完全同一性。

在第二方面,本公开提供了一种预防、减轻、改善、减少、抑制、消除和/或逆转在有此需要的受试者体内的Danon病或另一种自噬障碍的一种或多种症状的方法,该方法包含向受试者施用本公开的任何基因治疗载体。

在一个实施例中,经由选自由静脉内、动脉内、心内、冠状动脉内、心肌内、肾内、尿道内、硬膜外和肌内组成的群组的途径施用载体。

在一个实施例中,自噬障碍选自由以下组成的群组:终末期心力衰竭、心肌梗塞、药物毒性、糖尿病、终末期肾衰竭和衰老。

在一个实施例中,受试者是人。

在一个实施例中,受试者正表现出Danon病或另一种自噬障碍的症状。

在一个实施例中,已鉴定受试者具有降低的或不可检测的LAMP-2表达。

在一个实施例中,已鉴定受试者具有突变的LAMP-2基因。

在第三方面,本公开提供了一种用于预防、减轻、改善、减少、抑制、消除和/或逆转Danon病或另一种自噬障碍的一种或多种症状的药物组合物,该药物组合物包含本公开的任何基因治疗载体。

通过下面的详细描述和权利要求,本发明的其他特征和优点将显而易见并被其涵盖。

附图说明

图1A提供了本公开的病毒载体的示例性实施例的图。

图1B提供了腺相关病毒(AAV)基因治疗载体的表达盒的示例性实施例的图。

图2示出了用于测试和比较野生型LAMP-2B构建体与密码子优化的LAMP-2B构建体的基于质粒的绿色荧光蛋白(GFP)报告系统的表达盒。

图3是示出LAMP-2B构建体的转染表达效率的图表,该LAMP-2B构建体使用基于质粒的GFP报告系统的转染进行测试并以每孔GFP+细胞进行测量。将野生型LAMP-2B构建体(WT)与三个密码子优化(“CO”)的构建体CO 1、CO 2和CO 3以及无载体对照(标记为“仅ViaFect”)进行比较。

图4是示出在用基于质粒的GFP报告系统转染的细胞中用于测试LAMP-2B构建体的基因表达水平的图表,其以吸光度单位(A.U.)中GFP+细胞的平均GFP强度测量。将野生型LAMP-2B构建体(WT)转染的细胞的GFP表达与三个密码子优化(“CO”)的构建体CO 1、CO 2和CO 3以及无载体对照(标记为“仅ViaFect”)的GFP表达进行比较。

图5示出了用基于质粒的GFP报告系统转染后两天诱导性多能干细胞(iPSC)分化心肌细胞的免疫荧光图像。未用DNA或用表达野生型LAMP-2B、CO 1变体、CO 2变体或CO 3变体的LAMP-2B构建体转染细胞。

图6示出了用基于质粒的GFP报告系统转染后七天iPSC分化心肌细胞的免疫荧光图像。未用DNA或用表达野生型LAMP-2B、CO 1变体、CO 2变体或CO 3变体的LAMP-2B构建体转染细胞。

图7A示出了用包含野生型LAMP-2B v1.0转基因(AAV9 1.0)、优化变体LAMP-2Bv1.2转基因(AAV9 1.2)或GFP转基因(AAV9 GFP)的AAV9病毒载体转导的CHO-Lec2细胞中人LAMP-2B蛋白的免疫印迹。还包括分子量标记(MW)和对照LAMP-2B重组蛋白样品(LAMP2B(阳性对照))。

图7B示出了通过ELISA对用AAV9野生型LAMP-2B(v1.0)、AAV9优化的LAMP-2B(v1.2)或AAV9-GFP(GFP)载体转导的CHO-Lec2细胞中LAMP-2B蛋白的定量。

图8A示出了用指定量的AAV9-Luc(Luc)、AAV9野生型LAMP-2B(LAMP2B v1.0)或AAV9优化的LAMP-2B(LAMP2B v1.2)载体转导的Danon患者iPSC分化心肌细胞的免疫荧光图像。

图8B示出了用AAV9-Luc、AAV9野生型LAMP-2B(v1.0)或AAV9优化的LAMP-2B(v1.2)载体转导的Danon患者iPSC分化心肌细胞中人LAMP-2B蛋白的免疫荧光定量。

图8C示出了用AAV9-Luc、AAV9野生型LAMP-2B(v1.0)或AAV9优化的LAMP-2B(v1.2)载体转导的Danon患者iPSC分化心肌细胞中人LAMP-2B蛋白的免疫印迹。

图9A示出了从用AAV9野生型LAMP-2B(v1.0)、AAV9优化的LAMP-2B(v1.2)或AAV9溶媒对照治疗的LAMP-2缺陷型小鼠分离的心脏组织中病毒载体DNA的PCR量化。载体拷贝数量化为心脏组织中VCN/二倍体核。未注射载体的对照野生型小鼠作为对照(WT)包括在内。

图9B示出了从用AAV9野生型LAMP-2B(v1.0)、AAV9优化的LAMP-2B(v1.2)或AAV9溶媒对照(溶媒)治疗的LAMP-2缺陷小鼠分离的心脏组织中,使用WPRE元件特异性探针通过RT-PCR测量的转基因mRNA的定量RT-PCR分析。通过使用标准曲线将拷贝数转换为载体基因组,将mRNA的表达量化为每μg总细胞RNA中的载体基因组(vg)。

图9C显示了与未治疗的野生型小鼠(未治疗)相比,从用AA9野生型LAMP-2B(v1.0)、AAV9优化的LAMP-2B(v1.2)或AAV9溶媒对照(溶媒)治疗的LAMP-2缺陷小鼠分离的心脏组织中LAMP-2B蛋白的免疫印迹。

图9D示出了从用AAV9野生型LAMP-2B(v1.0)、AAV9优化的LAMP-2B(v1.2)或AAV9溶媒对照治疗的LAMP-2缺陷小鼠中分离出的心脏组织中人LAMP-2B蛋白的免疫荧光图像。

图10A示出了从用AAV9优化的人LAMP-2B(治疗)载体或无载体溶媒对照(未治疗)治疗的灵长类动物分离的心脏、肌肉、肝脏和脑组织中病毒载体DNA的PCR量化。个体表示为黑色或白色方块。

图10B示出了从用AAV9优化的人LAMP-2B载体(治疗)治疗的灵长类动物或无载体溶媒对照(未治疗)治疗的灵长类动物分离出的心腔中的病毒载体DNA的PCR量化。个体表示为B059(男性,M)、A991(女性,F)和A602(男性,M)。

图10C示出了从用AAV9优化的人LAMP-2B载体(治疗)的灵长类动物或无载体溶媒对照(未治疗)治疗的灵长类动物分离出的心脏、肌肉、肝脏和脑组织中的转基因mRNA的定量RT-PCR分析,其使用对WPRE元件具有特异性的探针通过RT-PCR测量。

图10D示出了从注射有AAV9优化的人LAMP-2B载体(治疗)的灵长类动物或无载体溶媒对照(未治疗)的灵长类动物分离出的心腔中的转基因mRNA的定量RT-PCR分析。

图10E示出了在从注射有AAV9优化的人LAMP-2B载体(治疗)的灵长类动物或无载体溶媒对照(未治疗)的灵长类动物中分离出的心脏、肌肉和肝脏组织中,原位表达转基因mRNA的细胞的百分比。个体表示为B059(男性,M)、A991(女性,F)和A602(男性,M)。

图10F示出了从注射有AAV9优化的人LAMP-2B载体的灵长类动物或无载体溶媒对照(未治疗)的灵长类动物分离的心脏组织中,原位转基因mRNA染色。个体表示为B059(男性,M)、A991(女性,F)和A602(男性,M)。

图10G示出了相对于无载体(未治疗),通过western blot评估的从用AAV9优化的人LAMP-2B载体治疗的灵长类动物分离的心脏、肌肉和肝脏组织中的LAMP-2B蛋白的变化倍数。

图10H示出了相对于无载体(未治疗),通过western blot评估的从用AAV9优化的人LAMP-2B载体治疗的灵长类动物分离的心腔中的LAMP-2B蛋白的变化倍数。

图10I示出了相对于无载体(未治疗),通过ELISA评估从用AAV9优化的人LAMP-2B载体治疗的灵长类动物分离的心脏、肌肉和肝脏组织中的LAMP-2B蛋白的量化。

图10J示出了相对于无载体(未治疗),通过ELISA对从用AAV9优化的人LAMP-2B载体治疗的灵长类动物分离的心腔中的LAMP-2B蛋白的量化。

具体实施方式

本公开提供了改进的编码LAMP-2异构体(例如,LAMP-2B)的多核苷酸序列、表达盒和载体,以及相关的药物组合物,及其治疗与LAMP-2缺陷或突变相关的疾病和障碍的用途。本发明人已发现,对LAMP-2B基因序列的修饰引起转基因表达的增加。另外,在编码LAMP-2B的基因治疗载体的表达盒中特定序列元件的存在引起转基因表达的改进。因此,与先前的基因治疗载体相比,本文公开的LAMP-2多核苷酸序列、表达盒和载体为基因治疗提供了优势,包括在治疗相关组织中实现更高LAMP-2表达水平的能力。

人LAMP-2B的野生型多肽序列(SEQ ID NO:1)和编码人LAMP-2B的野生型多核苷酸序列(SEQ ID NO:2)分别是:

(SEQ ID NO:1);和

(SEQ ID NO:2)。

本文公开了编码溶酶体相关膜蛋白2(LAMP-2)的异构体或其功能性变体的修饰的多核苷酸序列。在某些实施例中,与编码LAMP-2异构体的野生型多核苷酸相比,修饰的多核苷酸序列包含以下修饰的一种或多种:密码子优化、CpG耗竭、隐蔽剪接位点的去除或选择性开放阅读框(ORF)的数目减少。在一些实施例中,修饰的多核苷酸编码LAMP-2A、LAMP-2B、LAMP-2C或任何这些异构体的功能性变体。在实施例中,本公开提供了编码LAMP-2B或其功能性变体的多核苷酸序列或转基因,与SEQ ID NO:2相比,其包含一个或多个核苷酸取代基。在实施例中,转基因与选自SEQ ID NO:3至SEQ ID NO:5的序列具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%的同一性或完全同一性。本公开提供了至少三个示例性变体转基因序列,其编码(SEQ ID NO:3至SEQ IDNO:5)的LAMP-2B:

(SEQ ID NO:3);

(SEQ ID NO:4);和

(SEQ ID NO:5)。

在一个实施例中,转基因与选自SEQ ID NO:3至SEQ ID NO:5的序列具有至少95%的同一性。在一个实施例中,转基因与选自SEQ ID NO:3至SEQ ID NO:5的序列具有至少99%的同一性。在一个实施例中,转基因包含选自SEQ ID NO:3至SEQ ID NO:5的序列。在一个实施例中,转基因与SEQ ID NO:3具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%的同一性或完全同一性。在一个实施例中,转基因与SEQ ID NO:4具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%的同一性或完全同一性。在一个实施例中,转基因与SEQ IDNO:5具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%的同一性或完全同一性。

在一些实施例中,转基因与SEQ ID NO:3至SEQ ID NO:5中的任何一个的子序列相似或相同。在一些实施例中,转基因包含SEQ ID NO:3至SEQ ID NO:5中的任何一个的子序列。在各实施例中,子序列可以包含全序列中的任意组连续核苷酸(nt),其长度为至少约50nt、至少约100nt、至少约150nt、至少约250nt、至少约200nt、至少约350nt、至少约450nt、至少约400nt、至少约450nt、至少约550nt、至少约600nt、至少约650nt、至少约600nt、至少约650nt、至少约700nt、至少约750nt、至少约800nt、至少约850nt、至少约900nt、至少约950nt或至少约1000nt。

在一些实施例中,转基因与包含SEQ ID NO:3至SEQ ID NO:5中的任何一个的核苷酸1-500、核苷酸250-750、核苷酸500-1000或核苷酸750-1240的子序列具有至少95%的同一性。在一个实施例中,转基因与SEQ ID NO:3至SEQ ID NO:5中的任何一个的核苷酸1-500、核苷酸250-750、核苷酸500-1000或核苷酸750-1240的子序列具有至少99%的同一性。在一个实施例中,转基因包含序列,该序列包含SEQ ID NO:3至SEQ ID NO:5中的任何一个的核苷酸1-500、核苷酸250-750、核苷酸500-1000或核苷酸750-1240。在实施例中,转基因与包含SEQ ID NO:3至SEQ ID NO:5中的任何一个的核苷酸1-500、核苷酸250-750、核苷酸500-1000或核苷酸750-1240的子序列具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%的同一性或完全同一性。在实施例中,转基因与包含SEQ ID NO:3的核苷酸1-500、核苷酸250-750、核苷酸500-1000或核苷酸750-1240的子序列具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%的同一性或完全同一性。在实施例中,转基因与包含SEQ ID NO:3的核苷酸1-500、核苷酸250-750、核苷酸500-1000或核苷酸750-1240的子序列具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%的同一性或完全同一性。

在某些实施例中,转基因编码LAMP-2的各种异构体中的任何一种,包括LAMP-2A、LAMP-2B或LAMP-2C中的任何一种,或这些异构体中任何一种的功能片段或变体。因此,在具体实施例中,表达盒是编码LAMP-2A、LAMP-2B或LAMP-2C中的任何一种或其功能片段或变体的优化的多核苷酸序列,与相应的野生型多核苷酸序列相比,其包含一种或多种修饰,其包括选自以下的一种或多种修饰:编码LAMP-2A、LAMP-2B或LAMP-2C的转基因序列的密码子优化;表达盒或转基因序列比其相应的野生型序列含有更少的CpG位点;表达盒或转基因序列比其相应的野生型序列含有更少的CpG位点;表达盒或转基因序列比其相应的野生型序列含有更少的隐蔽剪接位点;和/或表达盒或转基因序列含有比其相应的野生型序列更少的开放阅读框。在特定的实施例中,优化的序列被优化以增加在人细胞中的表达。编码LAMP-2A和LAMP-2C异构体的野生型人多核苷酸序列分别示于SEQ ID NO:29和SEQ ID NO:30。人LAMP-2A和LAMP-2C蛋白的野生型序列分别示于SEQ ID NO:34和SEQ ID NO:35。野生型LAMP-2异构体的序列和编码序列也可公开获得。虽然本说明书描述了关于LAMP-2B的具体实施例,但是应当理解,LAMP-2A或LAMP-2C可选择地用于每个实施例中。

野生型LAMP-2A(SEQ ID NO:29)和野生型LAMP-2C(SEQ ID NO:30)的编码序列与野生型LAMP-2B(SEQ ID NO:2)的编码序列至少在核苷酸1-1080上100%相同。因此,本领域技术人员将容易认识到,本文公开的转基因、表达盒和载体可以通过用LAMP-2B的核苷酸1081-1233(例如,SEQ ID NO:3至SEQ ID NO:5中任何一个的优化LAMP-2B)代替LAMP-2A(SEQ ID NO:29)和野生型LAMP-2C(SEQ ID NO:30)的3'末端(核苷酸1081-末端)而适于LAMP-2的这些异构体的表达。例如,本发明的实施例利用优化的LAMP-2B基因序列,SEQ IDNO:3至SEQ ID NO:5的核苷酸1-1080,分别是SEQ ID NO:31至SEQ ID NO:33。

在一个实施例中,转基因与选自SEQ ID NO:31至SEQ ID NO:33的序列具有至少95%的同一性。在一个实施例中,转基因与选自SEQ ID NO:31至SEQ ID NO:33的序列具有至少99%的同一性。在一个实施例中,转基因包含选自SEQ ID NO:31至SEQ ID NO:33的序列。在一个实施例中,转基因与SEQ ID NO:31具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%的同一性或完全同一性。在一个实施例中,转基因与SEQ ID NO:32具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%的同一性或完全同一性。在一个实施例中,转基因与SEQID NO:33具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%的同一性或完全同一性。在一些情况下,转基因具有与参考序列的多核苷酸序列不同的多核苷酸序列,例如“天然”或“野生型”LAMP-2B序列。在一些实施例中,转基因与参考序列具有至多70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%或95%的同一性。在一些实施例中,参考序列是SEQ ID NO:2。例如,SEQ ID NO:3与SEQ ID NO:2具有78.5%的同一性。

在一些情况下,转基因具有与参考序列的多核苷酸序列不同的多核苷酸序列,例如,“天然”或“野生型”LAMP-2A序列。在一些实施例中,转基因与参考序列具有至多70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%或95%的同一性。在一些实施例中,参考序列是SEQ ID NO:29所示的野生型人LAMP-2A序列。

在一些情况下,转基因具有与参考序列的多核苷酸序列不同的多核苷酸序列,例如,“天然”或“野生型”LAMP-2C序列。在一些实施例中,转基因与参考序列具有至多70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%或95%的同一性。在一些实施例中,参考序列是SEQ ID NO:30所示的野生型人LAMP-2A序列。

在一个实施例中,转基因被密码子优化以在人宿主细胞中表达。在一个实施例中,转基因编码序列被修饰或“密码子优化”以通过用更频繁表达的密码子替换不频繁表达的密码子来增强表达。编码序列是mRNA序列中编码待转译氨基酸的部分。在转译过程中,61个三核苷酸密码子中的每个转译为20个氨基酸之一,从而导致遗传密码中的简并性或冗余。然而,不同的细胞类型和不同的动物物种会利用以不同的频率编码相同的氨基酸的tRNA(每个带有反密码子)。当基因序列含有很少由相应的tRNA表示的密码子时,核糖体转译机制可能会减慢,阻碍有效的转译。对于特定物种,可以经由“密码子优化”提高表达,其中将编码序列更改为编码相同的蛋白序列,但使用由高度表达的人蛋白所高度代表的和/或使用的密码子(Cid-Arregui等人,2003年;《病毒学杂志(J.Virol.)》77:4928)。

在一些实施例中,修饰转基因的编码序列,用在灵长类动物中频繁表达的密码子代替在哺乳动物或灵长类动物中不频繁表达的密码子。例如,在一些实施例中,转基因编码与参考多肽(例如,野生型LAMP-2B;SEQ ID NO:3)具有至少85%序列同一性的多肽——例如,与参考多肽具有至少90%序列同一性、至少95%序列同一性、至少98%同一性或至少99%同一性——其中编码序列的至少一个密码子在人类中具有比上述或本文公开的序列中的相应密码子更高的tRNA频率。

在一个实施例中,转基因包含比SEQ ID:2少的选择性开放阅读框。在一个实施例中,修饰转基因,通过终止或去除不编码所需转基因的开放阅读框(ORF)来增强表达。开放阅读框(ORF)是跟随起始密码子且不含有终止密码子的核酸序列。ORF可以是正向或反向,并且与目的基因相比,可以是“框内”或“框外”。此类开放阅读框有可能与目的基因一起在表达盒中表达,并且可能导致不期望的不良反用。在一些实施例中,转基因已被修饰以通过进一步更改密码子使用来去除开放阅读框。这可以通过以下方式完成:在与所需ORF的反方向上或在所需ORF的框架外消除一个或多个起始密码子(ATG)和/或引入一个或多个终止密码子(TAG、TAA或TGA),同时保留编码的氨基酸序列,并且任选地在目的基因中保持高度利用的密码子(即避免频率低于20%的密码子)。

在一些实施例中,表达盒包含处于转基因起始密码子5'端的至多一个、至多两个、至多三个、至多四个或至多五个起始密码子。在一些实施例中,表达盒不包含处于转基因起始密码子5'端的起始密码子。在一些实施例中,在去除一个或多个隐蔽起始位点之后,保留了5'UTR、启动子、增强、启动子/增强子元件或处于转基因起始密码子5'端的其他序列中的一个或多个ATG密码子。在一些实施例中,表达盒不包含转基因上游的隐蔽起始位点以免产生错误的mRNA。

在本公开的变种中,可以通过密码子优化或去除非转基因ORF或使用两种技术来优化转基因编码序列。在一些情况下,为了去除在密码子优化过程中引入的ORF,在密码子优化后去除或最少化非转基因ORF。

在一个实施例中,转基因含有比SEQ ID:2少的CpG位点。如果不受理论的束缚,据信多核苷酸序列中CpG位点的存在与宿主针对包含多核苷酸序列的病毒载体的不良免疫反应有关。在一些实施例中,设计转基因以减少CpG位点的数量。在美国专利申请公开第US20020065236A1号中提供了示例性方法。

在一个实施例中,转基因含有比SEQ ID:2少的隐蔽剪接位点。为了优化,可以使用

本文还公开了表达盒和编码LAMP-2B的基因治疗载体。在某些实施例中,表达盒和基因治疗载体包含本文公开的密码子优化的或变体LAMP-2B多核苷酸序列或转基因序列。

在特定的实施例中,编码LAMP-2B的表达盒或基因治疗载体包含:共有最优Kozak序列、全长聚腺苷酸化(polyA)序列(或截短的polyA取代的全长polyA)、以及最少或没有上游(即5')或隐蔽起始密码子(即ATG位点)。在一些实施例中,表达盒不包含处于能够产生选择性mRNA的转基因5'端的起始位点。在某些实施例中,表达盒和基因治疗载体包含编码LMAP-2B的序列,例如本文公开的密码子优化的或变体LAMP-2B多核苷酸序列或转基因序列。

在一些情况下,表达盒含有两个或更多个第一反向末端重复序列、增强子/启动子区、共有最优Kozak序列、转基因(例如,编码本文公开的LAMP-2B的转基因)、包括全长polyA序列的3'非转译区和第二反向末端重复序列。在一些实施例中,反向末端重复序列(ITR)中的一个或两个是AAV1、AAV2、AAV3、AAV4、AAV5、AAV6、AAV7或AAV9 ITR,或本领域已知的任何一种ITR。在一些实施例中,表达盒恰好包含两个ITR。在一些实施例中,两个ITR都是AAV2、AAV5或AAV9 ITR。在一些实施例中,两个ITR都是AAV2 ITR。

在一个实施例中,表达盒包含与转基因可操作地连接的Kozak序列。在一个实施例中,Kozak序列是共有最优Kozak序列,其包含或由SEQ ID NO:6:

GCCGCCACCATGG(SEQ ID NO:6)组成。

在各实施例中,表达盒包含与转基因可操作地连接的选择性Kozak序列。在一个实施例中,Kozak序列是选择性Kozak序列,其包含或由SEQ ID NO:14至SEQ ID NO:18

(gcc)gccRccAUGG(SEQ ID NO:14);

AGNNAUGN(SEQ ID NO:15);

ANNAUGG(SEQ ID NO:16);

ACCAUGG(SEQ ID NO:17);

GACACCAUGG(SEQ ID NO:18)

中的任何一个组成。

在一些实施例中,表达盒不包含Kozak序列。

在SEQ ID NO:14中,小写字母表示在碱基仍然可以变化的位置上最常见的碱基;大写字母表示高度保守的碱基;表示腺嘌呤或鸟嘌呤。在SEQ ID NO:14,括号(gcc)中的序列是可选的。在SEQ ID NO:15至SEQ ID NO:17,“N”表示任何碱基。

可以使用多种序列代替该共有最优Kozak序列作为转译起始位点,并且其他序列的鉴定和测试在本领域技术人员的技术范围内。参见Kozak M.《脊椎动物mRNA序列的分析:转译控制的暗示(An analysis of vertebrate mRNA sequences:intimations oftranslational control)》。《细胞生物学杂志(J.Cell Biol.)》115(4):887–903(1991)。

在一个实施例中,表达盒包含与转基因可操作地连接的全长polyA序列。在一个实施例中,全长polyA序列包含SEQ ID NO:7:

(SEQ ID NO:7)。

各种选择性polyA序列可以用于本公开的表达盒,包括但不限于牛生长激素聚腺苷酸化信号(bGHpA)(SEQ ID NO:19),SV40早期/晚期聚腺苷酸化信号(SEQ ID NO:20),以及人类生长激素(HGH)聚腺苷酸化信号(SEQ ID NO:21):

(SEQ ID NO:19);

(SEQ ID NO:20);

(SEQ ID NO:21)。

在一些实施例中,表达盒包含polyA序列的活性片段。在具体实施例中,polyA序列的活性片段包含或由例如,本文公开的任何polyA序列的少于20个碱基对(bp)、少于50bp、少于100bp或少于150bp组成。

在一些情况下,通过确保表达盒不含有竞争性ORF来增加转基因的表达。在一个实施例中,表达盒在转基因起始密码子5'端的20、30、40、50、60、70、80、90、100、200、300、400或500个碱基对内不包含起始密码子。在一些实施例中,表达盒不包含处于转基因起始密码子5'端的起始密码子。在一些实施例中,表达盒不包含处于能够产生选择性mRNA的转基因5'端的起始位点。

在一个实施例中,表达盒在5'至3'方向上包含可操作地连接的第一反向末端重复序列、增强子/启动子区、内含子、共有最优Kozak序列、转基因、包括全长polyA序列的3'非转译区和第二反向末端重复序列,其中表达盒不包含处于能够产生选择性mRNAs的转基因5'端的起始位点。

在一些实施例中,增强子/启动子区在5'至3'方向上包含CMV IE增强子和鸡β-肌动蛋白启动子。在一个实施例中,增强子/启动子区包含CAG启动子(SEQ ID NO:22)。如本文所用,“CAG启动子”指包含CMV早期增强子元件、鸡β-肌动蛋白启动子、鸡β-肌动蛋白基因的第一外显子和第一内含子以及兔β-珠蛋白基因的剪接受体的多核苷酸序列。

(SEQ ID NO:22)。

在一些实施例中,增强子/启动子区包含遍在启动子。在一些实施例中,增强子/启动子区包含CMV启动子(SEQ ID NO:23)、SV40启动子(SEQ ID NO:24)、PGK启动子(SEQ IDNO:25)和/或人β-肌动蛋白启动子(SEQ ID NO:26)。在一些实施例中,增强子/启动子区包含与SEQ ID NO:23至SEQ ID NO:26的任何一个具有至少75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的多核苷酸:

(SEQ ID NO:23);

(SEQ ID NO:24);

(SEQ ID NO:25);

(SEQ ID NO:26)。

进一步的示例性启动子包括但不限于人延伸因子1α启动子(EFS)、SV40早期启动子、小鼠乳腺肿瘤病毒长末端重复序列(LTR)启动子;腺病毒主要晚期启动子(Ad MLP);单纯疱疹病毒(HSV)启动子、与目标基因异源的内源性细胞启动子、巨细胞病毒(CMV)启动子(诸如CMV立即早期启动子区(CMVIE))、劳斯肉瘤病毒(RSV)启动子、合成启动子、杂合启动子等。

在一些实施例中,3'UTR包含与SEQ ID NO:27具有至少75%、80%、85%、90%、95%、96%、97%、98%、99%或100%的序列同一性的多核苷酸(WPRE元件):

(SEQ ID NO:27)。

在一些实施例中,表达盒与选自SEQ ID NO:8至SEQ ID NO:10的序列具有至少95%的同一性。在一个实施例中,表达盒与选自SEQ ID NO:8至SEQ ID NO:10的序列具有完全同一性,或与选自SEQ ID NO:8至SEQ ID NO:10的序列具有至少80%、至少85%、至少90%、至少95%、至少98%或至少99%的同一性:

(SEQ ID NO:8);

(SEQ ID NO:9);和

(SEQ ID NO:10)。

在某些实施例中,与选自SEQ ID NO:8至SEQ ID NO:10的序列相比,表达盒包含一种或多种修饰,包括但不限于本文公开的任何修饰。在具体实施例中,一种或多种修饰包含以下一种或多种:去除一个或多个(例如,全部)上游ATG序列、用优化的共有Kozak序列或另一种Kozak序列取代Kozak序列,包括但不限于本文公开的那些的任何一个,和/或用全长聚腺苷酸化序列或另一个聚腺苷酸化序列代替聚腺苷酸化序列,包括但不限于本文公开的那些的任何一个。这些示例性表达盒内的遗传元件的示例性构型描述于图1B。

在一个实施例中,载体是腺相关病毒(AAV)载体。在一个实施例中,表达盒包含选自SEQ ID NO:11至SEQ ID NO:12的反向末端重复(ITR)序列:

(SEQ ID NO:11);

(SEQ ID NO:12)。

在相关的实施例中,本公开提供了包含本文公开的表达盒的基因治疗载体。通常,本文所述的基因治疗载体包含表达盒,该表达盒包含编码溶酶体相关膜蛋白2(LAMP-2)的一种或多种异构体的多核苷酸,并且使LAMP-2的表达部分或全部纠正有此需要的受试者体内的LAMP-2蛋白的表达水平和/或自噬流不足(例如,患有Danon病或另一种障碍的受试者,其特征为至少部分由于LAMP-2表达不足引起的自噬流不足)。在具体实施例中,表达盒包含编码本文公开的LAMP-2的多核苷酸序列,例如SEQ ID NO:3至SEQ ID NO:5,或其功能性变体。在一些实施例中,变体序列与选自SEQ ID NO:3至SEQ ID NO:5中的任何一个具有至少90%、至少95%、至少98%、或至少99%的同一性。在一些实施例中,变体是SEQ ID NO:3至SEQ ID NO:5中的任何一个的片段,例如具有SEQ ID NO:3至SEQ ID NO:5中的任何一个的序列的至少50%、至少60%、至少70%、至少80%、至少90%或至少95%的片段。基因治疗载体可以是病毒或非病毒载体。示例性的非病毒载体包括,例如裸露的DNA、阳离子脂质体复合物、阳离子聚合物复合物、阳离子脂质体-聚合物复合物和外来体。病毒载体的实例包括但不限于腺病毒、逆转录病毒、慢病毒、疱疹病毒和腺相关病毒(AAV)载体。

在某些实施例中,病毒载体是AAV载体。AAV是一种4.7kb单链DNA病毒。基于AAV的重组载体具有出色的临床安全性,因为野生型AAV不具致病性,并且与任何已知疾病均无病因联系。此外,AAV还提供了在许多组织中高效递送基因和持续表达转基因的能力。“AAV载体”指来源于腺相关病毒血清型的载体,包括但不限于AAV1、AAV2、AAV3、AAV4、AAV5、AAV6、AAV7、AAV8、AAV9、AAV10、AAVrh.10、AAVrh.74等。AAV载体可以具有全部或部分缺失的一个或多个AAV野生型基因,例如rep和/或cap基因,但保留功能性侧接反向末端重复(ITR)序列。功能性ITR序列对于AAV病毒粒子的拯救、复制和包装是必需的。因此,本文将AAV载体定义为至少包括病毒复制和包装所需的顺式序列(例如功能性ITR)。ITR不必是野生型核苷酸序列,并且可以被更改,例如,通过核苷酸的插入、缺失或取代,只要序列提供功能性拯救、复制和包装。AAV载体可以包含其他修饰,包括但不限于一种或多种修饰的衣壳蛋白(例如,VP1、VP2和/或VP3)。例如,可以修饰衣壳蛋白以更改嗜性和/或降低免疫原性。

基于AAV的重组载体具有出色的临床安全性,因为野生型AAV不具致病性,并且与任何已知疾病均无病因联系。此外,AAV还提供了在许多组织中高效递送基因和持续表达转基因的能力。已知AAV的各种血清型,包括AAV1、AAV2、AAV3、AAV4、AAV5、AAV6、AAV7、AAV8、AAV9、AAV10、AAVrh.10、AAVrh.74等。AAV载体可以具有全部或部分缺失的一个或多个AAV野生型基因,例如rep和/或cap基因,但保留功能性侧接反向末端重复(ITR)序列。重组AAV载体的血清型由其衣壳决定。国际专利公开第WO2003042397A2号公开了各种衣壳序列,包括AAV1、AAV2、AAV3、AAV8、AAV9和rh10的那些。国际专利公开第WO2013078316A1号公开了来自AAVrh74的VP1的多肽序列。本领域已知多种多样的天然存在的或遗传修饰的AAV衣壳序列。

示例性的非限制性衣壳是AAV9衣壳,其具有SEQ ID NO:28的序列(或其VP1、VP2或VP3片段)。在一些实施例中,本公开的AAV载体包含衣壳蛋白,其与SEQ ID NO:28的整个序列、或SEQ ID NO:28的氨基酸138至736、或SEQ ID NO:28的氨基酸203至736具有至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或至少100%同一性。

(SEQ ID NO:28)。

使用已知技术构建AAV表达载体,以至少提供包括转录起始区、目的DNA(即LAMP-2基因)和转录终止区的控制元件作为转录方向上的可操作地连接的组分。

在一些实施例中,病毒载体是AAV9载体。在一些实施例中,病毒载体的表达盒侧接有AAV2反向末端重复序列(ITR)。在公开的载体的选择性实施例中使用的ITR包括但不限于AAV2、AAV3、AAV4、AAV5、AAV6、AAV7、AAV8和AAV9。在一些实施例中,病毒载体是AAV2/9载体。符号AAV2/9指具有AAV2的ITR和AAV9衣壳的AAV载体。本公开的其他实施例包括但不限于AAV2/9、AAV5/9、AAVrh74、AAV2/rh74、AAV5/9和AAV5/rh74载体。可以使用本领域中已知的其他ITR。可用于本公开的载体的示例性ITR(和其他AAV组分)包括但不限于US6936466B2、US9169494B2、US20050220766A1、US20190022249A1和US7282199B2中所述的那些,其各自整体通过引用并入本文。

在一些实施例中,载体是逆转录病毒载体,或更具体地,是慢病毒载体。如本文所用,术语“逆转录病毒”或“逆转录病毒的”指RNA病毒,其将其基因组RNA逆转录成线性双链DNA拷贝,然后将其基因组DNA共价整合到宿主基因组中。逆转录病毒载体是用于基因递送的常用工具(Miller,2000,《自然(Nature)》.357:455-460)。一旦病毒整合到宿主基因组中,就被称为“前病毒”。前病毒充当RNA聚合酶II的模板,并且指导病毒编码的RNA分子的表达。

示例性逆转录病毒(逆转录病毒科)包括但不限于:(1)γ逆转录病毒属,诸如莫洛尼鼠白血病病毒(M-MuLV)、莫洛尼鼠肉瘤病毒(MoMSV)、鼠类乳腺肿瘤病毒(MuMTV)、长臂猿白血病病毒(GaLV)和猫白血病病毒(FLV),(2)泡沫病毒属,诸如猿猴泡沫病毒,(3)慢病毒属,诸如人免疫缺陷病毒-1和猿猴免疫缺陷病毒。

如本文所用,术语“慢病毒的”或“慢病毒”指复杂的逆转录病毒的群组(或属)。示例性逆转录病毒包括但不限于:HIV(人免疫缺陷病毒;包括1型HIV和2型HIV;维斯纳梅迪病毒(VMV);山羊关节炎-脑炎病毒(CAEV);马传染性贫血病毒(EIAV);猫免疫缺陷病毒(FIV);牛免疫缺陷病毒(BIV);和猿猴免疫缺陷病毒(SIV)。在一个实施例中,优选基于HIV的载体主链(即,HIV顺式作用序列元件)。

逆转录病毒载体,尤其是慢病毒载体,可用于实施本发明。因此,如本文所用,术语“逆转录病毒载体”指包括“慢病毒载体”。如本文所用,术语“逆转录病毒”意在包括“慢病毒”。

术语病毒载体可指能够将核酸转移到细胞中的载体或病毒颗粒,或转移的核酸本身。病毒载体含有主要来源于病毒的结构和/或功能遗传元件。术语“逆转录病毒载体”指含有主要来源于逆转录病毒的结构和功能遗传元件或其部分的病毒载体。术语“慢病毒载体”指含有结构和功能遗传元件或其部分的病毒载体,包括主要来源于慢病毒的LTR。术语“杂合”指含有逆转录病毒序列例如慢病毒序列和非慢病毒序列的载体、LTR或其他核酸。在一个实施例中,杂合载体指包含用于逆转录、复制、整合和/或包装的逆转录病毒(例如慢病毒)序列的载体或转移质粒。

在特定的实施例中,术语“慢病毒载体”和“慢病毒表达载体”可用来指慢病毒转移质粒和/或传染性慢病毒颗粒。在本文中提及诸如克隆位点、启动子、调控元件、异源核酸等的元件时,应理解这些元件的序列以RNA形式存在于本发明的慢病毒颗粒中,并且以DNA形式存在于本发明的DNA质粒中。

根据某些具体实施例,大部分或全部病毒载体主链序列来源于慢病毒,例如HIV-1。然而,应当理解,可以使用许多不同来源的慢病毒序列,并且可以适应某些慢病毒序列的许多取代和更改,而不损害转移载体执行本文所述功能的能力。此外,多种慢病毒载体是本领域已知的,参见Naldini等人,(1996a,1996b,和1998);Zufferey等人,(1997);Dull等人,1998,美国专利第6,013,516号和第5,994,136号,其中许多可以适于产生本发明的病毒载体或转移质粒。

在各实施例中,本文公开的LAMP-2B转基因序列用于本领域已知或预期发现的任何载体系统中。本发明不限于本文所述的任何特定的病毒载体,因为在其他载体系统中使用转基因序列而无需过度实验并且具有合理的成功预期在本领域技术人员的技能范围内。

用于实施本发明的基因递送病毒载体可以利用分子生物学领域熟知的方法构建。通常,携带转基因的病毒载体由编码转基因的多核苷酸,合适的调节元件和介导细胞转导的病毒蛋白生产所必需的元件组装而成。此类重组病毒可通过本领域已知的技术产生,例如通过转染包装细胞或通过用辅助质粒或病毒瞬时转染。病毒包装细胞的通常实例包括但不限于HeLa细胞、SF9细胞(可选带有杆状病毒辅助载体)、293细胞等。基于疱疹病毒的系统可以用于生产AAV载体,如US20170218395A1中所述。产生此类复制缺陷型重组病毒的详细方案可在例如W095/14785、W096/22378,美国专利第5,882,877号、美国专利第6,013,516号、美国专利第4,861,719号、美国专利第5,278,056号和W094/19478中找到,其每一者的全部内容通过引用并入于此。

本发明还提供了包含本文公开的表达盒或载体(例如基因治疗载体)和一种或多种药学上可接受的载体、稀释剂或赋形剂的药物组合物。在具体实施例中,药物组合物包含AAV载体,其包含本文公开的表达盒,例如,其中表达盒包含编码LAMP-2B的密码子优化的转基因,例如SEQ ID NO:3至SEQ ID NO:5中的任何一个及其变体。提供了药物组合物,例如用于预防或治疗以自噬流不足(例如,Danon病)为特征的障碍,其包含治疗有效量的本文公开的表达盒或载体,该表达盒或载体包含编码LAMP-2的一种或多种异构体的多核苷酸的核酸序列。

用于本发明的AAV载体可以使用包括基于腺病毒系统和无辅助系统的各种系统包装成AAV病毒体(病毒颗粒)。AAV生物学中的标准方法包括以下所述的那些:Kwon和Schaffer《药学研究(pharm Res.)》(2008)25(3):489-99;Wu等人《分子治疗(Mol.Ther)》.(2006),14(3):316-27。Burger等人《分子治疗》.(2004)10(2):302-17;Grimm等人.《当代基因治疗(Curr Gene Ther)》.(2003)3(4):281-304;Deyle DR,Russell DW.《当代分子治疗观点(Curr Opin Mol Ther)》.(2009)11(4):442-447;McCarty等人.《基因治疗(GeneTher)》.(2001)8(16):1248-54;和Duan等人《分子治疗》.(2001),4(4):383-91。无辅助系统包括US 6,004,797;US 7,588,772和US 7,094,604中所述的那些。

含有表达盒或载体的药物组合物可以是适合所选施用方式的任何形式,例如心室内、心肌内、冠状动脉内、静脉内、动脉内、肾内、尿道内、硬膜外或肌内施用。包含编码一种或多种LAMP-2异构体的多核苷酸的基因治疗载体可以作为唯一的活性剂,或与其他活性剂组合,以单位施用形式,作为与常规药物载体的混合物,施用于动物和人。在一些实施例中,药物组合物包含用本公开的任何基因治疗载体离体转导的细胞。

在一些实施例中,当全身施用时,病毒载体(例如,AAV载体)或包含该载体的药物组合物是有效的。例如,在一些情况下,当静脉内施用于受试者(例如,灵长类,诸如非人灵长类或人)时,本公开的病毒载体表现出药效。在一些实施例中,当全身施用时(例如在心脏、肌肉和/或肺中),本公开的病毒载体能够诱导LAMP-2B在各种组织中的表达。在特定的实施例中,向受试者静脉内施用包含与SEQ ID NO:3大体上相同或完全相同的转基因的AAV9载体引起心脏组织中LAMP-2B的可检测表达。在一些实施例中,LAMP-2B的表达在受试者心脏的左心室、右心室、左心房和右心房中的一个或多个或全部中是可检测的。在一些实施例中,LAMP-2B的表达在受试者心脏的左心室的子区域1和/或子区域2中是可检测的。

“可检测表达”通常指与未用病毒载体治疗的对照受试者或组织相比,至少5%、10%、15%、20%或更多的转基因表达。在一些实施例中,可检测表达指比无载体对照高至少1.5倍、至少2倍、至少2.5倍、至少3倍、至少5倍、至少10倍、至少20倍、至少50倍或至少100倍的表达。转基因表达可以确定为野生型或内源基因在细胞中增加过度表达(说明转基因表达可能影响内源基因表达的可能性)。也可以通过RT-PCR检测转基因mRNA转录物上存在但内源基因mRNA转录物上不存在的序列来测定转基因表达。例如,转录物的3'UTR可以用于确定转基因的表达,而与内源基因(其可以具有不同的3'UTR)的表达无关。如以下实例中所述,可以通过western blot或酶联免疫吸附测定(ELISA)或本领域已知的其他方法来评估由转基因编码的多肽的表达。可以使用与蛋白的野生型和外源拷贝交叉反应的抗体。在一些情况下,对外源蛋白具有特异性的抗体可以识别,并且用于测定转基因表达。本领域技术人员可以考虑靶细胞或组织来设计合适的检测方法。在一些情况下,使用标准曲线定量测量表达。可以通过实例中所述的或本领域已知的方法,使用纯化的LAMP-2蛋白产生标准曲线。另选地,可以通过量化相应的mRNA评估转基因的表达。

在一些实施例中,LAMP-2B在心脏组织中的可检测表达的剂量,以载体基因组(vg)/千克受试者重量(kg)计,为5×10

在一些实施例中,LAMP-2B在心脏组织中的可检测表达的剂量,以载体基因组(vg)/千克受试者重量(kg)计,为1×10

在一些实施例中,LAMP-2B在心脏组织中的可检测表达的剂量,以载体基因组(vg)/千克受试者重量(kg)计,为1×10

在一些实施例中,LAMP-2B在心脏组织中的可检测表达的剂量,以载体基因组(vg)/千克受试者重量(kg)计,为1×10

在一些实施例中,LAMP-2B在心脏组织中的可检测表达的剂量,以载体基因组(vg)/千克受试者重量(kg)计,为1×10

在各实施例中,药物组合物含有溶媒(例如,载体、稀释剂和赋形剂),该溶媒对于能够注射的制剂是药学上可接受的。示例性赋形剂包括泊洛沙姆。用于病毒载体(包括AAV)的制剂缓冲液通常含有防止聚集的盐和减少载体粘性的其他赋形剂(例如,泊洛沙姆)。这些具体可以是等渗的、无菌的盐水溶液(磷酸二氢钠或磷酸氢二钠、氯化钠、氯化钾、氯化钙或氯化镁等或此类盐的混合物)、或干燥的、特别是冻干的组合物,其根据需要加入无菌水或生理盐水的情况下可以配制注射液。有利的是,该制剂在冷冻时(例如,在低于0℃、约-60℃或约-72℃)储存和使用是稳定的。

WO 2018/170239 A1提供了治疗溶酶体障碍和/或Danon病的示例性方法,其整体并入本文。本公开的转基因、表达盒和载体可用于体内(例如全身,特别是静脉内使用)以及体外使用。LAMP-2B转基因和功能性启动子可以用于体外基因校正患者的自体造血干细胞和祖细胞(HSPC),然后可以将其重新移植到患者体内重新填充其骨髓,骨髓是患者余生的“健康”细胞库。在一些实施例中,慢病毒载体用于体外基因校正,但是其他非病毒或病毒载体可以用于代替慢病毒载体。本公开设想使用供体HSPCs进行同种异体移植。在一些实施例中,慢病毒载体是自灭活(SIN)慢病毒载体。在一些实施例中,HSPC来源于使用例如粒细胞集落刺激因子(G-CSF)和/或普乐沙福调动的外周血。

在另一方面,本公开提供了一种预防、减轻、改善、减少、抑制、消除和/或逆转在有此需要的受试者体内的Danon病或另一种自噬障碍的一种或多种症状的方法,该方法包含向受试者施用本公开的基因治疗载体。术语“Danon病”指具有多系统临床表现的X连锁显性骨骼肌和心肌障碍。Danon病突变导致溶酶体相关膜蛋白2(LAMP-2)蛋白表达缺失。主要临床特征包括骨骼肌和心肌病、心脏传导异常、认知困难和视网膜疾病。男性通常比女性受影响更早、更严重。

在一个实施例中,载体经由选自由以下组成的群组的途径施用:肠胃外、静脉内、动脉内、心内、冠状动脉内、心肌内、肾内、尿道内、硬膜外和肌内。在一个实施例中,载体施用多次。在一个实施例中,通过肌内注射载体施用载体。在一个实施例中,通过将载体注射到骨骼肌中来施用载体。在一个实施例中,表达盒包含肌肉特异性启动子,任选地肌肉肌酸激酶(MCK)启动子或MCK/SV40杂合启动子,如Takeshita等人所述。肌肉肌酸激酶/SV40杂交启动子用于肌肉靶向的长期转基因表达。《国际分子医学杂志(Int J Mol Med)》.2007年2月;19(2):309-15。在一个实施例中,通过心内注射施用载体。

在一个实施例中,该载体,例如AAV载体,是全身施用的,更具体地是静脉内施用的。有利的是,载体以低于使用原始或野生型LAMP-2B序列时观察相同应答所需剂量的剂量(单位为Vg/mL、vg/kg体重或vg/min/kg)施用。在具体实施例中,载体是包含表达盒的AAV2/9载体,表达盒包含编码本文公开的LAMP-2B的多核苷酸。

在一些实施例中,本公开提供了在受试者体内表达LAMP-2B的方法,该方法包含向该受试者全身施用腺相关病毒(AAV)载体,其中该AAV载体包含表达盒,该表达盒包含与SEQID NO:3具有至少95%同一性的转基因或与SEQ ID NO:3相同的转基因。该转基因与增强子/启动子区可操作地连接,其中与施用AAV载体之前的LAMP-2B表达或未治疗的对照受试者体内的LAMP-2B表达相比,向受试者全身施用AAV载体引起LAMP-2B表达增加。在一些实施例中,AAV载体是AAV2/9载体。在具体实施例中,表达盒包含本文公开的任何元件。在一些实施例中,全身施用包含静脉内施用。在一些实施例中,受试者正表现出Danon病的症状。在一些实施例中,受试者患有Danon病或具有Danon病风险。

在一些实施例中,AAV载体以介于约1×10

在一些实施例中,AAV载体以如下的计量施用:约1×10

在一些实施例中,AAV载体以如下的计量施用:1×10

在一些实施例中,慢病毒载体以介于约1×10

在一些实施例中,慢病毒载体以如下的计量施用:约1×10

在一些实施例中,慢病毒载体以如下的计量施用:1×10

在一些实施例中,病毒载体以介于约1×10

在一些实施例中,病毒载体以如下的计量施用:约1×10

在一些实施例中,病毒载体以如下的计量施用:1×10

在一些实施例中,AAV载体以介于约1×10

在一些实施例中,AAV载体以如下的计量全身施用:约1×10

在一些实施例中,AAV载体以如下的计量全身施用:1×10

在一些实施例中,慢病毒载体以介于约1×10

在一些实施例中,慢病毒载体以如下的计量全身施用:约1×10

在一些实施例中,慢病毒载体以如下的计量全身施用:1×10

在一些实施例中,病毒载体以介于约1×10

在一些实施例中,病毒载体以如下的计量全身施用:约1×10

在一些实施例中,病毒载体以如下的计量全身施用:1×10

在一些实施例中,AAV载体以介于约1×10

在一些实施例中,AAV载体以如下的剂量静脉内施用:约1×10

在一些实施例中,AAV载体以如下的剂量静脉内施用:1×10

在一些实施例中,慢病毒载体以介于约1×10

在一些实施例中,慢病毒载体以如下的剂量静脉内施用:约1×10

在一些实施例中,慢病毒载体以如下的剂量静脉内施用:1×10

在一些实施例中,病毒载体以介于约1×10

在一些实施例中,病毒载体以如下的剂量静脉内施用:约1×10

在一些实施例中,病毒载体以如下的剂量静脉内施用:1×10

在一些实施例中,全身(或更具体地静脉内)施用引起受试者的一个或多个组织(例如心脏、肌肉和/或肝脏)内的LAMP-2B多核苷酸作为mRNA的表达,其形式为从转基因表达的mRNA。在一些实施例中,与未治疗的受试者或用对照载体治疗的受试者体内的表达相比,心脏内的LAMP-2B多核苷酸作为mRNA的表达增加至少约1.2倍、至少约1.3倍、至少约1.4倍、至少约1.5倍、至少约1.6倍、至少约1.7倍、至少约1.8倍、至少约1.9倍、至少约2.0倍、至少约2.2倍、至少约2.3倍、至少约2.4倍、至少约2.5倍、至少约3倍或至少约4倍。在一些实施例中,与未治疗的受试者或用对照载体治疗的受试者体内的表达相比,心脏内的LAMP-2B多核苷酸作为mRNA的表达增加至少1.2倍、至少1.3倍、至少1.4倍、至少1.5倍、至少1.6倍、至少1.7倍、至少1.8倍、至少1.9倍、至少2.0倍、至少2.2倍、至少2.3倍、至少2.4倍、至少2.5倍、至少3倍或至少4倍。在一些实施例中,与未治疗的受试者或用对照载体治疗的受试者体内的表达相比,心脏内的LAMP-2B多核苷酸作为mRNA的表达增加1.2倍、1.3倍、1.4倍、1.5倍、1.6倍、1.7倍、1.8倍、1.9倍、2.0倍、2.2倍、2.3倍、2.4倍、2.5倍、3倍或4倍。

在一些实施例中,与未治疗的受试者或用对照载体治疗的受试者体内的表达相比,肌肉内的LAMP-2B多核苷酸作为mRNA的表达增加至少约1.2倍、至少约1.3倍、至少约1.4倍、至少约1.5倍、至少约1.6倍、至少约1.7倍、至少约1.8倍、至少约1.9倍、至少约2.0倍、至少约2.2倍、至少约2.3倍、至少约2.4倍、至少约2.5倍、至少约3倍或至少约4倍。在一些实施例中,与未治疗的受试者或用对照载体治疗的受试者体内的表达相比,肌肉内的LAMP-2B多核苷酸作为mRNA的表达增加至少1.2倍、至少1.3倍、至少1.4倍、至少1.5倍、至少1.6倍、至少1.7倍、至少1.8倍、至少1.9倍、至少2.0倍、至少2.2倍、至少2.3倍、至少2.4倍、至少2.5倍、至少3倍或至少4倍。在一些实施例中,与未治疗的受试者或用对照载体治疗的受试者体内的表达相比,肌肉内的LAMP-2B多核苷酸作为mRNA的表达增加1.2倍、1.3倍、1.4倍、1.5倍、1.6倍、1.7倍、1.8倍、1.9倍、2.0倍、2.2倍、2.3倍、2.4倍、2.5倍、3倍或4倍。

在一些实施例中,LAMP-2B转基因在受试者的心脏内表达,而在肝脏内不表达。在一些实施例中,与肝脏相比,观察到LAMP-2B多核苷酸作为mRNA在心脏内的表达为至少约1.2倍、至少约1.3倍、至少约1.4倍、至少约1.5倍、至少约1.6倍、至少约1.7倍、至少约1.8倍、至少约1.9倍、至少约2.0倍、至少约2.2倍、至少约2.3倍、至少约2.4倍、至少约2.5倍、至少约3倍或至少约4倍。在一些实施例中,与肝脏相比,观察到LAMP-2B多核苷酸作为mRNA在心脏内的表达为至少1.2倍、至少1.3倍、至少1.4倍、至少1.5倍、至少1.6倍、至少1.7倍、至少1.8倍、至少1.9倍、至少2.0倍、至少2.2倍、至少2.3倍、至少2.4倍、至少2.5倍、至少3倍或至少4倍。在一些实施例中,与肝脏相比,观察到LAMP-2B多核苷酸作为mRNA在心脏内的表达为1.2倍、1.3倍、1.4倍、1.5倍、1.6倍、1.7倍、1.8倍、1.9倍、2.0倍、2.2倍、2.3倍、2.4倍、2.5倍、3倍或4倍。

在一些实施例中,与未治疗的受试者或用对照载体治疗的受试者体内的表达相比,野生型或功能性LAMP-2B蛋白在心脏内的表达增加至少约1.2倍、至少约1.3倍、至少约1.4倍、至少约1.5倍、至少约1.6倍、至少约1.7倍、至少约1.8倍、至少约1.9倍、至少约2.0倍、至少约2.2倍、至少约2.3倍、至少约2.4倍、至少约2.5倍、至少约3倍或至少约4倍。在一些实施例中,与未治疗的受试者或用对照载体治疗的受试者体内的表达相比,野生型或功能性LAMP-2B蛋白在心脏内的表达增加至少1.2倍、至少1.3倍、至少1.4倍、至少1.5倍、至少1.6倍、至少1.7倍、至少1.8倍、至少1.9倍、至少2.0倍、至少2.2倍、至少2.3倍、至少2.4倍、至少2.5倍、至少3倍或至少4倍。在一些实施例中,与未治疗的受试者或用对照载体治疗的受试者体内的表达相比,野生型或功能性LAMP-2B蛋白在心脏内的表达增加1.2倍、1.3倍、1.4倍、1.5倍、1.6倍、1.7倍、1.8倍、1.9倍、2.0倍、2.2倍、2.3倍、2.4倍、2.5倍、3倍或4倍。

在一些实施例中,与肝脏相比,观察到野生型或功能性LAMP-2B蛋白在心脏内的表达为至少约1.2倍、至少约1.3倍、至少约1.4倍、至少约1.5倍、至少约1.6倍、至少约1.7倍、至少约1.8倍、至少约1.9倍、至少约2.0倍、至少约2.2倍、至少约2.3倍、或至少约5倍。在一些实施例中,与肝脏相比,观察到野生型或功能性LAMP-2B蛋白在心脏内的表达为至少1.2倍、至少1.3倍、至少1.4倍、至少1.5倍、至少1.6倍、至少1.7倍、至少1.8倍、至少1.9倍、至少2.0倍、至少2.2倍、至少2.3倍、至少2.4倍、至少2.5倍、至少3倍或至少4倍。在一些实施例中,与肝脏相比,观察到野生型或功能性LAMP-2B蛋白在心脏内的表达为1.2倍、1.3倍、1.4倍、1.5倍、1.6倍、1.7倍、1.8倍、1.9倍、2.0倍、2.2倍、2.3倍、2.4倍、2.5倍、3倍或4倍。

在一些实施例中,与未治疗的受试者的肝脏内的表达相比,基因治疗载体的施用引起野生型或功能性LAMP-2B蛋白在肝脏内的表达增加至多约1.1倍、至多约1.2倍、至多约1.3倍、至多约1.4倍、至多约1.5倍、至多约1.6倍、至多约1.7倍、至多约1.8倍、至多约1.9倍或至多约2倍。在一些实施例中,与未治疗的受试者的肝脏内的表达相比,基因治疗载体的施用引起野生型或功能性LAMP-2B蛋白在肝脏内的表达增加至多1.1倍、至多1.2倍、至多1.3倍、至多1.4倍、至多1.5倍、至多1.6倍、至多1.7倍、至多1.8倍、至多1.9倍或至多2倍。在一些实施例中,与未治疗的受试者的肝脏内的表达相比,基因治疗载体的施用引起野生型或功能性LAMP-2B蛋白在肝脏内的表达增加1.1倍、1.2倍、1.3倍、1.4倍、1.5倍、1.6倍、1.7倍、1.8倍、1.9倍或2倍。

在一个实施例中,本公开提供了一种治疗在有此需要的受试者体内的疾病或障碍(任选Danon病)的方法,该方法包含使细胞与根据本公开的基因治疗载体接触并将该细胞施用于受试者。在一个实施例中,细胞是干细胞,任选多能干细胞。在一个实施例中,干细胞能够分化为心脏组织。在一个实施例中,干细胞能够分化为肌肉组织,例如,心肌组织和/或骨骼肌组织。在一个实施例中,干细胞是自体的。在一个实施例中,干细胞是诱导性多能干细胞(iPSC)。

在一个实施例中,该疾病或障碍是自噬障碍。在一些实施例中,自噬障碍选自但不限于由终末期心力衰竭、心肌梗死、药物毒性、糖尿病、终末期肾衰竭和衰老组成的群组。在一个实施例中,受试者是哺乳动物,例如人。在一个实施例中,受试者正表现出Danon病或另一种自噬障碍的症状。在一个实施例中,已鉴定受试者具有降低的或不可检测的LAMP-2表达。在一个实施例中,已鉴定受试者具有突变的LAMP-2基因。

适于使用本文所述方法进行治疗的受试者/患者包括但不限于具有以自噬流不足为特征的疾病或障碍的风险(例如,Danon病以及自噬的其他已知障碍,包括但不限于收缩和舒张性心力衰竭、心肌梗塞、药物毒性(例如蒽环类氯喹及其衍生物)、糖尿病、终末期肾脏疾病和衰老)但未表现出症状的个体,以及目前表现出症状的受试者。此类受试者可能已鉴定为具有突变的LAMP-2基因,或者具有降低的或不可检测的LAMP-2表达水平。

在一些实施例中,患者是人。在一些实施例中,患者是儿童、青少年或成人。在一些实施例中,患者是1岁、2岁、3岁、4岁、5岁、6岁、7岁、8岁、9岁、10岁、11岁、12岁、13岁、14岁、15岁、16岁、17岁、18岁、19岁或20岁,或大于20岁。在一些实施例中,患者是20至50岁。在一些实施例中,患者是50至65岁。在一些实施例中,患者是1至5岁、2至6岁、3至7岁、4至8岁、5至9岁、6至10岁、7至11岁、8至12岁、9至13岁、10至14岁、11至15岁、12至16岁、13至17岁、14至18岁、15至19岁或16至20岁。在一些实施例中,患者是5至6岁、6至7岁、7至8岁、8至9岁、9至10岁、10至11岁、11至12岁、12至13岁、13至14岁、14至15岁、15至16岁、16至17岁、17至18岁、18至19岁、19至20岁或20至21岁。在一个具体的实施例中,患者是15至16岁。

在一些实施例中,患者是男性。在一些实施例中,患者是儿童、青少年或成年男性。在一些实施例中,患者是1岁、2岁、3岁、4岁、5岁、6岁、7岁、8岁、9岁、10岁、11岁、12岁、13岁、14岁、15岁、16岁、17岁、18岁、19岁或20岁的男性,或大于20岁的男性。在一些实施例中,患者是20至50岁的男性。在一些实施例中,患者是50至65岁的男性。在一些实施例中,患者是1至5岁、2至6岁、3至7岁、4至8岁、5至9岁、6至10岁、7至11岁、8至12岁、9至13岁、10至14岁、11至15岁、12至16岁、13至17岁、14至18岁、15至19岁或16至20岁的男性。在一些实施例中,患者是5至6岁、6至7岁、7至8岁、8至9岁、9至10岁、10至11岁、11至12岁、12至13岁、13至14岁、14至15岁、15至16岁、16至17岁、17至18岁、18至19岁、19至20岁或20至21岁的男性。在一个具体的实施例中,患者是15至16岁。

在一些实施例中,患者是女性。在一些实施例中,患者是儿童、青少年或成年女性。在一些实施例中,患者是1岁、2岁、3岁、4岁、5岁、6岁、7岁、8岁、9岁、10岁、11岁、12岁、13岁、14岁、15岁、16岁、17岁、18岁、19岁或20岁的女性,或大于20岁的女性。在一些实施例中,患者是20至50岁的女性。在一些实施例中,患者是50至65岁的女性。

在一些实施例中,受试者正表现出以自噬流不足为特征的疾病或障碍的症状(例如,Danon病以及自噬的其他已知障碍,包括但不限于收缩性和舒张性心力衰竭、心肌梗塞、药物毒性、糖尿病、终末期肾脏疾病和衰老)。症状可能正在积极显现,或可能被抑制或控制(例如通过药物治疗)或缓解中。受试者可能或可能未例如由合格的医师诊断出患有障碍。

定义

术语“溶酶体相关膜蛋白2”和“LAMP-2”可互换地指核酸和多肽多态性变体、等位基因、突变体和种间同源物,其:(1)具有氨基酸序列,该氨基酸序列与LAMP-2核酸编码的氨基酸序列(参见例如GenBank登录号NM_002294.2(异构体A)。NM_013995.2(异构体B)、NM_001122606.1(异构体C))或与LAMP-2多肽的氨基酸序列(参见例如GenBank登录号NP_002285.1(异构体A)、NP_054701.1)(异构体B)、NP_001116078.1(异构体C))具有大于约90%氨基酸序列同一性,例如,91%、92%、93%、94%、95%、96%、97%、98%或99%或更高氨基酸序列同一性,优选地,在至少约25、50、100、200、300、400或更多氨基酸的区域或全长上;(2)结合抗体,例如多克隆抗体,针对免疫原产生,该免疫原包含LAMP-2多肽(例如本文所述的LAMP-2多肽)的氨基酸序列;或由LAMP-2核酸编码的氨基酸序列(例如本文所述的LAMP-2多核苷酸)及其保守修饰的变体;(3)在严格杂交条件下与对应于编码LAMP-2蛋白的核酸序列及其保守修饰的变体的反义链特异性杂交;(4)具有核酸序列,该核酸序列与LAMP-2核酸(例如如本文所述的LAMP-2多核苷酸和如本文所述的编码LAMP-2多肽的LAMP-2多核苷酸)具有大于约90%,优选地,大于约91%、92%、93%、94%、95%、96%、97%、98%、99%或更高核苷酸序列同一性的核酸序列,优选地,在至少约25、50、100、200、500、1000、2000或更多核苷酸的区域或全长上。

术语“溶酶体相关膜蛋白2B”和“LAMP-2B”可互换地指核酸和多肽多态性变体、等位基因、突变体和种间同源物,其:(1)具有氨基酸序列,该氨基酸序列与LAMP-2B核酸编码的氨基酸序列(例如参见NM_013995.2)或LAMP-2B多肽编码的氨基酸序列(例如参见NP_054701.1)具有大于约90%氨基酸序列同一性,例如,91%、92%、93%、94%、95%、96%、97%、98%或99%或更高氨基酸序列同一性,优选地,在至少约25、50、100、200、300、400或更多氨基酸的区域或全长上;(2)结合抗体,例如多克隆抗体,针对免疫原产生,该免疫原包含LAMP-2B多肽(例如,本文所述的LAMP-2B多肽)的氨基酸序列;或由LAMP-2B核酸编码的氨基酸序列(例如,本文所述的LAMP-2B多核苷酸)及其保守修饰的变体;(3)在严格杂交条件下,与编码LAMP-2B蛋白的核酸序列相对应的反义链及其保守修饰的变体特异性杂交;(4)具有核酸序列,该核酸序列与LAMP-2B核酸(例如如本文所述的LAMP-2B多核苷酸和如本文所述的编码LAMP-2B多肽的LAMP-2B多核苷酸)具有大于约90%,优选地,大于约91%、92%、93%、94%、95%、96%、97%、98%、99%或更高的核苷酸序列同一性,优选地,在至少约25、50、100、200、500、1000、2000或更多核苷酸的区域或全长上。

关于蛋白(例如,LAMP-2B)的术语“功能性变体”指具有至少约30、至少约40、至少约50、至少约60、至少约70或至少约80个氨基酸残基的多肽序列或多肽序列的片段,其保留蛋白的一种或多种功能属性。例如,LAMP-2B的一种功能性变体是LAMP-2B(如本文所定义),其保留一种或多种功能,诸如:(1)调节人心肌细胞功能(Chi等人.(2019)《美国科学院院刊(PNAS USA)》116(2)556-565);(2)提高Danon病的代谢和生理功能(Adler等人.(2019)《美国心脏病学会杂志(J.Am.College Cardiology)》S0735-1097(19)31295-1);和/或(3)自噬(Rowland等人.(2016)《细胞科学杂志(J.Cell Sci)》.(2016)129,2135-2143)。

LAMP-2B具有管腔结构域(残基29-375)、跨膜结构域(残基376-399)和胞质结构域(残基400-410),参见UniProt登录号P13473。LAMP-2B的功能包括伴侣介导的自噬,该过程介导蛋白的溶酶体降解,以响应各种应激并作为具有正常生物学半衰期的蛋白正常周转的一部分(Cuervo等人.《科学(Science)》273:501-503(1996),Cuervo等人《细胞科学杂志》.113:4441-4450(2000);Bandyopadhyay等人.《分子细胞生物学(Mol.Cell.Biol)》.28:5747-5763(2008),Li等人.《实验细胞研究(Exp.Cell Res)》.327:48-56(2014),Hubert等人.《生物学开放(Biol.Open)5:1516-1529(2016))。LAMP-2B可以靶向GAPDH和MLLT11进行溶酶体降解。自噬过程中自噬体与溶酶体的融合可能需要LAMP-2B。有人认为,缺乏LAMP2的细胞表达正常水平的VAMP8,但未能在自噬体上集聚STX17,这是自噬体和溶酶体之间缺乏融合的最可能的解释。自噬体内含物的正常降解可能需要LAMP-2B。通过其在溶酶体蛋白降解中的功能,有效的MHCII-介导的外源性抗原的呈递可能需要LAMP-2B;内体/溶酶体区室中的蛋白酶产生的抗原肽被新生的MHCII亚单位捕获(Crotzer等人.《免疫学(Immunology)》131:318-330(2010))。

因此,LAMP-2B的功能性变体包括能够介导任何前述功能的LAMP-2B的片段。在一些实施例中,LAMP-2B的功能片段包括管腔、跨膜和细胞质结构域中的一个或多个。在一些实施例中,LAMP-2B的功能性变体包含相对于天然LAMP-2B的一个或多个C末端或N末端缺失。在一些实施例中,LAMP-2B的功能性变体包含相对于天然LAMP-2B的一个或多个内部缺失。

在两种或更多种核酸或多肽序列的上下文中,术语“相同”或“同一性”百分比指当使用以下序列比较算法之一或通过手动比对和目视检查测量在比较窗口或指定区域上进行比较和比对以达到最大对应性时,两种或更多种序列或子序列相同或具有特定百分比的相同氨基酸残基或核苷酸(即,与参考序列在特定区域具有至少约80%的同一性,例如,至少约85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%的同一性,例如,如本文所述的LAMP-2多核苷酸或多肽序列。此类序列被称为“大体上相同”。该定义也指对测试序列的补充。优选地,该同一性存在于长度至少为约25个氨基酸或核苷酸的区域,例如长度为50、100、200、300、400个氨基酸或核苷酸的区域,或参考序列的全长。

对于序列比较,通常一个序列用作参考序列,将其与测试序列进行比较。当使用序列比较算法时,将测试序列和参考序列输入计算机,必要时指定子序列坐标,并指定序列算法程序参数。可以使用默认程序参数,也可以指定选择性参数。然后,基于程序参数,序列比较算法计算测试序列相对于参考序列的序列同一性百分比。为了将核酸和蛋白与LAMP-2核酸和蛋白进行序列比较,使用了BLAST和BLAST2.0算法以及默认参数。

如本文所用,“比较窗”包括对选自由20至600,通常约50至约200,更通常约100至约150的组成的组群中的多个连续位置中的任何一个的片段的引用。在两个序列最优比对之后,可以将其中一个序列与相同数目的连续位置的参考序列进行比较。用于比较的序列比对方法是本领域众所周知的。用于比较的序列的最优比对可以通过以下方法进行,例如通过Smith&Waterman的局部同源性算法,《应用数学进展(Adv.Appl.Math)》.2:482(1981)、通过Needleman&Wunsch的同源性比对算法,《分子生物学杂志(J.MolBiol.)》48:443(1970)、通过Pearson&Lipman的相似性搜索方法《美国科学院院刊(Proc.Nat'l.Acad.Sci.USA)》85:2444(1988),通过这些算法的计算机化实现(GAP、BESTFIT、FASTA和TFASTA,Wisconsin Genetics Software Package,Genetics Computer Group,575ScienceDr.,威斯康星州麦迪逊市),或者通过手动比对和目视检查(参见例如Ausubel等人编辑《最新分子生物学实验方法汇编(Current Protocols in Molecular Biology)(1995年增刊))。适于确定序列同一性和序列相似性百分比的算法的实例是BLAST和BLAST 2.0算法,其描述于Altschul等人《分子生物学杂志》215:403-410(1990)和Altschul等人《核酸研究(Nucleic Acids Res.)》25:3389-3402(1977)。用于BLAST分析的软件可通过美国国家生物技术信息中心(在万维网ncbi.nlm.nih.gov/)公开获得。

如下所述,两个核酸序列或多肽大体上相同的标志是由第一核酸编码的多肽与针对第二核酸编码的多肽产生的抗体发生免疫交叉反应。因此,一种多肽通常与第二种多肽大体上相同,例如,其中两种肽的不同之处仅在于保守取代。两个核酸序列大体上相同的另一个标志是,两个分子或其互补序列在严格条件下彼此杂交。两个核酸序列大体上相同的另一个标志是可以使用相同的引物来扩增该序列。

如本文所用,“施用”是指局部和全身施用,例如包括肠内、肠胃外、肺和局部/透皮施用。在本文所述的方法中发现有用的化合物(例如,编码一种或多种LAMP-2异构体的多核苷酸)的施用途径包括例如口服(经口(PO))施用、经鼻或吸入施用、作为栓剂施用、局部接触、经皮递送(例如,通过透皮贴剂)、鞘内(IT)施用、静脉内(“iv”)施用、腹膜内(“ip”)施用、肌肉内(“im”)施用、病灶内施用或皮下(“sc”)施用或缓释装置(例如微型渗透泵、储库型长效制剂等)植入受试者。可以通过包括肠胃外和透粘膜的任何途径(例如口服、经鼻、经阴道、经直肠或经皮)施用。肠胃外施用包括例如静脉内、肌内、动脉内、肾内、尿道内、心内、冠状动脉内、心肌内、皮内、硬膜外、皮下、腹膜内、心室内、离子电和颅内施用。其他递送方式包括但不限于脂质体制剂的使用、静脉内输注、透皮贴剂等。

术语“全身施用”和“全身施用的”指一种给哺乳动物施用化合物或组合物的方法,使得化合物或组合物经由循环系统被递送至体内的位点,包括药物作用的靶位点。全身施用包括但不限于口服、鼻内、直肠和肠胃外(例如,除了通过消化道,诸如肌内、静脉内、动脉内、经皮和皮下)施用。

术语“共同施用”或“同时施用”,当例如相对于化合物(例如LAMP-2多核苷酸)和/或其类似物和另一种活性剂使用时,指化合物和/或类似物和活性剂的施用,使得两者可以同时达到生理效果。然而,这两种药剂不需要一起施用。在某些实施例中,一种药剂的施用可以先于另一种药剂的施用。同时的生理效应不一定需要两种药剂同时存在于循环中。然而,在某些实施例中,共同施用通常引起两种药剂在任何给定剂量下以其最大血清浓度的显著分数(例如20%或更高,例如30%或40%或更高,例如50%或60%或更高,例如70%或80%或90%或更高)同时存在于体内(例如血浆中)。

术语“有效量”或“药学上有效量”指一种或多种化合物(例如,基因治疗载体)的量和/或剂量和/或剂量方案,其对于产生期望的结果是必需的,例如,一种或多种LAMP-2异构体的表达增加,其量足以降低以自噬受损或不足为特征的疾病(例如,Danon病)的最终严重程度。

短语“引起施用”指医学专业人员(例如,医生)或控制受试者医疗护理的人采取的行动,其控制和/或允许对受试者施用有争议的药剂/化合物。引起施用可以涉及诊断和/或确定适当的治疗或预防方案,和/或为受试者开出特定的药剂/化合物。此种处方可以包括例如起草处方表格、注释病历等。

如本文所用,术语“治疗(treating和treatment)”指延迟该术语所适用的疾病或病症或此类疾病或病症的一种或多种症状的发作、延缓或逆转其进展、降低其严重性、或减轻或预防该疾病或病症。术语“治疗”还包括预防、减轻、改善、减少、抑制、消除和/或逆转疾病或病症的一种或多种症状。

术语“减轻”指减少或消除该病理或疾病的一种或多种症状,和/或减少或延迟该病理或疾病的一种或多种症状的发作率或严重性,和/或预防该病理或疾病。在某些实施例中,病理或疾病的一种或多种症状的减少或消除可以包括,例如,LAMP-2的一种或多种异构体的表达水平的可测量的和持续的增加。

如本文所用,短语“基本上由……组成”指在方法或组合物中所列举的活性药剂的属或种类,并且还可以包括其他药剂,其本身对于所列举的适应症或目的不具有实质性活性。

术语“受试者”、“个体”和“患者”可互换地指哺乳动物,优选人或非人灵长类动物,但也指驯养的哺乳动物(例如犬科动物或猫科动物)、实验室哺乳动物(例如小鼠、大鼠、兔子、仓鼠、豚鼠)和农业哺乳动物(例如马、牛、猪、羊)。在各实施例中,受试者可以是人(例如成年男性、成年女性、青春期男性、青春期女性、男孩、女孩)。

术语“基因转移”或“基因递送”指用于可靠地将外源DNA插入宿主细胞的方法或系统。此类方法可以引起非整合转移DNA的瞬时表达、染色体外复制和转移复制子(例如附加体)的表达,或者转移的遗传物质整合到宿主细胞的基因组DNA中。

如本文所用,术语“载体”指能够转移或运输另一种核酸分子的核酸分子。转移的核酸通常与载体核酸分子连接,例如插入。载体可包括指导细胞中自主复制或逆转录的序列,或可包括足以整合到宿主细胞DNA中的序列。“载体”包括基因治疗载体。如本文所用,术语“基因治疗载体”指能够用于进行基因治疗,例如向受试者递送编码治疗性多肽的多核苷酸序列的载体。基因治疗载体可包含编码治疗活性多肽的核酸分子(“转基因”),例如LAMP-2B或在引入受试者时可用于替代基因治疗的其他基因。有用的载体包括但不限于病毒载体。

如本文所用,术语“表达盒”指能够在适当的环境下驱动编码治疗活性多肽(例如,LAMP-2B)的多核苷酸(“转基因”)表达的DNA片段,该多肽被掺入所述表达盒中。当导入宿主细胞时,表达盒尤其能够引导细胞机制将转基因转录成RNA,然后通常对其进行进一步加工,最后转译成治疗活性多肽。表达盒可以包含在基因治疗载体中。通常,术语表达盒不包括处于5'ITR的5'端和3'ITR的3'端的多核苷酸序列。

在本说明书中引用和标识的所有专利、专利出版物和其他出版物均单独地和明确地通过整体引用并入此文,用于所有目的。

实例

实例1:使用Lamp-2B转基因变体的加强型基因表达

图2所示的基因表达盒在基于质粒的绿色荧光蛋白(GFP)报告系统中构建,用于LAMP-2B转基因表达。该质粒包括编码LAMP-2B转基因的单一开放阅读框、2A肽和加强型绿色荧光蛋白(eGFP)。2A肽的转译后自我切割引起等摩尔量的LAMP-2B和eGFP共表达。野生型LAMP-2B编码序列(SEQ ID NO:2)和LAMP-2B编码序列的三个密码子变体(分别为密码子变体1、2和3;SEQ ID NO:3至SEQ ID NO:5)作为转基因进行测试。与野生型LAMP-2B编码序列相比,这三种密码子变体含有减少的CpG、去除了隐蔽位点、减少的开放阅读框。

将CellBIND 96孔板(NUNC#3300)的四十孔在室温下用0.1%明胶水溶液(密理博(Millipore)ES-006-B)涂覆1小时。将大约88,000个诱导多能干细胞(iPSC)衍生的心肌细胞(VWR MSPP-CMC10001)在37℃和5%二氧化碳(CO

初次铺板后大约28小时,将100μL维持培养基中的这种转染混合物加入每个孔中。加入含有转染混合物的培养基后大约48小时,在自动共聚焦显微镜(Perkin ElmerOperetta CLS,Harmony版本4.5软件)上对细胞成像并分析GFP阳性细胞(图3)及其平均荧光强度(图4)。转染后两天或七天,细胞的免疫荧光图像分别如图5和图6所示。

图3示出了与野生型转基因相比,密码子变体1(“CO 1”)或2(“CO 2”)的使用引起GFP在显著更多的细胞中表达(高约9倍)。同样,图4示出了用密码子变体1(“CO 1”)或2(“CO2”)转染的细胞中的平均GFP强度比野生型高1.5倍。

实例2:优化的LAMP-2B基因治疗载体

通过将实例1所述的LAMP-2B优化的变体CO1序列插入重组AAV载体的表达盒中,产生优化的AAV基因治疗载体。AAV调控盒通过去除上游隐蔽ATG序列、使用优化的共有Kozak序列和/或全长聚腺苷酸化序列进行修饰。将这些载体与对照重组AAV载体进行比较测试,该对照重组AAV载体含有一个或多个位于转基因上游的额外ATG位点、非最优Kozak序列和/或非全长聚腺苷酸化序列。在Danon患者iPSC衍生的心肌细胞和Danon病的LAMP-2

实例3:AAV9-LAMP-2B.v1.2的体外评估

通过将LAMP-2B变体序列CO1(SEQ ID NO:3)插入重组AAV质粒载体中产生AAV基因治疗盒和载体,该重组AAV质粒载体在转基因上游没有隐蔽起始位点,具有优化的共有Kozak序列,并且具有来自兔珠蛋白的全长聚腺苷酸化(polyA)序列(“LAMP-2B.v.1.2”;表达盒:SEQ ID NO:8)。将LAMP-2B.v1.2与LAMP-2B v1.0进行比较,LAMP-2B v1.0是调控盒,具有野生型LAMP-2B转基因(转基因序列:SEQ ID NO:2)而没有最优Kozak序列和mini-polyA。

HEK293细胞用于产生具有三质粒的病毒颗粒,无辅助病毒的系统用于产生包含血清型9衣壳蛋白和病毒基因组的重组AAV颗粒,其中AAV2 ITR侧接于LAMP-2B表达盒。表达盒含有由上游嵌合“CAG”启动子驱动的人密码子优化的LAMP-2B编码序列(v1.2或v1.0),该启动子含有CMV IE增强子(CMV IE)、鸡β-肌动蛋白(CBA)启动子和CBA内含子剪接供体(图1A)。表达盒还包括下游的WPRE元件,并由兔β-球蛋白聚腺苷酸化信号(RGpA)终止。用LAMP-2B.v1.2质粒载体或LAMP-2B.v1.0质粒载体、pAAV2/9包装质粒和pAd-辅助腺病毒辅助质粒瞬时转染HEK293细胞。

将CHO-Lec2细胞以1.2×10

LAMP-2B表达还通过ELISA在细胞裂解物中定量。简而言之,将96孔板涂上抗LAMP-2B抗体(克隆:H4B4),将裂解物加入孔中,使用抗LAMP-2B多克隆抗体(1:500,宾夕法尼亚州赛默飞世尔(Thermo Fisher);5-24575)进行检测,然后用HRP结合的抗兔抗体(1:3000,西格马(Sigma))孵育。与用AAV9野生型LAMP-2B.v1.0转导的细胞相比,用AAV9优化的LAMP-2B.v1.2载体转导引起LAMP-2B表达增加大约7倍(图7B)。

心肌细胞来源于患有Danon病的个体产生的iPSC。在节律性收缩和纯度选择后,用AAV9-Luc(阴性对照)、AAV9野生型LAMP-2B.v1.0或AAV9优化的LAMP-2B.v1.2的各种病毒基因组拷贝(vg)转导Danon病心肌细胞。转导后十天,将转导的心肌细胞用4%多聚甲醛固定、透化,在5%无IgG的BSA中封闭30分钟,并与任一小鼠抗人LAMP-2B抗体孵育1小时(1:25,克隆:H4B4)或兔抗α-辅肌动蛋白抗体(1:200,#A7811,西格玛)。用1X PBS洗涤细胞以去除残留的未结合的一级抗体,然后在室温下用适当的抗小鼠AlexaFluor标记的二级抗体和200纳克/毫升DAPI处理60分钟。然后在成像前用PBS洗涤孔。与用最高滴度的AAV9野生型LAMP-2B.v.1.0(8.45×10

对转导的Danon病心肌细胞进行蛋白印迹分析。AAV9优化的LAMP-2B.v1.2在0.983×10

实例4:Danon病小鼠模型中AAV 9-LAMP-2B.v1.2的体内评价

LAMP-2缺陷小鼠静脉注射1×10

方法

对于载体拷贝数的定量分析,根据制造商的指导方针,使用DNeasy血液和组织试剂盒从冷冻组织中分离总DNA。用分光光度法评估DNA浓度和完整性。使用带有正向引物(5'-ATCATGCTATTGCTTCCCGTA-3';SEQ ID NO:36)和反向引物(5'-CCTCCTTGTATAAATCCTGGTTGCTGTCT-3';SEQ ID NO:37)以及WPRE基因探针(5'-CCTCCTTGTATAAATCCTGGTTGCTGTCT-3';SEQ IDNO:38)的TaqPath ProAmp Master Mix(应用生物系统(Applied Biosystems))进行qPCR,计算每μg DNA的病毒基因组拷贝。RNase P用作内源性对照(赛默飞世尔,#4403328)。使用包含用于病毒生产的载体基因组(WPRE)的线性化质粒产生标准曲线。使用TaqMan拷贝数参考测定法计算每个样品的DNA定量,并表示为每个二倍体核(VCN/Diploid Nucleus)的载体拷贝数。

根据制造商的规程,使用RNeasy Fibrous Tissue Mini试剂盒从心脏中提取并纯化RNA。用分光光度法评估RNA浓度和完整性。使用iScript cDNA合成试剂盒对RNA进行反转录,使用cDNA作为定量实时(qRT)-PCR的模板。使用带有正向引物(5'-ATCATGCTATTGCTTCCCGTA-3';SEQ ID NO:36)和反向引物(5'-GGGCCACAACTCCTCATAAA-3';SEQ ID NO:37)以及WPRE基因探针(5'-CCTCCTTGTATAAATCCTGGTTGCTGTCT-3';SEQ IDNO:38)的TaqPath ProAmp Master Mix(应用生物系统)对cDNA进行qRT-PCR。

对于蛋白提取,将组织快速冷冻并粉碎,然后将随后的组织粉末在含有蛋白酶抑制剂和磷酸酶抑制剂混合物的蛋白溶解缓冲液(100mM Tris、300mM NaCl、20mM EDTA、2%NP-40、0.2%SDS)中消化。将部分蛋白裂解物通过玻璃组织研磨机,并在冰上以3次5秒的脉冲进行超声治疗,间隔10秒,振幅为30微米。以12000rpm的转速将样本离心15min,然后收集上清液。通过Lowry测定法确定样品中蛋白的浓度。使用10-20%SDS-PAGE分离蛋白(20μg/样品),并通过快速干转移技术转移到PVDF膜上。然后将膜在5%牛奶(溶解于含有0.1%Tween-20的PBS中的脱脂奶粉)中封闭1h,并且与抗人LAMP-2B(1:100,H4B4)、抗小鼠LAMP-2B(1:100)或抗GAPDH(1:1000,#32233,圣克鲁斯(Santa Cruz))抗体在4℃下孵育过夜。洗涤膜,然后与合适的HRP结合的二抗(1:10,000)在室温下孵育1小时。使用WesternBright

对于免疫荧光分析,将组织在4℃30%蔗糖/PBS中进行冷冻保护,包埋在最优切割温度(OCT)固定介质中,然后在标准冷冻切片机上将组织切割至8-10μm厚。然后将冷冻切片用4%PFA固定5分钟,用0.2%Triton-X透化5分钟,并用PBS中的1%BSA、3%血清、1%冷水鱼明胶封闭30分钟。将切片与直接与Alexa Fluor 647和兔抗肌营养不良蛋白抗体直接结合的小鼠抗人LAMP-2B抗体(1:50,H4B4)在4℃孵育过夜。然后将载玻片与抗兔Alexa Fluor488二抗和DAPI(1:2000,#D9542,西格玛)在室温孵育30分钟。然后使用Olympus FluoViewFV1000共焦显微镜对载玻片成像。在给定日期采集所有图像期间,扫描速度、偏置、电压和增益保持恒定。

结果

对AAV9治疗的LAMP-2缺陷小鼠的心脏组织进行定量PCR。与AAV9野生型LAMP-2B.v1.0相比,尽管在野生型和优化的含有LAMP-2B的载体治疗的小鼠的心脏组织中观察到了相似的病毒拷贝数(图9A),AAV9优化的LAMP-2B.v1.2的转录增加了近7倍(图9B)。尽管v1.0和v1.2病毒载体在心脏组织中的转导相似,但使用v1.2显著增强了对人LAMP-2B mRNA表达的诱导。

与AAV9野生型LAMP-2B.v1.0或溶媒对照治疗的LAMP2缺陷小鼠相比,静脉注射AAV9优化的LAMP-2B.v1.2载体的LAMP-2缺陷小鼠在心脏组织中还显示出显著更高的人LAMP-2B蛋白水平(图9C)。免疫荧光染色也获得了相似的结果:在用AAV9优化的LAMP-2B.v1.2治疗的LAMP-2缺陷小鼠的心脏组织中高度诱导了人LAMP-2B(图9D)。总的来说,这些数据表明,与相同剂量的AAV9野生型LAMP-2B.v1.0相比,使用AAV9优化的LAMP-2B.v1.2载体进行的病毒转导导致体内心脏组织中人LAMP-2B蛋白的表达增加。

实例4:非人类灵长类动物AAV9-LAMP-2B.v1.2的体内评估

向非人灵长类动物静脉注射1×10

方法

对于载体拷贝数的定量分析,根据制造商的指导方针,使用Qiagen DNeasy试剂盒从冷冻组织中分离总DNA。用分光光度法评估DNA浓度和完整性。使用带有正向引物(5'-ATCATGCTATTGCTTCCCGTA-3';SEQ ID NO:36)和反向引物(5'-GGGCCACAACTCCTCATAAA-3';SEQ ID NO:37)以及WPRE基因探针(5'-CCTCCTTGTATAAATCCTGGTTGCTGTCT-3';SEQ IDNO:38)的TaqMan Universial Master Mix II(应用生物系统)对分离的DNA进行定量PCR。RNaseP用作内源性对照(#4403328,赛默飞世尔)。使用含有用于病毒生产的载体基因组的线性化质粒产生标准曲线。使用TaqMan拷贝数参考测定法计算每个样品的DNA定量,并表示为每个二倍体核(VCN/Diploid Nucleus)的载体拷贝数。

根据制造商的规程,使用RNeasy纤维组织迷你试剂盒(Qiagen)从心脏和骨骼肌中提取和纯化RNA,并使用RNeasy脂质组织试剂盒(Qiagen)从肝脏和大脑中提取和纯化RNA。使用NanoDrop分光光度计评估RNA的浓度和完整性。使用SuperScript IV VILO预混液(赛默飞世尔)对RNA进行反转录,使用cDNA作为定量实时(qRT)-PCR的模板。使用带有正向引物(5'-ATCATGCTATTGCTTCCCGTA-3';SEQ ID NO:36)和反向引物(5'-GGGCCACAACTCCTCATAAA-3';SEQ ID NO:37)以及WPRE基因探针(5'-CCTCCTTGTATAAATCCTGGTTGCTGTCT-3';SEQIDNO:38)的TaqMan Universal Master Mix II对cDNA进行qRT-PCR。人HPRT-1用作内源性对照。使用含有用于病毒生产的载体基因组的线性化质粒产生标准曲线。

对于使用RNAScope技术对mRNA进行半定量分析,将心脏组织固定在10%中性福尔马林缓冲液中,包埋在石蜡中并切片。使用WPRE-O3探针(#518628,ACD)和RNAscope 2.5LSRED检测转基因mRNA。大于1点的细胞被认为是阳性的,阳性细胞的百分比分为五类:0%、1-25%、26-50%、51-75%或100%。

对于蛋白印迹分析,使用Next Advance Bullet系统将125mg心脏组织在500μL裂解缓冲液中匀浆。使用BCA试剂盒(赛默飞世尔)测定蛋白浓度,并使用SDS-PAGE分离蛋白(50μg/样品),然后转移至硝酸纤维素膜上。然后将膜用小鼠抗人LAMP2(1:100)进行探测、洗涤、然后与结合HRP的抗小鼠抗体一起孵育。使用ECL底物和BioRad ChemiDoc MP系统显影印迹。

对于LAMP-2B ELISA,如上所述进行蛋白提取。将板涂上小鼠抗LAMP-2B抗体(克隆:H4B4,#NBP2-22217,Novus Biologicals),向每个孔中加入100μg组织裂解物,并使用抗LAMP2多克隆抗体(#AF6228,R&D Systems)进行检测,然后与结合HRP的驴抗山羊抗体(#AP180P,密理博)一起孵育。

结果

对AAV9治疗的灵长类动物的各种组织进行定量PCR。与溶媒对照相比,注射1×10

蛋白印迹分析显示,与未治疗的对照相比,用1×10

序列表

<110> 火箭制药有限公司(ROCKET PHARMACEUTICALS, LTD.)

<120> 治疗Danon病的基因治疗载体

<130> ROPA-011/01WO 329592-2071

<150> US 62/697,302

<151> 2018-07-12

<160> 38

<170> PatentIn版本3.5

<210> 1

<211> 409

<212> PRT

<213> 智人(Homo sapiens)

<400> 1

Met Val Cys Phe Arg Leu Phe Pro Val Pro Gly Ser Gly Leu Val Leu

1 5 10 15

Val Cys Leu Val Leu Gly Ala Val Arg Ser Tyr Ala Leu Glu Leu Asn

20 25 30

Leu Thr Asp Ser Glu Asn Ala Thr Cys Leu Tyr Ala Lys Trp Gln Met

35 40 45

Asn Phe Thr Val Arg Tyr Glu Thr Thr Asn Lys Thr Tyr Lys Thr Val

50 55 60

Thr Ile Ser Asp His Gly Thr Val Thr Tyr Asn Gly Ser Ile Cys Gly

65 70 75 80

Asp Asp Gln Asn Gly Pro Lys Ile Ala Val Gln Phe Gly Pro Gly Phe

85 90 95

Ser Trp Ile Ala Asn Phe Thr Lys Ala Ala Ser Thr Tyr Ser Ile Asp

100 105 110

Ser Val Ser Phe Ser Tyr Asn Thr Gly Asp Asn Thr Thr Phe Pro Asp

115 120 125

Ala Glu Asp Lys Gly Ile Leu Thr Val Asp Glu Leu Leu Ala Ile Arg

130 135 140

Ile Pro Leu Asn Asp Leu Phe Arg Cys Asn Ser Leu Ser Thr Leu Glu

145 150 155 160

Lys Asn Asp Val Val Gln His Tyr Trp Asp Val Leu Val Gln Ala Phe

165 170 175

Val Gln Asn Gly Thr Val Ser Thr Asn Glu Phe Leu Cys Asp Lys Asp

180 185 190

Lys Thr Ser Thr Val Ala Pro Thr Ile His Thr Thr Val Pro Ser Pro

195 200 205

Thr Thr Thr Pro Thr Pro Lys Glu Lys Pro Glu Ala Gly Thr Tyr Ser

210 215 220

Val Asn Asn Gly Asn Asp Thr Cys Leu Leu Ala Thr Met Gly Leu Gln

225 230 235 240

Leu Asn Ile Thr Gln Asp Lys Val Ala Ser Val Ile Asn Ile Asn Pro

245 250 255

Asn Thr Thr His Ser Thr Gly Ser Cys Arg Ser His Thr Ala Leu Leu

260 265 270

Arg Leu Asn Ser Ser Thr Ile Lys Tyr Leu Asp Phe Val Phe Ala Val

275 280 285

Lys Asn Glu Asn Arg Phe Tyr Leu Lys Glu Val Asn Ile Ser Met Tyr

290 295 300

Leu Val Asn Gly Ser Val Phe Ser Ile Ala Asn Asn Asn Leu Ser Tyr

305 310 315 320

Trp Asp Ala Pro Leu Gly Ser Ser Tyr Met Cys Asn Lys Glu Gln Thr

325 330 335

Val Ser Val Ser Gly Ala Phe Gln Ile Asn Thr Phe Asp Leu Arg Val

340 345 350

Gln Pro Phe Asn Val Thr Gln Gly Lys Tyr Ser Thr Ala Gln Glu Cys

355 360 365

Ser Leu Asp Asp Asp Thr Ile Leu Ile Pro Ile Ile Val Gly Ala Gly

370 375 380

Leu Ser Gly Leu Ile Ile Val Ile Val Ile Ala Tyr Val Ile Gly Arg

385 390 395 400

Arg Lys Ser Tyr Ala Gly Tyr Gln Thr

405

<210> 2

<211> 1233

<212> DNA

<213> 智人(Homo sapiens)

<400> 2

atggtgtgct tccgcctctt cccggttccg ggctcagggc tcgttctggt ctgcctagtc 60

ctgggagctg tgcggtctta tgcattggaa cttaatttga cagattcaga aaatgccact 120

tgcctttatg caaaatggca gatgaatttc acagttcgct atgaaactac aaataaaact 180

tataaaactg taaccatttc agaccatggc actgtgacat ataatggaag catttgtggg 240

gatgatcaga atggtcccaa aatagcagtg cagttcggac ctggcttttc ctggattgcg 300

aattttacca aggcagcatc tacttattca attgacagcg tctcattttc ctacaacact 360

ggtgataaca caacatttcc tgatgctgaa gataaaggaa ttcttactgt tgatgaactt 420

ttggccatca gaattccatt gaatgacctt tttagatgca atagtttatc aactttggaa 480

aagaatgatg ttgtccaaca ctactgggat gttcttgtac aagcttttgt ccaaaatggc 540

acagtgagca caaatgagtt cctgtgtgat aaagacaaaa cttcaacagt ggcacccacc 600

atacacacca ctgtgccatc tcctactaca acacctactc caaaggaaaa accagaagct 660

ggaacctatt cagttaataa tggcaatgat acttgtctgc tggctaccat ggggctgcag 720

ctgaacatca ctcaggataa ggttgcttca gttattaaca tcaaccccaa tacaactcac 780

tccacaggca gctgccgttc tcacactgct ctacttagac tcaatagcag caccattaag 840

tatctagact ttgtctttgc tgtgaaaaat gaaaaccgat tttatctgaa ggaagtgaac 900

atcagcatgt atttggttaa tggctccgtt ttcagcattg caaataacaa tctcagctac 960

tgggatgccc ccctgggaag ttcttatatg tgcaacaaag agcagactgt ttcagtgtct 1020

ggagcatttc agataaatac ctttgatcta agggttcagc ctttcaatgt gacacaagga 1080

aagtattcta cagcccaaga gtgttcgctg gatgatgaca ccattctaat cccaattata 1140

gttggtgctg gtctttcagg cttgattatc gttatagtga ttgcttacgt aattggcaga 1200

agaaaaagtt atgctggata tcagactctg taa 1233

<210> 3

<211> 1233

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> LAMP-2变体

<400> 3

atggtctgct tcagactgtt ccctgtccct ggatctggtc tggtgcttgt gtgcttggtg 60

ctgggtgctg tgagatccta tgcccttgag ctgaacctga ctgactcaga aaatgccact 120

tgcctgtatg ccaagtggca gatgaacttc actgtgagat atgagactac caacaagacc 180

tacaagactg tgaccatctc agaccatggc actgtcacct acaatggatc aatctgtggt 240

gatgatcaga atggcccaaa gatagcagtg cagtttgggc ccggtttttc ctggattgct 300

aacttcacca aggcagcctc cacctacagc attgactcag tcagcttcag ctacaacact 360

ggggataaca ccaccttccc tgacgcagag gacaagggaa tccttactgt ggacgaactc 420

ctggcaatca gaatccccct taacgacctg ttcagatgca actccctttc aacccttgaa 480

aagaatgatg tggtgcaaca ctattgggac gtcctggtgc aagcctttgt gcagaatggg 540

acagtgagta ccaacgagtt cctctgtgac aaggacaaga ccagcactgt ggcccccact 600

atccacacca ctgtgcccag ccctaccact acccccaccc ctaaagagaa gccagaagct 660

ggaacctact cagtcaacaa tggaaatgac acatgcctcc ttgccaccat gggactgcag 720

ctgaacatca ctcaggacaa ggtggcctca gtgattaaca tcaaccctaa caccactcat 780

agcactggga gctgcagatc acatacagct ctgctgaggc tcaactcctc caccatcaag 840

tacctggact ttgtgtttgc tgtgaagaat gagaacaggt tctacctcaa ggaagtgaac 900

atttccatgt acctggtcaa tggttcagtg ttctctattg ccaacaacaa tctgagctac 960

tgggatgcac ccctgggatc ctcctacatg tgcaacaagg agcagactgt gagtgtgtca 1020

ggtgcttttc agatcaacac ttttgacctg agggtgcagc ccttcaatgt gactcaggga 1080

aagtactcca ctgcacaaga gtgttccttg gatgatgaca ctatcctcat ccccattatt 1140

gtgggagctg gactgtcagg attgattata gtgattgtga ttgcttatgt gattggaagg 1200

agaaagagct atgctggcta ccagaccctg taa 1233

<210> 4

<211> 1233

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> LAMP-2变体

<400> 4

atggtgtgct ttagactgtt tcctgtgcct ggttcagggc tggtcctggt ctgtctggtg 60

ctgggggctg tcagaagcta tgccttggag ctgaacctca ctgatagtga aaatgccact 120

tgtctgtatg ctaagtggca gatgaacttc actgtgagat atgaaaccac caacaagact 180

tacaaaacag tgaccatctc agatcatgga actgtgacct acaacggcag catttgtgga 240

gacgaccaga acggaccaaa aatcgctgtc caatttgggc ctggattctc ctggattgcc 300

aatttcacta aagctgcctc cacatattca attgactcag tgtccttctc ctacaacact 360

ggggacaaca ctactttccc tgatgctgaa gataagggaa tcttgacagt ggatgagctg 420

ctggctatca ggatcccttt gaatgacctg tttaggtgta attcactgag cactctggag 480

aagaacgacg tggtgcagca ctactgggac gtgctggtgc aggcctttgt gcagaacggc 540

actgtgtcca ccaacgaatt cctgtgtgat aaggacaaaa cttccactgt ggcacctaca 600

attcacacta ctgtgccttc acctaccacc actccaactc caaaggaaaa gcctgaagca 660

ggaacctact ctgtgaacaa tggcaatgat acctgtctgt tggccaccat gggcctccaa 720

ctgaacatta ctcaggacaa ggtggcctca gtgattaaca ttaaccccaa cactacccac 780

tccactggca gctgtagatc acacacagcc ttgctcagac tgaatagcag caccatcaag 840

tatttggatt ttgtgtttgc agtgaagaat gaaaacaggt tctacctgaa ggaagtcaac 900

atctcaatgt acctggtgaa cggctcagtg ttcagcattg ccaacaacaa cctctcctat 960

tgggacgctc cactggggag cagctacatg tgtaacaagg aacagactgt gtcagtgtca 1020

ggagccttcc agattaacac ctttgatctg agggtccaac cctttaatgt cactcaagga 1080

aagtatagca ctgcccagga gtgctccctg gatgatgaca ccattctgat tccaatcatt 1140

gtgggtgcag gactttctgg gcttattatt gtgattgtga ttgcctatgt gattggcaga 1200

aggaaatcct atgcagggta ccaaactctg taa 1233

<210> 5

<211> 1233

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> LAMP-2变体

<400> 5

atggtctgtt ttaggctgtt ccctgtccct ggttcaggac tggtcttagt gtgtctggtg 60

cttggagctg tcagaagcta tgccctggag ctgaacctga ctgactcaga aaatgccact 120

tgcctgtatg ccaagtggca gatgaacttc actgtcagat atgaaaccac caacaagacc 180

tataagactg tgaccatctc agaccatggc actgtgactt acaatgggtc aatttgtgga 240

gatgaccaga atggccctaa gatagctgtc cagtttggtc caggattcag ctggattgcc 300

aacttcacca aggcagccag cacctacagc attgactctg tgtccttctc ctacaacaca 360

ggagacaaca ccactttccc tgatgcagag gacaaaggta tcctgactgt ggatgagttg 420

ctggcaatca ggatcccact gaacgatctg ttcaggtgca actcactgtc cactctggaa 480

aagaatgatg tggtgcagca ctattgggat gtgctagtcc aggcctttgt ccagaatggg 540

actgtgtcaa ctaatgagtt cctgtgtgac aaggacaaga caagcactgt agcccccact 600

atccatacca cagtacctag ccccaccact actccaaccc ccaaggagaa gcctgaggct 660

ggcacctact cagtgaacaa tgggaatgac acctgtttgc tggccactat gggactccaa 720

ctgaacatca cccaggacaa agtggcctct gtgatcaata tcaatcccaa caccacccac 780

agcactgggt cctgcagaag ccacactgcc ctcctgaggc tcaactcatc aactatcaag 840

tacttggatt ttgtgtttgc agtgaagaat gagaacagat tctacctcaa agaggtcaac 900

atttcaatgt acctggtgaa tgggagtgtg ttctccattg ctaacaacaa cctgagctac 960

tgggatgccc ctctgggctc ctcatacatg tgcaacaagg aacagactgt gagtgtgtca 1020

ggggccttcc agatcaacac ttttgacctg agagtgcagc cctttaatgt gacacaggga 1080

aagtacagca ctgctcagga gtgcagcctg gatgatgaca ctatcctgat ccctatcatt 1140

gtgggggcag gcctgtctgg actcattatt gtgattgtga ttgcctatgt gatagggaga 1200

aggaagtctt atgctggata ccagaccctg taa 1233

<210> 6

<211> 13

<212> DNA

<213> 未知(Unknown)

<220>

<223> Kozak序列

<400> 6

gccgccacca tgg 13

<210> 7

<211> 387

<212> DNA

<213> 未知(Unknown)

<220>

<223> 全长polyA序列

<400> 7

tggctaataa aggaaattta ttttcattgc aatagtgtgt tggaattttt tgtgtctctc 60

actcggaagg acatatggga gggcaaatca tttaaaacat cagaatgagt atttggttta 120

gagtttggca acatatgccc atatgctggc tgccatgaac aaaggttggc tataaagagg 180

tcatcagtat atgaaacagc cccctgctgt ccattcctta ttccatagaa aagccttgac 240

ttgaggttag atttttttta tattttgttt tgtgttattt ttttctttaa catccctaaa 300

attttcctta catgttttac tagccagatt tttcctcctc tcctgactac tcccagtcat 360

agctgtccct cttctcttat ggagatc 387

<210> 8

<211> 4549

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 表达盒

<400> 8

ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60

ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120

aggggttcct tgtagttaat gattaacccg ccatgctact tatctaccag ggtaatgggg 180

atcctctaga actatagcta gtcgacattg attattgact agttattaat agtaatcaat 240

tacggggtca ttagttcata gcccatatat ggagttccgc gttacataac ttacggtaaa 300

tggcccgcct ggctgaccgc ccaacgaccc ccgcccattg acgtcaataa tgacgtatgt 360

tcccatagta acgccaatag ggactttcca ttgacgtcaa tgggtggagt atttacggta 420

aactgcccac ttggcagtac atcaagtgta tcatatgcca agtacgcccc ctattgacgt 480

caatgacggt aaatggcccg cctggcatta tgcccagtac atgaccttat gggactttcc 540

tacttggcag tacatctacg tattagtcat cgctattacc atggtcgagg tgagccccac 600

gttctgcttc actctcccca tctccccccc ctccccaccc ccaattttgt atttatttat 660

tttttaatta ttttgtgcag cgatgggggc gggggggggg ggggggcgcg cgccaggcgg 720

ggcggggcgg ggcgaggggc ggggcggggc gaggcggaga ggtgcggcgg cagccaatca 780

gagcggcgcg ctccgaaagt ttccttttat ggcgaggcgg cggcggcggc ggccctataa 840

aaagcgaagc gcgcggcggg cgggagtcgc tgcgcgctgc cttcgccccg tgccccgctc 900

cgccgccgcc tcgcgccgcc cgccccggct ctgactgacc gcgttactcc cacaggtgag 960

cgggcgggac ggcccttctc ctccgggctg taattagcgc ttggtttaat gacggcttgt 1020

ttcttttctg tggctgcgtg aaagccttga ggggctccgg gagggccctt tgtgcggggg 1080

gagcggctcg gggggtgcgt gcgtgtgtgt gtgcgtgggg agcgccgcgt gcggctccgc 1140

gctgcccggc ggctgtgagc gctgcgggcg cggcgcgggg ctttgtgcgc tccgcagtgt 1200

gcgcgagggg agcgcggccg ggggcggtgc cccgcggtgc ggggggggct gcgaggggaa 1260

caaaggctgc gtgcggggtg tgtgcgtggg ggggtgagca gggggtgtgg gcgcgtcggt 1320

cgggctgcaa ccccccctgc acccccctcc ccgagttgct gagcacggcc cggcttcggg 1380

tgcggggctc cgtacggggc gtggcgcggg gctcgccgtg ccgggcgggg ggtggcggca 1440

ggtgggggtg ccgggcgggg cggggccgcc tcgggccggg gagggctcgg gggaggggcg 1500

cggcggcccc cggagcgccg gcggctgtcg aggcgcggcg agccgcagcc attgcctttt 1560

atggtaatcg tgcgagaggg cgcagggact tcctttgtcc caaatctgtg cggagccgaa 1620

atctgggagg cgccgccgca ccccctctag cgggcgcggg gcgaagcggt gcggcgccgg 1680

caggaaggaa atgggcgggg agggccttcg tgcgtcgccg cgccgccgtc cccttctccc 1740

tctccagcct cggggctgtc cgcgggggga cggctgcctt cgggggggac ggggcagggc 1800

ggggttcggc ttctggcgtg tgaccggcgg ctctagagcc tctgctaacc atgttcatgc 1860

cttcttcttt ttcctacagc tcctgggcaa cgtgctggtt attgtgctgt ctcatcattt 1920

tggcaaagaa ttcgagcggc cgccagccgc caccatggtc tgcttcagac tgttccctgt 1980

ccctggatct ggtctggtgc ttgtgtgctt ggtgctgggt gctgtgagat cctatgccct 2040

tgagctgaac ctgactgact cagaaaatgc cacttgcctg tatgccaagt ggcagatgaa 2100

cttcactgtg agatatgaga ctaccaacaa gacctacaag actgtgacca tctcagacca 2160

tggcactgtc acctacaatg gatcaatctg tggtgatgat cagaatggcc caaagatagc 2220

agtgcagttt gggcccggtt tttcctggat tgctaacttc accaaggcag cctccaccta 2280

cagcattgac tcagtcagct tcagctacaa cactggggat aacaccacct tccctgacgc 2340

agaggacaag ggaatcctta ctgtggacga actcctggca atcagaatcc cccttaacga 2400

cctgttcaga tgcaactccc tttcaaccct tgaaaagaat gatgtggtgc aacactattg 2460

ggacgtcctg gtgcaagcct ttgtgcagaa tgggacagtg agtaccaacg agttcctctg 2520

tgacaaggac aagaccagca ctgtggcccc cactatccac accactgtgc ccagccctac 2580

cactaccccc acccctaaag agaagccaga agctggaacc tactcagtca acaatggaaa 2640

tgacacatgc ctccttgcca ccatgggact gcagctgaac atcactcagg acaaggtggc 2700

ctcagtgatt aacatcaacc ctaacaccac tcatagcact gggagctgca gatcacatac 2760

agctctgctg aggctcaact cctccaccat caagtacctg gactttgtgt ttgctgtgaa 2820

gaatgagaac aggttctacc tcaaggaagt gaacatttcc atgtacctgg tcaatggttc 2880

agtgttctct attgccaaca acaatctgag ctactgggat gcacccctgg gatcctccta 2940

catgtgcaac aaggagcaga ctgtgagtgt gtcaggtgct tttcagatca acacttttga 3000

cctgagggtg cagcccttca atgtgactca gggaaagtac tccactgcac aagagtgttc 3060

cttggatgat gacactatcc tcatccccat tattgtggga gctggactgt caggattgat 3120

tatagtgatt gtgattgctt atgtgattgg aaggagaaag agctatgctg gctaccagac 3180

cctgtaaaag ggcgaattcc agcacacgcg tcctaggagc tcgagtacta ctggcggccg 3240

ttactagtgg atccgcggta caagtaagca tgcaagcttc gaggacgggg tgaactacgc 3300

ctgaatcaag cttatcgata aattcgagca tcttaccgcc atttattccc atatttgttc 3360

tgtttttctt gatttgggta tacatttaaa tgttaataaa acaaaatggt ggggcaatca 3420

tttacatttt tagggatatg taattactag ttcaggtgta ttgccacaag acaaacatgt 3480

taagaaactt tcccgttatt tacgctctgt tcctgttaat caacctctgg attacaaaat 3540

ttgtgaaaga ttgactgata ttcttaacta tgttgctcct tttacgctgt gtggatatgc 3600

tgctttaatg cctctgtatc atgctattgc ttcccgtacg gctttcgttt tctcctcctt 3660

gtataaatcc tggttgctgt ctctttatga ggagttgtgg cccgttgtcc gtcaacgtgg 3720

cgtggtgtgc tctgtgtttg ctgacgcaac ccccactggc tggggcattg ccaccacctg 3780

tcaactcctt tctgggactt tcgctttccc cctcccgatc gccacggcag aactcatcgc 3840

cgcctgcctt gcccgctgct ggacaggggc taggttgctg ggcactgata attccgtggt 3900

gttgtcgggg aagggcctcg ataccgtcga tatcgatcct ggctaataaa ggaaatttat 3960

tttcattgca atagtgtgtt ggaatttttt gtgtctctca ctcggaagga catatgggag 4020

ggcaaatcat ttaaaacatc agaatgagta tttggtttag agtttggcaa catatgccca 4080

tatgctggct gccatgaaca aaggttggct ataaagaggt catcagtata tgaaacagcc 4140

ccctgctgtc cattccttat tccatagaaa agccttgact tgaggttaga ttttttttat 4200

attttgtttt gtgttatttt tttctttaac atccctaaaa ttttccttac atgttttact 4260

agccagattt ttcctcctct cctgactact cccagtcata gctgtccctc ttctcttatg 4320

gagatcgaag caattcgttg atctgaattt cgaccaccca taatagatct cccattaccc 4380

tggtagataa gtagcatggc gggttaatca ttaactacaa ggaaccccta gtgatggagt 4440

tggccactcc ctctctgcgc gctcgctcgc tcactgaggc cgggcgacca aaggtcgccc 4500

gacgcccggg ctttgcccgg gcggcctcag tgagcgagcg agcgcgcag 4549

<210> 9

<211> 4549

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 表达盒

<400> 9

ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60

ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120

aggggttcct tgtagttaat gattaacccg ccatgctact tatctaccag ggtaatgggg 180

atcctctaga actatagcta gtcgacattg attattgact agttattaat agtaatcaat 240

tacggggtca ttagttcata gcccatatat ggagttccgc gttacataac ttacggtaaa 300

tggcccgcct ggctgaccgc ccaacgaccc ccgcccattg acgtcaataa tgacgtatgt 360

tcccatagta acgccaatag ggactttcca ttgacgtcaa tgggtggagt atttacggta 420

aactgcccac ttggcagtac atcaagtgta tcatatgcca agtacgcccc ctattgacgt 480

caatgacggt aaatggcccg cctggcatta tgcccagtac atgaccttat gggactttcc 540

tacttggcag tacatctacg tattagtcat cgctattacc atggtcgagg tgagccccac 600

gttctgcttc actctcccca tctccccccc ctccccaccc ccaattttgt atttatttat 660

tttttaatta ttttgtgcag cgatgggggc gggggggggg ggggggcgcg cgccaggcgg 720

ggcggggcgg ggcgaggggc ggggcggggc gaggcggaga ggtgcggcgg cagccaatca 780

gagcggcgcg ctccgaaagt ttccttttat ggcgaggcgg cggcggcggc ggccctataa 840

aaagcgaagc gcgcggcggg cgggagtcgc tgcgcgctgc cttcgccccg tgccccgctc 900

cgccgccgcc tcgcgccgcc cgccccggct ctgactgacc gcgttactcc cacaggtgag 960

cgggcgggac ggcccttctc ctccgggctg taattagcgc ttggtttaat gacggcttgt 1020

ttcttttctg tggctgcgtg aaagccttga ggggctccgg gagggccctt tgtgcggggg 1080

gagcggctcg gggggtgcgt gcgtgtgtgt gtgcgtgggg agcgccgcgt gcggctccgc 1140

gctgcccggc ggctgtgagc gctgcgggcg cggcgcgggg ctttgtgcgc tccgcagtgt 1200

gcgcgagggg agcgcggccg ggggcggtgc cccgcggtgc ggggggggct gcgaggggaa 1260

caaaggctgc gtgcggggtg tgtgcgtggg ggggtgagca gggggtgtgg gcgcgtcggt 1320

cgggctgcaa ccccccctgc acccccctcc ccgagttgct gagcacggcc cggcttcggg 1380

tgcggggctc cgtacggggc gtggcgcggg gctcgccgtg ccgggcgggg ggtggcggca 1440

ggtgggggtg ccgggcgggg cggggccgcc tcgggccggg gagggctcgg gggaggggcg 1500

cggcggcccc cggagcgccg gcggctgtcg aggcgcggcg agccgcagcc attgcctttt 1560

atggtaatcg tgcgagaggg cgcagggact tcctttgtcc caaatctgtg cggagccgaa 1620

atctgggagg cgccgccgca ccccctctag cgggcgcggg gcgaagcggt gcggcgccgg 1680

caggaaggaa atgggcgggg agggccttcg tgcgtcgccg cgccgccgtc cccttctccc 1740

tctccagcct cggggctgtc cgcgggggga cggctgcctt cgggggggac ggggcagggc 1800

ggggttcggc ttctggcgtg tgaccggcgg ctctagagcc tctgctaacc atgttcatgc 1860

cttcttcttt ttcctacagc tcctgggcaa cgtgctggtt attgtgctgt ctcatcattt 1920

tggcaaagaa ttcgagcggc cgccagccgc caccatggtg tgctttagac tgtttcctgt 1980

gcctggttca gggctggtcc tggtctgtct ggtgctgggg gctgtcagaa gctatgcctt 2040

ggagctgaac ctcactgata gtgaaaatgc cacttgtctg tatgctaagt ggcagatgaa 2100

cttcactgtg agatatgaaa ccaccaacaa gacttacaaa acagtgacca tctcagatca 2160

tggaactgtg acctacaacg gcagcatttg tggagacgac cagaacggac caaaaatcgc 2220

tgtccaattt gggcctggat tctcctggat tgccaatttc actaaagctg cctccacata 2280

ttcaattgac tcagtgtcct tctcctacaa cactggggac aacactactt tccctgatgc 2340

tgaagataag ggaatcttga cagtggatga gctgctggct atcaggatcc ctttgaatga 2400

cctgtttagg tgtaattcac tgagcactct ggagaagaac gacgtggtgc agcactactg 2460

ggacgtgctg gtgcaggcct ttgtgcagaa cggcactgtg tccaccaacg aattcctgtg 2520

tgataaggac aaaacttcca ctgtggcacc tacaattcac actactgtgc cttcacctac 2580

caccactcca actccaaagg aaaagcctga agcaggaacc tactctgtga acaatggcaa 2640

tgatacctgt ctgttggcca ccatgggcct ccaactgaac attactcagg acaaggtggc 2700

ctcagtgatt aacattaacc ccaacactac ccactccact ggcagctgta gatcacacac 2760

agccttgctc agactgaata gcagcaccat caagtatttg gattttgtgt ttgcagtgaa 2820

gaatgaaaac aggttctacc tgaaggaagt caacatctca atgtacctgg tgaacggctc 2880

agtgttcagc attgccaaca acaacctctc ctattgggac gctccactgg ggagcagcta 2940

catgtgtaac aaggaacaga ctgtgtcagt gtcaggagcc ttccagatta acacctttga 3000

tctgagggtc caacccttta atgtcactca aggaaagtat agcactgccc aggagtgctc 3060

cctggatgat gacaccattc tgattccaat cattgtgggt gcaggacttt ctgggcttat 3120

tattgtgatt gtgattgcct atgtgattgg cagaaggaaa tcctatgcag ggtaccaaac 3180

tctgtaaaag ggcgaattcc agcacacgcg tcctaggagc tcgagtacta ctggcggccg 3240

ttactagtgg atccgcggta caagtaagca tgcaagcttc gaggacgggg tgaactacgc 3300

ctgaatcaag cttatcgata aattcgagca tcttaccgcc atttattccc atatttgttc 3360

tgtttttctt gatttgggta tacatttaaa tgttaataaa acaaaatggt ggggcaatca 3420

tttacatttt tagggatatg taattactag ttcaggtgta ttgccacaag acaaacatgt 3480

taagaaactt tcccgttatt tacgctctgt tcctgttaat caacctctgg attacaaaat 3540

ttgtgaaaga ttgactgata ttcttaacta tgttgctcct tttacgctgt gtggatatgc 3600

tgctttaatg cctctgtatc atgctattgc ttcccgtacg gctttcgttt tctcctcctt 3660

gtataaatcc tggttgctgt ctctttatga ggagttgtgg cccgttgtcc gtcaacgtgg 3720

cgtggtgtgc tctgtgtttg ctgacgcaac ccccactggc tggggcattg ccaccacctg 3780

tcaactcctt tctgggactt tcgctttccc cctcccgatc gccacggcag aactcatcgc 3840

cgcctgcctt gcccgctgct ggacaggggc taggttgctg ggcactgata attccgtggt 3900

gttgtcgggg aagggcctcg ataccgtcga tatcgatcct ggctaataaa ggaaatttat 3960

tttcattgca atagtgtgtt ggaatttttt gtgtctctca ctcggaagga catatgggag 4020

ggcaaatcat ttaaaacatc agaatgagta tttggtttag agtttggcaa catatgccca 4080

tatgctggct gccatgaaca aaggttggct ataaagaggt catcagtata tgaaacagcc 4140

ccctgctgtc cattccttat tccatagaaa agccttgact tgaggttaga ttttttttat 4200

attttgtttt gtgttatttt tttctttaac atccctaaaa ttttccttac atgttttact 4260

agccagattt ttcctcctct cctgactact cccagtcata gctgtccctc ttctcttatg 4320

gagatcgaag caattcgttg atctgaattt cgaccaccca taatagatct cccattaccc 4380

tggtagataa gtagcatggc gggttaatca ttaactacaa ggaaccccta gtgatggagt 4440

tggccactcc ctctctgcgc gctcgctcgc tcactgaggc cgggcgacca aaggtcgccc 4500

gacgcccggg ctttgcccgg gcggcctcag tgagcgagcg agcgcgcag 4549

<210> 10

<211> 4549

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 表达盒

<400> 10

ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60

ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120

aggggttcct tgtagttaat gattaacccg ccatgctact tatctaccag ggtaatgggg 180

atcctctaga actatagcta gtcgacattg attattgact agttattaat agtaatcaat 240

tacggggtca ttagttcata gcccatatat ggagttccgc gttacataac ttacggtaaa 300

tggcccgcct ggctgaccgc ccaacgaccc ccgcccattg acgtcaataa tgacgtatgt 360

tcccatagta acgccaatag ggactttcca ttgacgtcaa tgggtggagt atttacggta 420

aactgcccac ttggcagtac atcaagtgta tcatatgcca agtacgcccc ctattgacgt 480

caatgacggt aaatggcccg cctggcatta tgcccagtac atgaccttat gggactttcc 540

tacttggcag tacatctacg tattagtcat cgctattacc atggtcgagg tgagccccac 600

gttctgcttc actctcccca tctccccccc ctccccaccc ccaattttgt atttatttat 660

tttttaatta ttttgtgcag cgatgggggc gggggggggg ggggggcgcg cgccaggcgg 720

ggcggggcgg ggcgaggggc ggggcggggc gaggcggaga ggtgcggcgg cagccaatca 780

gagcggcgcg ctccgaaagt ttccttttat ggcgaggcgg cggcggcggc ggccctataa 840

aaagcgaagc gcgcggcggg cgggagtcgc tgcgcgctgc cttcgccccg tgccccgctc 900

cgccgccgcc tcgcgccgcc cgccccggct ctgactgacc gcgttactcc cacaggtgag 960

cgggcgggac ggcccttctc ctccgggctg taattagcgc ttggtttaat gacggcttgt 1020

ttcttttctg tggctgcgtg aaagccttga ggggctccgg gagggccctt tgtgcggggg 1080

gagcggctcg gggggtgcgt gcgtgtgtgt gtgcgtgggg agcgccgcgt gcggctccgc 1140

gctgcccggc ggctgtgagc gctgcgggcg cggcgcgggg ctttgtgcgc tccgcagtgt 1200

gcgcgagggg agcgcggccg ggggcggtgc cccgcggtgc ggggggggct gcgaggggaa 1260

caaaggctgc gtgcggggtg tgtgcgtggg ggggtgagca gggggtgtgg gcgcgtcggt 1320

cgggctgcaa ccccccctgc acccccctcc ccgagttgct gagcacggcc cggcttcggg 1380

tgcggggctc cgtacggggc gtggcgcggg gctcgccgtg ccgggcgggg ggtggcggca 1440

ggtgggggtg ccgggcgggg cggggccgcc tcgggccggg gagggctcgg gggaggggcg 1500

cggcggcccc cggagcgccg gcggctgtcg aggcgcggcg agccgcagcc attgcctttt 1560

atggtaatcg tgcgagaggg cgcagggact tcctttgtcc caaatctgtg cggagccgaa 1620

atctgggagg cgccgccgca ccccctctag cgggcgcggg gcgaagcggt gcggcgccgg 1680

caggaaggaa atgggcgggg agggccttcg tgcgtcgccg cgccgccgtc cccttctccc 1740

tctccagcct cggggctgtc cgcgggggga cggctgcctt cgggggggac ggggcagggc 1800

ggggttcggc ttctggcgtg tgaccggcgg ctctagagcc tctgctaacc atgttcatgc 1860

cttcttcttt ttcctacagc tcctgggcaa cgtgctggtt attgtgctgt ctcatcattt 1920

tggcaaagaa ttcgagcggc cgccagccgc caccatggtc tgttttaggc tgttccctgt 1980

ccctggttca ggactggtct tagtgtgtct ggtgcttgga gctgtcagaa gctatgccct 2040

ggagctgaac ctgactgact cagaaaatgc cacttgcctg tatgccaagt ggcagatgaa 2100

cttcactgtc agatatgaaa ccaccaacaa gacctataag actgtgacca tctcagacca 2160

tggcactgtg acttacaatg ggtcaatttg tggagatgac cagaatggcc ctaagatagc 2220

tgtccagttt ggtccaggat tcagctggat tgccaacttc accaaggcag ccagcaccta 2280

cagcattgac tctgtgtcct tctcctacaa cacaggagac aacaccactt tccctgatgc 2340

agaggacaaa ggtatcctga ctgtggatga gttgctggca atcaggatcc cactgaacga 2400

tctgttcagg tgcaactcac tgtccactct ggaaaagaat gatgtggtgc agcactattg 2460

ggatgtgcta gtccaggcct ttgtccagaa tgggactgtg tcaactaatg agttcctgtg 2520

tgacaaggac aagacaagca ctgtagcccc cactatccat accacagtac ctagccccac 2580

cactactcca acccccaagg agaagcctga ggctggcacc tactcagtga acaatgggaa 2640

tgacacctgt ttgctggcca ctatgggact ccaactgaac atcacccagg acaaagtggc 2700

ctctgtgatc aatatcaatc ccaacaccac ccacagcact gggtcctgca gaagccacac 2760

tgccctcctg aggctcaact catcaactat caagtacttg gattttgtgt ttgcagtgaa 2820

gaatgagaac agattctacc tcaaagaggt caacatttca atgtacctgg tgaatgggag 2880

tgtgttctcc attgctaaca acaacctgag ctactgggat gcccctctgg gctcctcata 2940

catgtgcaac aaggaacaga ctgtgagtgt gtcaggggcc ttccagatca acacttttga 3000

cctgagagtg cagcccttta atgtgacaca gggaaagtac agcactgctc aggagtgcag 3060

cctggatgat gacactatcc tgatccctat cattgtgggg gcaggcctgt ctggactcat 3120

tattgtgatt gtgattgcct atgtgatagg gagaaggaag tcttatgctg gataccagac 3180

cctgtaaaag ggcgaattcc agcacacgcg tcctaggagc tcgagtacta ctggcggccg 3240

ttactagtgg atccgcggta caagtaagca tgcaagcttc gaggacgggg tgaactacgc 3300

ctgaatcaag cttatcgata aattcgagca tcttaccgcc atttattccc atatttgttc 3360

tgtttttctt gatttgggta tacatttaaa tgttaataaa acaaaatggt ggggcaatca 3420

tttacatttt tagggatatg taattactag ttcaggtgta ttgccacaag acaaacatgt 3480

taagaaactt tcccgttatt tacgctctgt tcctgttaat caacctctgg attacaaaat 3540

ttgtgaaaga ttgactgata ttcttaacta tgttgctcct tttacgctgt gtggatatgc 3600

tgctttaatg cctctgtatc atgctattgc ttcccgtacg gctttcgttt tctcctcctt 3660

gtataaatcc tggttgctgt ctctttatga ggagttgtgg cccgttgtcc gtcaacgtgg 3720

cgtggtgtgc tctgtgtttg ctgacgcaac ccccactggc tggggcattg ccaccacctg 3780

tcaactcctt tctgggactt tcgctttccc cctcccgatc gccacggcag aactcatcgc 3840

cgcctgcctt gcccgctgct ggacaggggc taggttgctg ggcactgata attccgtggt 3900

gttgtcgggg aagggcctcg ataccgtcga tatcgatcct ggctaataaa ggaaatttat 3960

tttcattgca atagtgtgtt ggaatttttt gtgtctctca ctcggaagga catatgggag 4020

ggcaaatcat ttaaaacatc agaatgagta tttggtttag agtttggcaa catatgccca 4080

tatgctggct gccatgaaca aaggttggct ataaagaggt catcagtata tgaaacagcc 4140

ccctgctgtc cattccttat tccatagaaa agccttgact tgaggttaga ttttttttat 4200

attttgtttt gtgttatttt tttctttaac atccctaaaa ttttccttac atgttttact 4260

agccagattt ttcctcctct cctgactact cccagtcata gctgtccctc ttctcttatg 4320

gagatcgaag caattcgttg atctgaattt cgaccaccca taatagatct cccattaccc 4380

tggtagataa gtagcatggc gggttaatca ttaactacaa ggaaccccta gtgatggagt 4440

tggccactcc ctctctgcgc gctcgctcgc tcactgaggc cgggcgacca aaggtcgccc 4500

gacgcccggg ctttgcccgg gcggcctcag tgagcgagcg agcgcgcag 4549

<210> 11

<211> 130

<212> DNA

<213> 未知(Unknown)

<220>

<223> 反向末端重复(ITR)序列

<400> 11

ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60

ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120

aggggttcct 130

<210> 12

<211> 130

<212> DNA

<213> 未知(Unknown)

<220>

<223> 反向末端重复(ITR)序列

<400> 12

aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60

ccgggcgacc aaaggtcgcc cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc 120

gagcgcgcag 130

<210> 13

<400> 13

000

<210> 14

<211> 13

<212> RNA

<213> 未知(Unknown)

<220>

<223> 选择性Kozak序列

<220>

<221> misc_feature

<222> (1)..(3)

<223> 可能缺失

<220>

<221> misc_feature

<222> (1)..(1)

<223> g是最常见的碱基,但可能会有所不同

<220>

<221> misc_feature

<222> (2)..(3)

<223> c是最常见的碱基,但可能会有所不同

<220>

<221> misc_feature

<222> (4)..(4)

<223> g是最常见的碱基,但可能会有所不同

<220>

<221> misc_feature

<222> (5)..(6)

<223> c是最常见的碱基,但可能会有所不同

<220>

<221> misc_feature

<222> (8)..(9)

<223> c是最常见的碱基,但可能会有所不同

<400> 14

nnnnnnrnna ugg 13

<210> 15

<211> 8

<212> RNA

<213> 未知(Unknown)

<220>

<223> 选择性Kozak序列

<220>

<221> misc_feature

<222> (3)..(4)

<223> n是a、c、g或u

<220>

<221> misc_feature

<222> (8)..(8)

<223> n是a、c、g或u

<400> 15

agnnaugn 8

<210> 16

<211> 7

<212> RNA

<213> 未知(Unknown)

<220>

<223> 选择性Kozak序列

<220>

<221> misc_feature

<222> (2)..(3)

<223> n是a、c、g或u

<400> 16

annaugg 7

<210> 17

<211> 7

<212> RNA

<213> 未知(Unknown)

<220>

<223> 选择性Kozak序列

<400> 17

accaugg 7

<210> 18

<211> 10

<212> RNA

<213> 未知(Unknown)

<220>

<223> 选择性Kozak序列

<400> 18

gacaccaugg 10

<210> 19

<211> 235

<212> DNA

<213> 牛(Bos taurus)

<400> 19

tcgactgtgc cttctagttg ccagccatct gttgtttgcc cctcccccgt gccttccttg 60

accctggaag gtgccactcc cactgtcctt tcctaataaa atgaggaaat tgcatcgcat 120

tgtctgagta ggtgtcattc tattctgggg ggtggggtgg ggcaggacag caagggggag 180

gattgggagg acaatagcag gcatgctggg gatgcggtgg gctctatggc ttctg 235

<210> 20

<211> 222

<212> DNA

<213> 猿猴病毒40(Simian virus 40)

<400> 20

cagacatgat aagatacatt gatgagtttg gacaaaccac aactagaatg cagtgaaaaa 60

aatgctttat ttgtgaaatt tgtgatgcta ttgctttatt tgtaaccatt ataagctgca 120

ataaacaagt taacaacaac aattgcattc attttatgtt tcaggttcag ggggagatgt 180

gggaggtttt ttaaagcaag taaaacctct acaaatgtgg ta 222

<210> 21

<211> 202

<212> DNA

<213> 智人(Homo sapiens)

<400> 21

ctgcccgggt ggcatccctg tgacccctcc ccagtgcctc tcctggccct ggaagttgcc 60

actccagtgc ccaccagcct tgtcctaata aaattaagtt gcatcatttt gtctgactag 120

gtgtccttct ataatattat ggggtggagg ggggtggtat ggagcaaggg gcccaagttg 180

ggaagaaacc tgtagggcct gc 202

<210> 22

<211> 1730

<212> DNA

<213> 未知(Unknown)

<220>

<223> CAG启动子

<400> 22

ctagtcgaca ttgattattg actagttatt aatagtaatc aattacgggg tcattagttc 60

atagcccata tatggagttc cgcgttacat aacttacggt aaatggcccg cctggctgac 120

cgcccaacga cccccgccca ttgacgtcaa taatgacgta tgttcccata gtaacgccaa 180

tagggacttt ccattgacgt caatgggtgg agtatttacg gtaaactgcc cacttggcag 240

tacatcaagt gtatcatatg ccaagtacgc cccctattga cgtcaatgac ggtaaatggc 300

ccgcctggca ttatgcccag tacatgacct tatgggactt tcctacttgg cagtacatct 360

acgtattagt catcgctatt accatggtcg aggtgagccc cacgttctgc ttcactctcc 420

ccatctcccc cccctcccca cccccaattt tgtatttatt tattttttaa ttattttgtg 480

cagcgatggg ggcggggggg gggggggggc gcgcgccagg cggggcgggg cggggcgagg 540

ggcggggcgg ggcgaggcgg agaggtgcgg cggcagccaa tcagagcggc gcgctccgaa 600

agtttccttt tatggcgagg cggcggcggc ggcggcccta taaaaagcga agcgcgcggc 660

gggcgggagt cgctgcgcgc tgccttcgcc ccgtgccccg ctccgccgcc gcctcgcgcc 720

gcccgccccg gctctgactg accgcgttac tcccacaggt gagcgggcgg gacggccctt 780

ctcctccggg ctgtaattag cgcttggttt aatgacggct tgtttctttt ctgtggctgc 840

gtgaaagcct tgaggggctc cgggagggcc ctttgtgcgg ggggagcggc tcggggggtg 900

cgtgcgtgtg tgtgtgcgtg gggagcgccg cgtgcggctc cgcgctgccc ggcggctgtg 960

agcgctgcgg gcgcggcgcg gggctttgtg cgctccgcag tgtgcgcgag gggagcgcgg 1020

ccgggggcgg tgccccgcgg tgcggggggg gctgcgaggg gaacaaaggc tgcgtgcggg 1080

gtgtgtgcgt gggggggtga gcagggggtg tgggcgcgtc ggtcgggctg caaccccccc 1140

tgcacccccc tccccgagtt gctgagcacg gcccggcttc gggtgcgggg ctccgtacgg 1200

ggcgtggcgc ggggctcgcc gtgccgggcg gggggtggcg gcaggtgggg gtgccgggcg 1260

gggcggggcc gcctcgggcc ggggagggct cgggggaggg gcgcggcggc ccccggagcg 1320

ccggcggctg tcgaggcgcg gcgagccgca gccattgcct tttatggtaa tcgtgcgaga 1380

gggcgcaggg acttcctttg tcccaaatct gtgcggagcc gaaatctggg aggcgccgcc 1440

gcaccccctc tagcgggcgc ggggcgaagc ggtgcggcgc cggcaggaag gaaatgggcg 1500

gggagggcct tcgtgcgtcg ccgcgccgcc gtccccttct ccctctccag cctcggggct 1560

gtccgcgggg ggacggctgc cttcgggggg gacggggcag ggcggggttc ggcttctggc 1620

gtgtgaccgg cggctctaga gcctctgcta accatgttca tgccttcttc tttttcctac 1680

agctcctggg caacgtgctg gttattgtgc tgtctcatca ttttggcaaa 1730

<210> 23

<211> 204

<212> DNA

<213> 人巨细胞病毒(Human cytomegalovirus)

<400> 23

gtgatgcggt tttggcagta catcaatggg cgtggatagc ggtttgactc acggggattt 60

ccaagtctcc accccattga cgtcaatggg agtttgtttt ggcaccaaaa tcaacgggac 120

tttccaaaat gtcgtaacaa ctccgcccca ttgacgcaaa tgggcggtag gcgtgtacgg 180

tgggaggtct atataagcag agct 204

<210> 24

<211> 317

<212> DNA

<213> 猿猴病毒40(Simian virus 40)

<400> 24

ggtgtggaaa gtccccaggc tccccagcag gcagaagtat gcaaagcatg catctcaatt 60

agtcagcaac caggtgtgga aagtccccag gctccccagc aggcagaagt atgcaaagca 120

tgcatctcaa ttagtcagca accatagtcc cgcccctaac tccgcccatc ccgcccctaa 180

ctccgcccag ttccgcccat tctccgcccc atggctgact aatttttttt atttatgcag 240

aggccgaggc cgcctcggcc tctgagctat tccagaagta gtgaggaggc ttttttggag 300

gcctaggctt ttgcaaa 317

<210> 25

<211> 500

<212> DNA

<213> 未知(Unknown)

<220>

<223> PGK启动子

<400> 25

gggtagggga ggcgcttttc ccaaggcagt ctggagcatg cgctttagca gccccgctgg 60

gcacttggcg ctacacaagt ggcctctggc ctcgcacaca ttccacatcc accggtaggc 120

gccaaccggc tccgttcttt ggtggcccct tcgcgccacc ttctactcct cccctagtca 180

ggaagttccc ccccgccccg cagctcgcgt cgtgcaggac gtgacaaatg gaagtagcac 240

gtctcactag tctcgtgcag atggacagca ccgctgagca atggaagcgg gtaggccttt 300

ggggcagcgg ccaatagcag ctttgctcct tcgctttctg ggctcagagg ctgggaaggg 360

gtgggtccgg gggcgggctc aggggcgggc tcaggggcgg ggcgggcgcc cgaaggtcct 420

ccggaggccc ggcattctgc acgcttcaaa agcgcacgtc tgccgcgctg ttctcctctt 480

cctcatctcc gggcctttcg 500

<210> 26

<211> 2403

<212> DNA

<213> 智人(Homo sapiens)

<400> 26

cctgcagggc ccactagttc catgtcctta tatggactca tctttgccta ttgcgacaca 60

cactcaatga acacctacta cgcgctgcaa agagccccgc aggcctgagg tgcccccacc 120

tcaccactct tcctattttt gtgtaaaaat ccagcttctt gtcaccacct ccaaggaggg 180

ggaggaggag gaaggcaggt tcctctaggc tgagccgaat gcccctctgt ggtcccacgc 240

cactgatcgc tgcatgccca ccacctgggt acacacagtc tgtgattccc ggagcagaac 300

ggaccctgcc cacccggtct tgtgtgctac tcagtggaca gacccaaggc aagaaagggt 360

gacaaggaca gggtcttccc aggctggctt tgagttccta gcaccgcccc gcccccaatc 420

ctctgtggca catggagtct tggtccccag agtcccccag cggcctccag atggtctggg 480

agggcagttc agctgtggct gcgcatagca gacatacaac ggacggtggg cccagaccca 540

ggctgtgtag acccagcccc cccgccccgc agtgcctagg tcacccacta acgccccagg 600

cctggtcttg gctgggcgtg actgttaccc tcaaaagcag gcagctccag ggtaaaaggt 660

gccctgccct gtagagccca ccttccttcc cagggctgcg gctgggtagg tttgtagcct 720

tcatcacggg ccacctccag ccactggacc gctggcccct gccctgtcct ggggagtgtg 780

gtcctgcgac ttctaagtgg ccgcaagcca cctgactccc ccaacaccac actctacctc 840

tcaagcccag gtctctccct agtgacccac ccagcacatt tagctagctg agccccacag 900

ccagaggtcc tcaggccctg ctttcagggc agttgctctg aagtcggcaa gggggagtga 960

ctgcctggcc actccatgcc ctccaagagc tccttctgca ggagcgtaca gaacccaggg 1020

ccctggcacc cgtgcagacc ctggcccacc ccacctgggc gctcagtgcc caagagatgt 1080

ccacacctag gatgtcccgc ggtgggtggg gggcccgaga gacgggcagg ccgggggcag 1140

gcctggccat gcggggccga accgggcact gcccagcgtg gggcgcgggg gccacggcgc 1200

gcgcccccag cccccgggcc cagcacccca aggcggccaa cgccaaaact ctccctcctc 1260

ctcttcctca atctcgctct cgctcttttt ttttttcgca aaaggagggg agagggggta 1320

aaaaaatgct gcactgtgcg gcgaagccgg tgagtgagcg gcgcggggcc aatcagcgtg 1380

cgccgttccg aaagttgcct tttatggctc gagcggccgc ggcggcgccc tataaaaccc 1440

agcggcgcga cgcgccacca ccgccgagac cgcgtccgcc ccgcgagcac agagcctcgc 1500

ctttgccgat ccgccgcccg tccacacccg ccgccaggta agcccggcca gccgaccggg 1560

gcaggcggct cacggcccgg ccgcaggcgg ccgcggcccc ttcgcccgtg cagagccgcc 1620

gtctgggccg cagcgggggg cgcatggggg gggaaccgga ccgccgtggg gggcgcggga 1680

gaagcccctg ggcctccgga gatgggggac accccacgcc agttcggagg cgcgaggccg 1740

cgctcgggag gcgcgctccg ggggtgccgc tctcggggcg ggggcaaccg gcggggtctt 1800

tgtctgagcc gggctcttgc caatggggat cgcagggtgg gcgcggcgga gcccccgcca 1860

ggcccggtgg gggctggggc gccattgcgc gtgcgcgctg gtcctttggg cgctaactgc 1920

gtgcgcgctg ggaattggcg ctaattgcgc gtgcgcgctg ggactcaagg cgctaactgc 1980

gcgtgcgttc tggggcccgg ggtgccgcgg cctgggctgg ggcgaaggcg ggctcggccg 2040

gaaggggtgg ggtcgccgcg gctcccgggc gcttgcgcgc acttcctgcc cgagccgctg 2100

gccgcccgag ggtgtggccg ctgcgtgcgc gcgcgccgac ccggcgctgt ttgaaccggg 2160

cggaggcggg gctggcgccc ggttgggagg gggttggggc ctggcttcct gccgcgcgcc 2220

gcggggacgc ctccgaccag tgtttgcctt ttatggtaat aacgcggccg gcccggcttc 2280

ctttgtcccc aatctgggcg cgcgccggcg ccccctggcg gcctaaggac tcggcgcgcc 2340

ggaagtggcc agggcggggg cgacctcggc tcacagcgcg cccggctatt ctcgcagctc 2400

acc 2403

<210> 27

<211> 596

<212> DNA

<213> 土拨鼠肝炎病毒(Woodchuck hepatitis virus)

<400> 27

attcgagcat cttaccgcca tttattccca tatttgttct gtttttcttg atttgggtat 60

acatttaaat gttaataaaa caaaatggtg gggcaatcat ttacattttt agggatatgt 120

aattactagt tcaggtgtat tgccacaaga caaacatgtt aagaaacttt cccgttattt 180

acgctctgtt cctgttaatc aacctctgga ttacaaaatt tgtgaaagat tgactgatat 240

tcttaactat gttgctcctt ttacgctgtg tggatatgct gctttaatgc ctctgtatca 300

tgctattgct tcccgtacgg ctttcgtttt ctcctccttg tataaatcct ggttgctgtc 360

tctttatgag gagttgtggc ccgttgtccg tcaacgtggc gtggtgtgct ctgtgtttgc 420

tgacgcaacc cccactggct ggggcattgc caccacctgt caactccttt ctgggacttt 480

cgctttcccc ctcccgatcg ccacggcaga actcatcgcc gcctgccttg cccgctgctg 540

gacaggggct aggttgctgg gcactgataa ttccgtggtg ttgtcgggga agggcc 596

<210> 28

<211> 736

<212> PRT

<213> 腺相关病毒9(adeno-associated virus 9)

<400> 28

Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser

1 5 10 15

Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro

20 25 30

Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro

35 40 45

Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro

50 55 60

Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp

65 70 75 80

Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala

85 90 95

Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly

100 105 110

Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro

115 120 125

Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg

130 135 140

Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly

145 150 155 160

Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr

165 170 175

Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro

180 185 190

Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly

195 200 205

Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser

210 215 220

Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile

225 230 235 240

Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu

245 250 255

Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn

260 265 270

Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg

275 280 285

Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn

290 295 300

Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile

305 310 315 320

Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn

325 330 335

Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu

340 345 350

Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro

355 360 365

Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp

370 375 380

Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe

385 390 395 400

Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu

405 410 415

Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu

420 425 430

Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser

435 440 445

Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser

450 455 460

Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro

465 470 475 480

Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn

485 490 495

Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn

500 505 510

Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys

515 520 525

Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly

530 535 540

Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile

545 550 555 560

Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser

565 570 575

Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln

580 585 590

Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln

595 600 605

Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His

610 615 620

Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met

625 630 635 640

Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala

645 650 655

Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr

660 665 670

Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln

675 680 685

Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn

690 695 700

Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val

705 710 715 720

Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu

725 730 735

<210> 29

<211> 1233

<212> DNA

<213> 智人(Homo sapiens)

<400> 29

atggtgtgct tccgcctctt cccggttccg ggctcagggc tcgttctggt ctgcctagtc 60

ctgggagctg tgcggtctta tgcattggaa cttaatttga cagattcaga aaatgccact 120

tgcctttatg caaaatggca gatgaatttc acagtacgct atgaaactac aaataaaact 180

tataaaactg taaccatttc agaccatggc actgtgacat ataatggaag catttgtggg 240

gatgatcaga atggtcccaa aatagcagtg cagttcggac ctggcttttc ctggattgcg 300

aattttacca aggcagcatc tacttattca attgacagcg tctcattttc ctacaacact 360

ggtgataaca caacatttcc tgatgctgaa gataaaggaa ttcttactgt tgatgaactt 420

ttggccatca gaattccatt gaatgacctt tttagatgca atagtttatc aactttggaa 480

aagaatgatg ttgtccaaca ctactgggat gttcttgtac aagcttttgt ccaaaatggc 540

acagtgagca caaatgagtt cctgtgtgat aaagacaaaa cttcaacagt ggcacccacc 600

atacacacca ctgtgccatc tcctactaca acacctactc caaaggaaaa accagaagct 660

ggaacctatt cagttaataa tggcaatgat acttgtctgc tggctaccat ggggctgcag 720

ctgaacatca ctcaggataa ggttgcttca gttattaaca tcaaccccaa tacaactcac 780

tccacaggca gctgccgttc tcacactgct ctacttagac tcaatagcag caccattaag 840

tatctagact ttgtctttgc tgtgaaaaat gaaaaccgat tttatctgaa ggaagtgaac 900

atcagcatgt atttggttaa tggctccgtt ttcagcattg caaataacaa tctcagctac 960

tgggatgccc ccctgggaag ttcttatatg tgcaacaaag agcagactgt ttcagtgtct 1020

ggagcatttc agataaatac ctttgatcta agggttcagc ctttcaatgt gacacaagga 1080

aagtattcta cagctcaaga ctgcagtgca gatgacgaca acttccttgt gcccatagcg 1140

gtgggagctg ccttggcagg agtacttatt ctagtgttgc tggcttattt tattggtctc 1200

aagcaccatc atgctggata tgagcaattt tag 1233

<210> 30

<211> 1236

<212> DNA

<213> 智人(Homo sapiens)

<400> 30

atggtgtgct tccgcctctt cccggttccg ggctcagggc tcgttctggt ctgcctagtc 60

ctgggagctg tgcggtctta tgcattggaa cttaatttga cagattcaga aaatgccact 120

tgcctttatg caaaatggca gatgaatttc acagtacgct atgaaactac aaataaaact 180

tataaaactg taaccatttc agaccatggc actgtgacat ataatggaag catttgtggg 240

gatgatcaga atggtcccaa aatagcagtg cagttcggac ctggcttttc ctggattgcg 300

aattttacca aggcagcatc tacttattca attgacagcg tctcattttc ctacaacact 360

ggtgataaca caacatttcc tgatgctgaa gataaaggaa ttcttactgt tgatgaactt 420

ttggccatca gaattccatt gaatgacctt tttagatgca atagtttatc aactttggaa 480

aagaatgatg ttgtccaaca ctactgggat gttcttgtac aagcttttgt ccaaaatggc 540

acagtgagca caaatgagtt cctgtgtgat aaagacaaaa cttcaacagt ggcacccacc 600

atacacacca ctgtgccatc tcctactaca acacctactc caaaggaaaa accagaagct 660

ggaacctatt cagttaataa tggcaatgat acttgtctgc tggctaccat ggggctgcag 720

ctgaacatca ctcaggataa ggttgcttca gttattaaca tcaaccccaa tacaactcac 780

tccacaggca gctgccgttc tcacactgct ctacttagac tcaatagcag caccattaag 840

tatctagact ttgtctttgc tgtgaaaaat gaaaaccgat tttatctgaa ggaagtgaac 900

atcagcatgt atttggttaa tggctccgtt ttcagcattg caaataacaa tctcagctac 960

tgggatgccc ccctgggaag ttcttatatg tgcaacaaag agcagactgt ttcagtgtct 1020

ggagcatttc agataaatac ctttgatcta agggttcagc ctttcaatgt gacacaagga 1080

aagtattcta cagctgaaga atgttctgct gactctgacc tcaactttct tattcctgtt 1140

gcagtgggtg tggccttggg cttccttata attgttgtct ttatctctta tatgattgga 1200

agaaggaaaa gtcgtactgg ttatcagtct gtgtaa 1236

<210> 31

<211> 1000

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> LAMP-2变体

<400> 31

atggtctgct tcagactgtt ccctgtccct ggatctggtc tggtgcttgt gtgcttggtg 60

ctgggtgctg tgagatccta tgcccttgag ctgaacctga ctgactcaga aaatgccact 120

tgcctgtatg ccaagtggca gatgaacttc actgtgagat atgagactac caacaagacc 180

tacaagactg tgaccatctc agaccatggc actgtcacct acaatggatc aatctgtggt 240

gatgatcaga atggcccaaa gatagcagtg cagtttgggc ccggtttttc ctggattgct 300

aacttcacca aggcagcctc cacctacagc attgactcag tcagcttcag ctacaacact 360

ggggataaca ccaccttccc tgacgcagag gacaagggaa tccttactgt ggacgaactc 420

ctggcaatca gaatccccct taacgacctg ttcagatgca actccctttc aacccttgaa 480

aagaatgatg tggtgcaaca ctattgggac gtcctggtgc aagcctttgt gcagaatggg 540

acagtgagta ccaacgagtt cctctgtgac aaggacaaga ccagcactgt ggcccccact 600

atccacacca ctgtgcccag ccctaccact acccccaccc ctaaagagaa gccagaagct 660

ggaacctact cagtcaacaa tggaaatgac acatgcctcc ttgccaccat gggactgcag 720

ctgaacatca ctcaggacaa ggtggcctca gtgattaaca tcaaccctaa caccactcat 780

agcactggga gctgcagatc acatacagct ctgctgaggc tcaactcctc caccatcaag 840

tacctggact ttgtgtttgc tgtgaagaat gagaacaggt tctacctcaa ggaagtgaac 900

atttccatgt acctggtcaa tggttcagtg ttctctattg ccaacaacaa tctgagctac 960

tgggatgcac ccctgggatc ctcctacatg tgcaacaagg 1000

<210> 32

<211> 1000

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> LAMP-2变体

<400> 32

atggtgtgct ttagactgtt tcctgtgcct ggttcagggc tggtcctggt ctgtctggtg 60

ctgggggctg tcagaagcta tgccttggag ctgaacctca ctgatagtga aaatgccact 120

tgtctgtatg ctaagtggca gatgaacttc actgtgagat atgaaaccac caacaagact 180

tacaaaacag tgaccatctc agatcatgga actgtgacct acaacggcag catttgtgga 240

gacgaccaga acggaccaaa aatcgctgtc caatttgggc ctggattctc ctggattgcc 300

aatttcacta aagctgcctc cacatattca attgactcag tgtccttctc ctacaacact 360

ggggacaaca ctactttccc tgatgctgaa gataagggaa tcttgacagt ggatgagctg 420

ctggctatca ggatcccttt gaatgacctg tttaggtgta attcactgag cactctggag 480

aagaacgacg tggtgcagca ctactgggac gtgctggtgc aggcctttgt gcagaacggc 540

actgtgtcca ccaacgaatt cctgtgtgat aaggacaaaa cttccactgt ggcacctaca 600

attcacacta ctgtgccttc acctaccacc actccaactc caaaggaaaa gcctgaagca 660

ggaacctact ctgtgaacaa tggcaatgat acctgtctgt tggccaccat gggcctccaa 720

ctgaacatta ctcaggacaa ggtggcctca gtgattaaca ttaaccccaa cactacccac 780

tccactggca gctgtagatc acacacagcc ttgctcagac tgaatagcag caccatcaag 840

tatttggatt ttgtgtttgc agtgaagaat gaaaacaggt tctacctgaa ggaagtcaac 900

atctcaatgt acctggtgaa cggctcagtg ttcagcattg ccaacaacaa cctctcctat 960

tgggacgctc cactggggag cagctacatg tgtaacaagg 1000

<210> 33

<211> 1000

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> LAMP-2变体

<400> 33

atggtctgtt ttaggctgtt ccctgtccct ggttcaggac tggtcttagt gtgtctggtg 60

cttggagctg tcagaagcta tgccctggag ctgaacctga ctgactcaga aaatgccact 120

tgcctgtatg ccaagtggca gatgaacttc actgtcagat atgaaaccac caacaagacc 180

tataagactg tgaccatctc agaccatggc actgtgactt acaatgggtc aatttgtgga 240

gatgaccaga atggccctaa gatagctgtc cagtttggtc caggattcag ctggattgcc 300

aacttcacca aggcagccag cacctacagc attgactctg tgtccttctc ctacaacaca 360

ggagacaaca ccactttccc tgatgcagag gacaaaggta tcctgactgt ggatgagttg 420

ctggcaatca ggatcccact gaacgatctg ttcaggtgca actcactgtc cactctggaa 480

aagaatgatg tggtgcagca ctattgggat gtgctagtcc aggcctttgt ccagaatggg 540

actgtgtcaa ctaatgagtt cctgtgtgac aaggacaaga caagcactgt agcccccact 600

atccatacca cagtacctag ccccaccact actccaaccc ccaaggagaa gcctgaggct 660

ggcacctact cagtgaacaa tgggaatgac acctgtttgc tggccactat gggactccaa 720

ctgaacatca cccaggacaa agtggcctct gtgatcaata tcaatcccaa caccacccac 780

agcactgggt cctgcagaag ccacactgcc ctcctgaggc tcaactcatc aactatcaag 840

tacttggatt ttgtgtttgc agtgaagaat gagaacagat tctacctcaa agaggtcaac 900

atttcaatgt acctggtgaa tgggagtgtg ttctccattg ctaacaacaa cctgagctac 960

tgggatgccc ctctgggctc ctcatacatg tgcaacaagg 1000

<210> 34

<211> 410

<212> PRT

<213> 智人(Homo sapiens)

<400> 34

Met Val Cys Phe Arg Leu Phe Pro Val Pro Gly Ser Gly Leu Val Leu

1 5 10 15

Val Cys Leu Val Leu Gly Ala Val Arg Ser Tyr Ala Leu Glu Leu Asn

20 25 30

Leu Thr Asp Ser Glu Asn Ala Thr Cys Leu Tyr Ala Lys Trp Gln Met

35 40 45

Asn Phe Thr Val Arg Tyr Glu Thr Thr Asn Lys Thr Tyr Lys Thr Val

50 55 60

Thr Ile Ser Asp His Gly Thr Val Thr Tyr Asn Gly Ser Ile Cys Gly

65 70 75 80

Asp Asp Gln Asn Gly Pro Lys Ile Ala Val Gln Phe Gly Pro Gly Phe

85 90 95

Ser Trp Ile Ala Asn Phe Thr Lys Ala Ala Ser Thr Tyr Ser Ile Asp

100 105 110

Ser Val Ser Phe Ser Tyr Asn Thr Gly Asp Asn Thr Thr Phe Pro Asp

115 120 125

Ala Glu Asp Lys Gly Ile Leu Thr Val Asp Glu Leu Leu Ala Ile Arg

130 135 140

Ile Pro Leu Asn Asp Leu Phe Arg Cys Asn Ser Leu Ser Thr Leu Glu

145 150 155 160

Lys Asn Asp Val Val Gln His Tyr Trp Asp Val Leu Val Gln Ala Phe

165 170 175

Val Gln Asn Gly Thr Val Ser Thr Asn Glu Phe Leu Cys Asp Lys Asp

180 185 190

Lys Thr Ser Thr Val Ala Pro Thr Ile His Thr Thr Val Pro Ser Pro

195 200 205

Thr Thr Thr Pro Thr Pro Lys Glu Lys Pro Glu Ala Gly Thr Tyr Ser

210 215 220

Val Asn Asn Gly Asn Asp Thr Cys Leu Leu Ala Thr Met Gly Leu Gln

225 230 235 240

Leu Asn Ile Thr Gln Asp Lys Val Ala Ser Val Ile Asn Ile Asn Pro

245 250 255

Asn Thr Thr His Ser Thr Gly Ser Cys Arg Ser His Thr Ala Leu Leu

260 265 270

Arg Leu Asn Ser Ser Thr Ile Lys Tyr Leu Asp Phe Val Phe Ala Val

275 280 285

Lys Asn Glu Asn Arg Phe Tyr Leu Lys Glu Val Asn Ile Ser Met Tyr

290 295 300

Leu Val Asn Gly Ser Val Phe Ser Ile Ala Asn Asn Asn Leu Ser Tyr

305 310 315 320

Trp Asp Ala Pro Leu Gly Ser Ser Tyr Met Cys Asn Lys Glu Gln Thr

325 330 335

Val Ser Val Ser Gly Ala Phe Gln Ile Asn Thr Phe Asp Leu Arg Val

340 345 350

Gln Pro Phe Asn Val Thr Gln Gly Lys Tyr Ser Thr Ala Gln Asp Cys

355 360 365

Ser Ala Asp Asp Asp Asn Phe Leu Val Pro Ile Ala Val Gly Ala Ala

370 375 380

Leu Ala Gly Val Leu Ile Leu Val Leu Leu Ala Tyr Phe Ile Gly Leu

385 390 395 400

Lys His His His Ala Gly Tyr Glu Gln Phe

405 410

<210> 35

<211> 411

<212> PRT

<213> 智人(Homo sapiens)

<400> 35

Met Val Cys Phe Arg Leu Phe Pro Val Pro Gly Ser Gly Leu Val Leu

1 5 10 15

Val Cys Leu Val Leu Gly Ala Val Arg Ser Tyr Ala Leu Glu Leu Asn

20 25 30

Leu Thr Asp Ser Glu Asn Ala Thr Cys Leu Tyr Ala Lys Trp Gln Met

35 40 45

Asn Phe Thr Val Arg Tyr Glu Thr Thr Asn Lys Thr Tyr Lys Thr Val

50 55 60

Thr Ile Ser Asp His Gly Thr Val Thr Tyr Asn Gly Ser Ile Cys Gly

65 70 75 80

Asp Asp Gln Asn Gly Pro Lys Ile Ala Val Gln Phe Gly Pro Gly Phe

85 90 95

Ser Trp Ile Ala Asn Phe Thr Lys Ala Ala Ser Thr Tyr Ser Ile Asp

100 105 110

Ser Val Ser Phe Ser Tyr Asn Thr Gly Asp Asn Thr Thr Phe Pro Asp

115 120 125

Ala Glu Asp Lys Gly Ile Leu Thr Val Asp Glu Leu Leu Ala Ile Arg

130 135 140

Ile Pro Leu Asn Asp Leu Phe Arg Cys Asn Ser Leu Ser Thr Leu Glu

145 150 155 160

Lys Asn Asp Val Val Gln His Tyr Trp Asp Val Leu Val Gln Ala Phe

165 170 175

Val Gln Asn Gly Thr Val Ser Thr Asn Glu Phe Leu Cys Asp Lys Asp

180 185 190

Lys Thr Ser Thr Val Ala Pro Thr Ile His Thr Thr Val Pro Ser Pro

195 200 205

Thr Thr Thr Pro Thr Pro Lys Glu Lys Pro Glu Ala Gly Thr Tyr Ser

210 215 220

Val Asn Asn Gly Asn Asp Thr Cys Leu Leu Ala Thr Met Gly Leu Gln

225 230 235 240

Leu Asn Ile Thr Gln Asp Lys Val Ala Ser Val Ile Asn Ile Asn Pro

245 250 255

Asn Thr Thr His Ser Thr Gly Ser Cys Arg Ser His Thr Ala Leu Leu

260 265 270

Arg Leu Asn Ser Ser Thr Ile Lys Tyr Leu Asp Phe Val Phe Ala Val

275 280 285

Lys Asn Glu Asn Arg Phe Tyr Leu Lys Glu Val Asn Ile Ser Met Tyr

290 295 300

Leu Val Asn Gly Ser Val Phe Ser Ile Ala Asn Asn Asn Leu Ser Tyr

305 310 315 320

Trp Asp Ala Pro Leu Gly Ser Ser Tyr Met Cys Asn Lys Glu Gln Thr

325 330 335

Val Ser Val Ser Gly Ala Phe Gln Ile Asn Thr Phe Asp Leu Arg Val

340 345 350

Gln Pro Phe Asn Val Thr Gln Gly Lys Tyr Ser Thr Ala Glu Glu Cys

355 360 365

Ser Ala Asp Ser Asp Leu Asn Phe Leu Ile Pro Val Ala Val Gly Val

370 375 380

Ala Leu Gly Phe Leu Ile Ile Val Val Phe Ile Ser Tyr Met Ile Gly

385 390 395 400

Arg Arg Lys Ser Arg Thr Gly Tyr Gln Ser Val

405 410

<210> 36

<211> 21

<212> DNA

<213> 土拨鼠肝炎病毒(Woodchuck hepatitis virus)

<400> 36

atcatgctat tgcttcccgt a 21

<210> 37

<211> 20

<212> DNA

<213> 土拨鼠肝炎病毒(Woodchuck hepatitis virus)

<400> 37

gggccacaac tcctcataaa 20

<210> 38

<211> 29

<212> DNA

<213> 土拨鼠肝炎病毒(Woodchuck hepatitis virus)

<400> 38

cctccttgta taaatcctgg ttgctgtct 29

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号