首页> 中国专利> 通过肝导向基因替代疗法治疗严重PKU的改良的人PAH的产生

通过肝导向基因替代疗法治疗严重PKU的改良的人PAH的产生

摘要

本文提供了变体苯丙氨酸羟化酶(PAH)多肽,其比野生型人PAH更稳定并且具有更大的活性。还提供了在有需要的个体中治疗苯丙酮尿症(PKU)和/或降低苯丙氨酸水平的方法。本文还提供了用于在有需要的个体中表达所述变体PAH多肽的表达盒、载体(例如,rAAV载体)、病毒粒子、药物组合物和试剂盒。

著录项

  • 公开/公告号CN113194982A

    专利类型发明专利

  • 公开/公告日2021-07-30

    原文格式PDF

  • 申请/专利权人 建新公司;

    申请/专利号CN201980082127.3

  • 发明设计人 S·库斯迪奥-穆尔;P·马纳瓦兰;

    申请日2019-10-11

  • 分类号A61K38/44(20060101);C12N15/864(20060101);

  • 代理机构11494 北京坤瑞律师事务所;

  • 代理人封新琴

  • 地址 美国马萨诸塞州

  • 入库时间 2023-06-19 12:02:28

说明书

相关申请的交叉引用

本申请要求以下申请的优先权益:2018年10月12日提交的美国临时申请序列号62/744,944,其通过引用以其整体并入本文。

ASCII文本文件序列表的提交

将以下提交的ASCII文本文件的内容通过引用以其整体并入本文:计算机可读形式(CRF)的序列表(文件名:159792016640SEQLIST.TXT,记录日期:2019年10月16日,大小:33KB)。

技术领域

本公开文本涉及变体苯丙氨酸羟化酶多肽。在一些方面,本公开文本涉及使用基因疗法治疗苯丙酮尿症的组合物和方法。

背景技术

苯丙酮尿症(PKU)是催化苯丙氨酸(Phe)羟基化为酪氨酸(Tyr)的肝酶苯丙氨酸羟化酶(PAH)的遗传缺陷。这种疾病是氨基酸代谢最常见的先天性缺陷,在北美的总发病率为1:10000-1:15000,并且在大多数发达国家通过新生儿筛查项目检测到。在没有任何治疗的情况下,严重形式的PKU导致高度升高的血液Phe水平,这具有神经毒性,并与严重的精神发育迟滞相关联(Kochhar 2012,Ho 2014,Blau 2015)。受影响的蛋白质PAH是一种多结构域蛋白质,其由N-末端调节结构域(1-117)、中心催化结构域(118-410)和C-末端四聚结构域(411-452)组成(Flydal 2013)。迄今为止,已有超过560种致病突变被定位到每个结构域,其中催化区是受影响最频繁的位点(Erlandsen 2003)。同源多聚体酶通过结合到N-末端结构域的底物Phe经受磷酸化和变构活化的复杂调节,所述结合通过改变酶的各种构象和多聚体状态来微调PAH酶活性(Knappskog 1996,Jaffe 2013,Arturo 2016)。

目前对PKU的治疗是使用低蛋白饮食和液体药物配方对Phe进行终生饮食限制(Kochhar 2012,Ho 2014,Blau 2015)。虽然有效,但药用食物的味道差和对食物选择的严重限制使得儿童难以坚持饮食,且不遵守饮食的情况稳步增加,并且到青少年后期,近80%的患者具有高于推荐水平的血液Phe水平(Waisbren 2007,Thomas 2017)。也有新的证据表明,尽管很好地坚持Phe限制饮食,但许多患者在各种神经认知和神经精神功能方面存在缺陷,并且注意力缺陷多动障碍(ADHD)的发病率很高。虽然其原因尚不清楚,但潜在的解释包括脑氨基酸失衡、某些维生素和微量元素的营养缺乏,以及通常由肝脏PAH活动维持稳定的血液Phe水平波动(Cleary 2013,Gonzales 2016,Vogel 2017)。有趣的是,用辅因子四氢生物蝶呤(BH4)(沙丙蝶呤二盐酸盐)的合成形式治疗轻度PKU患者不仅显示有效降低血液Phe水平,还表明改善了神经功能,如减少ADHD症状(Burton 2015)。这种疗法通过充当药理学分子伴侣来增加残留的PAH酶活性,并且因此可以通过提供正常的Phe调节的PAH活性来部分纠正遗传缺陷(Blau 2015)。最近批准的另一种疗法由使用将Phe代谢为反式肉桂酸的细菌苯丙氨酸解氨酶(PAL)的聚乙二醇化形式的酶替代疗法组成。这种疗法显著降低血液Phe水平,但对神经学终点似乎不太有效(Longo 2014)。目前还不清楚这种疗法或主要基于降低血液Phe水平的任何其他疗法,在没有纠正作为系统Phe水平调节剂和Tyr产生者的PAH功能的情况下,是否能够解决甚至在顺从饮食的PKU患者中观察到的认知和神经精神问题。

本文引用的所有参考文献(包括专利申请和出版物)均通过引用以其整体而并入。

发明内容

本发明至少部分基于发明人发现的改进的hPAH变体,并且特别是变体-1(V1),其含有四种氨基酸变化,与内源性hPAH相比,导致蛋白质稳定性和酶活性的改进。使用临床相关剂量的rAAV将编码这种hPAH-V1变体的cDNA递送到肝脏改善了人PKU模型PAH

在一些方面,本发明提供了包含两个氨基酸取代的变体苯丙氨酸羟化酶(PAH)多肽,其中氨基酸取代位于选自野生型人PAH多肽的M180、K199、S250和G256的位点处。在一些方面,本发明提供了包含三个氨基酸取代的变体苯丙氨酸羟化酶(PAH)多肽,其中氨基酸取代位于选自野生型人PAH多肽的M180、K199、S250和G256的位点处。在一些方面,本发明提供了包含四个氨基酸取代的变体苯丙氨酸羟化酶(PAH)多肽,所述氨基酸取代位于野生型人PAH多肽的位点M180、K199、S250和G256处。在一些实施方案中,氨基酸取代包括M180T、K199P、S250P和G256A中的一种或多种。在一些实施方案中,氨基酸取代包括K199P、S250P和G256A;M180T、S250P和G256A;M180T、K199P和G256A;或者M180T、K199P和S250P。在一些实施方案中,氨基酸取代包括M180T、K199P、S250P和G256A。在一些实施方案中,变体PAH多肽还包含H264P、G272A、G272P、P275L、P279Q、G272P和P275L,或T323R和F327T氨基酸取代。在一些实施方案中,野生型人PAH多肽包含SEQ ID NO:1的氨基酸序列。在一些实施方案中,变体PAH多肽是人PAH多肽。在一些实施方案中,变体PAH多肽包含与SEQ ID NO:3的氨基酸序列至少约80%相同的氨基酸序列。在一些实施方案中,变体PAH多肽包含SEQ ID NO:3的氨基酸序列。在一些实施方案中,变体PAH多肽还包含选自野生型人PAH多肽的G33A、G46A、G46P、G103A、G139A、G139P、G148A、G188A、G218A、G239A、G247A、G257A、G272A、G289A、G307A、G312A、G332A、G337A、G344A、G352A和G442A的一个或多个氨基酸取代。在一些实施方案中,变体PAH多肽还包含选自野生型人PAH多肽的P9G、G10V、G12S、K184R、K192R、S196A、Y206H、H220R、Q336E、E360D、I374C、N376E、N401T、I421V、I441V、S446H的一个或多个氨基酸取代,以及在野生型人PAH多肽的位置453处添加S。在一些实施方案中,变体PAH多肽还包含选自野生型人PAH多肽的F240W、A246P、G247A、Y268W、C284F、T323R、F327Y、E319P、I306(Y、F)、K113P、G188A、F191Y、T193R、Y206H、G337P和N376P的一个或多个氨基酸取代。在一些实施方案中,变体PAH多肽包含选自野生型人PAH多肽的G33A、G46A、G46P、G103A、G139A、G139P、G148A、G188A、G218A、G239A、G247A、G257A、G272A、G289A、G307A、G312A、G332A、G337A、G344A、G352A和G442A的一个或多个氨基酸取代。

在一些方面,本发明提供了变体PAH多肽,其中变体PAH多肽包含选自野生型人PAH多肽的P9G、G10V、G12S、K184R、K192R、S196A、Y206H、H220R、Q336E、E360D、I374C、N376E、N401T、I421V、I441V、S446H的一个或多个氨基酸取代,以及在野生型人PAH多肽的位置453处添加S。在一些方面,本发明提供一种变体PAH多肽,其包含选自野生型人PAH多肽的F240W、A246P、G247A、Y268W、C284F、T323R、F327Y、E319P、I306(Y、F)、K113P、G188A、F191Y、T193R、Y206H、G337P和N376P的一个或多个氨基酸取代。

在一些实施方案中,变体PAH多肽包含N-末端截短。在一些实施方案中,N-末端截短包括N-末端调节结构域的截短。在一些实施方案中,N-末端截短包括野生型PAH多肽的氨基酸残基1-102的截短。在一些实施方案中,变体PAH多肽包含C-末端截短。在一些实施方案中,C-末端截短包括四聚结构域的截短。在一些实施方案中,C-末端截短包括野生型PAH多肽的氨基酸残基429-452的截短。在一些实施方案中,变体PAH多肽包含对应于野生型PAH多肽的氨基酸残基103-428的氨基酸序列。

在一些实施方案中,变体PAH多肽包含一个或多个氨基酸取代,以消除潜在的蛋白酶切割位点。在一些实施方案中,消除潜在蛋白酶切割位点的一个或多个氨基酸取代位于野生型PAH多肽的位置270-295和/或380-405处。

在一些实施方案中,变体PAH多肽与肝靶向多肽融合。在一些实施方案中,肝靶向多肽是HGF或其片段或者结合肝细胞去唾液酸糖蛋白受体的糖蛋白。在一些实施方案中,变体PAH多肽被聚乙二醇化和/或亚硝基化。在一些实施方案中,变体PAH多肽包含I374C氨基酸取代,其中位置374处的cys残基被亚硝基化。

在一些实施方案中,本发明提供了包含如本文所述的变体PAH多肽的组合物。在一些实施方案中,所述组合物还包含药学上可接受的载体。

在一些方面,本发明提供了编码如本文所述的变体PAH多肽的分离核酸。在一些实施方案中,编码变体PAH多肽的核酸可操作地连接至启动子。在一些实施方案中,所述启动子选自巨细胞病毒(CMV)即时早期启动子、RSV LTR、MoMLV LTR、磷酸甘油酸激酶-1(PGK)启动子、猿猴病毒40(SV40)启动子、CK6启动子、转甲状腺素蛋白启动子(TTR)、mTTR482启动子、mA1MB2-mTTR482启动子、TK启动子、四环素应答性启动子(TRE)、HBV启动子、hAAT启动子、LSP启动子、LP1启动子、嵌合肝脏特异性启动子(LSP)、E2F启动子、端粒酶(hTERT)启动子;巨细胞病毒增强子/鸡β-肌动蛋白/兔β-球蛋白启动子(CAG)启动子、延长因子1-α启动子(EF1-α)启动子、人β-葡糖醛酸酶启动子、鸡β-肌动蛋白(CBA)启动子、修饰的鸡β-肌动蛋白(CBA)启动子或SEQ ID NO:17、逆转录劳斯肉瘤病毒(RSV)LTR启动子、二氢叶酸还原酶启动子和13-肌动蛋白启动子。在一些实施方案中,所述启动子是LP1启动子或mA1MB2-mTTR482启动子。在一些实施方案中,所述核酸还包含多腺苷酸化信号。在一些实施方案中,多腺苷酸化信号是牛生长激素多腺苷酸化信号、SV40多腺苷酸化信号或HSV TK多腺苷酸化信号。在一些实施方案中,所述核酸还包含内含子。在一些实施方案中,所述内含子是鸡β-肌动蛋白(CBA)/兔β-球蛋白杂合内含子。在一些实施方案中,所述内含子是SEQ ID NO:15的修饰的鸡β-肌动蛋白(CBA)/兔β-球蛋白杂合内含子。在一些实施方案中,所述核酸还包含一个或多个ITR。在一些实施方案中,所述核酸还包含填充(stuffer)核酸。在一些实施方案中,填充核酸被优化以去除ATG序列。在一些实施方案中,填充核酸是SEQ ID NO:16的A1AT内含子填充序列。

在一些方面,本发明提供了编码人PAH多肽的分离核酸,其中所述核酸是密码子优化的。在一些实施方案中,所述核酸序列与SEQ ID NO:14的核酸序列至少80%相同。在一些实施方案中,所述核酸包含SEQ ID NO:14的核酸序列。在一些实施方案中,所述核酸是mRNA。在一些方面,本发明提供了包含如本文所述的核酸的组合物。在一些实施方案中,所述组合物还包含药学上可接受的载体。

在一些方面,本发明提供了包含如本文所述的分离核酸的载体。在一些实施方案中,所述载体是重组腺相关病毒(rAAV)载体。在一些实施方案中,rAAV载体包含如本文所述的核酸,其侧翼是一个或多个AAV反向末端重复(ITR)序列。在一些实施方案中,所述核酸的侧翼是两个AAV ITR。在一些实施方案中,AAV ITR是AAV1、AAV2、AAV3、AAV4、AAV5、AAV6、AAV7、AAV8、AAVrh8、AAVrh8R、AAV9、AAV10、AAVrh10、AAV11、AAV12、AAV2R471A、AAV DJ、山羊AAV、牛AAV或小鼠AAV血清型ITR。在一些实施方案中,AAV ITR是AAV2 ITR。在一些实施方案中,rAAV载体从5'到3'包含AAV2 ITR、启动子、内含子、编码PAH多肽的核酸、填充核酸、多腺苷酸化信号和AAV2 ITR。在一些实施方案中,所述启动子是m1A1MB2-mTTR482启动子或LP1启动子。在一些实施方案中,所述内含子是鸡β-肌动蛋白(CBA)/兔β-球蛋白杂合内含子。在一些实施方案中,PAH多肽是如本文所述的变体PAH多肽。在一些实施方案中,编码PAH多肽的核酸是密码子优化的核酸。在一些实施方案中,填充核酸包含来自人α1抗胰蛋白酶基因内含子的核酸。在一些实施方案中,人α1抗胰蛋白酶基因的内含子已经突变以去除ATG序列。在一些实施方案中,多腺苷酸化信号是牛生长激素多腺苷酸化信号。在一些实施方案中,所述载体是自身互补载体。在一些实施方案中,所述载体包含编码PAH多肽的第一核酸序列和编码PAH多肽的补体的第二核酸序列,其中所述第一核酸序列可以与所述第二核酸序列沿着其大部分或全部长度形成链内碱基对。在一些实施方案中,所述第一核酸序列和所述第二核酸序列通过突变的AAV ITR连接,其中所述突变的AAV ITR包含D区的缺失并且包含末端解链序列的突变。

在一些方面,本发明提供了包含如本文所述的rAAV载体的rAAV粒子。在一些实施方案中,AAV病毒粒子包含AAV1、AAV2、AAV3、AAV4、AAV5、AAV6、AAV7、AAV8、AAVrh8、AAVrh8R、AAV9、AAV10、AAVrh10、AAV11、AAV12、AAV2R471A、AAV2/2-7m8、AAV DJ、AAV2 N587A、AAV2E548A、AAV2 N708A、AAV2 V708K、山羊AAV、AAV1/AAV2嵌合、牛AAV、小鼠AAV或rAAV2/HBoV1血清型衣壳。在一些实施方案中,AAV病毒粒子包含工程化AAV衣壳。在一些实施方案中,工程化AAV衣壳是DJ衣壳或LK03衣壳。在一些实施方案中,rAAV病毒粒子的ITR和衣壳来源于相同的AAV血清型。在一些实施方案中,rAAV病毒粒子的ITR和衣壳来源于不同的AAV血清型。在一些实施方案中,rAAV病毒粒子包含AAV8衣壳。在一些实施方案中,rAAV病毒粒子包含AAV8衣壳,并且其中所述载体包含AAV2 ITR。

在一些实施方案中,AAV病毒粒子包含与AAV1、AAV2、AAV3、AAV4、AAV5、AAV6、AAV7、AAV8、AAVrh8、AAVrh8R、AAV9、AAV10、AAVrh10、AAV11、AAV12、AAV2R471A、AAV2/2-7m8、AAVDJ、AAV2 N587A、AAV2 E548A、AAV2 N708A、AAV2 V708K、山羊AAV、AAV1/AAV2嵌合、牛AAV、小鼠AAV或rAAV2/HBoV1血清型衣壳具有至少85%序列同一性,如至少87%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列同一性的衣壳。在一些实施方案中,AAV病毒粒子包含与AAV1血清型衣壳具有至少85%序列同一性,如至少87%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列同一性的衣壳。在一些实施方案中,AAV病毒粒子包含与AAV2血清型衣壳具有至少85%序列同一性,如至少87%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列同一性的衣壳。在一些实施方案中,AAV病毒粒子包含与AAV3血清型衣壳具有至少85%序列同一性,如至少87%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列同一性的衣壳。在一些实施方案中,AAV病毒粒子包含与AAV4血清型衣壳具有至少85%序列同一性,如至少87%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列同一性的衣壳。在一些实施方案中,AAV病毒粒子包含与AAV5血清型衣壳具有至少85%序列同一性,如至少87%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列同一性的衣壳。在一些实施方案中,AAV病毒粒子包含与AAV6血清型衣壳具有至少85%序列同一性,如至少87%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列同一性的衣壳。在一些实施方案中,AAV病毒粒子包含与AAV7血清型衣壳具有至少85%序列同一性,如至少87%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列同一性的衣壳。在一些实施方案中,AAV病毒粒子包含与AAV8血清型衣壳具有至少85%序列同一性,如至少87%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列同一性的衣壳。在一些实施方案中,AAV病毒粒子包含与AAV9血清型衣壳具有至少85%序列同一性,如至少87%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列同一性的衣壳。在一些实施方案中,AAV病毒粒子包含与AAV11血清型衣壳具有至少85%序列同一性,如至少87%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列同一性的衣壳。在一些实施方案中,AAV病毒粒子包含与AAV12血清型衣壳具有至少85%序列同一性,如至少87%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列同一性的衣壳。

在一些实施方案中,AAV病毒粒子包含杂合衣壳。在一些实施方案中,杂合衣壳是AAV1/AAV6、AAV2/AAV6、AAV3/AAV6、AAV4/AAV6、AAV5/AAV6、AAV7/AAV6、AAV8/AAV6、AAV9/AAV6、AAV10/AAV6、AAV11/AAV6、AAV12/AAV6、AAV1/AAV8、AAV2/AAV8、AAV3/AAV8、AAV4/AAV8、AAV5/AAV8、AAV7/AAV8、AAV9/AAV8、AAV10/AAV8、AAV11/AAV8、AAV12/AAV8或AAV1/AAV6/AAV8杂合衣壳。在一些实施方案中,杂合衣壳是AAV8/AAV6杂合衣壳。在一些实施方案中,杂合衣壳是AAV1/AAV6/AAV8杂合衣壳。

在一些实施方案中,AAV病毒粒子包含杂合衣壳。在一些实施方案中,杂合衣壳是AAV1/AAV6、AAV2/AAV6、AAV3/AAV6、AAV4/AAV6、AAV5/AAV6、AAV7/AAV6、AAV8/AAV6、AAV9/AAV6、AAV10/AAV6、AAV11/AAV6、AAV12/AAV6、AAV1/AAV8、AAV2/AAV8、AAV3/AAV8、AAV4/AAV8、AAV5/AAV8、AAV7/AAV8、AAV9/AAV8、AAV10/AAV8、AAV11/AAV8、AAV12/AAV8或AAV1/AAV6/AAV8杂合衣壳。在一些实施方案中,杂合衣壳是AAV8/AAV6杂合衣壳。在一些实施方案中,杂合衣壳是AAV1/AAV6/AAV8杂合衣壳。

在一些实施方案中,杂合衣壳包含与AAV1衣壳序列的一部分具有至少95%序列同一性,如至少96%、97%、98%或99%序列同一性的氨基酸序列。在一些实施方案中,杂合衣壳包含与AAV2衣壳序列的一部分具有至少95%序列同一性,如至少96%、97%、98%或99%序列同一性的氨基酸序列。在一些实施方案中,杂合衣壳包含与AAV3衣壳序列的一部分具有至少95%序列同一性,如至少96%、97%、98%或99%序列同一性的氨基酸序列。在一些实施方案中,杂合衣壳包含与AAV4衣壳序列的一部分具有至少95%序列同一性,如至少96%、97%、98%或99%序列同一性的氨基酸序列。在一些实施方案中,杂合衣壳包含与AAV5衣壳序列的一部分具有至少95%序列同一性,如至少96%、97%、98%或99%序列同一性的氨基酸序列。在一些实施方案中,杂合衣壳包含与AAV6衣壳序列的一部分具有至少95%序列同一性,如至少96%、97%、98%或99%序列同一性的氨基酸序列。在一些实施方案中,杂合衣壳包含与AAV7衣壳序列的一部分具有至少95%序列同一性,如至少96%、97%、98%或99%序列同一性的氨基酸序列。在一些实施方案中,杂合衣壳包含与AAV8衣壳序列的一部分具有至少95%序列同一性,如至少96%、97%、98%或99%序列同一性的氨基酸序列。在一些实施方案中,杂合衣壳包含与AAV9衣壳序列的一部分具有至少95%序列同一性,如至少96%、97%、98%或99%序列同一性的氨基酸序列。在一些实施方案中,杂合衣壳包含与AAV10衣壳序列的一部分具有至少95%序列同一性,如至少96%、97%、98%或99%序列同一性的氨基酸序列。在一些实施方案中,杂合衣壳包含与AAV12衣壳序列的一部分具有至少95%序列同一性,如至少96%、97%、98%或99%序列同一性的氨基酸序列。在一些实施方案中,杂合衣壳包含与AAV8衣壳序列的一部分具有至少95%序列同一性,如至少96%、97%、98%或99%序列同一性的氨基酸序列。在一些实施方案中,所述部分包含至少100个氨基酸,如至少150、200、250、300、350或400个氨基酸。

在一些方面,本发明提供了包含如本文所述的rAAV粒子的组合物。在一些实施方案中,所述组合物还包含药学上可接受的载体。

在一些方面,本发明提供了包含如本文所述的分离核酸的细胞。在一些方面,本发明提供了产生变体PAH多肽的方法,所述方法包括在产生变体PAH多肽的条件下培养上述细胞。在一些实施方案中,所述方法还包括纯化变体PAH多肽的步骤。

在一些方面,本发明提供了用于治疗有需要的个体中苯丙酮尿症的方法,其包括向所述个体施用如本文所述的变体PAH多肽或如本文所述的组合物。在一些方面,本发明提供了用于治疗有需要的个体中苯丙酮尿症的方法,其包括向所述个体施用编码如本文所述的变体PAH多肽的核酸或如本文所述的核酸。在一些方面,本发明提供了用于治疗有需要的个体中苯丙酮尿症的方法,其包括向所述个体施用如本文所述的rAAV载体。在一些方面,本发明提供了用于治疗有需要的个体中苯丙酮尿症的方法,其包括向所述个体施用如本文所述的rAAV粒子。在一些实施方案中,本发明提供了用于治疗有需要的个体中苯丙酮尿症的方法,其包括向所述个体施用如本文所述的组合物。在一些实施方案中,本发明提供了用于治疗有需要的个体中苯丙酮尿症的方法,其包括向所述个体施用如本文所述的细胞。在一些实施方案中,所述个体缺乏PAH活性。

在一些方面,本发明提供了用于降低有需要的个体血液中苯丙氨酸水平的方法,其包括向所述个体施用如本文所述的变体PAH多肽。在一些方面,本发明提供了用于降低有需要的个体血液中苯丙氨酸水平的方法,其包括向所述个体施用编码如本文所述的变体PAH多肽的核酸或如本文所述的核酸。在一些方面,本发明提供了用于降低有需要的个体血液中苯丙氨酸水平的方法,其包括向所述个体施用如本文所述的rAAV载体。在一些方面,本发明提供了用于降低有需要的个体血液中苯丙氨酸水平的方法,其包括向所述个体施用如本文所述的rAAV粒子。在一些方面,本发明提供了用于降低有需要的个体血液中苯丙氨酸水平的方法,其包括向所述个体施用如本文所述的组合物。在一些实施方案中,与同等匹配对照(peer-matched control)个体的血液中苯丙氨酸水平相比,治疗前个体血液中苯丙氨酸水平升高。在一些方面,本发明提供了用于降低有需要的个体血液中苯丙氨酸水平的方法,其包括向所述个体施用如本文所述的细胞。

在一些实施方案中,核酸、rAAV载体、rAAV粒子、组合物或细胞通过静脉内、动脉内、肝内、门静脉内、腹膜内或皮下施用。在一些实施方案中,所述施用与另一种疗法组合。在一些实施方案中,另一种疗法是用四氢生物蝶呤治疗,用苯丙氨酸解氨酶(PAL)或聚乙二醇化PAL治疗,或苯丙氨酸限制饮食。

在一些方面,本发明提供了用于制备PAH多肽的方法,其包括在产生PAH多肽的条件下培养如本文所述的细胞。在一些实施方案中,所述方法还包括纯化PAH多肽。

在一些方面,本发明提供了包含如本文所述的变体PAH多肽的试剂盒。在一些实施方案中,本发明提供了包含如本文所述的核酸、如本文所述的rAAV载体、如本文所述的rAAV粒子或如本文所述的组合物的试剂盒。在一些实施方案中,试剂盒还包括使用说明;缓冲剂和/或药学上可接受的赋形剂;和/或瓶子、小瓶和/或注射器。

在一些方面,本发明提供了用于在肝细胞中表达转基因的表达盒,其中表达盒包含可操作地连接至启动子和增强子的转基因,其中所述启动子包括小鼠甲状腺素运载蛋白(mTTR)启动子,并且所述增强子包括一个或两个修饰的凝血酶原增强子(pPrT2)、一个或两个修饰的α1-微bikunin增强子(mA1MB2)、修饰的小鼠白蛋白增强子(mEalb)、乙型肝炎病毒增强子II(HEII)或CRM8增强子。在一些实施方案中,mTTR启动子是mTTR482启动子。在一些实施方案中,增强子在mTTR启动子的5'侧。

在一些方面,本发明提供了用于在肝细胞中表达转基因的表达盒,其中表达盒包含可操作地连接至启动子和和3'元件的转基因,其中所述启动子包括小鼠甲状腺素运载蛋白(mTTR)启动子,并且所述3'元件是白蛋白3'元件(3'Alb)或连接至人α1抗胰蛋白酶支架/基质附着区(SMAR)的白蛋白3'元件(3'AlbSMAR)。在一些实施方案中,mTTR启动子是mTTR482启动子。在一些实施方案中,3'元件位于转基因的3'侧。

在一些方面,本发明提供了用于在肝细胞中表达转基因的表达盒,其中表达盒包含可操作地连接至启动子和增强子和3'元件的转基因,其中所述启动子包括小鼠甲状腺素运载蛋白(mTTR)启动子,并且所述增强子包括一个或两个修饰的凝血酶原增强子(pPrT2)、一个或两个修饰的α1-微bikunin增强子(mA1MB2)、修饰的小鼠白蛋白增强子(mEalb)、乙型肝炎病毒增强子II(HEII)或CRM8增强子,并且其中所述3'元件是白蛋白3'元件(3'Alb)或连接至人α1抗胰蛋白酶支架/基质附着区(SMAR)的白蛋白3'元件(3'AlbSMAR)。在一些实施方案中,mTTR启动子是mTTR482启动子。在一些实施方案中,增强子在mTTR启动子的5'侧。在一些实施方案中,3'元件位于转基因的3'侧。

在一些实施方案中,表达盒还包含内含子。在一些实施方案中,所述内含子是鸡β-肌动蛋白/兔β-球蛋白杂合内含子。在一些实施方案中,表达盒还包含多腺苷酸化信号。在一些实施方案中,多腺苷酸化信号是牛生长激素多腺苷酸化信号。

在一些实施方案中,所述转基因编码PAH多肽或变体PAH多肽。在一些实施方案中,本发明提供了包含如本文所述的表达盒的载体。在一些实施方案中,所述载体是重组腺相关病毒(rAAV)载体。

在一些实施方案中,本发明提供了包含如本文所述的表达盒的rAAV载体,所述表达盒的侧翼是一个或多个AAV反向末端重复(ITR)序列。在一些实施方案中,所述表达盒的侧翼是两个AAV ITR。在一些实施方案中,AAV ITR是AAV1、AAV2、AAV3、AAV4、AAV5、AAV6、AAV7、AAV8、AAVrh8、AAVrh8R、AAV9、AAV10、AAVrh10、AAV11、AAV12、AAV2R471A、AAV DJ、山羊AAV、牛AAV或小鼠AAV血清型ITR。在一些实施方案中,AAV ITR是AAV2 ITR。

在一些实施方案中,所述载体是自身互补载体。在一些实施方案中,所述载体包含编码PAH多肽的第一核酸序列和编码PAH多肽的补体的第二核酸序列,其中所述第一核酸序列可以与所述第二核酸序列沿着其大部分或全部长度形成链内碱基对。在一些实施方案中,所述第一核酸序列和所述第二核酸序列通过突变的AAV ITR连接,其中所述突变的AAVITR包含D区的缺失并且包含末端解链序列的突变。

在一些实施方案中,本发明提供了包含如本文所述的rAAV载体的rAAV粒子。在一些实施方案中,AAV病毒粒子包含AAV1、AAV2、AAV3、AAV4、AAV5、AAV6、AAV7、AAV8、AAVrh8、AAVrh8R、AAV9、AAV10、AAVrh10、AAV11、AAV12、AAV2R471A、AAV2/2-7m8、AAV DJ、AAV2N587A、AAV2E548A、AAV2 N708A、AAV2 V708K、山羊AAV、AAV1/AAV2嵌合、牛AAV、小鼠AAV或rAAV2/HBoV1血清型衣壳。在一些实施方案中,AAV病毒粒子包含工程化AAV衣壳。在一些实施方案中,工程化AAV衣壳是DJ衣壳或LK03衣壳。在一些实施方案中,rAAV病毒粒子的ITR和衣壳来源于相同的AAV血清型。在一些实施方案中,rAAV病毒粒子的ITR和衣壳来源于不同的AAV血清型。在一些实施方案中,本发明提供了包含如本文所述的rAAV粒子的组合物。在一些实施方案中,所述组合物还包含药学上可接受的载体。

附图说明

图1A-图1C示出了肝脏启动子的优化。图1A示出了前病毒质粒构建体的示意图。构建体mTTR482(编号1)通过添加各种肝脏增强子元件(构建体编号2-6)或3'稳定性元件(构建体编号7-8)进行修饰。将含CBA启动子的构建体用于比较。所有构建体都含有侧翼ITR、杂合内含子和SEAP报告子。然后将构建体转染入Huh7细胞(图1B)或HepG2细胞(图1C)。转染后72小时测量分泌的SEAP活性水平,并通过来自共转染的LacZ质粒的b-半乳糖苷酶水平归一化。每次评价包含n=3-4/质粒。

图2A和图2B示出了通过体内SEAP生产对肝脏启动子的评价。图2A示出了正常C57BL/6小鼠的SEAP水平。图2B示出了PAH

图3A-图3D示出了PAH

图4A-图4D示出了对PAH

图5A和图5B示出了人PAH cDNA的密码子优化。将编码FLAG标记的hPAH的cDNA克隆到mTTR482-hPAH-BGHpA表达质粒中。在体外和体内测试hPAH的产生。图5A示出了Huh7细胞中的FLAG-hPAH水平。转染质粒,并在48小时后制备细胞裂解物。通过蛋白质印迹法分析细胞裂解物中的PAH蛋白水平。图5B示出了C57BL/6小鼠肝脏中的FLAG-hPAH水平。质粒通过流体动力注射施用,并在24小时后收集肝脏。使用FLAG-ELISA对肝裂解物中FLAG标记的hPAH水平进行定量,并通过总蛋白归一化。值代表n=4-5只动物/组的平均值。缩写:C,阴性对照质粒;GS,Genscript,GA,GeneArt,GS CpG,除去CpG的Genscript序列;non,原始hPAH DNA序列;初始

图6A是蛋白质印迹,其示出了在不同启动子(mTTR482、CBA和LP1)的控制下,人苯丙氨酸羟化酶(hPAH)和小鼠苯丙氨酸羟化酶(mPAH)的表达。将表达质粒转染入Huh7细胞,并且在两天后使用针对FLAG的抗体分析细胞裂解物的FLAG-PAH水平。

图6B是蛋白质印迹,其示出了全长(FL)和双截短(DT)人和小鼠PAH体外表达的比较。分析如图6A。

图6C是全长(FL)和双截短(DT)形式两者的hPAH和mPAH蛋白水平的比较。用表达质粒转染后,通过ELISA对Huh7细胞裂解物进行FLAG标记的蛋白质的定量。

图6D是hPAH和mPAH mRNA水平的比较。通过qPCR对图6C中使用的材料进行RNA分析。

图6E是蛋白质印迹,其示出了纯化的hPAH和mPAH(均以全长和双截短形式产生)的分析。蛋白质通过FLAG亲和柱纯化,并在SDS-PAGE凝胶中运行,随后用抗FLAG抗体检测。

图6F示出了在PKU小鼠模型中编码hPAH或mPAH的rAAV8载体的功效。hPAH和mPAH两者均由具有LP1启动子的自身互补载体(sc-LP1)表达。将功效作为在单次IV注射到PAH

图7A-图7C示出了小鼠/人杂合PAH构建体的产生。图7A示出了小鼠/人杂合PAH构建体的示意图。显示了来源于人(绿色)和小鼠(灰色)PAH的区域。图7B示出了替代hPAH的N-末端区域对蛋白质表达水平的影响。图7C示出了hPAH的C-末端区域的变化对蛋白质表达水平的影响。通过将具有CBA-PAH表达盒的质粒转染到293T细胞中进行实验。在48小时后,收集细胞用于通过FLAG ELISA定量FLAG-PAH。

图8A和图8B示出了体外筛选双截短hPAH(hPAH-DT)变体。图8A示出了质粒表达的hPAH蛋白变体(编号1至编号8)的蛋白表达水平。图8B示出了质粒表达的hPAH蛋白变体的PAH活性水平。将所有变体转染到293细胞中,并由具有CBA启动子的质粒表达。将变体质粒的结果与表达人或小鼠PAH的类似质粒进行比较。

图9A-图9C示出了针对体外PAH产生对hPAH-V1-DT衍生物的表征。图9A示出了hPAH-V1-DT衍生物的PAH活性水平。图9B示出了hPAH-V1-DT衍生物的PAH蛋白水平。图9C示出了hPAH-V1-DT衍生物的特定PAH活性。结果基于对来自转染的293细胞的细胞裂解物的分析。

图10A-图10C示出了针对体外PAH产生对hPAH-V1-DT衍生物的重复分析。图10A示出了所选择hPAH-V1-DT衍生物的PAH活性水平。图10B示出了hPAH-V1-DT衍生物的PAH蛋白水平。图10C示出了hPAH-V1-DT衍生物的特定PAH活性。数据如图8A和8B中所述生成。图10D示出了变体-1的三个双突变体形式的PAH活性。数据如图8A和8B中所述生成。

图11A-图11C示出了全长hPAH-V1与小鼠PAH(mPAH)和人PAH(hPAH)的体外比较。图11A是蛋白质表达的蛋白质印迹分析。图11B示出了通过FLAG-ELISA的PAH蛋白水平。图11C示出了PAH活性水平。通过将具有肝启动子A1MB2-mTTR482且编码全长PAH蛋白的表达质粒转染到Huh7中,随后分析细胞裂解物来产生数据。m表示标记泳道。

图12A-图12C示出了在PAH

图13A-图13C示出了肝脏中rAAV载体基因组和3x-FLAG-PAH水平的定量。图13A示出了PAH蛋白水平。图13B示出了PAH活性水平。图13C示出了肝脏中的载体基因组拷贝。如图12A-12C所述进行实验,并在载体施用后69天收集肝脏。在每个图中,示出了3e11 VG/小鼠治疗组(hPAH、hPAH-V1和mPAH)和1e12 vg/小鼠治疗组(hPAH、hPAH-V1)的数据。P值,***为<0.001。

图14A-图14D示出了脑中各种氨基酸水平的定量。图14A示出了脑苯丙氨酸水平。图14B示出了脑酪氨酸水平。图14C示出了脑与血液苯丙氨酸水平之间的相关性。图14D示出了脑色氨酸水平。如图12A-12C所述进行了实验。示出的数据来自以3e11 VG/小鼠给药的治疗组(n=5/组)(第69天)。P值,***为<0.001。

图15A-图15D示出了脑中的神经递质水平。图15A示出了脑多巴胺水平。图15B示出了多巴胺代谢物DOPAC的脑水平。图15C示出了脑血清素水平。图15D示出了血清素代谢物HIAA的脑水平。实验如图12A-12C所述进行,并且值来自3e11 VG/小鼠群组(第69天)。P值,**为P<0.01,并且***为P<0.001。

图16A-图16B示出了3.8和4.6kb A1MB2-mTTR-hPAV-V1载体基因组的功效比较。图16A示出了载体的示意图。图16B示出了PAH

图17A-图17C示出了用rAAV载体递送后非人灵长类动物肝脏中hPAH-V1与hPAH产生的体内比较。图17A示出了每只单独动物的肝脏中rAAV载体基因组的水平。图17B示出了每只所治疗动物的肝脏和脾脏中载体衍生的mRNA水平。将每只动物的mRNA水平针对载体基因组拷贝归一化。图17C示出了对肝匀浆中FLAG标记的PAH蛋白的检测。通过检测看家蛋白GAPDH来确认裂解物加载量相等。实验是通过IV施用5e12 g/kg从A1MB2-mTTR启动子表达FLAG标记的PAH或PAH-V1的rAAV载体来进行的。2周后收集组织用于分析肝脏中的载体基因组、载体衍生的mRNA和PAH蛋白。

具体实施方式

在一些方面,本文所述的本发明提供了人PAH(hPAH-V1)多肽的变体,其包含至少两个四个氨基酸的变化,与野生型hPAH相比,所述变化在体外和体内赋予更高的PAH蛋白和/或活性水平。在其他方面,本文所述的本发明提供了改进的人PAH(hPAH-V1)的变体,其包含至少两个、三个或四个氨基酸的变化,与野生型hPAH相比,所述变化在体外和体内赋予更高的PAH蛋白和/或活性水平。在一些方面,本发明提供了编码所述人PAH变体的核酸。在一些方面,本发明提供了包含本公开文本的变体PAH多肽的表达盒、重组腺相关病毒(rAAV)载体和病毒粒子以及药物组合物。在其他方面,本发明提供了用于治疗苯丙酮尿症(PKU)的方法;例如,通过增加PAH活性,增加酪氨酸和色氨酸向脑的转运,并使包括多巴胺和血清素的脑神经递质水平正常化。在又其他方面,本发明提供了用于使用本公开文本的变体PAH治疗个体中PKU的试剂盒。

I.通用技术

本领域技术人员通常熟知并且通常使用常规方法来使用本文描述或引用的技术和程序,例如像描述在以下文献中的广泛使用的方法:Molecular Cloning:A LaboratoryManual(Sambrook等人,第4版,Cold Spring Harbor Laboratory Press,冷泉港,纽约,2012);Current Protocols in Molecular Biology(F.M.Ausubel,等人编辑,2003);theseries Methods in Enzymology(Academic Press,Inc.);PCR 2:A Practical Approach(M.J.MacPherson,B.D.Hames和G.R.Taylor编辑,1995);Antibodies,A LaboratoryManual(Harlow和Lane编辑,1988);Culture of Animal Cells:A Manual of BasicTechnique and Specialized Applications(R.I.Freshney,第6版,J.Wiley and Sons,2010);Oligonucleotide Synthesis(M.J.Gait编辑,1984);Methods in MolecularBiology,Humana Press;Cell Biology:A Laboratory Notebook(J.E.Cellis编辑,Academic Press,1998);Introduction to Cell and Tissue Culture(J.P.Mather和P.E.Roberts,Plenum Press,1998);Cell and Tissue Culture:Laboratory Procedures(A.Doyle,J.B.Griffiths和D.G.Newell编辑,J.Wiley and Sons,1993-8);Handbook ofExperimental Immunology(D.M.Weir和C.C.Blackwell编辑,1996);Gene TransferVectors for Mammalian Cells(J.M.Miller和M.P.Calos编辑,1987);PCR:ThePolymerase Chain Reaction,(Mullis等人编辑,1994);Current Protocols inImmunology(J.E.Coligan等人编辑,1991);Short Protocols in Molecular Biology(Ausubel等人编辑,J.Wiley and Sons,2002);Immunobiology(C.A.Janeway等人,2004);Antibodies(P.Finch,1997);Antibodies:A Practical Approach(D.Catty.编辑,IRLPress,1988-1989);Monoclonal Antibodies:A Practical Approach(P.Shepherd和C.Dean编辑,Oxford University Press,2000);Using Antibodies:A Laboratory Manual(E.Harlow和D.Lane,Cold Spring Harbor Laboratory Press,1999);The Antibodies(M.Zanetti和J.D.Capra编辑,Harwood Academic Publishers,1995);以及Cancer:Principles and Practice of Oncology(V.T.DeVita等人编辑,J.B.LippincottCompany,2011)。

II.定义

如本文所用的“载体”是指包含有待在体外或在体内递送至宿主细胞中的核酸的重组质粒或病毒。

如本文所用的术语“多核苷酸”或“核酸”是指任何长度的聚合形式的核苷酸(核糖核苷酸或脱氧核糖核苷酸)。因此,此术语包括但不限于单链、双链或多链DNA或RNA;基因组DNA;cDNA;DNA-RNA杂合体;或者包括嘌呤和嘧啶碱基或其他天然的、化学修饰的或生化修饰的核苷酸碱基,非天然的或衍生的核苷酸碱基的聚合物。多核苷酸的主链可包括糖和磷酸基团(正如典型地可在RNA或DNA中所见的)或者经修饰或取代的糖或磷酸基团。可替代地,多核苷酸的主链可以包含合成亚基(如氨基磷酸酯)的聚合物,并且因此可以是寡脱氧核苷氨基磷酸酯(P-NH

术语“多肽”和“蛋白质”可互换使用以指代氨基酸残基的聚合物,并且不限于最小长度。氨基酸残基的此类聚合物可以含有天然或非天然氨基酸残基,并且包括但不限于氨基酸残基的肽、寡肽、二聚体、三聚体和多聚体。所述定义涵盖了全长蛋白质及其片段两者。所述术语还包括多肽的表达后修饰,例如糖基化、唾液酸化、乙酰化、磷酸化等。此外,出于本公开文本的目的,“多肽”是指包括对天然序列的修饰(如缺失、添加和取代,在本质上通常是保守的)的蛋白质,只要所述蛋白质保持期望的活性即可。这些修饰可能是故意的(如通过定点诱变),或可能是偶然的(如通过产生蛋白质的宿主的突变或由于PCR扩增引起的错误)。

“重组病毒载体”是指包含一个或多个异源序列(即,不是病毒来源的核酸序列)的重组多核苷酸载体。在重组AAV载体的情况下,重组核酸的侧翼是至少一个,且在实施方案中是两个反向末端重复序列(ITR)。

“重组AAV载体(rAAV载体)”是指包含一个或多个侧翼是至少一个,且在实施方案中是两个AAV反向末端重复序列(ITR)的异源序列(即,不是AAV来源的核酸序列)的多核苷酸载体。当此类rAAV载体存在于已感染合适的辅助病毒(或所述辅助病毒表达合适的辅助功能)并且正在表达AAV rep和cap基因产物(即AAV Rep和Cap蛋白)的宿主细胞中时,所述rAAV载体可以被复制并包装在感染性病毒粒子中。当将rAAV载体掺入较大多核苷酸中(例如,在染色体中或在用于克隆或转染的另一种载体如质粒中)时,则rAAV载体可以被称为“前载体”,其可以通过在AAV包装功能和合适辅助功能的存在下复制和衣壳化被“挽救”。rAAV载体可以是多种形式中的任一种,包括但不限于质粒、线性人工染色体、与脂质复合、包封在脂质体内、和衣壳化于病毒粒子(特别是AAV粒子)中。rAAV载体可以被包装在AAV病毒衣壳中,以产生“重组腺相关病毒粒子(rAAV粒子)”。

“异源的”意指衍生自基因型不同于其所比较或其所引入或掺入的实体的其余部分的实体。例如,通过基因工程技术引入不同细胞类型中的多核苷酸是异源多核苷酸(并且在表达时可以编码异源多肽)。类似地,掺入病毒载体的细胞序列(例如,基因或其部分)是相对于所述载体的异源核苷酸序列。

术语“转基因”是指引入细胞并且能够转录成RNA并且任选地在适当条件下翻译和/或表达的多核苷酸。在多个方面,它赋予引入它的细胞以所期望的特性,或以其他方式产生所期望的治疗或诊断结果。

“鸡β-肌动蛋白(CBA)启动子”是指来源于鸡β-肌动蛋白基因(例如,红原鸡(Gallus gallus)β肌动蛋白,以GenBank Entrez Gene ID 396526表示)的多核苷酸序列。如本文所用,“鸡β-肌动蛋白启动子”可以指含有巨细胞病毒(CMV)早期增强子元件、鸡β-肌动蛋白基因的启动子和第一外显子和内含子、和兔β-球蛋白基因的剪接受体的启动子,如Miyazaki,J.等人(1989)Gene 79(2):269-77中所述序列。如本文所用,术语“CAG启动子”可以互换使用。如本文所用,术语“CMV早期增强子/鸡β肌动蛋白(CAG)启动子”可以互换使用。

如关于病毒滴度使用的术语“基因组粒子(gp)”、“基因组当量”或“基因组拷贝”是指含重组AAV DNA基因组的病毒粒子的数量,与感染性或功能性无关。特定载体制剂中基因组粒子的数量可以通过如本文实施例中或例如以下文献中所述的程序来测量:Clark等人(1999)Hum.Gene Ther.,10:1031-1039;Veldwijk等人(2002)Mol.Ther.,6:272-278。

如本文所用的术语“载体基因组(vg)”可以指包含一组载体(例如,病毒载体)的多核苷酸序列的一种或多种多核苷酸。载体基因组可以衣壳化于病毒粒子中。根据特定的病毒载体,载体基因组可以包含单链DNA、双链DNA或单链RNA或双链RNA。载体基因组可以包括与特定病毒载体相关的内源序列和/或通过重组技术插入特定病毒载体的任何异源序列。例如,重组AAV载体基因组可以包括位于启动子侧翼的至少一个ITR序列、填充片段、感兴趣序列(例如RNAi)和多腺苷酸化序列。完整的载体基因组可以包括载体的全组多核苷酸序列。在一些实施方案中,病毒载体的核酸滴度可以按vg/mL测量。适用于测量此滴度的方法在本领域中是已知的(例如,定量PCR)。

如关于病毒滴度使用的术语“感染单位(iu)”、“感染性粒子”或“复制单位”是指感染性和复制型重组AAV载体粒子的数量,如通过感染中心测定(也称为复制中心测定)测量的,如例如McLaughlin等人(1988)J.Virol.,62:1963-1973中所述。

如关于病毒滴度使用的术语“转导单位(tu)”是指导致产生功能转基因产物的感染性重组AAV载体粒子的数量,如在功能测定中测量的,如本文实施例中或例如以下文献中所述:Xiao等人(1997)Exp.Neurobiol.,144:113-124中;或Fisher等人(1996)J.Virol.,70:520-532(LFU测定)。

“反向末端重复”或“ITR”序列是本领域中熟知的术语,并且是指在病毒基因组末端发现的处于相反方向的相对较短的序列。

“AAV反向末端重复(ITR)”序列是本领域中熟知的术语,是存在于天然单链AAV基因组的两端处的大约145个核苷酸的序列。ITR的最外侧的125个核苷酸能以两个替代方向中的任一个存在,导致不同AAV基因组之间以及单个AAV基因组两端之间的异质性。最外侧的125个核苷酸也含有几个较短的自身互补的区域(指定为A、A'、B、B'、C、C'和D区),允许在ITR的这个部分内发生链内碱基配对。

“末端解链序列”或“trs”是AAV ITR的D区中的序列,其在病毒DNA复制期间被AAVrep蛋白切割。突变体末端解链序列难以被AAV rep蛋白切割。

“AAV辅助功能”是指允许AAV被宿主细胞复制和包装的功能。AAV辅助功能可以按多种形式中的任一种提供,包括但不限于协助AAV复制和包装的辅助病毒或辅助病毒基因。其他AAV辅助功能在本领域中是已知的,如基因毒性剂。

AAV的“辅助病毒”是指允许AAV(其是缺陷型细小病毒)被宿主细胞复制和包装的病毒。辅助病毒提供允许AAV复制的“辅助功能”。已经鉴定了多种此类辅助病毒,包括腺病毒、疱疹病毒和痘病毒,如牛痘和杆状病毒。腺病毒涵盖多种不同子群,但子群C的5型腺病毒(Ad5)是最常用的。人、非人哺乳动物和鸟类来源的许多腺病毒是已知的,并且可从如ATCC等保藏机构获得。也可从如ATCC等保藏机构获得的疱疹家族病毒包括例如单纯疱疹病毒(HSV)、爱泼斯坦-巴尔(Epstein-Barr)病毒(EBV)、巨细胞病毒(CMV)和假狂犬病病毒(PRV)。用于复制AAV的腺病毒辅助功能的例子包括E1A功能、E1B功能、E2A功能、VA功能和E4orf6功能。可从保藏机构获得的杆状病毒包括苜蓿银纹夜蛾(Autographa californica)核型多角体病毒。

如果感染性AAV粒子与感染性辅助病毒粒子的比率是至少约10

将关于参考多肽或核酸序列的“序列同一性百分比(%)”定义为在比对序列并引入空位(如果需要)以实现最大序列同一性百分比之后,并且不将任何保守取代视为序列同一性的一部分,候选序列中与参考多肽或核酸序列中的氨基酸残基或核苷酸相同的氨基酸残基或核苷酸的百分比。用于确定氨基酸或核酸序列同一性百分比的目的的比对可以用在本领域技术范围内的多种方式实现,例如使用可公开获得的计算机软件程序,例如CurrentProtocols in Molecular Biology(Ausubel等人编辑,1987),增刊30,第7.7.18章,表7.7.1中描述的那些,并且包括BLAST、BLAST-2、ALIGN或Megalign(DNASTAR)软件。优选的比对程序是ALIGN Plus(科学教育软件(Scientific and Educational Software),宾夕法尼亚州(Pennsylvania))。本领域技术人员可以确定用于测量比对的适当参数,包括为了在被比较的序列的全长上实现最大比对所需要的任何算法。出于本文的目的,给定氨基酸序列A与(to、with或against)给定氨基酸序列B的氨基酸序列同一性%(其可以可替代地表述为具有或包含与(to、with或against)给定氨基酸序列B的一定氨基酸序列同一性%的给定氨基酸序列A)计算如下:100乘以分数X/Y,其中,X是通过序列比对程序在所述程序对A和B的比对中被评为相同匹配的氨基酸残基的数量,并且其中Y是B中氨基酸残基的总数。应了解当氨基酸序列A的长度不等于氨基酸序列B的长度时,A对于B的氨基酸序列同一性%将不等于B对于A的氨基酸序列同一性%。出于本文的目的,给定核酸序列C与(to、with或against)给定核酸序列D的核酸序列同一性%(其可以可替代地表述为具有或包含与(to、with或against)给定核酸核酸D的一定核酸序列同一性%的给定核酸序列C)计算如下:100乘以分数W/Z,其中,W是通过序列比对程序在所述程序对C和D的比对中被评为相同匹配的核苷酸的数量,并且其中Z是D中核苷酸的总数。应了解当核酸序列C的长度不等于核酸序列D的长度时,C对于D的核酸序列同一性%将不等于D对于C的核酸序列同一性%。

“分离的”分子(例如,核酸或蛋白质)或细胞意指已经从其天然环境的组分中鉴别并分离和/或回收。

“有效量”是足以产生有益或期望结果的量,所述结果包括临床结果(例如,症状的改善、临床终点的实现等)。有效量能以一次或多次施用来施用。就疾病状态而言,有效量是足以改善、稳定疾病或延迟疾病发展的量。

“个体”或“受试者”是哺乳动物。哺乳动物包括但不限于家养动物(例如牛、绵羊、猫、狗和马)、灵长类动物(例如人和非人灵长类动物如猴)、兔和啮齿动物(例如小鼠和大鼠)。在某些实施方案中,所述个体或受试者是人。

如本文所用,“治疗”是用于获得有益或期望临床结果的途径。出于本公开文本的目的,有益或期望的临床结果包括但不限于以下:缓解症状、减小疾病的程度、稳定疾病状态(例如不恶化)、防止疾病扩散(例如,转移)、延迟或减缓疾病进展、改善或缓和疾病状态、以及缓解(无论是部分或是全部),无论是可检测的还是不可检测的。“治疗”还可以意指与如果没有接受治疗的预期的存活期相比,延长存活期。

如本文所用,术语“预防性治疗”是指这样的治疗,其中已知或怀疑个体患有障碍或具有患上障碍的风险,但尚未展示出该障碍的症状或展示出该障碍的最小症状。可以在症状发作之前治疗经历预防性治疗的个体。

如本文所用,“苯丙氨酸羟化酶(PAH)”是催化苯丙氨酸芳香侧链羟基化生成酪氨酸的酶(EC 1.14.16.1)。PAH是单加氧酶,其使用四氢生物蝶呤(BH4,一种蝶呤辅因子)和非血红素铁进行催化。在反应过程中,分子氧被异裂,其中将一个氧原子连续掺入BH4和苯丙氨酸底物中。苯丙氨酸羟基化为酪氨酸是苯丙氨酸分解代谢的限速步骤,并且这种酶活性的缺乏导致常染色体隐性障碍苯丙酮尿症。PAH也可称为PH、PKU或PKU1。PAH是多结构域蛋白质,其由N-末端调节结构域(1-117)、中心催化结构域(118-410)和C-末端四聚结构域(411-452)组成。人PAH在GenBank中提供;例如,NM_000277、NM_00877、NM_001354304、NP_000268、NP_032803、NP_001341233、AAA60082.1、AAH26251.1、AAC51772.1和AAL78816.1(GI:18765885)。人PAH的例子是作为SEQ ID NO:1来提供。

如本文所用,“苯丙酮尿症(PKU)”是指肝酶苯丙氨酸羟化酶(PAH)的遗传缺陷。在没有任何治疗的情况下,严重形式的PKU导致高度升高的血液Phe水平,这具有神经毒性,并与严重的精神发育迟滞相关联。

“mTTR启动子”是指来源于鼠甲状腺素运载蛋白基因的多核苷酸序列。mTTR启动子的例子mTTR482由Kyostio-Moore,(2016)和Nambiar(2017)提供。

“修饰的凝血酶原增强子(mPrT2)”是指来源于人凝血酶原基因的多核苷酸序列的两个拷贝。mPrT2增强子的例子由(McEachern 2006,Jacobs 2008)提供。mPrT2序列的例子由SEQ ID NO:7提供。

“修饰的α1-微bikunin(mA1MB2)”是指来源于人α1-微bikunin/bikunin基因的多核苷酸序列的两个拷贝。mA1MB2的例子是(McEachern 2006,Jacobs 2008)的增强子。mA1MB2序列的例子由SEQ ID NO:8提供。

“修饰的小鼠白蛋白增强子(mEalb)”是指来源于鼠类白蛋白基因的多核苷酸序列。mEalb增强子的例子由(Kramer 2003)提供。mEalb序列的例子由SEQ ID NO:9提供。

“乙型肝炎病毒增强子II(HEII)”是指来源于乙型肝炎病毒的位于前C区启动子上游的多核苷酸序列。hEII增强子的例子由(Kramer 2003)提供。HEII序列的例子由SEQ IDNO:10提供。

“CRM8”是指来源于来自人Serpina1基因的多核苷酸序列的顺式作用调节模块(Chuah 2014)。CRM8序列的例子由SEQ ID NO:11提供。

“Alb 3”是指人白蛋白基因编码区3'侧的多核苷酸序列。Alb 3'元件的例子由Wooddell(2008)提供。Alb 3'序列的例子由SEQ ID NO:12提供。“Alb3'/SMAR”是指连接至人α1-抗胰蛋白酶基因(AF156542)的支架/基质附着区的Alb3'。Alb3'/SMAR序列的例子由SEQ ID NO:13提供。

本文对“约”某一值或参数的提及包括(并描述)涉及所述值或参数本身的实施方案。例如,提及“约X”的描述包括“X”的描述。

除非另外说明,否则如本文所用,冠词的单数形式“一个(a)”、“一种(an)”和“所述”包括复数指示物。

应理解,本文所述的公开文本的方面和实施方案包括“包含”方面和实施方案、“由方面和实施方案组成”和/或“基本上由方面和实施方案组成”。

III.PAH变体

在一些方面,本发明提供了变体PAH多肽,当在个体中表达时,其赋予更高的PAH表达和/或活性水平。在一些实施方案中,变体PAH多肽包含至少两个氨基酸取代,其中所述氨基酸取代位于选自野生型人PAH多肽的M180、K199、S250、S251、H264、G256、G272、G275、P279、T323和F327的位点处。在一些实施方案中,变体PAH多肽包含在H264和G275处的至少两个氨基酸取代。在一些实施方案中,变体PAH多肽包含至少三个氨基酸取代,其中所述氨基酸取代位于选自野生型人PAH多肽的M180、K199、S250和G256的位点处。在一些实施方案中,变体PAH多肽包含在野生型人PAH多肽的位点M180、K199、S250和G256处的四个氨基酸取代。在一些实施方案中,变体PAH多肽包含在M180、K199、S250、S251、G256、G272和P279处的五个氨基酸取代。在一些实施方案中,变体PAH多肽包含在M180、K199、S250、G256、T323和F327处的六个氨基酸取代。在一些实施方案中,变体PAH多肽包含H264P和G275H的至少两个氨基酸取代。在一些实施方案中,变体PAH多肽包含选自M180T、K199P、S250P和G256A的至少三个氨基酸取代。在一些实施方案中,变体PAH多肽包含包括以下的氨基酸取代:K199P、S250P和G256A;M180T、S250P和G256A;M180T、K199P和G256A;或者M180T、K199P和S250P。在一些实施方案中,变体PAH多肽还包含氨基酸取代H264P、G272A、G272P、P275L、P279Q、G272P和P275L,或T323R和F327T氨基酸取代。在一些实施方案中,变体PAH多肽是表1-3中列出的任一种变体PAH多肽。在一些实施方案中,变体PAH多肽包含氨基酸取代M180T、K199P、S250P和G256A,并且包含另外的氨基酸取代,同时至少大致保持野生型PAH的苯丙氨酸羟化酶活性。在一些实施方案中,氨基酸取代的位置基于野生型人PAH多肽;例如,包含SEQ ID NO:1的氨基酸序列的人PAH多肽。

在一些实施方案中,变体PAH多肽是人PAH多肽。在一些实施方案中,变体PAH多肽包含SEQ ID NO:3的氨基酸序列。在一些实施方案中,变体PAH多肽包含与SEQ ID NO:3的氨基酸序列具有至少约为80%、85%、90%、95%或99%中任一同一性的氨基酸序列。在一些实施方案中,包含与SEQ ID NO:3的氨基酸序列具有至少约为80%、85%、90%、95%或99%中任一同一性的氨基酸序列的变体PAH多肽具有至少约25%、50%、75%、100%或大于100%的野生型PAH的苯丙氨酸羟化酶活性。在一些实施方案中,包含与SEQ ID NO:3的氨基酸序列具有至少约为80%、85%、90%、95%或99%中任一同一性的氨基酸序列的变体PAH多肽具有至少约25%、50%、75%、100%或大于100%的SEQ ID NO:1的野生型PAH的苯丙氨酸羟化酶活性。

在一些实施方案中,变体PAH多肽是保持苯丙氨酸羟化酶活性的截短PAH多肽。在一些实施方案中,截短PAH多肽包含N-末端截短。在一些实施方案中,N-末端截短是N-末端调节结构域的部分或全部截短。在一些实施方案中,N-末端截短是野生型人PAH多肽(例如,SEQ ID NO:1的PAH多肽)的氨基酸残基1至约氨基酸残基102的缺失。在一些实施方案中,截短PAH多肽包含C-末端截短。在一些实施方案中,C-末端截短是四聚结构域的部分或全部截短。在一些实施方案中,C-末端截短是野生型人PAH多肽(例如,SEQ ID NO:1的PAH多肽)的约429至452的氨基酸残基的缺失。在一些实施方案中,变体PAH多肽包含N-末端截短和C-末端截短。在一些实施方案中,截短PAH多肽包含N-末端调节序列的部分或全部截短以及四聚结构域的部分或全部截短。在一些实施方案中,截短PAH多肽包含野生型人PAH多肽(例如,SEQ ID NO:1的PAH多肽)的氨基酸残基1至约氨基酸残基102和约429至约452的缺失。在一些实施方案中,变体PAH多肽包含对应于野生型人PAH多肽(例如,SEQ ID NO:1的PAH多肽)的约102至约428的氨基酸残基的氨基酸序列。在一些实施方案中,变体PAH多肽包含对应于野生型人PAH多肽(例如,SEQ ID NO:1的PAH多肽)的102至428的氨基酸残基的氨基酸序列。在一些实施方案中,截短PAH多肽还包含在野生型人PAH多肽(例如,SEQ ID NO:1的PAH多肽)的位点M180、K199、S250和G256处的四个氨基酸取代。在一些实施方案中,截短PAH多肽包含选自M180T、K199P、S250P和G256A的四个氨基酸取代。在一些实施方案中,截短变体PAH多肽还包含表1-3中列出的氨基酸取代的任一种组合。在一些实施方案中,截短PAH多肽具有至少约25%、50%、75%、100%或大于100%的野生型PAH(例如,SEQ ID NO:1的PAH多肽)的苯丙氨酸羟化酶活性。

在一些实施方案中,变体PAH多肽包含在以下位点的一个或多个处的一个或多个氨基酸取代:G33、G46、G103、G139、G148、G188、G218、G239、G247、G257、G272、G289、G307、G312、G332、G337、G344、G352或G442。在一些实施方案中,变体PAH多肽包含以下氨基酸取代中的一个:G33A、G46(A、P)、G103A、G139(A、P)、G148A、G188A、G218A、G239A、G247A、G257A、G272A、G289A、G307A、G312A、G332A、G337A、G344A、G352A或G442A。在一些实施方案中,变体编号1PAH多肽还包含在以下位点的一个或多个处的一个或多个氨基酸取代:G33、G46、G103、G139、G148、G188、G218、G239、G247、G257、G272、G289、G307、G312、G332、G337、G344、G352或G442。在一些实施方案中,变体编号1PAH多肽包含以下氨基酸取代中的一个或多个:G33A、G46(A、P)、G103A、G139(A、P)、G148A、G188A、G218A、G239A、G247A、G257A、G272A、G289A、G307A、G312A、G332A、G337A、G344A、G352A或G442A。

在一些实施方案中,变体PAH多肽(例如变体编号1PAH多肽)包含以下氨基酸取代中的一个或多个:P9G、G10V、G12S、K184R、K192R、S196A、Y206H、H220R、Q336E、E360D、I374C、N376E、N401T、I421V、I441V、S446H。在一些实施方案中,变体PAH多肽(例如变体编号1)还包含在人PAH的C-末端处的丝氨酸残基(Ser453)。

在一些实施方案中,变体PAH多肽(例如变体编号1PAH多肽)包含以下氨基酸取代中的一个或多个:F240W、A246P、G247A、Y268W、C284F、T323R、F327Y、E319P、I306(Y、F)、K113P、G188A、F191Y、T193R、Y206H、G337P、N376P。

在一些实施方案中,变体PAH多肽(例如变体编号1PAH多肽)包含任何氨基酸取代,以消除潜在的蛋白酶切割位点。在一些实施方案中,用于消除潜在蛋白酶切割位点的氨基酸取代位于PAH片段270-295和380-405内。

在一些实施方案中,变体PAH多肽(例如变体编号1PAH多肽)包含翻译后修饰,以增强人PAH的稳定性。在一些实施方案中,变体PAH多肽包含翻译后修饰,如聚乙二醇化和通过外部亚硝化试剂对Cys残基特别是I374C进行的亚硝化。

III.核酸

在一些方面,本发明提供了编码变体PAH多肽的核酸,当在个体中表达时,所述变体PAH多肽赋予更高的PAH活性水平。在一些实施方案中,所述核酸编码包含至少三个氨基酸取代的变体PAH多肽,其中所述氨基酸取代位于选自野生型人PAH多肽的M180、K199、S250和G256的位点处。在一些实施方案中,所述核酸编码包含在野生型人PAH多肽的位点M180、K199、S250和G256处的四个氨基酸取代的变体PAH多肽。在一些实施方案中,所述核酸编码包含选自M180T、K199P、S250P和G256A的至少三个氨基酸取代的变体PAH多肽。在一些实施方案中,所述核酸编码包含氨基酸取代M180T、K199P、S250P和G256A的变体PAH多肽。在一些实施方案中,所述核酸编码包含包括以下的氨基酸取代的变体PAH多肽:K199P、S250P和G256A;M180T、S250P和G256A;M180T、K199P和G256A;或者M180T、K199P和S250P。在一些实施方案中,所述核酸编码包含氨基酸取代M180T、K199P、S250P和G256A的变体PAH多肽。在一些实施方案中,所述核酸编码还包含氨基酸取代H264P、G272A、G272P、P275L、P279Q、G272P和P275L,或T323R和F327T氨基酸取代的变体PAH多肽。在一些实施方案中,所述核酸编码是表1-3中列出的任一种变体PAH多肽的变体PAH多肽。在一些实施方案中,所述核酸编码包含氨基酸取代M180T、K199P、S250P和G256A,并且包含另外的氨基酸取代,同时至少大致保持野生型PAH的苯丙氨酸羟化酶活性的变体PAH多肽。在一些实施方案中,由所述核酸编码的氨基酸取代的位置基于野生型人PAH多肽;例如,包含SEQ ID NO:1的氨基酸序列的人PAH多肽。

在一些实施方案中,所述核酸编码变体人PAH多肽。在一些实施方案中,所述核酸编码包含SEQ ID NO:3的氨基酸序列的变体PAH多肽。在一些实施方案中,所述核酸编码包含与SEQ ID NO:3的氨基酸序列具有至少约为80%、85%、90%、95%或99%中任一同一性的氨基酸序列的变体PAH多肽。在一些实施方案中,所述核酸编码包含与SEQ ID NO:3的氨基酸序列具有至少约为80%、85%、90%、95%或99%中任一同一性的氨基酸序列并且具有至少约25%、50%、75%、100%或大于100%的野生型PAH的苯丙氨酸羟化酶活性的变体PAH多肽。在一些实施方案中,所述核酸编码包含与SEQ ID NO:3的氨基酸序列具有至少约为80%、85%、90%、95%或99%中任一同一性的氨基酸序列并且具有至少约25%、50%、75%、100%或大于100%的SEQ ID NO:1的野生型PAH的苯丙氨酸羟化酶活性的变体PAH多肽。

在一些实施方案中,所述核酸编码是保持苯丙氨酸羟化酶活性的截短PAH多肽的变体PAH多肽。在一些实施方案中,所述核酸编码包含N-末端截短的截短PAH多肽。在一些实施方案中,所述核酸编码是N-末端调节结构域的部分或全部截短的N-末端截短。在一些实施方案中,所述核酸编码包含野生型人PAH多肽(例如,SEQ ID NO:1的PAH多肽)的氨基酸残基1至约氨基酸残基102的缺失的N-末端截短。在一些实施方案中,所述核酸编码包含C-末端截短的截短PAH多肽。在一些实施方案中,所述核酸编码是四聚结构域的部分或全部截短的C-末端截短。在一些实施方案中,所述核酸编码包含野生型人PAH多肽(例如,SEQ ID NO:1的PAH多肽)的约429至452的氨基酸残基的缺失的C-末端截短。在一些实施方案中,所述核酸编码包含N-末端截短和C-末端截短的变体PAH多肽。在一些实施方案中,截短PAH多肽包含N-末端调节序列的部分或全部截短以及四聚结构域的部分或全部截短。在一些实施方案中,截短PAH多肽包含野生型人PAH多肽(例如,SEQ ID NO:1的PAH多肽)的氨基酸残基1至约氨基酸残基102和约429至约452的缺失。在一些实施方案中,所述核酸编码包含对应于野生型人PAH多肽(例如,SEQ ID NO:1的PAH多肽)的约102至约428的氨基酸残基的氨基酸序列的变体PAH多肽。在一些实施方案中,所述核酸编码包含对应于野生型人PAH多肽(例如,SEQID NO:1的PAH多肽)的102至428的氨基酸残基的氨基酸序列的变体PAH多肽。在一些实施方案中,所述核酸编码还包含在野生型人PAH多肽(例如,SEQ ID NO:1的PAH多肽)的位点M180、K199、S250和G256处的四个氨基酸取代的截短PAH多肽。在一些实施方案中,所述核酸编码包含选自M180T、K199P、S250P和G256A的四个氨基酸取代的截短PAH多肽。在一些实施方案中,所述核酸编码还包含表1-3中列出的氨基酸取代的任一种组合的截短变体PAH多肽。在一些实施方案中,所述核酸编码具有至少约25%、50%、75%、100%或大于100%的野生型PAH(例如,SEQ ID NO:1的PAH多肽)的苯丙氨酸羟化酶活性的截短PAH多肽。

在一些实施方案中,编码变体PAH多肽的核酸可操作地连接至启动子。在一些实施方案中,所述启动子选自巨细胞病毒(CMV)即时早期启动子、RSV LTR、MoMLV LTR、磷酸甘油酸激酶-1(PGK)启动子、猿猴病毒40(SV40)启动子、CK6启动子、小鼠转甲状腺素蛋白启动子(mTTR)、mTTR482启动子、mA1MB2-mTTR482启动子、TK启动子、四环素应答性启动子(TRE)、HBV启动子、hAAT启动子、LSP启动子、LP1启动子、嵌合肝脏特异性启动子(LSP)、E2F启动子、端粒酶(hTERT)启动子;巨细胞病毒增强子/鸡β-肌动蛋白/兔β-球蛋白启动子(CAG)启动子、延长因子1-α启动子(EF1-α)启动子、人β-葡糖醛酸酶启动子、鸡β-肌动蛋白(CBA)启动子、逆转录劳斯肉瘤病毒(RSV)LTR启动子、二氢叶酸还原酶启动子和13-肌动蛋白启动子。在一些实施方案中,所述启动子是LP1启动子或mA1MB2-mTTR482启动子。

在一些实施方案中,所述核酸还包含多腺苷酸化信号。在一些实施方案中,多腺苷酸化信号是牛生长激素多腺苷酸化信号、SV40多腺苷酸化信号或HSV TK pA。在一些实施方案中,多腺苷酸化信号是合成的多腺苷酸化信号,如Levitt,N等人(1989),GenesDevelop.3:1019-1025中所述。

在一些实施方案中,所述核酸还包含内含子。对于本领域中技术人员而言可用于本发明的各种内含子是已知的,并且包括MVM内含子、F IX截短内含子1、β-球蛋白SD/免疫球蛋白重链SA、腺病毒SD/免疫球蛋白SA、SV40晚期SD/SA(19S/16S)和杂合腺病毒SD/IgGSA。(Wu等人2008,Kurachi等人,1995,Choi等人2014,Wong等人,1985,Yew等人1997,Huang和Gorman(1990)。在一些实施方案中,所述内含子是鸡β-肌动蛋白(CBA)/兔β-球蛋白杂合内含子。在一些实施方案中,内含子是鸡β-肌动蛋白(CBA)/兔β-球蛋白杂交启动子和内含子,其中所有的ATG位点被去除以最小化错误翻译起始位点(SEQ ID NO:15)。

在一些实施方案中,核酸可以包括(一种或多种)填充核酸。在一些实施方案中,填充核酸可以包含编码报告多肽的序列。如本领域技术人员将理解的,填充核酸可以位于核酸内的多个区域内,并且可以由核酸内的一个连续序列(例如,在单个位置中的单个填充核酸)或多个序列(例如,在超过一个位置(例如2个位置、3个位置等)中的超过一个填充核酸)组成。在一些实施方案中,填充核酸可以位于编码变体PAH多肽的核酸序列的下游。在实施方案中,填充核酸可以位于编码变体PAH多肽的核酸序列的上游(例如,在启动子与编码变体PAH多肽的核酸序列之间)。如本领域技术人员还将理解的,可以使用各种核酸作为填充核酸。在一些实施方案中,填充核酸包含人α-1-抗胰蛋白酶(AAT)填充序列或C16 P1染色体16P1克隆(人C16)填充序列的全部或一部分。在一些实施方案中,填充序列包含基因的全部或一部分。例如,填充序列包含人AAT序列的一部分。本领域技术人员将理解,基因(例如人AAT序列)的不同部分可以用作填充片段。例如,填充片段可以来自基因的5'末端、基因的3'末端、基因的中间部分、基因的非编码部分(例如内含子)、基因的编码区(例如外显子)、或基因的非编码部分和编码部分的混合物。本领域技术人员还将理解,填充序列的全部或一部分可以用作填充序列。在一些实施方案中,填充序列被修饰以去除内部ATG密码子。在一些实施方案中,填充序列包含SEQ ID NO:16的核苷酸序列。

在一些实施方案中,编码人PAH多肽的分离核酸是密码子优化的。在一些实施方案中,编码人PAH多肽的分离核酸针对在特定细胞(如真核细胞)中表达进行了密码子优化。真核细胞可以是特定生物的那些或源自于特定生物,所述生物如哺乳动物,包括但不限于人、小鼠、大鼠、兔、狗或非人灵长类动物。通常,密码子优化是指通过用更频繁或最常用于所述宿主细胞的基因中的密码子替代天然序列的至少一个密码子来修饰核酸序列以增强在感兴趣宿主细胞中的表达,同时保持天然氨基酸序列的过程。各种物种表现出对特定氨基酸的某些密码子的特别偏好。密码子使用表很容易获得,例如在“密码子使用数据库”中,并且这些表可以以多种方式修改(例如参见,Nakamura,Y.等人(2000)Nucleic Acids Res.28:292)。还可获得用于针对在特定宿主细胞中的表达对特定序列进行密码子优化的计算机算法,如Gene Forge(Aptagen;雅各布斯区(Jacobus),宾夕法尼亚州)、DNA2.0、GeneArt(GA)或Genscript(GS)以及与CpG含量的降低相结合的GS算法。在一些实施方案中,编码PAH多肽的核酸使用GA算法进行密码子优化。在一些实施方案中,所述核酸序列与SEQ ID NO:14的核酸序列至少80%相同。在一些实施方案中,所述核酸包含SEQ ID NO:14的核酸序列。

IV.肝脏特异性表达盒

在一些方面,本发明提供了用于在肝细胞中表达转基因的表达盒,其中表达盒包含可操作地连接至启动子和增强子的转基因,其中所述启动子包括小鼠甲状腺素运载蛋白(mTTR)启动子,并且所述增强子包括一个或两个修饰的凝血酶原增强子(mPrT2)、一个或两个修饰的α1-微bikunin增强子(mA1MB2)、修饰的小鼠白蛋白增强子(mEalb)、乙型肝炎病毒增强子II(HEII)或CRM8增强子。在一些实施方案中,mTTR启动子是mTTR482启动子。在一些实施方案中,增强子在mTTR启动子的5'侧。在一些实施方案中,所述转基因编码如本文所述的变体PAH多肽。

在一些实施方案中,本发明提供了用于在肝细胞中表达转基因的表达盒,其中表达盒包含可操作地连接至启动子和和3'元件的转基因,其中所述启动子包括小鼠甲状腺素运载蛋白(mTTR)启动子,并且所述3'元件是白蛋白3'元件(3'Alb)或连接至人α1抗胰蛋白酶支架/基质附着区(SMAR)的白蛋白3'元件(3'AlbSMAR)。在一些实施方案中,mTTR启动子是mTTR482启动子。在一些实施方案中,3'元件位于转基因的3'侧。在一些实施方案中,所述转基因编码如本文所述的变体PAH多肽。

在一些实施方案中,本发明提供了用于在肝细胞中表达转基因的表达盒,其中表达盒包含可操作地连接至启动子和增强子和3'元件的转基因,其中所述启动子包括小鼠甲状腺素运载蛋白(mTTR)启动子,并且所述增强子包括一个或两个修饰的凝血酶原增强子(mPrT2)、一个或两个修饰的α1-微bikunin增强子(mA1MB2)、修饰的小鼠白蛋白增强子(mEalb)、乙型肝炎病毒增强子II(HEII)或CRM8增强子,并且其中所述3'元件是白蛋白3'元件(3'Alb)或连接至人α1抗胰蛋白酶支架/基质附着区(SMAR)的白蛋白3'元件(3'AlbSMAR)。在一些实施方案中,mTTR启动子是mTTR482启动子。在一些实施方案中,增强子在mTTR启动子的5'侧。在一些实施方案中,3'元件位于转基因的3'侧。在一些实施方案中,所述转基因编码如本文所述的变体PAH多肽。

在一些实施方案中,表达盒还包含内含子。在一些实施方案中,所述内含子是MVM内含子、F IX截短内含子1、β-球蛋白SD/免疫球蛋白重链SA、腺病毒SD/免疫球蛋白SA、SV40晚期SD/SA(19S/16S)或杂合腺病毒SD/IgG SA。在一些实施方案中,所述内含子是鸡β-肌动蛋白(CBA)/兔β-球蛋白杂合内含子。

在一些实施方案中,表达盒还包含多腺苷酸化信号。在一些实施方案中,多腺苷酸化信号是牛生长激素多腺苷酸化信号、SV40多腺苷酸化信号或HSV TK pA。

在一些实施方案中,表达盒被掺入载体中。在一些实施方案中,表达盒被掺入病毒载体中。在一些实施方案中,病毒载体是如本文所述的rAAV载体。

V.载体和病毒粒子

在某些方面,编码变体PAH多肽的核酸包含在载体中。在一些实施方案中,本发明设想使用重组病毒基因组来引入编码变体PAH多肽的核酸序列,以包装入病毒粒子,例如下面描述的病毒粒子。重组病毒基因组可以包括建立变体PAH多肽的表达的任何元件,例如启动子、ITR、核糖体结合元件、终止子、增强子、选择标记、内含子、多聚A信号和/或复制起点。下面更详细地描述用于病毒粒子的示例性病毒基因组元件和递送方法。

非病毒递送系统

常规的非病毒基因转移方法也可以用于将核酸引入细胞或靶组织。非病毒载体递送系统包括DNA质粒、裸露核酸和与递送系统复合的核酸。例如,所述载体可以与脂质(例如阳离子或中性脂质)、脂质体、聚阳离子、纳米颗粒或增强核酸细胞摄取的试剂复合。所述载体可以与适用于本文所述任何递送方法的试剂复合。在一些实施方案中,所述核酸包含一个或多个病毒ITR(例如AAV ITR)。

病毒粒子

在一些实施方案中,包含编码变体PAH多肽的核酸的载体是重组腺相关病毒(rAAV)载体、重组腺病毒载体、重组慢病毒载体或重组单纯疱疹病毒(HSV)载体。

rAAV粒子

在一些实施方案中,所述载体是重组AAV(rAAV)载体。在一些实施方案中,编码变体PAH多肽的核酸的侧翼是一个或多个AAV反向末端重复(ITR)序列。在一些实施方案中,病毒粒子是包含核酸的重组AAV粒子,所述核酸包含侧翼是一个或两个ITR的编码变体PAH多肽的核酸。在一些实施方案中,编码变体PAH多肽的核酸的侧翼是两个AAV ITR。

在一些实施方案中,编码本公开文本的变体PAH多肽的核酸可操作地连接在转录方向上的组分、控制序列(包括转录起始序列和终止序列),从而形成表达盒。表达盒的5'和3'末端的侧翼是至少一个功能AAV ITR序列。“功能性AAV ITR序列”意指旨在用于挽救、复制和包装AAV病毒粒子的ITR序列功能。参见Davidson等人,PNAS,2000,97(7)3428-32;Passini等人,J.Virol.,2003,77(12):7034-40;和Pechan等人,Gene Ther.,2009,16:10-16,其全部通过引用以其整体并入本文。为了实施本发明的一些方面,重组载体至少包含为衣壳化所必需的所有AAV序列和用于由rAAV感染的物理结构。用于本发明载体的AAV ITR不需要具有野生型核苷酸序列(例如,如Kotin,Hum.Gene Ther.,1994,5:793-801中所述),并且可以通过核苷酸的插入、缺失或取代来改变,或者AAV ITR可以来源于几种AAV血清型中的任一种。目前已知超过40种AAV血清型,并且仍在鉴定出新的血清型和现有血清型的变体。参见Gao等人,PNAS,2002,99(18):11854-6;Gao等人,PNAS,2003,100(10):6081-6;和Bossis等人,J.Virol.,2003,77(12):6799-810。

使用任何AAV血清型都被视为在本发明的范围内。在一些实施方案中,rAAV载体是来源于AAV血清型的载体,包括但不限于,AAV ITR是AAV1、AAV2、AAV3、AAV4、AAV5、AAV6、AAV7、AAV8、AAVrh8、AAVrh8R、AAV9、AAV10、AAVrh10、AAV11、AAV12、山羊AAV、牛AAV或小鼠AAV ITR等。在一些实施方案中,AAV中的核酸包含AAV ITR的ITR,所述AAV ITR是AAV1、AAV2、AAV3、AAV4、AAV5、AAV6、AAV7、AAV8、AAVrh8、AAVrh8R、AAV9、AAV10、AAVrh10、AAV11、AAV12、山羊AAV、牛AAV或小鼠AAV等。在某些实施方案中,AAV ITR是AAV2 ITR。

在一些实施方案中,载体可以包括填充核酸。在一些实施方案中,填充核酸可以编码绿色荧光蛋白。在一些实施方案中,填充核酸可以位于编码本公开文本的变体PAH多肽的核酸的3'侧。

在一些方面,本发明提供了包含重组自身互补基因组的病毒粒子。在一些实施方案中,所述载体是自身互补载体。具有自身互补基因组的AAV病毒粒子和使用自身互补的AAV基因组的方法描述在以下文献中:美国专利号6,596,535;7,125,717;7,765,583;7,785,888;7,790,154;7,846,729;8,093,054;和8,361,457;和Wang Z.,等人,(2003)GeneTher 10:2105-2111,所述文献各自通过引用以其整体并入本文。包含自身互补基因组的rAAV将借助其部分互补的序列(例如,转基因的互补编码链和非编码链)迅速形成双链DNA分子。在一些实施方案中,本发明提供了包含AAV基因组的AAV病毒粒子,其中所述rAAV基因组包含第一异源多核苷酸序列(例如,本发明的变体PAH多肽的编码链)和第二异源多核苷酸序列(例如,本公开文本的变体PAH多肽的非编码或反义链),其中所述第一异源多核苷酸序列可以与所述第二多核苷酸序列沿着其大部分或全部长度形成链内碱基对。

在一些实施方案中,第一异源多核苷酸序列和第二异源多核苷酸序列通过促进链内碱基配对的序列连接;例如发夹DNA结构。发夹结构在本领域中是已知的,例如在siRNA分子中。在一些实施方案中,第一异源多核苷酸序列和第二异源多核苷酸序列通过突变ITR(例如,右ITR)连接。突变的ITR包含含末端解链序列的D区的缺失。因此,在复制AAV病毒基因组时,rep蛋白将不会在突变的ITR处切割病毒基因组,并且因此,以5'至3'顺序包含以下的重组病毒基因组将被包装在病毒衣壳中:AAV ITR、包括调节序列的第一异源多核苷酸序列、突变的AAV ITR、与第一异源多核苷酸反向的第二异源多核苷酸和第三AAV ITR。

在一些实施方案中,第一异源核酸序列和第二异源核酸序列通过突变的ITR(例如,右ITR)连接。在一些实施方案中,ITR包含多核苷酸序列5'-CACTCCCTCTCTGCGCGCTCGCTCGCTCACTGAGGCCGGGCGACCAAAGGTCGCCCACGCCCGGGCTTTGCCCGGGCG-3'(SEQ ID NO:17)。突变的ITR包含含末端解链序列的D区的缺失。因此,在复制AAV病毒基因组时,rep蛋白将不会在突变的ITR处切割病毒基因组,并且因此,以5'至3'顺序包含以下的重组病毒基因组将被包装在病毒衣壳中:AAV ITR、包括调节序列的第一异源多核苷酸序列、突变的AAV ITR、与第一异源多核苷酸反向的第二异源多核苷酸和第三AAV ITR。

在一些实施方案中,所述载体被衣壳化在病毒粒子中。在一些实施方案中,病毒粒子是包含重组AAV载体的重组AAV病毒粒子。使用不同的AAV血清型优化特定靶细胞的转导或靶向特定靶组织(例如,眼组织)内的特定细胞类型。rAAV粒子可以包含相同血清型或混合血清型的病毒蛋白和病毒核酸。例如,在一些实施方案中,rAAV粒子可以包含本发明的AAV2衣壳蛋白和至少一种AAV2 ITR,或其可以包含AAV2衣壳蛋白和至少一种AAV1 ITR。本文提供了生产rAAV粒子的AAV血清型的任何组合,如同每个组合都已在本文中明确说明一样。在一些实施方案中,本发明提供了包含本发明的AAV2衣壳的rAAV粒子。在一些实施方案中,本发明提供了包含本发明的AAVrh8R衣壳的rAAV粒子。

在一些实施方案中,rAAV粒子包含AAV1衣壳、AAV2衣壳、AAV3衣壳、AAV4衣壳、AAV5衣壳、AAV6衣壳(例如,野生型AAV6衣壳,或变体AAV6衣壳如ShH10,如美国授予前公开2012/0164106中所述)、AAV7衣壳、AAV8衣壳、AAVrh8衣壳、AAVrh8R衣壳、AAV9衣壳(例如,野生型AAV9衣壳,或如美国授予前公开2013/0323226中所述的修饰的AAV9衣壳)、AAV10衣壳、AAVrh10衣壳、AAV11衣壳、AAV12衣壳、酪氨酸衣壳突变体、肝素结合衣壳突变体、AAV2R471A衣壳、AAVAAV2/2-7m8衣壳、AAV DJ衣壳(例如,AAV-DJ/8衣壳、AAV-DJ/9衣壳,或美国授予前公开2012/0066783中所述的任何其他衣壳)、AAV2 N587A衣壳、AAV2 E548A衣壳、AAV2N708A衣壳、AAV V708K衣壳、山羊AAV衣壳、AAV1/AAV2嵌合衣壳、牛AAV衣壳、小鼠AAV衣壳、rAAV2/HBoV1衣壳,或者美国专利号8,283,151或国际公开号WO/2003/042397中所述的AAV衣壳。在一些实施方案中,突变体衣壳蛋白保留形成AAV衣壳的能力。在一些实施方案中,rAAV粒子包含AAV5酪氨酸突变体衣壳(Zhong L.等人,(2008)Proc Natl Acad Sci USA105(22):7827-7832。在进一步的实施方案中,rAAV粒子包含来自进化枝A-F的AAV血清型的衣壳蛋白(Gao等人,J.Virol.2004,78(12):6381)。在一些实施方案中,rAAV粒子包含AAV1衣壳蛋白或其突变体。在其他实施方案中,rAAV粒子包含AAV2衣壳蛋白或其突变体。在一些实施方案中,AAV血清型是AAV1、AAV2、AAV5、AAV6、AAV7、AAV8、AAVrh8、AAVrh8R、AAV9、AAV10或AAVrh10。在一些实施方案中,rAAV粒子包含AAV血清型1(AAV1)衣壳。在一些实施方案中,rAAV粒子包含AAV血清型2(AAV2)衣壳。在一些实施方案中,重组AAV病毒粒子包含AAV1、AAV2、AAV8、AAVrh8R、AAV9和/或AAVrh10衣壳。在一些实施方案中,AAV1、AAV2、AAV8、AAVrh8R、AAV9和/或AAVrh10衣壳包含酪氨酸突变或乙酰肝素结合突变,例如如下所述。在一些实施方案中,衣壳是肝靶向衣壳;例如但不限于LK03衣壳、HSC15衣壳或17衣壳。在一些实施方案中,衣壳是工程化AAV衣壳(例如,改组衣壳)。工程化AAV衣壳的例子包括但不限于DJ(Grimm D等人,J Virol.2008,82:5887-911)、LK03(Lisowski L等人,Nature,2014,506:382-6)以及HSC15和HSC17(Smith LJ等人,Mol Ther,2014Sep;22(9):1625-34)。

已知AAV(例如AAV2、AAV8等)的衣壳包括三种衣壳蛋白:VP1、VP2和VP3。这些蛋白质含有大量重叠的氨基酸序列和独特的N-末端序列。AAV2衣壳包括60个按照二十面体对称排列的亚基(Xie,Q.,等人(2002)Proc.Natl.Acad.Sci.USA 99(16):10405-10)。已经发现VP1、VP2和VP3以1:1:10的比率存在。

在一些实施方案中,rAAV粒子包含a)包含rAAV衣壳蛋白的rAAV衣壳,所述rAAV衣壳蛋白包含在与硫酸乙酰肝素蛋白聚糖相互作用的一个或多个位置处的一个或多个氨基酸取代,和b)包含异源核酸和至少一个AAV反向末端重复序列的rAAV载体。

在一些实施方案中,rAAV粒子包含衣壳蛋白的一个或多个氨基酸取代,所述氨基酸取代减少或消除rAAV粒子与硫酸乙酰肝素蛋白聚糖的结合,和/或其中所述一个或多个氨基酸取代位于基于AAV2的VP1编号来编号的位置484、487、532、585或588处。如本文所用,“基于AAV2的VP1编号”是指对应于AAV2的VP1的所述氨基酸的所述衣壳蛋白的氨基酸。例如,如果一个或多个氨基酸取代位于基于AAV2的VP1编号的位置347、350、390、395、448、451、484、487、527、532、585和/或588处,则所述一个或多个氨基酸取代位于所述衣壳蛋白对应于AAV2的VP1的氨基酸347、350、390、395、448、451、484、487、527、532、585和/或588的一个或多个氨基酸处。在一些实施方案中,所述一个或多个氨基酸取代位于AAV2的VP1的位置484、487、532、585或588处。在一些实施方案中,所述一个或多个氨基酸取代位于基于AAV2的VP1编号的AAV3的VP1的位置484、487、532、585或588处。在一些实施方案中,所述一个或多个氨基酸取代位于基于AAVrh8R的VP1编号的位置485、488、528、533、586或589处。在一些实施方案中,在对应于氨基酸585和/或588(基于AAV2的VP1编号)的一个或多个位置处的一个或多个氨基酸被精氨酸残基替代(例如,AAV1或AAV6的S586和/或T589;AAV9的S586和/或A589;AAVrh8R的A586和/或T589;AAV8的Q588和/或T591;以及AAVrh10的Q588和/或A591)。在其他实施方案中,在对应于氨基酸484、487、527和/或532(基于AAV2的VP1编号)的一个或多个位置处的一个或多个氨基酸(例如精氨酸或赖氨酸)被一个或多个非正电荷氨基酸(如丙氨酸)替代(例如AAV1或AAV6的R485、R488、K528和/或K533;AAV9或AAVrh8的RR485、R488、K528和/或R533;以及AAV8或AAVrh10的R487、R490、K530和/或R535)。

AAV粒子的产生

在本领域中已知许多方法用于产生rAAV载体,包括转染、稳定细胞系生产和感染性杂合病毒生产系统,所述系统包括腺病毒-AAV杂合体、疱疹病毒-AAV杂合体(Conway,JE等人,(1997)

用于产生rAAV粒子的一种方法是三重转染方法。简而言之,可以将含rep基因和衣壳基因的质粒连同辅助腺病毒质粒转染(例如利用磷酸钙法)到细胞系(例如,HEK-293细胞)中,并可以收集并任选地纯化病毒。因此,在一些实施方案中,通过将编码rAAV载体的核酸、编码AAV rep和cap的核酸以及编码AAV辅助病毒功能的核酸三重转染到宿主细胞中来产生rAAV粒子,其中核酸向宿主细胞的转染产生能够产生rAAV粒子的宿主细胞。

在一些实施方案中,rAAV粒子可以通过生产细胞系方法产生(参见Martin等人,(2013)Human Gene Therapy Methods 24:253-269;美国专利授予前公开号US 2004/0224411;和Liu,X.L.等人(1999)Gene Ther.6:293-299)。简而言之,可以用含有rep基因、衣壳基因和包含启动子-异源核酸序列(例如,变体PAH多肽)的载体基因组的质粒稳定地转染细胞系(例如,HeLa、293、A549或Perc.6细胞系)。可以筛选细胞系,以选择用于rAAV产生的前导克隆(lead clone),然后可以将其扩增至生产生物反应器,并且用辅助病毒(例如,腺病毒或HSV)感染,以启动rAAV生产。随后可以收获病毒,可以使腺病毒失活(例如,通过加热)和/或去除,并且可以纯化rAAV粒子。因此,在一些实施方案中,通过包含编码rAAV载体的核酸、编码AAV rep和cap的核酸和编码AAV辅助病毒功能的核酸中的一种或多种的生产细胞系产生rAAV粒子。如本文所述,与三重转染方法相比,生产细胞系方法对于产生具有过大基因组的rAAV粒子而言可能是有利的。

在一些实施方案中,编码AAV rep和cap基因和/或rAAV基因组的核酸稳定地维持在生产细胞系中。在一些实施方案中,将编码AAV rep和cap基因和/或rAAV基因组的核酸在一种或多种质粒上引入细胞系中以产生生产细胞系。在一些实施方案中,将AAV rep、AAVcap和rAAV基因组在相同质粒上引入细胞中。在其他实施方案中,将AAV rep、AAV cap和rAAV基因组在不同质粒上引入细胞中。在一些实施方案中,用质粒稳定地转染的细胞系在细胞系的多次传代(例如,5、10、20、30、40、50或超过50次细胞传代)中维持质粒。例如,所述一种或多种质粒可以在细胞复制时复制,或者所述一种或多种质粒可以整合到细胞基因组中。已经鉴定了使质粒能够在细胞(例如,人细胞)中自主复制的多种序列(参见例如,Krysan,P.J.等人(1989)Mol.Cell Biol.9:1026-1033)。在一些实施方案中,所述一种或多种质粒可以含有允许选择维持质粒的细胞的选择标记(例如,抗生素抗性标记)。通常用于哺乳动物细胞的选择标记包括但不限于杀稻瘟素、G418、潮霉素B、博莱霉素、嘌呤霉素及其衍生物。用于将核酸引入细胞中的方法在本领域中是已知的,并且包括但不限于病毒转导、阳离子转染(例如,使用阳离子聚合物如DEAE-葡聚糖或阳离子脂质如lipofectamine)、磷酸钙转染、显微注射、粒子轰击、电穿孔和纳米颗粒转染(关于更多细节,参见例如,Kim,T.K.和Eberwine,J.H.(2010)Anal.Bioanal.Chem.397:3173-3178)。

在一些实施方案中,编码AAV rep和cap基因和/或rAAV基因组的核酸稳定地整合到生产细胞系的基因组中。在一些实施方案中,将编码AAV rep和cap基因和/或rAAV基因组的核酸在一种或多种质粒上引入细胞系中以产生生产细胞系。在一些实施方案中,将AAVrep、AAV cap和rAAV基因组在相同质粒上引入细胞中。在其他实施方案中,将AAV rep、AAVcap和rAAV基因组在不同质粒上引入细胞中。在一些实施方案中,所述一种或多种质粒可以含有允许选择维持质粒的细胞的选择标记(例如,抗生素抗性标记)。用于将核酸稳定地整合到多种宿主细胞系中的方法在本领域中是已知的。例如,重复选择(例如,通过使用选择标记)可以用于选择已整合含有选择标记(和AAV cap和rep基因和/或rAAV基因组)的核酸的细胞。在其他实施方案中,核酸能以位点特异性方式整合到细胞系中以产生生产细胞系。一些位点特异性重组系统是本领域已知的,如FLP/FRT(参见例如,O'Gorman,S.等人(1991)Science 251:1351-1355)、Cre/loxP(参见例如,Sauer,B.和Henderson,N.(1988)Proc.Natl.Acad.Sci.85:5166-5170)和phi C31-att(参见例如,Groth,A.C.等人(2000)Proc.Natl.Acad.Sci.97:5995-6000)。

在一些实施方案中,生产细胞系衍生自灵长类动物细胞系(例如,非人灵长类动物细胞系,如Vero或FRhL-2细胞系)。在一些实施方案中,细胞系衍生自人细胞系。在一些实施方案中,生产细胞系衍生自HeLa、293、A549或PERC.

在一些实施方案中,生产细胞系适于在悬浮液中生长。如在本领域中已知的,锚定依赖性细胞通常不能在没有基质(如微载体珠)的情况下在悬浮液中生长。使细胞系适于在悬浮液中生长可以包括例如使用缺少钙和镁离子的培养基以防止结块(和任选地消泡剂),使用用渗硅化合物涂布的培养容器,使细胞系在具有搅拌桨的旋动培养中生长,并且在每次传代时选择培养物中(而不是在大块中或在容器的侧面上)的细胞。关于进一步的描述,参见例如,ATCC常见问题文件(可在www.atcc.org/Global/FAQs/9/1/Adapting%20a%20monolayer%20cell%20line%20to%20suspension-40.aspx处获得)和其中引用的参考文献。

在一些方面,提供了用于生产本文公开的任何rAAV粒子的方法,所述方法包括(a)在产生rAAV粒子的条件下培养宿主细胞,其中所述宿主细胞包含(i)一种或多种AAV包装基因,其中每种所述AAV包装基因编码AAV复制蛋白和/或衣壳化蛋白;(ii)rAAV前载体,其包含编码如本文所述的异源核酸、侧翼为至少一个AAV ITR的核酸,和(iii)AAV辅助功能;和(b)回收由宿主细胞产生的rAAV粒子。在一些实施方案中,所述至少一个AAV ITR选自AAV1、AAV2、AAV3、AAV4、AAV5、AAV6、AAV7、AAV8、AAVrh8、AAVrh8R、AAV9、AAV10、AAVrh10、AAV11、AAV12、山羊AAV、牛AAV或小鼠AAV血清型ITR等。例如,在一些实施方案中,AAV血清型是AAV1、AAV2、AAV5、AAV6、AAV7、AAV8、AAVrh8、AAVrh8R、AAV9、AAV10或AAVrh10。在某些实施方案中,AAV中的核酸包含AAV2 ITR。在一些实施方案中,所述衣壳化蛋白选自AAV1、AAV2、AAV3、AAV4、AAV5、AAV6、AAV7、AAV8、AAVrh8、AAVrh8R、AAV9、AAV10、AAVrh10、AAV11、AAV12、AAV2R471A、AAV2/2-7m8、AAV DJ、AAV2 N587A、AAV2 E548A、AAV2 N708A、AAV V708K、山羊AAV、AAV1/AAV2嵌合、牛AAV或小鼠AAV衣壳rAAV2/HBoV1血清型衣壳蛋白或其突变体。在一些实施方案中,衣壳化蛋白是AAV8衣壳蛋白。在一些实施方案中,rAAV粒子包含AAV8衣壳和包含AAV2 ITR的重组基因组,以及编码治疗性转基因/核酸的核酸(例如,编码变体PAH多肽的核酸)。

本发明的合适的rAAV生产培养基可以补充有0.5%-20%(v/v或w/v)水平的血清或血清衍生的重组蛋白。可替代地,如在本领域中已知的,rAAV载体可以在无血清条件下产生,所述无血清条件也可以称为不含动物源产品的培养基。本领域普通技术人员可以理解,设计用于支持rAAV载体产生的商业或定制培养基还可以补充有本领域中已知的一种或多种细胞培养组分,包括但不限于葡萄糖、维生素、氨基酸和/或生长因子,以便提高生产培养物中rAAV的滴度。

rAAV生产培养物可以在适合于所用特定宿主细胞的多种条件(在很宽的温度范围内、持续不同的时间长度等)下生长。如本领域已知的,rAAV生产培养物包括附着依赖培养物,其可以在合适的附着依赖容器(例如像滚瓶、中空纤维过滤器、微载体和填充床或流化床生物反应器)中培养。rAAV载体生产培养物也可以包括适应悬浮液的宿主细胞,如HeLa、293和SF-9细胞,它们可以以多种方式培养,包括例如旋转烧瓶、搅拌罐生物反应器和一次性系统,如Wave袋系统。

本发明的rAAV载体粒子可以通过裂解生产培养物的宿主细胞或通过从生产培养物中收获用过的培养基而从rAAV生产培养物中收获,条件是细胞在本领域中已知的引起rAAV粒子从完整细胞释放到培养基中的条件下培养,如美国专利号6,566,118中更全面地描述的。裂解细胞的合适方法在本领域中也是已知的,并且包括例如多次冷冻/解冻循环、超声处理、微流化和用化学品(如洗涤剂和/或蛋白酶)处理。

在另一实施方案中,rAAV粒子被纯化。如本文所用的术语“纯化的”包括rAAV粒子的制剂,其缺少至少一些也可存在于rAAV粒子天然存在或最初所制备的地方的其他组分。因此,例如,分离的rAAV粒子可以使用纯化技术使其从源混合物(如培养裂解物或生产培养上清液)富集而制备。能以多种方式测量富集情况,例如像根据溶液中存在的DNA酶抗性颗粒(DRP)或基因组拷贝(gc)的比例、或根据感染性,或者可以根据源混合物中存在的第二潜在干扰物质(如污染物,包括生产培养污染物或进程内污染物,包括辅助病毒、培养基组分等)来测量。

在一些实施方案中,澄清rAAV生产培养收获物以除去宿主细胞碎片。在一些实施方案中,通过经由一系列深度过滤器过滤来澄清生产培养收获物,所述深度过滤器包括例如DOHC级Millipore Millistak+HC Pod过滤器、A1HC级Millipore Millistak+HC Pod过滤器和0.2μm Filter Opticap XL1O Millipore Express SHC亲水膜过滤器。澄清也可以通过本领域中已知的多种其他标准技术来实现,如离心或通过本领域中已知的0.2μm或更大孔径的任何醋酸纤维素过滤器过滤。

在一些实施方案中,用

可以使用以下一个或多个纯化步骤分离或纯化rAAV粒子:平衡离心;流过式阴离子交换过滤;用于浓缩rAAV粒子的切向流过滤(TFF);通过磷灰石色谱捕获rAAV;辅助病毒的热灭活;通过疏水相互作用色谱捕获rAAV;通过尺寸排阻色谱(SEC)进行缓冲液交换;纳滤;以及通过阴离子交换色谱、阳离子交换色谱或亲和色谱捕获rAAV。这些步骤可以单独使用,以各种组合使用,或者以不同顺序使用。在一些实施方案中,所述方法以如下所述的顺序包括所有步骤。纯化rAAV粒子的方法见于例如以下文献中:Xiao等人,(1998)Journal ofVirology 72:2224-2232;美国专利号6,989,264和8,137,948;以及WO 2010/148143。

VI.治疗方法

本公开文本的某些方面涉及在有需要的个体中治疗苯丙酮尿症和/或降低苯丙氨酸水平的方法。苯丙酮尿症(PKU)是苯丙氨酸羟化酶(PAH)缺乏引起的,这种缺乏导致血液Phe水平升高,对脑有毒并随后在不进行治疗的情况下导致严重精神障碍。目前通过饮食限制进行的治疗是有效的,但青少年和成年人的不遵从性是一个主要问题。

治疗PKU的努力受到基因治疗载体中人PAH活性低的阻碍。本方法部分基于发现与内源性人PAH多肽相比具有改善的蛋白质稳定性和酶活性的变体PAH多肽。与编码内源性人PAH的载体相比,使用编码本文所述变体PAH多肽的rAAV载体通过基因治疗来治疗PKU导致血液和脑Phe水平的更好降低。此外,虽然hPAH和hPAH-V1都改善了Tyr和Trp向脑的转运,但只有变体PAH治疗的动物具有正常化的脑神经递质水平(包括多巴胺和血清素),表明对Phe影响的功能有不同的敏感性。

在一些实施方案中,本发明提供了治疗PKU的方法,其包括向有需要的个体施用治疗有效量的如本文所述的变体PAH多肽。在一些实施方案中,变体PAH多肽包含至少三个氨基酸取代,其中所述氨基酸取代位于选自野生型人PAH多肽的M180、K199、S250和G256的位点处。在一些实施方案中,变体PAH多肽包含在野生型人PAH多肽的位点M180、K199、S250和G256处的四个氨基酸取代。在一些实施方案中,变体PAH多肽包含选自M180T、K199P、S250P和G256A的至少三个氨基酸取代。在一些实施方案中,变体PAH多肽包含氨基酸取代M180T、K199P、S250P和G256A。在一些实施方案中,变体PAH多肽包含包括以下的氨基酸取代:K199P、S250P和G256A;M180T、S250P和G256A;M180T、K199P和G256A;或者M180T、K199P和S250P。在一些实施方案中,变体PAH多肽包含氨基酸取代M180T、K199P、S250P和G256A。在一些实施方案中,变体PAH多肽还包含氨基酸取代H264P、G272A、G272P、P275L、P279Q、G272P和P275L,或T323R和F327T氨基酸取代。在一些实施方案中,变体PAH多肽是表1-3中列出的任一种变体PAH多肽。在一些实施方案中,变体PAH多肽包含氨基酸取代M180T、K199P、S250P和G256A,并且包含另外的氨基酸取代,同时至少大致保持野生型PAH的苯丙氨酸羟化酶活性。在一些实施方案中,氨基酸取代的位置基于野生型人PAH多肽;例如,包含SEQ ID NO:1的氨基酸序列的人PAH多肽。在一些实施方案中,变体PAH多肽是融合多肽。在一些实施方案中,变体PAH多肽是与组织靶向肽融合的融合多肽。在一些实施方案中,变体PAH多肽是与肝靶向多肽融合的融合多肽。肝靶向多肽的例子包括但不限于人肝细胞生长因子的片段(Eavri和Lorberboum-Galkski,J Biol Chem 2007,282:23402-23409)或与肝细胞去唾液酸糖蛋白受体结合的糖蛋白(Huang,等人,Bioconjugate Chemistry 2017,28:283-295)。

在一些实施方案中,本发明提供了通过施用有效量的本公开文本的变体PAH多肽来治疗PKU的方法。变体PAH多肽可以施用到特定的感兴趣组织,或者可以全身施用。在一些实施方案中,可以肠胃外施用有效量的变体PAH多肽。肠胃外施用途径可以包括但不限于静脉内、腹膜内、骨内、动脉内、大脑内、肌内、鞘内、皮下、脑室内、肝内等。在一些实施方案中,可以通过一种施用途径施用有效量的变体PAH多肽。在一些实施方案中,可以通过多于一种施用途径的组合施用有效量的变体PAH多肽。在一些实施方案中,将有效量的变体PAH多肽施用到一个位置。在其他实施方案中,可以将有效量的变体PAH多肽施用到多于一个位置。

在一些实施方案中,本发明提供了治疗PKU的方法,其包括向有需要的个体施用治疗有效量的编码如本文所述的变体PAH多肽的核酸(例如DNA或mRNA)。在一些实施方案中,所述核酸编码包含至少三个氨基酸取代的变体PAH多肽,其中所述氨基酸取代位于选自野生型人PAH多肽的M180、K199、S250和G256的位点处。在一些实施方案中,所述核酸编码包含在野生型人PAH多肽的位点M180、K199、S250和G256处的四个氨基酸取代的变体PAH多肽。在一些实施方案中,所述核酸编码包含选自M180T、K199P、S250P和G256A的至少三个氨基酸取代的变体PAH多肽。在一些实施方案中,所述核酸编码包含氨基酸取代M180T、K199P、S250P和G256A的变体PAH多肽。在一些实施方案中,所述核酸编码包含包括以下的氨基酸取代的变体PAH多肽:K199P、S250P和G256A;M180T、S250P和G256A;M180T、K199P和G256A;或者M180T、K199P和S250P。在一些实施方案中,所述核酸编码包含氨基酸取代M180T、K199P、S250P和G256A的变体PAH多肽。在一些实施方案中,所述核酸编码还包含氨基酸取代H264P、G272A、G272P、P275L、P279Q、G272P和P275L,或T323R和F327T氨基酸取代的变体PAH多肽。在一些实施方案中,所述核酸编码是表1-3中列出的任一种变体PAH多肽的变体PAH多肽。在一些实施方案中,所述核酸编码包含氨基酸取代M180T、K199P、S250P和G256A,并且包含另外的氨基酸取代,同时至少大致保持野生型PAH的苯丙氨酸羟化酶活性的变体PAH多肽。在一些实施方案中,由所述核酸编码的氨基酸取代的位置基于野生型人PAH多肽;例如,包含SEQID NO:1的氨基酸序列的人PAH多肽。

在一些实施方案中,所述核酸编码变体人PAH多肽。在一些实施方案中,所述核酸编码包含SEQ ID NO:3的氨基酸序列的变体PAH多肽。在一些实施方案中,所述核酸编码包含与SEQ ID NO:3的氨基酸序列具有至少约为80%、85%、90%、95%或99%中任一同一性的氨基酸序列的变体PAH多肽。在一些实施方案中,所述核酸编码包含与SEQ ID NO:3的氨基酸序列具有至少约为80%、85%、90%、95%或99%中任一同一性的氨基酸序列并且具有至少约25%、50%、75%、100%或大于100%的野生型PAH的苯丙氨酸羟化酶活性的变体PAH多肽。在一些实施方案中,所述核酸编码包含与SEQ ID NO:3的氨基酸序列具有至少约为80%、85%、90%、95%或99%中任一同一性的氨基酸序列并且具有至少约25%、50%、75%、100%或大于100%的SEQ ID NO:1的野生型PAH的苯丙氨酸羟化酶活性的变体PAH多肽。在一些实施方案中,编码变体PAH多肽的核酸是DNA。在一些实施方案中,编码变体PAH多肽的核酸是RNA(例如mRNA)。

在一些实施方案中,所述核酸编码是保持苯丙氨酸羟化酶活性的截短PAH多肽的变体PAH多肽。在一些实施方案中,所述核酸编码包含N-末端截短的截短PAH多肽。在一些实施方案中,所述核酸编码是N-末端调节结构域的部分或全部截短的N-末端截短。在一些实施方案中,所述核酸编码包含野生型人PAH多肽(例如,SEQ ID NO:1的PAH多肽)的氨基酸残基1至约氨基酸残基102的缺失的N-末端截短。在一些实施方案中,所述核酸编码包含C-末端截短的截短PAH多肽。在一些实施方案中,所述核酸编码是四聚结构域的部分或全部截短的C-末端截短。在一些实施方案中,所述核酸编码包含野生型人PAH多肽(例如,SEQ ID NO:1的PAH多肽)的约429至452的氨基酸残基的缺失的C-末端截短。在一些实施方案中,所述核酸编码包含N-末端截短和C-末端截短的变体PAH多肽。在一些实施方案中,截短PAH多肽包含N-末端调节序列的部分或全部截短以及四聚结构域的部分或全部截短。在一些实施方案中,截短PAH多肽包含野生型人PAH多肽(例如,SEQ ID NO:1的PAH多肽)的氨基酸残基1至约氨基酸残基102和约429至约452的缺失。在一些实施方案中,所述核酸编码包含对应于野生型人PAH多肽(例如,SEQ ID NO:1的PAH多肽)的约102至约428的氨基酸残基的氨基酸序列的变体PAH多肽。在一些实施方案中,所述核酸编码包含对应于野生型人PAH多肽(例如,SEQID NO:1的PAH多肽)的102至428的氨基酸残基的氨基酸序列的变体PAH多肽。在一些实施方案中,所述核酸编码还包含在野生型人PAH多肽(例如,SEQ ID NO:1的PAH多肽)的位点M180、K199、S250和G256处的四个氨基酸取代的截短PAH多肽。在一些实施方案中,所述核酸编码包含选自M180T、K199P、S250P和G256A的四个氨基酸取代的截短PAH多肽。在一些实施方案中,所述核酸编码还包含表1-3中列出的氨基酸取代的任一种组合的截短变体PAH多肽。在一些实施方案中,所述核酸编码具有至少约25%、50%、75%、100%或大于100%的野生型PAH(例如,SEQ ID NO:1的PAH多肽)的苯丙氨酸羟化酶活性的截短PAH多肽。在一些实施方案中,编码变体PAH多肽的核酸编码与组织靶向肽融合的融合多肽。在一些实施方案中,变体PAH多肽是与肝靶向肽融合的融合多肽。在一些实施方案中,编码变体PAH多肽的核酸是DNA。在一些实施方案中,编码变体PAH多肽的核酸是RNA(例如mRNA)。

在一些实施方案中,本发明提供了通过施用有效量的编码本公开文本的变体PAH多肽的核酸来治疗PKU的方法。编码变体PAH多肽的核酸可以施用到特定的感兴趣组织,或者可以全身施用。在一些实施方案中,可以肠胃外施用有效量的编码变体PAH多肽的核酸。肠胃外施用途径可以包括但不限于静脉内、腹膜内、骨内、动脉内、大脑内、肌内、鞘内、皮下、脑室内、肝内等。在一些实施方案中,来自肝脏以外组织的变体PAH的表达可能需要辅因子BH4的存在(例如,系统递送或从核酸共表达)Ding等人,Mol Ther 2008,16:673-681。在一些实施方案中,可以通过一种施用途径施用有效量的编码变体PAH多肽的核酸。在一些实施方案中,可以通过多于一种施用途径的组合施用有效量的编码变体PAH多肽的核酸。在一些实施方案中,可以将有效量的编码变体PAH多肽的核酸施用到一个位置。在其他实施方案中,可以将有效量的变体PAH多肽施用到多于一个位置。在一些实施方案中,编码变体PAH多肽的核酸是DNA。在一些实施方案中,编码变体PAH多肽的核酸是RNA(例如mRNA)。

在本发明的一些方面,通过病毒载体将编码变体PAH多肽的核酸递送到个体。用于基因治疗的病毒载体是本领域已知的。在一些方面,本发明提供了通过施用有效量的编码本公开文本的变体PAH多肽的慢病毒粒子来治疗PKU的方法。在一些方面,本发明提供了通过施用有效量的编码本公开文本的变体PAH多肽的rAAV粒子来治疗PKU的方法。rAAV可以施用到特定的感兴趣组织,或者可以全身施用。在一些实施方案中,可以肠胃外施用有效量的rAAV。肠胃外施用途径可以包括但不限于静脉内、腹膜内、骨内、动脉内、大脑内、肌内、鞘内、皮下、脑室内、肝内等。在一些实施方案中,可以通过一种施用途径施用有效量的rAAV。在一些实施方案中,可以通过多于一种施用途径的组合施用有效量的rAAV。在一些实施方案中,将有效量的rAAV施用到一个位置。在其他实施方案中,可以将有效量的rAAV施用到多于一个位置。

根据治疗目的,施用有效量的rAAV(在一些实施方案中为粒子形式)。例如,当低百分比的转导可以实现期望的治疗效果时,则治疗的目标通常是达到或超过这一转导水平。在一些情况下,这种转导水平可以通过转导仅约1%至5%的所期望组织类型的靶细胞,在一些实施方案中至少约20%的所期望组织类型的细胞,在一些实施方案中至少约50%,在一些实施方案中至少约80%,在一些实施方案中至少约95%,在一些实施方案中至少约99%的所期望组织类型的细胞来实现。rAAV组合物可以通过在同一程序期间或者间隔数天、数周、数月或数年的一次或多次施用来施用。可以使用本文所述的任何施用途径中的一种或多种。在一些实施方案中,可以使用多个载体来治疗人。

鉴定由AAV病毒粒子转导的细胞的方法是本领域已知的;例如,免疫组织化学或标记物如增强型绿色荧光蛋白的使用可以用于检测病毒粒子的转导;例如包含具有一个或多个氨基酸取代的rAAV衣壳的病毒粒子。

在一些实施方案中,同时或依次地将有效量的rAAV粒子施用到多于一个位置。在其他实施方案中,多于一次(例如重复)地将有效量的rAAV粒子施用到单个位置。在一些实施方案中,多次注射rAAV病毒粒子间隔不超过1小时、2小时、3小时、4小时、5小时、6小时、9小时、12小时或24小时。

在一些实施方案中,本发明提供了用于通过施用有效量的包含编码本公开文本的变体PAH多肽的重组病毒载体的药物组合物来治疗患有PKU的人的方法。在一些实施方案中,所述药物组合物包含一种或多种药学上可接受的赋形剂。

在一些实施方案中,所述方法包括施用有效量的包含编码本公开文本的变体PAH多肽的重组病毒载体的药物组合物,以在有需要的个体中治疗PKU。在一些实施方案中,病毒粒子(例如,rAAV粒子)的病毒滴度至少约为以下中的任一者:5×10

在一些实施方案中,施用到个体的病毒粒子的剂量至少约为以下中的任一者:1×10

在一些实施方案中,施用到个体的病毒粒子的总量至少约为以下中的任一者:1×10

本发明的组合物(例如,包含编码本公开文本的变体PAH多肽的载体的重组病毒粒子)可以单独使用或与用于治疗PKU的一种或多种另外的治疗剂组合使用。依次施用之间的间隔可以是按至少(或,可替代地,少于)分钟、小时或天计算。

根据治疗目的,施用有效量的rAAV(在一些实施方案中为粒子形式)。例如,当低百分比的转导可以实现期望的治疗效果时,则治疗的目标通常是达到或超过这一转导水平。在一些情况下,这种转导水平可以通过转导仅约1%至5%的靶细胞,在一些实施方案中至少约20%的所期望组织类型的细胞,在一些实施方案中至少约50%,在一些实施方案中至少约80%,在一些实施方案中至少约95%,在一些实施方案中至少约99%的所期望组织类型的细胞来实现。rAAV组合物可以通过在同一程序期间或者间隔数天、数周、数月或数年的一次或多次施用来施用。在一些实施方案中,可以使用多个载体来治疗哺乳动物(例如,人)。

在一些实施方案中,本公开文本的rAAV组合物可以用于施用到人。在一些实施方案中,本公开文本的rAAV组合物可以用于儿科施用。不希望被理论束缚,因为PKU的许多症状本质上是发展性的(例如,严重的精神障碍),因此尽可能早地治疗PKU可能是特别有利的。在一些实施方案中,将有效量的rAAV(在一些实施方案中为粒子形式)施用至年龄小于一个月、小于两个月、小于三个月、小于四个月、小于五个月、小于六个月、小于七个月、小于八个月、小于九个月、小于十个月、小于十一个月、小于一岁、小于13个月、小于14个月、小于15个月、小于16个月、小于17个月、小于18个月、小于19个月、小于20个月、小于21个月、小于22个月、小于两岁或小于三岁的患者。

在一些实施方案中,本公开文本的rAAV组合物可以用于施用到年轻成人。在一些实施方案中,将有效量的rAAV(在一些实施方案中为粒子形式)施用至小于12岁、小于13岁、小于14岁、小于15岁、小于16岁、小于17岁、小于18岁、小于19岁、小于20岁、小于21岁、小于22岁、小于23岁、小于24岁或小于25岁的患者。

在一些实施方案中,本发明提供了治疗PKU的方法,其包括向有需要的个体施用治疗有效量的包含编码如本文所述的变体PAH多肽的核酸的细胞。在一些实施方案中,所述细胞包含编码包含至少三个氨基酸取代的变体PAH多肽的核酸,其中所述氨基酸取代位于选自野生型人PAH多肽的M180、K199、S250和G256的位点处。在一些实施方案中,所述细胞中的核酸编码包含在野生型人PAH多肽的位点M180、K199、S250和G256处的四个氨基酸取代的变体PAH多肽。在一些实施方案中,所述细胞中的核酸编码包含选自M180T、K199P、S250P和G256A的至少三个氨基酸取代的变体PAH多肽。在一些实施方案中,所述细胞中的核酸编码包含氨基酸取代M180T、K199P、S250P和G256A的变体PAH多肽。在一些实施方案中,所述细胞中的核酸编码包含包括以下的氨基酸取代的变体PAH多肽:K199P、S250P和G256A;M180T、S250P和G256A;M180T、K199P和G256A;或者M180T、K199P和S250P。在一些实施方案中,所述细胞中的核酸编码包含氨基酸取代M180T、K199P、S250P和G256A的变体PAH多肽。在一些实施方案中,所述细胞中的核酸编码还包含氨基酸取代H264P、G272A、G272P、P275L、P279Q、G272P和P275L,或T323R和F327T氨基酸取代的变体PAH多肽。在一些实施方案中,所述细胞中的核酸编码是表1-3中列出的任一种变体PAH多肽的变体PAH多肽。在一些实施方案中,所述细胞中的核酸编码包含氨基酸取代M180T、K199P、S250P和G256A,并且包含另外的氨基酸取代,同时至少大致保持野生型PAH的苯丙氨酸羟化酶活性的变体PAH多肽。在一些实施方案中,由所述细胞中的核酸编码的氨基酸取代的位置基于野生型人PAH多肽;例如,包含SEQID NO:1的氨基酸序列的人PAH多肽。

在一些实施方案中,所述细胞中的核酸编码变体人PAH多肽。在一些实施方案中,所述细胞中的核酸编码包含SEQ ID NO:3的氨基酸序列的变体PAH多肽。在一些实施方案中,所述细胞中的核酸编码包含与SEQ ID NO:3的氨基酸序列具有至少约为80%、85%、90%、95%或99%中任一同一性的氨基酸序列的变体PAH多肽。在一些实施方案中,所述细胞中的核酸编码包含与SEQ ID NO:3的氨基酸序列具有至少约为80%、85%、90%、95%或99%中任一同一性的氨基酸序列并且具有至少约25%、50%、75%、100%或大于100%的野生型PAH的苯丙氨酸羟化酶活性的变体PAH多肽。在一些实施方案中,所述细胞中的核酸编码包含与SEQ ID NO:3的氨基酸序列具有至少约为80%、85%、90%、95%或99%中任一同一性的氨基酸序列并且具有至少约25%、50%、75%、100%或大于100%的SEQ ID NO:1的野生型PAH的苯丙氨酸羟化酶活性的变体PAH多肽。

在一些实施方案中,所述细胞中的核酸编码是保持苯丙氨酸羟化酶活性的截短PAH多肽的变体PAH多肽。在一些实施方案中,所述细胞中的核酸编码包含N-末端截短的截短PAH多肽。在一些实施方案中,所述细胞中的核酸编码是N-末端调节结构域的部分或全部截短的N-末端截短。在一些实施方案中,所述细胞中的核酸编码包含野生型人PAH多肽(例如,SEQ ID NO:1的PAH多肽)的氨基酸残基1至约氨基酸残基102的缺失的N-末端截短。在一些实施方案中,所述细胞中的核酸编码包含C-末端截短的截短PAH多肽。在一些实施方案中,所述细胞中的核酸编码是四聚结构域的部分或全部截短的C-末端截短。在一些实施方案中,所述细胞中的核酸编码包含野生型人PAH多肽(例如,SEQ ID NO:1的PAH多肽)的约429至452的氨基酸残基的缺失的C-末端截短。在一些实施方案中,所述细胞中的核酸编码包含N-末端截短和C-末端截短的变体PAH多肽。在一些实施方案中,截短PAH多肽包含N-末端调节序列的部分或全部截短以及四聚结构域的部分或全部截短。在一些实施方案中,截短PAH多肽包含野生型人PAH多肽(例如,SEQ ID NO:1的PAH多肽)的氨基酸残基1至约氨基酸残基102和约429至约452的缺失。在一些实施方案中,所述细胞中的核酸编码包含对应于野生型人PAH多肽(例如,SEQ ID NO:1的PAH多肽)的约102至约428的氨基酸残基的氨基酸序列的变体PAH多肽。在一些实施方案中,所述细胞中的核酸编码包含对应于野生型人PAH多肽(例如,SEQ ID NO:1的PAH多肽)的102至428的氨基酸残基的氨基酸序列的变体PAH多肽。在一些实施方案中,所述细胞中的核酸编码还包含在野生型人PAH多肽(例如,SEQ IDNO:1的PAH多肽)的位点M180、K199、S250和G256处的四个氨基酸取代的截短PAH多肽。在一些实施方案中,所述细胞中的核酸编码包含选自M180T、K199P、S250P和G256A的四个氨基酸取代的截短PAH多肽。在一些实施方案中,所述细胞中的核酸编码还包含表1-3中列出的氨基酸取代的任一种组合的截短变体PAH多肽。在一些实施方案中,所述细胞中的核酸编码具有至少约25%、50%、75%、100%或大于100%的野生型PAH(例如,SEQ ID NO:1的PAH多肽)的苯丙氨酸羟化酶活性的截短PAH多肽。

在一些实施方案中,本发明提供了通过施用有效量的包含编码本公开文本的变体PAH多肽的核酸的细胞来治疗PKU的方法。包含编码变体PAH多肽的核酸的细胞可以施用到特定的感兴趣组织,或者可以全身施用。在一些实施方案中,可以肠胃外施用有效量的包含编码变体PAH多肽的核酸的细胞。肠胃外施用途径可以包括但不限于静脉内、腹膜内、骨内、动脉内、大脑内、肌内、鞘内、皮下、脑室内、肝内等。在一些实施方案中,所述细胞被包封或在装置中。在一些实施方案中,肝脏外表达PAH的细胞可能需要外源添加或共表达辅因子BH4。在一些实施方案中,所述细胞被包封或在还包含BH4的装置中。在一些实施方案中,可以通过一种施用途径施用有效量的包含编码变体PAH多肽的核酸的细胞。在一些实施方案中,可以通过多于一种施用途径的组合施用有效量的编码变体PAH多肽的核酸。在一些实施方案中,可以将有效量的编码变体PAH多肽的核酸施用到一个位置。在其他实施方案中,可以将有效量的变体PAH多肽施用到多于一个位置。

在一些实施方案中,包含编码变体PAH多肽的核酸的细胞是肝细胞、肌肉细胞、成纤维细胞、内皮细胞、上皮细胞、血细胞、骨髓细胞、干细胞或诱导多能干细胞。在一些实施方案中,所述细胞还包含外源添加的辅因子BH4和/或共表达的辅因子BH4。

在一些实施方案中,所述细胞是细胞系(例如CHO细胞系、HeLa细胞系等)。在一些实施方案中,本发明提供了产生变体PAH多肽的方法,其包括在产生变体PAH多肽的条件下培养包含编码变体PAH多肽的核酸(例如,编码变体PAH多肽的表达载体)的细胞。在一些实施方案中,产生变体PAH多肽的方法还包括一个或多个纯化变体PAH多肽的步骤。

VII.试剂盒或制品

如本文所述的变体PAH多肽、核酸、rAAV载体、粒子和/或药物组合物可以包含在例如设计用于如本文所述的本发明方法之一的试剂盒或制品中。

通常,所述系统包括适用于本发明方法的套管、一个或多个注射器(例如,1、2、3、4或更多)和一种或多种流体(例如,1、2、3、4或更多)。

注射器可以是任何合适的注射器,只要它能够连接至用于递送流体的套管。在一些实施方案中,所述系统具有一个注射器。在一些实施方案中,所述系统具有两个注射器。在一些实施方案中,所述系统具有三个注射器。在一些实施方案中,所述系统具有四个或更多个注射器。适用于本发明方法的流体包括本文所述的流体,例如,各自包含有效量的如本文所述的一种或多种载体的一种或多种流体,以及包含一种或多种治疗剂的一种或多种流体。

在一些实施方案中,试剂盒包含单一流体(例如,包含有效量载体的药学上可接受的流体)。在一些实施方案中,试剂盒包含2种流体。在一些实施方案中,试剂盒包含3种流体。在一些实施方案中,试剂盒包含4种或更多种流体。流体可以包括稀释剂、缓冲剂、赋形剂或本文所述或本领域已知的适用于递送、稀释、稳定、缓冲或以其他方式运输本公开文本的变体PAH多肽或rAAV载体组合物的任何其他液体。在一些实施方案中,试剂盒包含一种或多种缓冲剂,例如含水的pH缓冲溶液。缓冲剂的例子可以包括但不限于磷酸盐、柠檬酸盐、Tris、HEPES和其他有机酸缓冲剂。

在一些实施方案中,试剂盒包含容器。合适的容器可以包括例如小瓶、袋、注射器和瓶子。容器可以由一种或多种材料(如玻璃、金属或塑料)制成。在一些实施方案中,将容器用于容纳本公开文本的rAAV组合物。在一些实施方案中,容器还可以容纳流体和/或其他治疗剂。

在一些实施方案中,试剂盒包含附加治疗剂与本公开文本的rAAV组合物。在一些实施方案中,rAAV组合物和附加治疗剂可以混合。在一些实施方案中,rAAV组合物和附加治疗剂可以保持分离。在一些实施方案中,rAAV组合物和附加治疗剂可以在同一容器中。在一些实施方案中,rAAV组合物和附加治疗剂可以在不同容器中。在一些实施方案中,rAAV组合物和附加治疗剂可以同时施用。在一些实施方案中,rAAV组合物和附加治疗剂可以在同一天施用。在一些实施方案中,rAAV组合物可以在施用附加治疗剂的一天、两天、三天、四天、五天、六天、七天、两周、三周、四周、两个月、三个月、四个月、五个月或六个月内施用。

在一些实施方案中,试剂盒包含在AAV施用之前短暂抑制免疫系统的治疗剂。在一些实施方案中,在注射病毒之前和之后不久,对患者进行短暂的免疫抑制,以抑制T细胞对AAV粒子的响应(例如,参见Ferreira等人,Hum.Gene Ther.25:180-188,2014)。在一些实施方案中,试剂盒还提供环孢霉素、霉酚酸酯和/或甲基强的松龙。

本发明的rAAV粒子和/或组合物还可以被包装到包括使用说明的试剂盒中。在一些实施方案中,试剂盒还包括用于递送(例如,本文所述的任何类型的肠胃外施用)rAAV粒子组合物的装置。在一些实施方案中,使用说明包括根据本文所述的方法之一的说明。在一些实施方案中,所述说明被印刷在与容器一起提供(例如,附着到容器)的标签上。在一些实施方案中,使用说明包括用于向个体(例如人)施用有效量的rAAV粒子,例如用于治疗个体中的PKU的说明。

VIII.示例性实施方案

实施方案1.一种包含两个氨基酸取代的变体苯丙氨酸羟化酶(PAH)多肽,其中所述氨基酸取代位于选自野生型人PAH多肽的M180、K199、S250和G256的位点处。

实施方案2.一种包含三个氨基酸取代的变体苯丙氨酸羟化酶(PAH)多肽,其中所述氨基酸取代位于选自野生型人PAH多肽的M180、K199、S250和G256的位点处。

实施方案3.一种包含四个氨基酸取代的变体苯丙氨酸羟化酶(PAH)多肽,所述氨基酸取代位于野生型人PAH多肽的位点M180、K199、S250和G256处。

实施方案4.实施方案1-3中任一项的变体PAH多肽,其中氨基酸取代包括M180T、K199P、S250P和G256A中的一种或多种。

实施方案5.实施方案1-4中任一项的变体PAH多肽,其中氨基酸取代包括K199P、S250P和G256A;M180T、S250P和G256A;M180T、K199P和G256A;或者M180T、K199P和S250P。

实施方案6.实施方案1-5中任一项的变体PAH多肽,其中氨基酸取代包括M180T、K199P、S250P和G256A。

实施方案7.实施方案1-6中任一项的变体PAH多肽,其中变体PAH多肽还包含H264P、G272A、G272P、P275L、P279Q、G272P和P275L,或T323R和F327T氨基酸取代。

实施方案8.实施方案1-7中任一项的变体PAH多肽,其中野生型人PAH多肽包含SEQID NO:1的氨基酸序列。

实施方案9.实施方案1-8中任一项的变体PAH多肽,其中变体PAH多肽是人PAH多肽。

实施方案10.实施方案1-9中任一项的变体PAH多肽,其中变体PAH多肽包含与SEQID NO:3的氨基酸序列至少约80%相同的氨基酸序列。

实施方案11.实施方案1-6中任一项的变体PAH多肽,其中变体PAH多肽包含SEQ IDNO:3的氨基酸序列。

实施方案12.实施方案1-11中任一项的变体PAH,其中变体PAH多肽还包含选自野生型人PAH多肽的G33A、G46A、G46P、G103A、G139A、G139P、G148A、G188A、G218A、G239A、G247A、G257A、G272A、G289A、G307A、G312A、G332A、G337A、G344A、G352A和G442A的一个或多个氨基酸取代。

实施方案13.实施方案1-12中任一项的变体PAH,其中变体PAH多肽还包含选自野生型人PAH多肽的P9G、G10V、G12S、K184R、K192R、S196A、Y206H、H220R、Q336E、E360D、I374C、N376E、N401T、I421V、I441V、S446H的一个或多个氨基酸取代,以及在野生型人PAH多肽的位置453处添加S。

实施方案14.实施方案1-13中任一项的变体PAH,其中变体PAH多肽还包含选自野生型人PAH多肽的F240W、A246P、G247A、Y268W、C284F、T323R、F327Y、E319P、I306(Y、F)、K113P、G188A、F191Y、T193R、Y206H、G337P和N376P的一个或多个氨基酸取代。

实施方案15.一种变体PAH多肽,其中变体PAH多肽包含选自野生型人PAH多肽的G33A、G46A、G46P、G103A、G139A、G139P、G148A、G188A、G218A、G239A、G247A、G257A、G272A、G289A、G307A、G312A、G332A、G337A、G344A、G352A和G442A的一个或多个氨基酸取代。

实施方案16.一种变体PAH多肽,其中变体PAH多肽包含选自野生型人PAH多肽的P9G、G10V、G12S、K184R、K192R、S196A、Y206H、H220R、Q336E、E360D、I374C、N376E、N401T、I421V、I441V、S446H的一个或多个氨基酸取代,以及在野生型人PAH多肽的位置453处添加S。

实施方案17.一种变体PAH多肽,其中变体PAH多肽包含选自野生型人PAH多肽的F240W、A246P、G247A、Y268W、C284F、T323R、F327Y、E319P、I306(Y、F)、K113P、G188A、F191Y、T193R、Y206H、G337P和N376P的一个或多个氨基酸取代。

实施方案18.实施方案1-17中任一项的变体PAH多肽,其中变体PAH多肽包含N-末端截短。

实施方案19.实施方案18的变体PAH多肽,其中N-末端截短包括N-末端调节结构域的截短。

实施方案20.实施方案18或19的变体PAH多肽,其中N-末端截短包括野生型PAH多肽的氨基酸残基1-102的截短。

实施方案21.实施方案1-20中任一项的变体PAH多肽,其中变体PAH多肽包含C-末端截短。

实施方案22.实施方案21的变体PAH多肽,其中C-末端截短包括四聚结构域的截短。

实施方案23.实施方案21或22的变体PAH多肽,其中C-末端截短包括野生型PAH多肽的氨基酸残基429-452的截短。

实施方案24.实施方案1-23中任一项的变体PAH多肽,其中变体PAH多肽包含对应于野生型PAH多肽的氨基酸残基103-428的氨基酸序列。

实施方案25.实施方案1-24中任一项的变体PAH多肽,其中变体PAH多肽包含一个或多个氨基酸取代,以消除潜在的蛋白酶切割位点。

实施方案26.实施方案25的变体PAH多肽,其中消除潜在蛋白酶切割位点的一个或多个氨基酸取代位于野生型PAH多肽的位置270-295和/或380-405处。

实施方案27.实施方案1-26中任一项的变体PAH多肽,其中变体PAH多肽与肝靶向多肽融合。

实施方案28.实施方案27的变体PAH多肽,其中肝靶向多肽是HGF或其片段或者结合肝细胞去唾液酸糖蛋白受体的糖蛋白。

实施方案29.实施方案1-25中任一项的变体PAH多肽,其中变体PAH多肽被聚乙二醇化和/或亚硝基化。

实施方案30.实施方案26的变体PAH多肽,其中变体PAH多肽包含I374C氨基酸取代,其中位置374处的cys残基被亚硝基化。

实施方案31.一种组合物,其包含实施方案1-30中任一项的变体PAH多肽。

实施方案32.实施方案31的组合物,其中所述组合物还包含药学上可接受的载体。

实施方案33.一种分离核酸,其编码实施方案1-30中任一项的变体PAH多肽。

实施方案34.实施方案33的分离核酸,其中编码变体PAH多肽的核酸可操作地连接至启动子。

实施方案35.实施方案34的分离核酸,其中所述启动子选自巨细胞病毒(CMV)即时早期启动子、RSV LTR、MoMLV LTR、磷酸甘油酸激酶-1(PGK)启动子、猿猴病毒40(SV40)启动子、CK6启动子、转甲状腺素蛋白启动子(TTR)、mTTR482启动子、mA1MB2-mTTR482启动子、TK启动子、四环素应答性启动子(TRE)、HBV启动子、hAAT启动子、LSP启动子、LP1启动子、嵌合肝脏特异性启动子(LSP)、E2F启动子、端粒酶(hTERT)启动子;巨细胞病毒增强子/鸡β-肌动蛋白/兔β-球蛋白启动子(CAG)启动子、延长因子1-α启动子(EF1-α)启动子、人β-葡糖醛酸酶启动子、鸡β-肌动蛋白(CBA)启动子、修饰的鸡β-肌动蛋白(CBA)启动子或SEQ ID NO:17、逆转录劳斯肉瘤病毒(RSV)LTR启动子、二氢叶酸还原酶启动子和13-肌动蛋白启动子。

实施方案36.实施方案34或35的分离核酸,其中所述启动子是LP1启动子或mA1MB2-mTTR482启动子。

实施方案37.实施方案33-36中任一项的分离核酸,其中所述核酸还包含多腺苷酸化信号。

实施方案38.实施方案37的分离核酸,其中所述多腺苷酸化信号是牛生长激素多腺苷酸化信号、SV40多腺苷酸化信号或HSV TK pA。

实施方案39.实施方案33-38中任一项的分离核酸,其中所述核酸还包含内含子。

实施方案40.实施方案39的分离核酸,其中所述内含子是鸡β-肌动蛋白(CBA)/兔β-球蛋白杂合内含子。

实施方案41.实施方案39的分离核酸,其中所述内含子是SEQ ID NO:15的修饰的鸡β-肌动蛋白(CBA)/兔β-球蛋白杂合内含子。

实施方案42.实施方案33-41中任一项的分离核酸,其中所述核酸还包含一个或多个ITR。

实施方案43.实施方案33-42中任一项的分离核酸,其中所述核酸还包含填充核酸。

实施方案44.实施方案43的分离核酸,其中所述填充核酸被优化以去除ATG序列。

实施方案45.实施方案44的分离核酸,其中所述填充核酸是SEQ ID NO:16的A1AT内含子填充序列。

实施方案46.一种编码人PAH多肽的分离核酸,其中所述核酸是密码子优化的。

实施方案47.实施方案46的分离核酸,其中所述核酸序列与SEQ ID NO:14的核酸序列至少80%相同。

实施方案48.实施方案46的分离核酸,其中所述核酸包含SEQ ID NO:14的核酸序列。

实施方案49.实施方案33的分离核酸,其中所述核酸是mRNA。

实施方案50.一种组合物,其包含实施方案33-49中任一项的核酸。

实施方案51.实施方案50的组合物,其中所述组合物还包含药学上可接受的载体。

实施方案52.一种载体,其包含实施方案33-49中任一项的核酸。

实施方案53.实施方案52的载体,其中所述载体是重组腺相关病毒(rAAV)载体。

实施方案54.一种包含实施方案33-41或43-49中任一项的核酸的rAAV载体,所述核酸的侧翼是一个或多个AAV反向末端重复(ITR)序列。

实施方案55.实施方案54的rAAV载体,其中实施方案33-48中任一项的核酸的侧翼是两个AAV ITR。

实施方案56.实施方案54或55的rAAV载体,其中AAV ITR是AAV1、AAV2、AAV3、AAV4、AAV5、AAV6、AAV7、AAV8、AAVrh8、AAVrh8R、AAV9、AAV10、AAVrh10、AAV11、AAV12、AAV2R471A、AAV DJ、山羊AAV、牛AAV或小鼠AAV血清型ITR。

实施方案57.实施方案54-56中任一项的rAAV载体,其中所述AAV ITR是AAV2 ITR。

实施方案58.实施方案57的rAAV载体,其中所述rAAV载体从5'到3'包含AAV2 ITR、启动子、内含子、编码PAH多肽的核酸、填充核酸、多腺苷酸化信号和AAV2 ITR。

实施方案59.实施方案58的rAAV载体,其中所述启动子是m1A1MB2-mTTR482启动子或LP1启动子。

实施方案60.实施方案58或59的rAAV载体,其中所述内含子是鸡β-肌动蛋白(CBA)/兔β-球蛋白杂合内含子。

实施方案61.实施方案58-59中任一项的rAAV载体,其中PAH多肽是实施方案1-30中任一项的变体PAH多肽。

实施方案62.实施方案58-60中任一项的rAAV载体,其中编码PAH多肽的核酸是实施方案46-48中任一项的密码子优化的核酸。

实施方案63.实施方案58-62中任一项的rAAV载体,其中所述填充核酸包含来自人α1抗胰蛋白酶基因内含子的核酸。

实施方案64.实施方案63的rAAV载体,其中人α1抗胰蛋白酶基因的内含子已经突变以去除ATG序列。

实施方案65.实施方案58-64中任一项的rAAV载体,其中多腺苷酸化信号是牛生长激素多腺苷酸化信号。

实施方案66.实施方案53-65中任一项的rAAV载体,其中所述载体是自身互补的载体。

实施方案67.实施方案66的rAAV载体,其中所述载体包含编码PAH多肽的第一核酸序列和编码PAH多肽的补体的第二核酸序列,其中所述第一核酸序列可以与所述第二核酸序列沿着其大部分或全部长度形成链内碱基对。

实施方案68.实施方案67的rAAV载体,其中所述第一核酸序列和所述第二核酸序列通过突变AAV ITR连接,其中所述突变AAV ITR包含D区的缺失,并且包含末端解链序列的突变。

实施方案69.一种rAAV粒子,其包含实施方案53-68中任一项的rAAV载体。

实施方案70.实施方案中69的rAAV粒子,其中AAV病毒粒子包含AAV1、AAV2、AAV3、AAV4、AAV5、AAV6、AAV7、AAV8、AAVrh8、AAVrh8R、AAV9、AAV10、AAVrh10、AAV11、AAV12、AAV2R471A、AAV2/2-7m8、AAV DJ、AAV2 N587A、AAV2 E548A、AAV2 N708A、AAV2V708K、山羊AAV、AAV1/AAV2嵌合、牛AAV、小鼠AAV或rAAV2/HBoV1血清型衣壳。

实施方案71.实施方案69的rAAV粒子,其中AAV病毒粒子包含工程化AAV衣壳。

实施方案72.实施方案71的rAAV粒子,其中工程化AAV衣壳是DJ衣壳或LK03衣壳。

实施方案73.实施方案69或70的rAAV粒子,其中rAAV病毒粒子的ITR和衣壳来源于相同AAV血清型。

实施方案74.实施方案69或70的rAAV粒子,其中rAAV病毒粒子的ITR和衣壳来源于不同AAV血清型。

实施方案75.实施方案69-70或73-74中任一项的rAAV粒子,其中rAAV病毒粒子包含AAV8衣壳。

实施方案76.实施方案74的rAAV粒子,其中rAAV病毒粒子包含AAV8衣壳,并且其中所述载体包含AAV2 ITR。

实施方案77.一种组合物,其包含实施方案69-76中任一项的rAAV粒子。

实施方案78.实施方案77的组合物,其中所述组合物还包含药学上可接受的载体。

实施方案79.一种细胞,其包含实施方案33-49中任一项的核酸或权利要求52或53的载体或实施方案54-68中任一项的rAAV载体。

实施方案80.一种产生变体PAH多肽的方法,所述方法包括在产生变体PAH多肽的条件下培养实施方案79的细胞。

实施方案81.实施方案80的方法,其还包括纯化变体PAH多肽的步骤。

实施方案82.一种用于治疗有需要的个体中苯丙酮尿症的方法,其包括向所述个体施用实施方案1-30中任一项的变体PAH多肽或实施方案31或32的组合物。

实施方案83.一种用于治疗有需要的个体中苯丙酮尿症的方法,其包括向所述个体施用编码实施方案1-30中任一项的变体PAH多肽的核酸或实施方案33、34或49的核酸。

实施方案84.一种用于治疗有需要的个体中苯丙酮尿症的方法,其包括向所述个体施用实施方案53-68中任一项的rAAV载体。

实施方案85.一种用于治疗有需要的个体中苯丙酮尿症的方法,其包括向所述个体施用实施方案69-76中任一项的rAAV粒子。

实施方案86.一种用于治疗有需要的个体中苯丙酮尿症的方法,其包括向所述个体施用实施方案31、32、50、51、77或78的组合物。

实施方案87.一种用于治疗有需要的个体中苯丙酮尿症的方法,其包括向所述个体施用实施方案79的细胞。

实施方案88.实施方案82-87中任一项的方法,其中所述个体缺乏PAH活性。

实施方案89.一种用于降低有需要的个体的血液中苯丙氨酸水平的方法,其包括向所述个体施用实施方案1-30中任一项的变体PAH多肽或权利要求31或32的组合物。

实施方案90.一种用于降低有需要的个体的血液中苯丙氨酸水平的方法,其包括向所述个体施用编码实施方案1-30中任一项的变体PAH多肽的核酸或实施方案33、34或49的核酸。

实施方案91.一种用于降低有需要的个体的血液中苯丙氨酸水平的方法,其包括向所述个体施用实施方案53-68中任一项的rAAV载体。

实施方案92.一种用于降低有需要的个体的血液中苯丙氨酸水平的方法,其包括向所述个体施用实施方案69-76中任一项的rAAV粒子。

实施方案93.一种用于降低有需要的个体的血液中苯丙氨酸水平的方法,其包括向所述个体施用实施方案31、32、50、51、77或78的组合物。

实施方案94.一种用于降低有需要的个体的血液中苯丙氨酸水平的方法,其包括向所述个体施用实施方案79的细胞。

实施方案95.实施方案89-94中任一项的方法,其中与同等匹配对照个体的血液中苯丙氨酸水平相比,治疗前个体血液中苯丙氨酸水平升高。

实施方案96.实施方案82-95中任一项的方法,其中变体PAH多肽、核酸、rAAV载体、rAAV粒子、组合物或细胞通过静脉内、动脉内、肝内、门静脉内、腹膜内或皮下施用。

实施方案97.实施方案82-96中任一项的方法,其中所述施用与另一种疗法组合。

实施方案98.实施方案97的方法,其中所述另一种疗法是用四氢生物蝶呤治疗,用苯丙氨酸解氨酶(PAL)或聚乙二醇化PAL治疗,或苯丙氨酸限制饮食。

实施方案99.一种用于制备PAH多肽的方法,其包括在产生PAH多肽的条件下培养实施方案79的细胞。

实施方案100.实施方案99的方法,其还包括纯化所述PAH多肽。

实施方案101.一种试剂盒,其包含实施方案1-24中任一项的变体PAH多肽。

实施方案102.一种试剂盒,其包含实施方案33-46中任一项的核酸、实施方案53-68中任一项的rAAV载体、实施方案69-76中任一项的rAAV粒子或实施方案77或78的组合物。

实施方案103.实施方案101或102的试剂盒,其中所述试剂盒还包括使用说明;缓冲剂和/或药学上可接受的赋形剂;和/或瓶子、小瓶和/或注射器。

实施方案104.一种用于在肝细胞中表达转基因的表达盒,其中所述表达盒包含可操作地连接至启动子和增强子的转基因,其中所述启动子包括小鼠甲状腺素运载蛋白(mTTR)启动子,并且所述增强子包括一个或两个修饰的凝血酶原增强子(pPrT2)、一个或两个修饰的α1-微bikunin增强子(mA1MB2)、修饰的小鼠白蛋白增强子(mEalb)、乙型肝炎病毒增强子II(HEII)或CRM8增强子。

实施方案105.实施方案104的表达盒,其中所述mTTR启动子是mTTR482启动子。

实施方案106.实施方案104或105的表达盒,其中所述增强子在mTTR启动子的5'侧。

实施方案107.一种用于在肝细胞中表达转基因的表达盒,其中所述表达盒包含可操作地连接至启动子和和3'元件的转基因,其中所述启动子包括小鼠甲状腺素运载蛋白(mTTR)启动子,并且所述3'元件是白蛋白3'元件(3'Alb)或连接至人α1抗胰蛋白酶支架/基质附着区(SMAR)的白蛋白3'元件(3'AlbSMAR)。

实施方案108.实施方案107的表达盒,其中所述mTTR启动子是mTTR482启动子。

实施方案109.实施方案107或108的表达盒,其中所述3'元件位于转基因的3'侧。

实施方案110.一种用于在肝细胞中表达转基因的表达盒,其中所述表达盒包含可操作地连接至启动子和增强子和3'元件的转基因,其中所述启动子包括小鼠甲状腺素运载蛋白(mTTR)启动子,并且所述增强子包括一个或两个修饰的凝血酶原增强子(pPrT2)、一个或两个修饰的α1-微bikunin增强子(mA1MB2)、修饰的小鼠白蛋白增强子(mEalb)、乙型肝炎病毒增强子II(HEII)或CRM8增强子,并且其中所述3'元件是白蛋白3'元件(3'Alb)或连接至人α1抗胰蛋白酶支架/基质附着区(SMAR)的白蛋白3'元件(3'AlbSMAR)。

实施方案111.实施方案110的表达盒,其中所述mTTR启动子是mTTR482启动子。

实施方案112.实施方案110或111的表达盒,其中所述增强子在mTTR启动子的5'侧。

实施方案113.实施方案110-112中任一项的表达盒,其中所述3'元件位于转基因的3'侧。

实施方案114.实施方案104-113中任一项的表达盒,其中所述表达盒还包含内含子。

实施方案115.实施方案114的表达盒,其中所述内含子是鸡β-肌动蛋白/兔β-球蛋白杂合内含子。

实施方案116.实施方案104-115中任一项的表达盒,其中所述表达盒还包含多腺苷酸化信号。

实施方案117.实施方案116的表达盒,其中多腺苷酸化信号是牛生长激素多腺苷酸化信号。

实施方案118.实施方案104-117中任一项的表达盒,其中所述转基因编码PAH多肽或变体PAH多肽。

实施方案119.实施方案118的表达盒,其中变体PAH多肽是实施方案1-30中任一项的变体PAH多肽。

实施方案120.一种载体,其包含实施方案104-119中任一项的表达盒。

实施方案121.实施方案120的载体,其中所述载体是重组腺相关病毒(rAAV)载体。

实施方案122.一种包含实施方案104-119中任一项的表达盒的rAAV载体,所述表达盒的侧翼是一个或多个AAV反向末端重复(ITR)序列。

实施方案123.实施方案122的rAAV载体,其中实施方案104-118中任一项的表达盒的侧翼是两个AAV ITR。

实施方案124.实施方案122或123的rAAV载体,其中AAV ITR是AAV1、AAV2、AAV3、AAV4、AAV5、AAV6、AAV7、AAV8、AAVrh8、AAVrh8R、AAV9、AAV10、AAVrh10、AAV11、AAV12、AAV2R471A、AAV DJ、山羊AAV、牛AAV或小鼠AAV血清型ITR。

实施方案125.实施方案122-124中任一项的rAAV载体,其中所述AAV ITR是AAV2ITR。

实施方案126.实施方案122-125中任一项的rAAV载体,其中所述载体是自身互补的载体。

实施方案127.实施方案126的rAAV载体,其中所述载体包含编码PAH多肽的第一核酸序列和编码PAH多肽的补体的第二核酸序列,其中所述第一核酸序列可以与所述第二核酸序列沿着其大部分或全部长度形成链内碱基对。

实施方案128.实施方案127的rAAV载体,其中所述第一核酸序列和所述第二核酸序列通过突变AAV ITR连接,其中所述突变AAV ITR包含D区的缺失,并且包含末端解链序列的突变。

实施方案129.一种rAAV粒子,其包含实施方案122-127中任一项的rAAV载体。

实施方案130.实施方案中129的rAAV粒子,其中AAV病毒粒子包含AAV1、AAV2、AAV3、AAV4、AAV5、AAV6、AAV7、AAV8、AAVrh8、AAVrh8R、AAV9、AAV10、AAVrh10、AAV11、AAV12、AAV2R471A、AAV2/2-7m8、AAV DJ、AAV2 N587A、AAV2 E548A、AAV2 N708A、AAV2 V708K、山羊AAV、AAV1/AAV2嵌合、牛AAV、小鼠AAV或rAAV2/HBoV1血清型衣壳。

实施方案131.实施方案130的rAAV粒子,其中AAV病毒粒子包含工程化AAV衣壳。

实施方案132.实施方案131的rAAV粒子,其中工程化AAV衣壳是DJ衣壳或LK03衣壳。

实施方案133.实施方案131或132的rAAV粒子,其中rAAV病毒粒子的ITR和衣壳来源于相同AAV血清型。

实施方案134.实施方案131或132的rAAV粒子,其中rAAV病毒粒子的ITR和衣壳来源于不同AAV血清型。

实施方案135.一种组合物,其包含实施方案129-134中任一项的rAAV粒子。

实施方案136.实施方案135的组合物,其中所述组合物还包含药学上可接受的载体。

实施方案137.一种细胞,其包含实施方案104-119中任一项的表达盒或实施方案120-128中任一项的载体。

实施方案138.一种用于治疗有需要的个体中苯丙酮尿症的方法,其包括向所述个体施用实施方案104-119中任一项的表达盒。

实施方案139.一种用于治疗有需要的个体中苯丙酮尿症的方法,其包括向所述个体施用实施方案122-128中任一项的rAAV载体。

实施方案140.一种用于治疗有需要的个体中苯丙酮尿症的方法,其包括向所述个体施用实施方案129-134中任一项的rAAV粒子。

实施方案141.一种用于治疗有需要的个体中苯丙酮尿症的方法,其包括向所述个体施用实施方案135或136的组合物。

实施方案142.一种用于治疗有需要的个体中苯丙酮尿症的方法,其包括向所述个体施用实施方案137的细胞。

实施方案143.实施方案138-142中任一项的方法,其中所述个体缺乏PAH活性。

实施方案144.一种用于降低有需要的个体的血液中苯丙氨酸水平的方法,其包括向所述个体施用实施方案104-119中任一项的表达盒。

实施方案145.一种用于降低有需要的个体的血液中苯丙氨酸水平的方法,其包括向所述个体施用实施方案122-128中任一项的rAAV载体。

实施方案146.一种用于降低有需要的个体的血液中苯丙氨酸水平的方法,其包括向所述个体施用实施方案129-134中任一项的rAAV粒子。

实施方案147.一种用于降低有需要的个体的血液中苯丙氨酸水平的方法,其包括向所述个体施用实施方案135或136的组合物。

实施方案148.一种用于降低有需要的个体的血液中苯丙氨酸水平的方法,其包括向所述个体施用实施方案137的细胞。

实施方案149.实施方案144-148中任一项的方法,其中与同等匹配对照个体的血液中苯丙氨酸水平相比,治疗前个体血液中苯丙氨酸水平升高。

实施方案150.实施方案138-149中任一项的方法,其中核酸、rAAV载体、rAAV粒子、组合物或细胞通过静脉内、动脉内、肝内、门静脉内、腹膜内或皮下施用。

实施方案151.实施方案138-150中任一项的方法,其中所述施用与另一种疗法组合。

实施方案152.实施方案151的方法,其中所述另一种疗法是用四氢生物蝶呤治疗,用苯丙氨酸解氨酶(PAL)或聚乙二醇化PAL治疗,或苯丙氨酸限制饮食。

实施方案153.一种试剂盒,其包含实施方案104-119中任一项的表达盒、实施方案122-128中任一项的rAAV载体、实施方案129-134中任一项的rAAV粒子或实施方案135或136的组合物。

实施方案154.实施方案153的试剂盒,其中所述试剂盒还包括使用说明;缓冲剂和/或药学上可接受的赋形剂;和/或瓶子、小瓶和/或注射器。

实施例

通过参考以下实施例将更全面地理解本发明。然而,它们不应被解读为限制本发明的范围。应理解,本文描述的实施例和实施方案仅用于说明目的,并且根据它们进行的各种修改或改变将为本领域技术人员知晓,并且应包括在本申请的精神和范围内以及所附实施方案的范围内。

实施例1.肝脏特异性表达盒的产生

进行以下研究以开发在个体肝脏中表达转基因的强表达构建体。

PAH表达盒和rAAV载体的构建

为了增加肝脏启动子的强度,将含有小鼠甲状腺素运载蛋白(mTTR)启动子、内源性mTTR增强子和牛生长激素(BGH)聚腺苷酸化(pA)位点的质粒mTTR482-HI-hFVIII-BGHpA用于另外的修饰(Kyostio-Moore 2016,Nambiar 2017)。在此质粒中,用编码分泌型胚胎碱性磷酸酶(SEAP)的cDNA替代FVIII cDNA,并且用1069bp的鸡b-肌动蛋白(CBA)/兔β-球蛋白杂合内含子替代现有内含子。在mTTR482增强子上游克隆了各种肝脏增强子序列。这些包括修饰的凝血酶原增强子(mPrT2,两个拷贝)、修饰的α1-微bikunin(mA1MB2,两个拷贝)(McEachern 2006,Jacobs 2008)、修饰的小鼠白蛋白增强子(mEalb)(Kramer 2003)、乙型肝炎病毒增强子II(E11)(Kramer 2003)和CRM8(Chuah 2014)。另外,在BGH pA下游测试并克隆了两个3'元件,即白蛋白(Alb 3')(Wooddell 2008)和白蛋白加人A1AT1 SMAR元件(AF156542)(Alb3'/SMAR)(图1A)。一些增强子中的修饰由将肝核因子(HNF)3和4结合位点改变为更高亲和力的序列组成,类似于先前对mTTR482进行的修饰(Nambiar 2017;增刊1)。

为了产生人或小鼠PAH质粒表达盒,将编码全长PAH(氨基酸1-452)的对应cDNA克隆到三个表达质粒中。这些质粒含有肝脏特异性(LP1;Nathwani 2011)、A1MB2-mTTR482或CBA启动子、杂合内含子和pA序列(BGH或猿猴病毒40[SV40]pA)(Nathwani 2011,Kyostio-Moore 2016)。所有表达质粒都含有侧翼AAV2 ITR。将mTTR482(Nambiar 2017)用作主链来评价编码hPAH的各种cDNA。四个密码子优化的cDNA由DNA2.0、GeneArt(GA)或Genscript(GS)和结合CpG含量的降低的GS算法生成。在每个表达质粒中,将PAH蛋白用N-末端22-氨基酸3xFLAG肽(MDYKDHDGDYKDHDIDYKDDDDK(SEQ ID NO:18))标记,用于检测和定量目的。

将所选含有AAV2 ITR的具有肝启动子、杂合内含子、PAH cDNA和BGHpA的质粒用于rAAV载体的生产。使用三重转染法,随后用CsCl2纯化(Univ.Massachusetts Gene TherapyCore)产生具有AAV8血清型衣壳的rAAV载体。通过针对BGHpA的qPCR将载体批次定量(Nambiar 2017)。

体外细胞培养物

所有组织培养试剂均获自Irvine Scientific(圣安娜,加利福尼亚州)或Invitrogen。为了瞬时转染,将人293或人肝癌细胞(Huh7或HepG2)(8×10

SEAP活性的定量

收集条件培养基或血清,并将样品在65℃下加热30分钟以灭活内源性碱性磷酸酶。使用碱性磷酸酶(ALP)-SL试剂(Sekisui Diagnostics)测量SEAP活性,并将样品孵育10分钟至2小时,随后读取405nm处的吸光度。将人碱性磷酸酶HPAP用作标准(Calbiochem)。通过将样品值除以转换因子0.103mU/ng,将SEAP活性表示为ug/ml。

PAH蛋白和活性的定量

在48小时后,通过在裂解缓冲液或RIPA缓冲液中裂解细胞产生全细胞裂解物。另外,在一些实验中,将超声波处理或剪切用于增强细胞裂解。在解冻后,将裂解物在测定前以14,000g旋转30分钟。根据制造商的说明,并且使用试剂盒标准或内部纯化的3xFLAG-mPAH-FL作为蛋白质标准,通过FLAG ELISA(SE002-flag;ABSbio)测量FLAG融合蛋白水平的定量。通过由BCA蛋白质测定试剂盒(Pierce)测量的总蛋白质含量归一化体内样品。PAH蛋白的酶活性如先前Yew等人2013所述进行了测量,其中做了一些小的修改。使用标准方案,使用抗hPAH抗体(LS-C344145;LSBio)或抗FLAG抗体(F1804;Sigma)进行PAH检测的蛋白质印迹。

体内研究

在Taconic饲养了一群BTBR-PAH

血液和组织分析

使用配备有与API 4000三重四极质谱仪(AB SCIEX,弗雷明汉,美国马萨诸塞州)联用的Dionex Ultimate 3000HPLC(Thermo Fisher,沃尔瑟姆,美国马萨诸塞州)的Transcend II LX4多重系统,通过UHPLC-MS/MS分析血浆Phe和Tyr水平。使用L-Phe和L-Tyr(Sigma-Aldrich,圣路易斯,美国密苏里州)来制备标准溶液,并将标记的L-Phe-13C9,15N和标记的L-Tyr-13C9,15N(Sigma-Aldrich)用作内标。在正离子模式下进行MS/MS检测。所述分析使用Acquity BEH C18柱(1.7μm,2.1×30mm)用梯度分离进行,所述梯度分离包括在98%流动相A(水中0.1%甲酸)下保持10秒,随后在2%-45%流动相B(乙腈中0.1%甲酸)梯度下保持30秒,增加到75%B并保持15秒,在75%B下洗涤10秒,并且在98%A下再平衡1分钟,流速为0.5mL/分钟。MS/MS转换为:Phe为166.1/120.1,Tyr为182.1/136.1,标记的Phe为176.1/129.1,以及标记的Tyr为192.1/145.1。

对于脑神经递质的定量,按照稍作修改的描述处理脑(Kankaanpaa 2001)。简而言之,用Bead Ruptor 24(Omni)在冰冷的裂解缓冲液(1mM草酸、3mM半胱氨酸、0.1M乙酸)中,以4.85m/秒在4℃下,将半个矢状切割的、PBS灌注的脑匀浆20秒。将样品以14K旋转10分钟,并且随后将上清液冷冻。然后使用与API 5000三重四极质谱仪(AB SCIEX,弗雷明汉,美国马萨诸塞州)联用的Acquity UPLC(Waters Corporation,米尔福德市,美国马萨诸塞州),通过UPLC-MS/MS定量大脑匀浆(200mg/mL)的左旋多巴、多巴胺、高香草酸(HVA)、血清素、5-羟基色氨酸(5-HTP)、5-羟基吲哚乙酸(5-HIAA)和去甲肾上腺素水平。为了提高神经递质的稳定性,使用0.1%甲酸(FA)和乙腈中的300ng/mL半胱氨酸作为样品稀释缓冲液。类似于如上所述的样品,制备每种分析物(Sigma-Aldrich)的标准品和标准溶液。在正离子模式下进行MS/MS检测(在负离子模式下检测HVA)。所述分析使用Acquity HSS C18 SB(1.7μm,2.1x100mm)用梯度分离进行,所述梯度分离包括在98%流动相A(水中0.1%FA)下保持0.5分钟,随后在2%-40%流动相B(乙腈中0.1%FA)梯度下保持3.5分钟,增加到95%B并保持0.1分钟,在95%B下洗涤0.5分钟,并且在98%A下再平衡2.4分钟,流速为0.5mL/分钟。正离子MS/MS转换为:左旋多巴为198/152,血清素为177/160.1,多巴胺为154/137.1,5-HIAA为192/146,去甲肾上腺素为170.1/107,5-HTP为221.1/201。除了取消梯度的初始保持阶段之外,类似于上述方法,以负离子模式进行HVA检测。负离子模式下HVA的MS/MS转换为181.1/137.1。将所述水平表示为μg/mL匀浆或uM。如上一节所述定量大脑Phe和Tyr水平。

对于肝脏样品,定量载体基因组、PAH活性和蛋白质水平。通过qPCR定量载体基因组的拷贝(Martin 2013)。如下进行FLAG标记的蛋白质的定量。在匀浆器(Bead Ruptor 24;Omni)中,将肝样品在具有珠(15-340-153;Fisher Scientific)的管中,在含有1×蛋白酶抑制剂的1×PBS或RIPA缓冲液中,以5.65rpm在4℃下匀浆20-30秒。将样品在4℃下以14,000g旋转30分钟。然后通过FLAG ELISA测定将上清液用于PAH定量,并通过总蛋白归一化(BCA蛋白质测定试剂盒;Pierce)。如上所述进行肝匀浆中的PAH蛋白活性。

先前描述了肝脏mTTR482启动子,其含有小鼠甲状腺素运载蛋白核心启动子及其5'增强子元件(在HNF-3和HNF-4结合位点中具有修饰)(Nambiar 2016)。本研究的目标是进一步增加启动子强度。将此启动子上游的各种基于肝脏的增强子或BGH pA下游的3'稳定性元件添加到表达盒中,并且然后在体外测量分泌的碱性磷酸酶(SEAP)水平作为两种人肝脏系中的报告物(图1A)。将SEAP质粒瞬时转染入Huh7和HepG2细胞表明,具有mA1MB2增强子的表达盒(编号3)在培养基中产生最高的SEAP水平,并且在两种细胞系中比亲代mTTR482构建体高大约2倍(图1B、1C)。通过在正常C57BL/6小鼠中进行流体动力注射对前病毒质粒的体内评价也显示了含有mA1MB2增强子的质粒的最高和最持久的SEAP表达。在第1、7、14和28天,SEAP水平分别比用亲代mTTR482-SEAP质粒治疗的动物中检测到的水平高2.8、4.4、4和3.6倍(图2A)。在PAH

实施例2.PAH

为了在PKU疾病模型中验证我们优化的肝脏启动子,产生了AAV8/mA1MB2-mPAH载体,并将其与可与Yagi等人(2011)使用的载体相比的AAV8/scLP1-mPAH进行了比较。将两种载体以两种不同剂量(4e10和1e11,VG/小鼠)静脉内施用,并测量血液Phe水平。在两种剂量下,与sc-LP1载体相比,mA1MB2-mTTR482载体在降低血液Phe水平方面更有效(图3A、图3B)。使用较高剂量(1e11 vg/小鼠)的两种载体都增加血液Tyr水平;已经在第7天(第一次施用后测量)检测到升高,并保持升高直到第56天(研究结束)(图3C)。尽管在较低剂量治疗的动物中也检测到血液Tyr增加,但所述增加与对应动物的治疗前值没有显著差异。肝脏中病毒载体基因组的定量显示,在第56天,自身互补载体的VG拷贝增加了2至3倍(图3D)。

因为脑Phe水平是病理学的主要原因,所以测量了脑中的Phe水平。用1e11剂量,仅mA1MB2-mTTR482构建体提供了与野生型脑(HET)相似的低脑Phe水平(图4A)。脑Phe水平的降低与血液中测量的Phe水平密切相关(图4B)。脑神经递质水平的分析表明,两种构建体的多巴胺升高是相当的(图4C)。mA1MB2-mTTR482构建体在较低(4e10)剂量下也观察到相似的功效。脑血清素定量显示,与sc-LP1载体相比,使用mA1MB2-mTTR482构建体治疗产生的血清素明显更多(图4D)。总之,用mA1MB2-mTTR482构建体对血液Phe水平的有效降低转化为脑Phe水平的稳健降低,并随后增强所治疗动物脑中的多巴胺和血清素合成。

实施例3.评价密码子优化的hPAH cDNA的hPAH产生

先前发表的研究表明,在PAH

实施例4:人PAH和小鼠PAH的体外和体内比较

质粒载体和重组AAV产生。

肝脏特异性启动子(LP1和mTTR482)、杂合内含子、多聚腺苷酸化位点(牛生长激素[BGH]和猿猴病毒40[SV40])的产生是本领域已知的,并已在Nathwani(2012)和Nambiar(2017)中进行了描述。构建了具有肝脏特异性或鸡b-肌动蛋白(CBA)启动子、杂合内含子、编码全长(FL)人(h)或小鼠(m)PAH和BGH多聚A的cDNA的各种质粒载体。还产生了具有mPAH和hPAH的双截短形式(DT;氨基酸103-428)或具有各种杂合构建体的表达盒。在具有CBA启动子、杂合内含子、PAH-DT和BGH多聚A的质粒载体中评价了hPAH-DT和mPAH中的氨基酸修饰。通过合成改变的DNA序列或通过定点诱变(Genscript)引入变化来产生PAH-DT氨基酸序列变体(V)中的氨基酸变化。为了检测和定量目的,大多数构建体含有在PAH cDNA上游的编码N-末端22-氨基酸3xFLAG-肽的序列(MDYKDHDG DYKDHDI DYKDDDDK(SEQ ID NO:18))。

将具有肝脏特异性启动子(LP1或mA1MB2-mTTR482)、1069bp鸡β-肌动蛋白(CBA)/兔β-球蛋白混合内含子、hPAH cDNA(或变体)cDNA和BGHpA的所选择PAH质粒载体亚克隆到含AAV2 ITR的质粒中。最终的hPAH-V1载体构建体另外地含有去除了ATG的修饰内含子和来自α1抗胰蛋白酶内含子的0.9kb“填充”序列(减少了ATG),以将载体基因组大小增加到4.6kb。所有rAAV载体都是用AAV8血清型衣壳使用三重转染法产生的,随后进行CsCl

PAH蛋白的纯化。

根据制造商的说明,在无血清悬浮培养环境中,使用Expi293F表达系统试剂盒(LifeTechnologies)进行Expi293F细胞(LifeTechnologies)的瞬时转染。将编码带有FL或DT形式的3xFLAG标记的hPAH、hPAH-V1和mPAH的pCBA-PAH-BGHpA表达质粒用于转染。使细胞旋转沉降,并在裂解缓冲液(50mM Tris-HCl(pH 7.4)、150mM NaCl、1mM EDTA和1%TritonX-100)中产生全细胞裂解物。使用FLAG亲和柱(ANTI-FLAG M2亲和凝胶;Sigma-Aldrich)纯化Flag标记的PAH蛋白。使用0.1M甘氨酸-HCl(pH 3.5)或TBS中的100ug/ml FLAG肽(Sigma-Aldrich)来洗脱蛋白质。将蛋白质重新悬浮在50mM Tris-HCl(pH 7.4)、150mM NaCl(一些批次另外地含有10%甘露醇以提高稳定性,Nascimento 2010)中。在SDS-PAGE 4%-12%Tris-BIS-MES凝胶上分析蛋白质,并通过考马斯蓝染色进行染色。还使用抗FLAG肽或PAH蛋白的抗体通过蛋白质印迹来分析蛋白质。

PAH蛋白和活性水平的定量。

使用Lipofectamine 2000(LifeTechnologies),用含有FLAG标记的PAH表达盒的质粒瞬时转染HEK293T细胞。在48小时后,通过在裂解缓冲液或RIPA缓冲液(Pierce/ThermoFisher)中裂解细胞产生全细胞裂解物。另外,在一些实验中,将超声波处理或剪切用于增强细胞裂解。在解冻后,将裂解物在测定前以14,000g旋转30分钟。根据制造商的说明,并且使用试剂盒标准或内部纯化的3xFLAG-mPAH-FL作为蛋白质标准,通过FLAG ELISA(SE002-flag;ABSbio)测量FLAG融合蛋白水平的定量。PAH蛋白的酶活性如先前所述(Yew2013)进行了测量,其中做了一些小的修改。使用本领域已知的标准方案,使用抗hPAH抗体(LSBio)或抗FLAG抗体(Sigma)进行PAH检测的蛋白质印迹。

对人和小鼠PAH蛋白在Huh7和293细胞中的产生进行了体外评估。为了定量hPAH和mPAH的产生,所有表达的蛋白质中都含有N-末端3xFLAG标签。数据显示与mPAH相比,在全Huh7细胞裂解物中hPAH的水平较低,并且与所使用的表达盒无关(图6A)。与mPAH相比,全长(F1,1-452)和双截短(DT)形式的hPAH显示hPAH的产生较低(图6B、图6C)。DT形式是由氨基酸103至428组成的PAH的缩短和组成型活性形式,因此缺乏PAH的N-末端调节结构域和C-末端四聚结构域。

每种构建体的mRNA定量显示了可比较的信息水平,表明hPAH与mPAH蛋白水平的差异是转录后效应(图6D)。当使用FLAG亲和柱纯化hPAH和mPAH(FL和DT形式)时,人PAH(FL和DT两种形式)显示出对于小鼠PAH没有观察到的极为不同的降解模式(图6E)。

在PAH

综上所述,此数据表明hPAH的内源形式不如mPAH有效,并且这与体外观察到的hPAH蛋白的产生/稳定性差相关。

实施例5:人PAH的改良变体的产生

产生含有源自mPAH的不同长度的N-末端或C-末端序列的杂合hPAH构建体(图7A)。测试了这些构建体的FLAG标记的蛋白的体外生产,并且表明用对应的小鼠序列替代hPAH的N-末端或C-末端都不能提高蛋白水平(图7B、图7C)。因此,含有催化核心(103-448,DT)的区域对mPAH的稳定性负责。

为了提高hPAH核心区的稳定性,将各种修饰引入hPAH-DT主链。使用hPAH-DT主链将各种氨基酸修饰引入hPAH序列。根据其他物种(包括小鼠、鸡和细菌)中PAH的氨基酸序列将氨基酸变化建模(表1)。所有构建体还在柔性N-末端中含有3x-FLAG-标签。在体外在293细胞中表达人变体(V;V1-13),并对全细胞裂解物进行PAH蛋白和活性水平的定量,并与hPAH和mPAH的DT形式进行比较(图8A)。蛋白质定量显示,一些hPAH变体,如V1、V5(与V1相比增加了一个变化)和V8(两个氨基酸变化与V1不同)与未修饰的hPAH相比具有提高的蛋白质水平。然而,当测试这些变体的PAH酶活性时,仅V1具有显著提高的PAH活性(图8B)。V1由位于催化结构域的三个不同部分的四个氨基酸变化(M180T、K199P、S250P和G256A)组成。在构建体V9-13中没有观察到变化(数据未显示)。

表1.人PAH变体描述

产生了V1的另外衍生物。第一组包括仅有一个氨基酸改变的构建体(V14-17,表1)。PAH活性结果表明,所有这些构建体的PAH水平和活性都很差,与未修饰的hPAH相当,并且因此表明这些变化都不能单独提供任何改善(图9A-图9C、图10A-图10C)。第二组构建体是V1的衍生物,其中四个氨基酸中的一个被还原为人野生型氨基酸。

表2.人PAH变体-1衍生物

然后确定三个氨基酸变化是否足够(V18-21)。其中最好的是没有S250P变化的V20,具有大约67%的V1活性(图9A)。有趣的是,此变体尽管由于PAH蛋白水平降低而具有较低的总酶活性,但与亲代V1相比具有提高2倍的比活性(图9B、图9C)。

还测试了人PAH变体-1的一组双突变体衍生物。与单突变体系列(V14-17)不同,双突变体V29和V30在活性上获得了一些改善,但是不如V1改善得多(图10D)。

为了进一步改善V1,引入了额外的变化,其中一些变化旨在增加比活性(V22-28,表2)。虽然这些变化都没有提高总的PAH活性,但一些修饰确实提高了PAH蛋白水平或其比活性。例如,V23具有比hPAH-V1高2倍的PAH蛋白。

通过对hPAH中103-428区域内存在的那些残基一次连续改变两个或三个残基,进行mPAH的“反向”诱变。跨越此区域的五个构建体的活性测试表明,这些改变都没有导致mPAH生产降低到针对hPAH观察到的水平(数据未显示)。

表3.小鼠PAH变体

构建了表达盒,所述表达盒编码表现最佳的变体(V1),其作为全长蛋白,并从A1MB2-mTTR启动子表达。在将质粒转染入Huh7细胞后,将此构建体与可比较的小鼠PAH和hPAH表达质粒进行PAH蛋白产生和活性的比较。数据表明,与内源性hPAH相比,hPAH-V1使PAH蛋白的产生和活性提高了大约10倍(图11A-图11C)。所有PAH蛋白具有相当的活性与蛋白质的比率,这表明比活性大致相似。

综上所述,所述数据证明了通过氨基酸变化(例如,2、3、4、5或6个氨基酸变化)改善人PAH特征的可行性,所有这些氨基酸变化都有助于观察到的改善。

实施例6:通过PAH-V1校正高苯丙氨酸血症

血液和组织分析。

如实施例1-3中所述进行脑和组织分析。

动物实验。

如实施例1-3中所述进行动物实验。

为了在体内测试修饰的hPAH的功效,产生了编码hPAH-V1的rAAV8载体,以及具有小鼠或hPAH(均为FL形式)的相似载体。表达hPAH-V1的载体在PKU的PAH

分析了不同的脑终点(对3e11 VG/小鼠治疗组进行)。数据表明,与初始PAH

测量了治疗的小鼠脑中的脑神经递质多巴胺和血清素水平及其代谢物水平。数据显示,与hPAH相比,hPAH-V1治疗的动物中这些神经递质的增加显著更高(图15A-图15D)。

总之,hPAH-V1蛋白的改良特性转化为增强的降低血液和脑Phe水平以及增加脑中Tyr和神经递质水平的能力。由于肝脏中存在可比较的载体基因组水平,所述数据表明用编码hPAH-V1的载体获得了更高的效力。

产生了用于mA1MB2-mTTR482启动子/hPAH-V1载体的4.6kb基因组。除了在BGH pA下游引入的填充序列,此基因组在内含子序列中不包含“ATG”序列(图16A)。当在PAH

实施例7.NHP肝脏中提高的hPAH-V1蛋白水平

重组AAV载体的构建

除了使用杂合衣壳之外,如实施例4中所述进行A1MB2-HI-hPAH和A1MB2-HI-hPAH-V1的载体产生。

动物实验

2至3岁(2-4kg)的雄性食蟹猴(cynomolgus monkey,Macaca fascicularis)通过缓慢静脉内输注(1ml/min)到隐静脉来接受10ml的测试品。治疗组由媒介物组(PBS,n=1)、rAAV/hPAH(n=3)和rAAV/hPAH-V1(n=3)组成。在两周后对动物进行人道安乐死,并收集各种组织并在-80℃下冷冻直至分析。

载体基因组、mRNA和PAH蛋白的定量

如实施例1-3中所述,使用针对BGHpA的引物/探针通过qPCR定量肝脏和脾脏中的载体基因组和载体衍生的mRNA的拷贝。如实施例1-3中所述,通过蛋白质印迹针对FLAG标签分析肝匀浆中人PAH蛋白的水平。

为了测试A1MB2-mTTR启动子在NHP肝脏中的功能,在载体递送后的两个时间评价了mRNA和PAH的产生水平。平均而言,在所有载体治疗的动物的肝脏中检测到可比较的载体和载体衍生的mRNA的水平(归一化为载体基因组拷贝)(图17A、图17B)。通过比较肝脏和脾脏中的载体mRNA(两种组织中的mRNA水平归一化为载体基因组拷贝)来分析表达的肝脏特异性,并证明肝脏中的转录物/VG比率高于脾脏(图17B)。还通过测试肝中载体衍生的FLAG标记的PAH蛋白的检测来评价转导。用编码PAH-V1的载体治疗的所有动物都证明肝脏中存在大小正确的hPAH-V1。相比之下,在用编码hPAH的载体治疗的动物中检测到极少至无的hPAH蛋白(图17C)。由于载体基因组和mRNA水平两者在两个治疗组中都是可比较的,因此这些结果表明NHP肝脏中的hPAH-V1蛋白具有更好的稳定性。这些观察结果类似于在小鼠中进行的研究以及用人肝细胞系进行的体外研究,表明hPAH-V1在所有测试系统中的优越性。

参考文献

Kochhar JS,et al.,Drug Deliv Transl Res 2012,2:223-237.

Ho G,Christodoulou J.Transl Pediatr 2014,4:49-62.

Blau N,Longo N.Expert Opin Pharmacother 2015,16:791-800.

Flydal MI,Martinez A.IUBMB Life 2013,65:341-349.

Erlandsen H,et al.,Pediatrics 2003,112:1557-1565.

Knappskog PM,et al.,Eur J Biochem 1996,242:813-821.

Jaffe E,et al.,Arch Biochem Biophys 2013,530:73-82.

Arturo EC,et al.,PNAS 2016,113:2394-2399.

Waisbren SE,et al.,Mol Genet Metab 2007,92:63-70.

Thomas J,et al.,J Inborn Errors Metabolism&Screening 5:1-9.

Cleary M,et al.,Mol Gen Metab 2013,110:418-423.

Gonzales MJ,et al.,SeminPediatr Neurol 2016,23:332-340.

Vogel KR,et al.,J Inherit Metab Dis 2017,40:227-235.

Burton B,et al.,Mol Gen Metab 2015,114:415-424.

Longo N,et al.,Lancet 2014,384:37-44.

Mochizuki S,et al.,Gene Ther 2004,11:1081-1086.

Ding Z,et al.,Gene Therapy 2006,13:587-593.

Harding CO,et al.,Gene Therapy 2006,13:457-462.

Yagi H,et al.,J Gene Med 2011,13:114-122.

Yagi H,et al.,NeuroReport 2012,23:30-34.

Winn SR,et al.,Mol Gen Metabolism 2018,123:6-20.

Oh H-J,et al.,Pediatric Research 2004,56:278-284.

Nathwani AC,et al.,Blood 2006,107:2653-2661.

Nambiar B,et al.,Hum Gene Ther Methods 2017,28:23-38.

Martin J,et al.,Hum Gene Ther Methods 2013;24:253-269.

Yew NS et al.,Mol Gen Metab 2013,109:339-344.

McDonald JD,Charlton CK.Genomics 1996,39:402-405.

Kyostio-Moore S,et al.,Mol Ther Methods Clin Dev 2016,3:16006.

Nascimento C,et al.,Appl Biochem Biotechnol 2010,162:192-207.

Baker RE,Shiman R.J Biol Chem 19:9633-9639.

Ledley FD,et al.,Biochem J 1990,267:399-406.

Aquado C,et al.,FEBs Letters 2006,580:1697-1701.

Doskeland AP,Flatmark T.Biochim Biophys Acta 2001,1547:379-386.

Solstad T,Flatmark T.Eur J Biochem 2000,267:6302-6310.

Andersen OA,et al.,J Mol Bio 2002,320:1095-1108.

Erlandsen H,et al.,J Mol Bio 2002,320:645-661

Ziegler RJ,et al.,Mol Ther 2007,15:492-500.

Finn JD,et al.,Blood 2010,116:5842-5848.

George LA,et al.,N Eng J Med 2017,377:2215-2227.

Walter JH,et al.,The Lancet 2002,360:55-56.

Anderson PJ,Leuzzi V.Mol Gen Metab 2010,99:S3-S9.

Garcia MI,et al.,Mol Gen Metab 2017,11:54-58.

Harding CO,et al.,Mol Genet Metab 2018,March 31(abstract)

Thomas J,et al.,Mol Genet Metab 2018,March 18(abstract).

McEachern KA,et al.,J Gene Med 2006,8:719-729.

Jacobs F,et al.,Gene Ther 2008,15:594-603.

Kramer MG,et al.,Mol Ther 2003,7:375-385.

Chuah MK,et al.,Mol Ther 2014,9:1605-1613.

Wooddell CI,et al.,Gene Med 2008,10:551-563.

Nathwani AC,et al.,NEJM 2011,365:2357-2365.

Jiang,H,et al.,Blood 2006;108:107-115.

Park JW,et al.,Exp Mol Med 2010,42:105-115.

Charron CE,Lewin AS,Laipis PJ.Mol Ther 2004,9:S334.

Grimm D,et al.,J Virol.2008,82:5887-911.

Lisowski L,et al.,Nature,2014,506:382-6.

Smith LJ,et al.,Mol Ther.2014 Sep;22(9):1625-34.

序列

MSTAVLENPGLGRKLSDFGQETSYIEDNCNQNGAISLIFSLKEEVGALAKVLRLFEENDVNLTHIESRPSRLKKDEYEFFTHLDKRSLPALTNIIKILRHDIGATVHELSRDKKKDTVPWFPRTIQELDRFANQILSYGAELDADHPGFKDPVYRARRKQFADIAYNYRHGQPIPRVEYMEEEKKTWGTVFKTLKSLYKTHACYEYNHIFPLLEKYCGFHEDNIPQLEDVSQFLQTCTGFRLRPVAGLLSSRDFLGGLAFRVFHCTQYIRHGSKPMYTPEPDICHELLGHVPLFSDRSFAQFSQEIGLASLGAPDEYIEKLATIYWFTVEFGLCKQGDSIKAYGAGLLSSFGELQYCLSEKPKLLPLELEKTAIQNYTVTEFQPLYYVAESFNDAKEKVRNFAATIPRPFSVRYDPYTQRIEVLDNTQQLKILADSINSEIGILCSALQKIK(SEQ ID NO:1)

ATGAGCACAGCCGTGCTGGAAAACCCCGGCCTGGGCAGAAAGCTGAGCGACTTCGGCCAGGAAACCAGCTACATCGAGGACAACTGCAACCAGAACGGCGCCATCAGCCTGATCTTCAGCCTGAAAGAAGAAGTGGGCGCCCTGGCCAAGGTGCTGCGGCTGTTCGAGGAGAACGACGTGAACCTGACCCACATCGAGAGCCGGCCCAGCAGACTGAAGAAGGACGAGTACGAGTTCTTCACCCACCTGGACAAGCGGAGCCTGCCCGCCCTGACCAACATCATCAAGATCCTGCGGCACGACATCGGCGCCACCGTGCACGAGCTGAGCCGGGACAAGAAAAAGGACACCGTGCCCTGGTTCCCCAGAACCATCCAGGAACTGGACAGATTCGCCAACCAGATCCTGTCCTACGGCGCCGAGCTGGATGCCGACCACCCTGGCTTCAAGGACCCCGTGTACCGGGCCAGACGGAAGCAGTTCGCCGATATCGCCTACAACTACCGGCACGGCCAGCCCATCCCCAGAGTCGAGTACACCGAAGAGGGCAAGAAAACCTGGGGCACCGTGTTCAAGACCCTGAAGTCCCTGTACCCCACCCACGCCTGCTACGAGTACAACCACATCTTCCCACTGCTCGAAAAGTACTGCGGCTTCCACGAGGACAATATCCCTCAGCTGGAGGACGTGTCCCAGTTTCTGCAGACCTGCACCGGCTTCAGACTCAGGCCTGTGGCCGGCCTGCTGCCCAGCAGAGATTTTCTGGCCGGACTGGCCTTCCGGGTGTTCCACTGCACCCAGTACATCAGACACGGCAGCAAGCCCATGTACACCCCTGAGCCCGACATCTGCCACGAGCTGCTGGGACATGTGCCCCTGTTCAGCGACAGAAGCTTCGCCCAGTTCAGCCAGGAAATCGGCCTGGCCTCTCTGGGCGCTCCCGACGAGTATATCGAGAAGCTGGCCACCATCTACTGGTTCACCGTGGAATTCGGCCTGTGCAAGCAGGGCGACAGCATCAAGGCCTATGGCGCCGGACTCCTGTCCAGCTTCGGCGAGCTGCAGTACTGTCTGAGCGAGAAGCCCAAGCTGCTGCCCCTGGAACTGGAAAAGACCGCCATCCAGAACTACACCGTGACCGAGTTCCAGCCCCTGTACTACGTGGCCGAGAGCTTCAACGACGCCAAAGAAAAAGTGCGGAACTTCGCCGCCACCATCCCTCGGCCCTTCAGCGTCAGATACGACCCCTACACCCAGCGGATCGAGGTGCTGGACAACACACAGCAGCTGAAAATTCTGGCCGACTCCATCAACAGCGAGATCGGCATCCTGTGCAGCGCCCTGCAGAAAATCAAGTGA(SEQ ID NO:4)

GAGCTCTTGGCCACTCCCTCTCTGCGCGCTCGCTCGCTCACTGAGGCCGGGCGACCAAAGGTCGCCCGACGCCCGGGCTTTGCCCGGGCGGCCTCAGTGAGCGAGCGAGCGCGCAGAGAGGGAGTGGCCAACTCCATCACTAGGGGTTCCTACGCGTGGCCCCAGGTTAATTTTTAAAAAGCAGTCAAAGGTCAAAGTGGCCCTTGGCAGCATTTACTCTCTCTATTGACTTTGGTTAATAATCTCAGGAGCACAAACATTCCTGGAGGCAGGAGAAGAAATCAACATCCTGGACTTATCCTCTGGGCCTCTCCCCACCTTCGATGGCCCCAGGTTAATTTTTAAAAAGCAGTCAAAGGTCAAAGTGGCCCTTGGCAGCATTTACTCTCTCTATTGACTTTGGTTAATAATCTCAGGAGCACAAACATTCCTGGAGGCAGGAGAAGAAATCAACATCCTGGACTTATCCTCTGGGCCTCTCCCCACCGATATCTACCTGCTGATCGCCCGGCCCCTGTTCAAACATGTCCTAATACTCTGTCGGGGCAAAGGTCGGCAGTAGTTTTCCATCTTACTCAACATCCTCCCAGTGTACGTAGGATCCTGTCTGTCTGCACATTTCGTAGAGCGAGTGTTCCGATACTCTAATCTCCCGGGGCAAAGGTCGTATTGACTTAGGTTACTTATTCTCCTTTTGTTGACTAAGTCAATAATCAGAATCAGCAGGTTTGGAGTCAGCTTGGCAGGGATCAGCAGCCTGGGTTGGAAGGAGGGGGTATAAAAGCCCCTTCACCAGGAGAAGCCGTCACACAGATCCACAAGCTCCTGCTAGCAGTCGCTGCGCGCTGCCTTCGCCCCGTGCCCCGCTCCGCCGCCGCCTCGCGCCGCCCGCCCCGGCTCTGACTGACCGCGTTACTCCCACAGGTGAGCGGGCGGGACGGCCCTTCTCCTCCGGGCTGTAATTAGCGCTTGGTTTAATGACGGCTTGTTTCTTTTCTGTGGCTGCGTGAAAGCCTTGAGGGGCTCCGGGAAGGCCCTTTGTGCGGGGGGAGCGGCTCGGGGGGTGCGTGCGTGTGTGTGTGCGTGGGGAGCGCCGCGTGCGGCTCCGCGCTGCCCGGCGGCTGTGAGCGCTGCGGGCGCGGCGCGGGGCTTTGTGCGCTCCGCAGTGTGCGCGAGGGGAGCGGGGCCGGGGGCGGTGCCCCGCGGTGCGGGGGGGGCTGCGAGGGGAACAAAGGCTGCGTGCGGGGTGTGTGCGTGGGGGGGTGAGCAGGGGGTGTGGGCGCGTCGGTCGGGCTGCAACCCCCCCTGCACCCCCCTCCCCGAGTTGCTGAGCACGGCCCGGCTTCGGGTGCGGGGCTCCGTACGGGGCGTGGCGCGGGGCTCGCCGTGCCGGGCGGGGGGTGGCGGCAGGTGGGGGTGCCGGGCGGGGCGGGGCCGCCTCGGGCCGGGGAGGGCTCGGGGGAGGGGCGCGGCGGCCCCCGGAGCGCCGGCGGCTGTCGAGGCGCGGCGAGCCGCAGCCATTGCCTTTTATGGTAATCGTGCGAGAGGGCGCAGGGACTTCCTTTGTCCCAAATCTGTGCGGAGCCGAAATCTGGGAGGCGCCGCCGCACCCCCTCTAGCGGGCGCGGGGCGAAGCGGTGCGGCGCCGGCAGGAAGGAAATGGGCGGGGAGGGCCTTCGTGCGTCGCCGCGCCGCCGTCCCCTTCTCCCTCTCCAGCCTCGGGGCTGTCCGCGGGGGGACGGCTGCCTTCGGGGGGGACGGGGCAGGGCGGGGTTCGGCTTCTGGCGTGTGACCGGCGGCTCTAGAGCCTCTGCTAACCATGTTCATGCCTTCTTCTTTTTCCTACAGCTCCTGGGCAACGTGCTGGTTATTGTGCTGTCTCATCATTTTGGCAAAGAATTCATTTCGAAGCCGCCACCATGAGCACAGCCGTGCTGGAAAACCCCGGCCTGGGCAGAAAGCTGAGCGACTTCGGCCAGGAAACCAGCTACATCGAGGACAACTGCAACCAGAACGGCGCCATCAGCCTGATCTTCAGCCTGAAAGAAGAAGTGGGCGCCCTGGCCAAGGTGCTGCGGCTGTTCGAGGAGAACGACGTGAACCTGACCCACATCGAGAGCCGGCCCAGCAGACTGAAGAAGGACGAGTACGAGTTCTTCACCCACCTGGACAAGCGGAGCCTGCCCGCCCTGACCAACATCATCAAGATCCTGCGGCACGACATCGGCGCCACCGTGCACGAGCTGAGCCGGGACAAGAAAAAGGACACCGTGCCCTGGTTCCCCAGAACCATCCAGGAACTGGACAGATTCGCCAACCAGATCCTGTCCTACGGCGCCGAGCTGGATGCCGACCACCCTGGCTTCAAGGACCCCGTGTACCGGGCCAGACGGAAGCAGTTCGCCGATATCGCCTACAACTACCGGCACGGCCAGCCCATCCCCAGAGTCGAGTACACCGAAGAGGGCAAGAAAACCTGGGGCACCGTGTTCAAGACCCTGAAGTCCCTGTACCCCACCCACGCCTGCTACGAGTACAACCACATCTTCCCACTGCTCGAAAAGTACTGCGGCTTCCACGAGGACAATATCCCTCAGCTGGAGGACGTGTCCCAGTTTCTGCAGACCTGCACCGGCTTCAGACTCAGGCCTGTGGCCGGCCTGCTGCCCAGCAGAGATTTTCTGGCCGGACTGGCCTTCCGGGTGTTCCACTGCACCCAGTACATCAGACACGGCAGCAAGCCCATGTACACCCCTGAGCCCGACATCTGCCACGAGCTGCTGGGACATGTGCCCCTGTTCAGCGACAGAAGCTTCGCCCAGTTCAGCCAGGAAATCGGCCTGGCCTCTCTGGGCGCTCCCGACGAGTATATCGAGAAGCTGGCCACCATCTACTGGTTCACCGTGGAATTCGGCCTGTGCAAGCAGGGCGACAGCATCAAGGCCTATGGCGCCGGACTCCTGTCCAGCTTCGGCGAGCTGCAGTACTGTCTGAGCGAGAAGCCCAAGCTGCTGCCCCTGGAACTGGAAAAGACCGCCATCCAGAACTACACCGTGACCGAGTTCCAGCCCCTGTACTACGTGGCCGAGAGCTTCAACGACGCCAAAGAAAAAGTGCGGAACTTCGCCGCCACCATCCCTCGGCCCTTCAGCGTCAGATACGACCCCTACACCCAGCGGATCGAGGTGCTGGACAACACACAGCAGCTGAAAATTCTGGCCGACTCCATCAACAGCGAGATCGGCATCCTGTGCAGCGCCCTGCAGAAAATCAAGTGACCTAGGTGATCAAGATCTGCTAGCTTAATTAACCCGGGACTAGTGCGGCCGCTCGAGACTAGTCTGTGCCTTCTAGTTGCCAGCCATCTGTTGTTTGCCCCTCCCCCGTGCCTTCCTTGACCCTGGAAGGTGCCACTCCCACTGTCCTTTCCTAATAAAATGAGGAAATTGCATCGCATTGTCTGAGTAGGTGTCATTCTATTCTGGGGGGTGGGGTGGGGCAGGACAGCAAGGGGGAGGATTGGGAAGACAATAGCAGGCATGCTGGGGATGCGGTGGGCTCTATGGTACCAGGAACCCCTAGTGATGGAGTTGGCCACTCCCTCTCTGCGCGCTCGCTCGCTCACTGAGGCCGGGCGACCAAAGGTCGCCCGACGCCCGGGCTTTGCCCGGGCGGCCTCAGTGAGCGAGCGAGCGCGCAGAGAGGGAGTGGCC(SEQID NO:5)

TTGGCCACTCCCTCTCTGCGCGCTCGCTCGCTCACTGAGGCCGCCCGGGCAAAGCCCGGGCGTCGGGCGACCTTTGGTCGCCCGGCCTCAGTGAGCGAGCGAGCGCGCAGAGAGGGAGTGGCCAACTCCATCACTAGGGGTTCCTTACCGCGTGGCCCCAGGTTAATTTTTAAAAAGCAGTCAAAGGTCAAAGTGGCCCTTGGCAGCATTTACTCTCTCTATTGACTTTGGTTAATAATCTCAGGAGCACAAACATTCCTGGAGGCAGGAGAAGAAATCAACATCCTGGACTTATCCTCTGGGCCTCTCCCCACCTTCGATGGCCCCAGGTTAATTTTTAAAAAGCAGTCAAAGGTCAAAGTGGCCCTTGGCAGCATTTACTCTCTCTATTGACTTTGGTTAATAATCTCAGGAGCACAAACATTCCTGGAGGCAGGAGAAGAAATCAACATCCTGGACTTATCCTCTGGGCCTCTCCCCACCGATATCTACCTGCTGATCGCCCGGCCCCTGTTCAAACATGTCCTAATACTCTGTCGGGGCAAAGGTCGGCAGTAGTTTTCCATCTTACTCAACATCCTCCCAGTGTACGTAGGATCCTGTCTGTCTGCACATTTCGTAGAGCGAGTGTTCCGATACTCTAATCTCCCGGGGCAAAGGTCGTATTGACTTAGGTTACTTATTCTCCTTTTGTTGACTAAGTCAATAATCAGAATCAGCAGGTTTGGAGTCAGCTTGGCAGGGATCAGCAGCCTGGGTTGGAAGGAGGGGGTATAAAAGCCCCTTCACCAGGAGAAGCCGTCACACAGATCCACAAGCTCCTGCTAGCCAATTGAGTCGCTGCGCGCTGCCTTCGCCCCGTGCCCCGCTCCGCCGCCGCCTCGCGCCGCCCGCCCCGGCTCTGACTGACCGCGTTACTCCCACAGGTGAGCGGGCGGGACGGCCCTTCTCCTCCGGGCTGTAATTAGCGCTTGGTTTATTGACGGCTTGTTTCTTTTCTGTGGCTGCGTGAAAGCCTTGAGGGGCTCCGGGAAGGCCCTTTGTGCGGGGGGAGCGGCTCGGGGGGTGCGTGCGTGTGTGTGTGCGTGGGGAGCGCCGCGTGCGGCTCCGCGCTGCCCGGCGGCTGTGAGCGCTGCGGGCGCGGCGCGGGGCTTTGTGCGCTCCGCAGTGTGCGCGAGGGGAGCGGGGCCGGGGGCGGTGCCCCGCGGTGCGGGGGGGGCTGCGAGGGGAACAAAGGCTGCGTGCGGGGTGTGTGCGTGGGGGGGTGAGCAGGGGGTGTGGGCGCGTCGGTCGGGCTGCAACCCCCCCTGCACCCCCCTCCCCGAGTTGCTGAGCACGGCCCGGCTTCGGGTGCGGGGCTCCGTACGGGGCGTGGCGCGGGGCTCGCCGTGCCGGGCGGGGGGTGGCGGCAGGTGGGGGTGCCGGGCGGGGCGGGGCCGCCTCGGGCCGGGGAGGGCTCGGGGGAGGGGCGCGGCGGCCCCCGGAGCGCCGGCGGCTGTCGAGGCGCGGCGAGCCGCAGCCATTGCCTTTTTTGGTAATCGTGCGAGAGGGCGCAGGGACTTCCTTTGTCCCAAATCTGTGCGGAGCCGAAATCTGGGAGGCGCCGCCGCACCCCCTCTAGCGGGCGCGGGGCGAAGCGGTGCGGCGCCGGCAGGAAGGAATTGGGCGGGGAGGGCCTTCGTGCGTCGCCGCGCCGCCGTCCCCTTCTCCCTCTCCAGCCTCGGGGCTGTCCGCGGGGGGACGGCTGCCTTCGGGGGGGACGGGGCAGGGCGGGGTTCGGCTTCTGGCGTGTGACCGGCGGCTCTAGAGCCTCTGCTAACCTTGTTCTTGCCTTCTTCTTTTTCCTACAGCTCCTGGGCAACGTGCTGGTTATTGTGCTGTCTCATCATTTTGGCAAAGAATTCATTTCGAAGCCGCCACCATGAGCACAGCCGTGCTGGAAAACCCCGGCCTGGGCAGAAAGCTGAGCGACTTCGGCCAGGAAACCAGCTACATCGAGGACAACTGCAACCAGAACGGCGCCATCAGCCTGATCTTCAGCCTGAAAGAAGAAGTGGGCGCCCTGGCCAAGGTGCTGCGGCTGTTCGAGGAGAACGACGTGAACCTGACCCACATCGAGAGCCGGCCCAGCAGACTGAAGAAGGACGAGTACGAGTTCTTCACCCACCTGGACAAGCGGAGCCTGCCCGCCCTGACCAACATCATCAAGATCCTGCGGCACGACATCGGCGCCACCGTGCACGAGCTGAGCCGGGACAAGAAAAAGGACACCGTGCCCTGGTTCCCCAGAACCATCCAGGAACTGGACAGATTCGCCAACCAGATCCTGTCCTACGGCGCCGAGCTGGATGCCGACCACCCTGGCTTCAAGGACCCCGTGTACCGGGCCAGACGGAAGCAGTTCGCCGATATCGCCTACAACTACCGGCACGGCCAGCCCATCCCCAGAGTCGAGTACACCGAAGAGGGCAAGAAAACCTGGGGCACCGTGTTCAAGACCCTGAAGTCCCTGTACCCCACCCACGCCTGCTACGAGTACAACCACATCTTCCCACTGCTCGAAAAGTACTGCGGCTTCCACGAGGACAATATCCCTCAGCTGGAGGACGTGTCCCAGTTTCTGCAGACCTGCACCGGCTTCAGACTCAGGCCTGTGGCCGGCCTGCTGCCCAGCAGAGATTTTCTGGCCGGACTGGCCTTCCGGGTGTTCCACTGCACCCAGTACATCAGACACGGCAGCAAGCCCATGTACACCCCTGAGCCCGACATCTGCCACGAGCTGCTGGGACATGTGCCCCTGTTCAGCGACAGAAGCTTCGCCCAGTTCAGCCAGGAAATCGGCCTGGCCTCTCTGGGCGCTCCCGACGAGTATATCGAGAAGCTGGCCACCATCTACTGGTTCACCGTGGAATTCGGCCTGTGCAAGCAGGGCGACAGCATCAAGGCCTATGGCGCCGGACTCCTGTCCAGCTTCGGCGAGCTGCAGTACTGTCTGAGCGAGAAGCCCAAGCTGCTGCCCCTGGAACTGGAAAAGACCGCCATCCAGAACTACACCGTGACCGAGTTCCAGCCCCTGTACTACGTGGCCGAGAGCTTCAACGACGCCAAAGAAAAAGTGCGGAACTTCGCCGCCACCATCCCTCGGCCCTTCAGCGTCAGATACGACCCCTACACCCAGCGGATCGAGGTGCTGGACAACACACAGCAGCTGAAAATTCTGGCCGACTCCATCAACAGCGAGATCGGCATCCTGTGCAGCGCCCTGCAGAAAATCAAGTGAACTAGTCTGTGCCTTCTAGTTGCCAGCCATCTGTTGTTTGCCCCTCCCCCGTGCCTTCCTTGACCCTGGAAGGTGCCACTCCCACTGTCCTTTCCTAATAAAATGAGGAAATTGCATCGCATTGTCTGAGTAGGTGTCATTCTATTCTGGGGGGTGGGGTGGGGCAGGACAGCAAGGGGGAGGATTGGGAAGACAATAGCAGGCATGCTGGGGATGCGGTGGGCTCTATACCGGTCCAGGGGTGAGTGAAGGTTTGGAAGAGTGTAGCAGAATAAGAAACCATGAGTCCCCTCCCTGAGAAGCCCTGAGCCCCCTTGACGACACACATCCCTCGAGGCTCAGCTTCATCATCTGTAAAAGGTGCTGAAACTGACCATCCAAGCTGCCGAAAAAGATTGTGTGGGGATAATTCAAAACTAGAGGAAGATGCAGAATTTCTACATCGTGGCGATGTCAGGCTAAGAGTTGCCATCGTGGCTGTCCATCGATTTTATTGGAATCATATGTTTATTTGAGGGTGTCTTGGATATTACAAATAAATTGTTGGAGCATCAGGCATATTTGGTAATTCTGTCTAAGGCTCCCTGCCCCTTGTTAATTGGCAGCTCAGTTATTCATCCAGGGCAAACATTCTGCTTACTATTCCTGAGAGCTTTCCTCATCCTCTAGATTGGCAGGGGAATTGCAGTTGCCTGAGCAGCCTCCCCTCTGCCATACCAACAGAGCTTCACCATCGAGGCTTGCAGAGTGGACAGGGGCCTCAGGGACCCCTGATCCCAGCTTTCTCATTGGACAGAAGGAGGAGACTGGGGCTGGAGAGGGACCTGGGCCCCCACTAAGGCCACAGCAGAGCCAGGACTTTAGCTGTGCTGACTGCAGCCTGGCTTGCCTCCACTGCCCTCCTTTGCCTCAAGAGCAAGGGAGCCTCAGAGTGGAGGAAGCAGCCCCTGGCCTTGCCTCCCACCTCCCCTCCCCTTTGCTGTTTTCCTGGGACAGTGGGAGCTGGCTTAGATTGCCCTGGGGCCCCCAGGACCCTGGCATTTTAACCCCTCAGGGGCAGGAAGGCAGCCTGAGATACAGAAGAGTCCATCACCTGCTGTATGCCACACACCATCCCCACAGTCGACATTTAAATTAGGAACCCCTAGTGATGGAGTTGGCCACTCCCTCTCTGCGCGCTCGCTCGCTCACTGAGGCCGCCCGGGCAAAGCCCGGGCGTCGGGCGACCTTTGGTCGCCCGGCCTCAGTGAGCGAGCGAGCGCGCAGAGAGGGAGTGGCCAA(SEQ ID NO:6)

加下划线的,肝核因子结合位点;粗体,引入以产生更高亲和力的结合位点的修饰,斜体,重复序列

加下划线的,肝核因子结合位点;粗体,引入以产生更高亲和力的结合位点的修饰,斜体,重复序列

加下划线的,肝核因子结合位点;粗体,引入以产生更高亲和力的结合位点的修饰,斜体,重复序列

GGGGAGGCTGCTGGTGAATATTAACCAAGGTCACCCCAGTTATCGGAGGAGCAAACAGGGGCTAAGTCCAC(SEQ ID NO:11)

CTCAATTGGATGACACTAGTCATCACATTTAAAAGCATCTCAGGTAACTATATTTTGAATTTTTTAAAAAAGTAACTATAATAGTTATTATTAAAATAGCAAAGATTGACCATTTCCAAGAGCCATATAGACCAGCACCGACCACTATTCTAAACTATTTATGTATGTAAATATTAGCTTTTAAAATTCTCAAAATAGTTGCTGAGTTGGGAACCACTATTATTTCTATCGATTCAGCAGCCGTAAGTCTAGGACAGGCTTAAATTGTTTTCACTGGTGTAAATTGCAGAAAGATGATCTAAGTAATTTGGCATTTATTTTAATAGGTTTGAAAAACACATGCCATTTTACAAATAAGACTTATATTTGTCCTTTTGTTTTTCAGCCTACCATGAGAATAAGAGAAAGAAAATGAAGATCAAAAGCTTATTCATCTGTTTTTCTTTTTCGTTGGTGTAAAGCCAACACCCTGTCTAAAAAACATAAATTTCTTTAATCATTTTGCCTCTTTTCTCTGTGCTTCAATTAATAAAAAATGGAAAGAATCTAATAGAGTGGTACAGCACTGTTATTTTTCAAAGATGTGTTGCTATCCTGAAAATTCTGTAGGTTCTGTGGAAGTTCCAGTGTTCTCTCTTATTCCACTTCGGTAGAGGATTTCTAGTTTCTTGTGGGCTAATTAAATAAATCATTAATACTCTTCTAAGTTATGGATTATAAACATTCAAAATAATATTTTGACATTATGATAATTCTGAATAAAAGAACAAAAACCATGGTATAGGTAAGGAATATAAAACATGGCTTTTACCTTAGAAAAAACAATTCTAAAATTCATATGGAATCAAAAAAGAGCCTGCAGGTACCCT(SEQ ID NO:12)

CTCAATTGGATGACACTAGTCATCACATTTAAAAGCATCTCAGGTAACTATATTTTGAATTTTTTAAAAAAGTAACTATAATAGTTATTATTAAAATAGCAAAGATTGACCATTTCCAAGAGCCATATAGACCAGCACCGACCACTATTCTAAACTATTTATGTATGTAAATATTAGCTTTTAAAATTCTCAAAATAGTTGCTGAGTTGGGAACCACTATTATTTCTATCTACTGTTTTAATTAAAATTATCTCTAAGGCATGTGAACTGGCTGTCTTGGTTTTCATCTGTACTTCATCTGCTACCTCTGTGACCTGAAACATATTTATAATTCCATTAAGCTGTGCATATGATAGATTTATCATATGTATTTTCCTTAAAGGATTTTTGTAAGAACTAATTGAATTGATACCTGTAAAGTCTTTATCACACTACCCAATAAATAATAAATCTCTTTGTTCAGCTCTCTGTTTCTATAAATATGTACCAGTTTTATTGTTTTTAGTGGTAGTGATTTTATTCTCTTTCTATATATATACACACACATGTGTGCATTCATAAATATATACAATTTTTATGAATAAAAAATTATTAGCAATCAATATTGAAAACCACTGATTTTTGTTTATGTGAGCAAACAGCAGATTAAAAGGAATTCCTGCAGATTCAGCAGCCGTAAGTCTAGGACAGGCTTAAATTGTTTTCACTGGTGTAAATTGCAGAAAGATGATCTAAGTAATTTGGCATTTATTTTAATAGGTTTGAAAAACACATGCCATTTTACAAATAAGACTTATATTTGTCCTTTTGTTTTTCAGCCTACCATGAGAATAAGAGAAAGAAAATGAAGATCAAAAGCTTATTCATCTGTTTTTCTTTTTCGTTGGTGTAAAGCCAACACCCTGTCTAAAAAACATAAATTTCTTTAATCATTTTGCCTCTTTTCTCTGTGCTTCAATTAATAAAAAATGGAAAGAATCTAATAGAGTGGTACAGCACTGTTATTTTTCAAAGATGTGTTGCTATCCTGAAAATTCTGTAGGTTCTGTGGAAGTTCCAGTGTTCTCTCTTATTCCACTTCGGTAGAGGATTTCTAGTTTCTTGTGGGCTAATTAAATAAATCATTAATACTCTTCTAAGTTATGGATTATAAACATTCAAAATAATATTTTGACATTATGATAATTCTGAATAAAAGAACAAAAACCATGGTATAGGTAAGGAATATAAAACATGGCTTTTACCTTAGAAAAAACAATTCTAAAATTCATATGGAATCAAAAAAGAGCCTGCAGGTACCCT(SEQ ID NO:13)

ATGAGCACAGCCGTGCTGGAAAACCCCGGCCTGGGCAGAAAGCTGAGCGACTTCGGCCAGGAAACCAGCTACATCGAGGACAACTGCAACCAGAACGGCGCCATCAGCCTGATCTTCAGCCTGAAAGAAGAAGTGGGCGCCCTGGCCAAGGTGCTGCGGCTGTTCGAAGAGAACGACGTGAACCTGACCCACATCGAGAGCCGGCCCAGCAGACTGAAGAAGGACGAGTACGAGTTCTTCACCCACCTGGACAAGCGGAGCCTGCCCGCCCTGACCAACATCATCAAGATCCTGCGGCACGACATCGGCGCCACCGTGCACGAGCTGAGCCGGGACAAGAAAAAGGACACCGTGCCCTGGTTCCCCAGAACCATCCAGGAACTGGACAGATTCGCCAACCAGATCCTGTCCTACGGCGCCGAGCTGGATGCCGACCACCCTGGCTTCAAGGACCCCGTGTACCGGGCCAGACGGAAGCAGTTCGCCGATATCGCCTACAACTACCGGCACGGCCAGCCCATCCCCAGAGTCGAGTACATGGAAGAGGGCAAGAAAACCTGGGGCACCGTGTTCAAGACCCTGAAGTCCCTGTACAAGACCCACGCCTGCTACGAGTACAACCACATCTTCCCACTGCTCGAGAAGTACTGCGGCTTCCACGAGGACAATATCCCTCAGCTCGAGGACGTGTCCCAGTTTCTGCAGACCTGCACCGGCTTCAGACTCAGGCCTGTGGCCGGCCTGCTGAGCAGCAGAGATTTTCTGGGCGGACTGGCCTTCCGGGTGTTCCACTGCACCCAGTACATCAGACACGGCAGCAAGCCCATGTACACCCCTGAGCCCGACATCTGCCACGAGCTGCTGGGACATGTGCCCCTGTTCAGCGACAGAAGCTTCGCCCAGTTCAGCCAGGAAATCGGCCTGGCCTCTCTGGGCGCTCCCGACGAGTATATCGAGAAGCTGGCCACCATCTACTGGTTCACCGTGGAATTCGGCCTGTGCAAGCAGGGCGACAGCATCAAGGCCTATGGCGCCGGACTCCTGTCCAGCTTCGGCGAGCTGCAGTACTGTCTGAGCGAGAAGCCCAAGCTGCTGCCCCTGGAACTGGAAAAGACCGCCATCCAGAACTACACCGTGACCGAGTTCCAGCCCCTGTACTACGTGGCCGAGAGCTTCAACGACGCCAAAGAAAAAGTGCGGAACTTCGCCGCCACCATCCCTCGGCCCTTCAGCGTCAGATACGACCCCTACACCCAGCGGATCGAGGTGCTGGACAACACACAGCAGCTGAAAATTCTGGCCGACTCCATCAACAGCGAGATCGGCATCCTGTGCAGCGCCCTGCAGAAAATCAAGTGA(SEQ ID NO:14)

粗体=变为T以消除ATG的G、A、A、A、A(5个变化)

粗体=变化以消除ATG的7个碱基;都是A变为T。

序列表

<110> GENZYME CORPORATION

<120> 通过肝导向基因替代疗法治疗严重PKU的改良的人PAH的产生

<130> 15979-20166.00

<140> 尚未分配

<141> 同时随同提交

<150> US 62/744,944

<151> 2018-10-12

<160> 18

<170> Windows版本4.0的FastSEQ

<210> 1

<211> 452

<212> PRT

<213> 智人

<400> 1

Met Ser Thr Ala Val Leu Glu Asn Pro Gly Leu Gly Arg Lys Leu Ser

1 5 10 15

Asp Phe Gly Gln Glu Thr Ser Tyr Ile Glu Asp Asn Cys Asn Gln Asn

20 25 30

Gly Ala Ile Ser Leu Ile Phe Ser Leu Lys Glu Glu Val Gly Ala Leu

35 40 45

Ala Lys Val Leu Arg Leu Phe Glu Glu Asn Asp Val Asn Leu Thr His

50 55 60

Ile Glu Ser Arg Pro Ser Arg Leu Lys Lys Asp Glu Tyr Glu Phe Phe

65 70 75 80

Thr His Leu Asp Lys Arg Ser Leu Pro Ala Leu Thr Asn Ile Ile Lys

85 90 95

Ile Leu Arg His Asp Ile Gly Ala Thr Val His Glu Leu Ser Arg Asp

100 105 110

Lys Lys Lys Asp Thr Val Pro Trp Phe Pro Arg Thr Ile Gln Glu Leu

115 120 125

Asp Arg Phe Ala Asn Gln Ile Leu Ser Tyr Gly Ala Glu Leu Asp Ala

130 135 140

Asp His Pro Gly Phe Lys Asp Pro Val Tyr Arg Ala Arg Arg Lys Gln

145 150 155 160

Phe Ala Asp Ile Ala Tyr Asn Tyr Arg His Gly Gln Pro Ile Pro Arg

165 170 175

Val Glu Tyr Met Glu Glu Glu Lys Lys Thr Trp Gly Thr Val Phe Lys

180 185 190

Thr Leu Lys Ser Leu Tyr Lys Thr His Ala Cys Tyr Glu Tyr Asn His

195 200 205

Ile Phe Pro Leu Leu Glu Lys Tyr Cys Gly Phe His Glu Asp Asn Ile

210 215 220

Pro Gln Leu Glu Asp Val Ser Gln Phe Leu Gln Thr Cys Thr Gly Phe

225 230 235 240

Arg Leu Arg Pro Val Ala Gly Leu Leu Ser Ser Arg Asp Phe Leu Gly

245 250 255

Gly Leu Ala Phe Arg Val Phe His Cys Thr Gln Tyr Ile Arg His Gly

260 265 270

Ser Lys Pro Met Tyr Thr Pro Glu Pro Asp Ile Cys His Glu Leu Leu

275 280 285

Gly His Val Pro Leu Phe Ser Asp Arg Ser Phe Ala Gln Phe Ser Gln

290 295 300

Glu Ile Gly Leu Ala Ser Leu Gly Ala Pro Asp Glu Tyr Ile Glu Lys

305 310 315 320

Leu Ala Thr Ile Tyr Trp Phe Thr Val Glu Phe Gly Leu Cys Lys Gln

325 330 335

Gly Asp Ser Ile Lys Ala Tyr Gly Ala Gly Leu Leu Ser Ser Phe Gly

340 345 350

Glu Leu Gln Tyr Cys Leu Ser Glu Lys Pro Lys Leu Leu Pro Leu Glu

355 360 365

Leu Glu Lys Thr Ala Ile Gln Asn Tyr Thr Val Thr Glu Phe Gln Pro

370 375 380

Leu Tyr Tyr Val Ala Glu Ser Phe Asn Asp Ala Lys Glu Lys Val Arg

385 390 395 400

Asn Phe Ala Ala Thr Ile Pro Arg Pro Phe Ser Val Arg Tyr Asp Pro

405 410 415

Tyr Thr Gln Arg Ile Glu Val Leu Asp Asn Thr Gln Gln Leu Lys Ile

420 425 430

Leu Ala Asp Ser Ile Asn Ser Glu Ile Gly Ile Leu Cys Ser Ala Leu

435 440 445

Gln Lys Ile Lys

450

<210> 2

<211> 452

<212> PRT

<213> 智人

<400> 2

Met Ser Thr Ala Val Leu Glu Asn Pro Gly Leu Gly Arg Lys Leu Ser

1 5 10 15

Asp Phe Gly Gln Glu Thr Ser Tyr Ile Glu Asp Asn Cys Asn Gln Asn

20 25 30

Gly Ala Ile Ser Leu Ile Phe Ser Leu Lys Glu Glu Val Gly Ala Leu

35 40 45

Ala Lys Val Leu Arg Leu Phe Glu Glu Asn Asp Val Asn Leu Thr His

50 55 60

Ile Glu Ser Arg Pro Ser Arg Leu Lys Lys Asp Glu Tyr Glu Phe Phe

65 70 75 80

Thr His Leu Asp Lys Arg Ser Leu Pro Ala Leu Thr Asn Ile Ile Lys

85 90 95

Ile Leu Arg His Asp Ile Gly Ala Thr Val His Glu Leu Ser Arg Asp

100 105 110

Lys Lys Lys Asp Thr Val Pro Trp Phe Pro Arg Thr Ile Gln Glu Leu

115 120 125

Asp Arg Phe Ala Asn Gln Ile Leu Ser Tyr Gly Ala Glu Leu Asp Ala

130 135 140

Asp His Pro Gly Phe Lys Asp Pro Val Tyr Arg Ala Arg Arg Lys Gln

145 150 155 160

Phe Ala Asp Ile Ala Tyr Asn Tyr Arg His Gly Gln Pro Ile Pro Arg

165 170 175

Val Glu Tyr Met Glu Glu Gly Lys Lys Thr Trp Gly Thr Val Phe Lys

180 185 190

Thr Leu Lys Ser Leu Tyr Lys Thr His Ala Cys Tyr Glu Tyr Asn His

195 200 205

Ile Phe Pro Leu Leu Glu Lys Tyr Cys Gly Phe His Glu Asp Asn Ile

210 215 220

Pro Gln Leu Glu Asp Val Ser Gln Phe Leu Gln Thr Cys Thr Gly Phe

225 230 235 240

Arg Leu Arg Pro Val Ala Gly Leu Leu Ser Ser Arg Asp Phe Leu Gly

245 250 255

Gly Leu Ala Phe Arg Val Phe His Cys Thr Gln Tyr Ile Arg His Gly

260 265 270

Ser Lys Pro Met Tyr Thr Pro Glu Pro Asp Ile Cys His Glu Leu Leu

275 280 285

Gly His Val Pro Leu Phe Ser Asp Arg Ser Phe Ala Gln Phe Ser Gln

290 295 300

Glu Ile Gly Leu Ala Ser Leu Gly Ala Pro Asp Glu Tyr Ile Glu Lys

305 310 315 320

Leu Ala Thr Ile Tyr Trp Phe Thr Val Glu Phe Gly Leu Cys Lys Gln

325 330 335

Gly Asp Ser Ile Lys Ala Tyr Gly Ala Gly Leu Leu Ser Ser Phe Gly

340 345 350

Glu Leu Gln Tyr Cys Leu Ser Glu Lys Pro Lys Leu Leu Pro Leu Glu

355 360 365

Leu Glu Lys Thr Ala Ile Gln Asn Tyr Thr Val Thr Glu Phe Gln Pro

370 375 380

Leu Tyr Tyr Val Ala Glu Ser Phe Asn Asp Ala Lys Glu Lys Val Arg

385 390 395 400

Asn Phe Ala Ala Thr Ile Pro Arg Pro Phe Ser Val Arg Tyr Asp Pro

405 410 415

Tyr Thr Gln Arg Ile Glu Val Leu Asp Asn Thr Gln Gln Leu Lys Ile

420 425 430

Leu Ala Asp Ser Ile Asn Ser Glu Ile Gly Ile Leu Cys Ser Ala Leu

435 440 445

Gln Lys Ile Lys

450

<210> 3

<211> 452

<212> PRT

<213> 智人

<400> 3

Met Ser Thr Ala Val Leu Glu Asn Pro Gly Leu Gly Arg Lys Leu Ser

1 5 10 15

Asp Phe Gly Gln Glu Thr Ser Tyr Ile Glu Asp Asn Cys Asn Gln Asn

20 25 30

Gly Ala Ile Ser Leu Ile Phe Ser Leu Lys Glu Glu Val Gly Ala Leu

35 40 45

Ala Lys Val Leu Arg Leu Phe Glu Glu Asn Asp Val Asn Leu Thr His

50 55 60

Ile Glu Ser Arg Pro Ser Arg Leu Lys Lys Asp Glu Tyr Glu Phe Phe

65 70 75 80

Thr His Leu Asp Lys Arg Ser Leu Pro Ala Leu Thr Asn Ile Ile Lys

85 90 95

Ile Leu Arg His Asp Ile Gly Ala Thr Val His Glu Leu Ser Arg Asp

100 105 110

Lys Lys Lys Asp Thr Val Pro Trp Phe Pro Arg Thr Ile Gln Glu Leu

115 120 125

Asp Arg Phe Ala Asn Gln Ile Leu Ser Tyr Gly Ala Glu Leu Asp Ala

130 135 140

Asp His Pro Gly Phe Lys Asp Pro Val Tyr Arg Ala Arg Arg Lys Gln

145 150 155 160

Phe Ala Asp Ile Ala Tyr Asn Tyr Arg His Gly Gln Pro Ile Pro Arg

165 170 175

Val Glu Tyr Thr Glu Glu Glu Lys Lys Thr Trp Gly Thr Val Phe Lys

180 185 190

Thr Leu Lys Ser Leu Tyr Pro Thr His Ala Cys Tyr Glu Tyr Asn His

195 200 205

Ile Phe Pro Leu Leu Glu Lys Tyr Cys Gly Phe His Glu Asp Asn Ile

210 215 220

Pro Gln Leu Glu Asp Val Ser Gln Phe Leu Gln Thr Cys Thr Gly Phe

225 230 235 240

Arg Leu Arg Pro Val Ala Gly Leu Leu Pro Ser Arg Asp Phe Leu Ala

245 250 255

Gly Leu Ala Phe Arg Val Phe His Cys Thr Gln Tyr Ile Arg His Gly

260 265 270

Ser Lys Pro Met Tyr Thr Pro Glu Pro Asp Ile Cys His Glu Leu Leu

275 280 285

Gly His Val Pro Leu Phe Ser Asp Arg Ser Phe Ala Gln Phe Ser Gln

290 295 300

Glu Ile Gly Leu Ala Ser Leu Gly Ala Pro Asp Glu Tyr Ile Glu Lys

305 310 315 320

Leu Ala Thr Ile Tyr Trp Phe Thr Val Glu Phe Gly Leu Cys Lys Gln

325 330 335

Gly Asp Ser Ile Lys Ala Tyr Gly Ala Gly Leu Leu Ser Ser Phe Gly

340 345 350

Glu Leu Gln Tyr Cys Leu Ser Glu Lys Pro Lys Leu Leu Pro Leu Glu

355 360 365

Leu Glu Lys Thr Ala Ile Gln Asn Tyr Thr Val Thr Glu Phe Gln Pro

370 375 380

Leu Tyr Tyr Val Ala Glu Ser Phe Asn Asp Ala Lys Glu Lys Val Arg

385 390 395 400

Asn Phe Ala Ala Thr Ile Pro Arg Pro Phe Ser Val Arg Tyr Asp Pro

405 410 415

Tyr Thr Gln Arg Ile Glu Val Leu Asp Asn Thr Gln Gln Leu Lys Ile

420 425 430

Leu Ala Asp Ser Ile Asn Ser Glu Ile Gly Ile Leu Cys Ser Ala Leu

435 440 445

Gln Lys Ile Lys

450

<210> 4

<211> 1359

<212> DNA

<213> 智人

<400> 4

atgagcacag ccgtgctgga aaaccccggc ctgggcagaa agctgagcga cttcggccag 60

gaaaccagct acatcgagga caactgcaac cagaacggcg ccatcagcct gatcttcagc 120

ctgaaagaag aagtgggcgc cctggccaag gtgctgcggc tgttcgagga gaacgacgtg 180

aacctgaccc acatcgagag ccggcccagc agactgaaga aggacgagta cgagttcttc 240

acccacctgg acaagcggag cctgcccgcc ctgaccaaca tcatcaagat cctgcggcac 300

gacatcggcg ccaccgtgca cgagctgagc cgggacaaga aaaaggacac cgtgccctgg 360

ttccccagaa ccatccagga actggacaga ttcgccaacc agatcctgtc ctacggcgcc 420

gagctggatg ccgaccaccc tggcttcaag gaccccgtgt accgggccag acggaagcag 480

ttcgccgata tcgcctacaa ctaccggcac ggccagccca tccccagagt cgagtacacc 540

gaagagggca agaaaacctg gggcaccgtg ttcaagaccc tgaagtccct gtaccccacc 600

cacgcctgct acgagtacaa ccacatcttc ccactgctcg aaaagtactg cggcttccac 660

gaggacaata tccctcagct ggaggacgtg tcccagtttc tgcagacctg caccggcttc 720

agactcaggc ctgtggccgg cctgctgccc agcagagatt ttctggccgg actggccttc 780

cgggtgttcc actgcaccca gtacatcaga cacggcagca agcccatgta cacccctgag 840

cccgacatct gccacgagct gctgggacat gtgcccctgt tcagcgacag aagcttcgcc 900

cagttcagcc aggaaatcgg cctggcctct ctgggcgctc ccgacgagta tatcgagaag 960

ctggccacca tctactggtt caccgtggaa ttcggcctgt gcaagcaggg cgacagcatc 1020

aaggcctatg gcgccggact cctgtccagc ttcggcgagc tgcagtactg tctgagcgag 1080

aagcccaagc tgctgcccct ggaactggaa aagaccgcca tccagaacta caccgtgacc 1140

gagttccagc ccctgtacta cgtggccgag agcttcaacg acgccaaaga aaaagtgcgg 1200

aacttcgccg ccaccatccc tcggcccttc agcgtcagat acgaccccta cacccagcgg 1260

atcgaggtgc tggacaacac acagcagctg aaaattctgg ccgactccat caacagcgag 1320

atcggcatcc tgtgcagcgc cctgcagaaa atcaagtga 1359

<210> 5

<211> 3713

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 5

gagctcttgg ccactccctc tctgcgcgct cgctcgctca ctgaggccgg gcgaccaaag 60

gtcgcccgac gcccgggctt tgcccgggcg gcctcagtga gcgagcgagc gcgcagagag 120

ggagtggcca actccatcac taggggttcc tacgcgtggc cccaggttaa tttttaaaaa 180

gcagtcaaag gtcaaagtgg cccttggcag catttactct ctctattgac tttggttaat 240

aatctcagga gcacaaacat tcctggaggc aggagaagaa atcaacatcc tggacttatc 300

ctctgggcct ctccccacct tcgatggccc caggttaatt tttaaaaagc agtcaaaggt 360

caaagtggcc cttggcagca tttactctct ctattgactt tggttaataa tctcaggagc 420

acaaacattc ctggaggcag gagaagaaat caacatcctg gacttatcct ctgggcctct 480

ccccaccgat atctacctgc tgatcgcccg gcccctgttc aaacatgtcc taatactctg 540

tcggggcaaa ggtcggcagt agttttccat cttactcaac atcctcccag tgtacgtagg 600

atcctgtctg tctgcacatt tcgtagagcg agtgttccga tactctaatc tcccggggca 660

aaggtcgtat tgacttaggt tacttattct ccttttgttg actaagtcaa taatcagaat 720

cagcaggttt ggagtcagct tggcagggat cagcagcctg ggttggaagg agggggtata 780

aaagcccctt caccaggaga agccgtcaca cagatccaca agctcctgct agcagtcgct 840

gcgcgctgcc ttcgccccgt gccccgctcc gccgccgcct cgcgccgccc gccccggctc 900

tgactgaccg cgttactccc acaggtgagc gggcgggacg gcccttctcc tccgggctgt 960

aattagcgct tggtttaatg acggcttgtt tcttttctgt ggctgcgtga aagccttgag 1020

gggctccggg aaggcccttt gtgcgggggg agcggctcgg ggggtgcgtg cgtgtgtgtg 1080

tgcgtgggga gcgccgcgtg cggctccgcg ctgcccggcg gctgtgagcg ctgcgggcgc 1140

ggcgcggggc tttgtgcgct ccgcagtgtg cgcgagggga gcggggccgg gggcggtgcc 1200

ccgcggtgcg gggggggctg cgaggggaac aaaggctgcg tgcggggtgt gtgcgtgggg 1260

gggtgagcag ggggtgtggg cgcgtcggtc gggctgcaac cccccctgca cccccctccc 1320

cgagttgctg agcacggccc ggcttcgggt gcggggctcc gtacggggcg tggcgcgggg 1380

ctcgccgtgc cgggcggggg gtggcggcag gtgggggtgc cgggcggggc ggggccgcct 1440

cgggccgggg agggctcggg ggaggggcgc ggcggccccc ggagcgccgg cggctgtcga 1500

ggcgcggcga gccgcagcca ttgcctttta tggtaatcgt gcgagagggc gcagggactt 1560

cctttgtccc aaatctgtgc ggagccgaaa tctgggaggc gccgccgcac cccctctagc 1620

gggcgcgggg cgaagcggtg cggcgccggc aggaaggaaa tgggcgggga gggccttcgt 1680

gcgtcgccgc gccgccgtcc ccttctccct ctccagcctc ggggctgtcc gcggggggac 1740

ggctgccttc gggggggacg gggcagggcg gggttcggct tctggcgtgt gaccggcggc 1800

tctagagcct ctgctaacca tgttcatgcc ttcttctttt tcctacagct cctgggcaac 1860

gtgctggtta ttgtgctgtc tcatcatttt ggcaaagaat tcatttcgaa gccgccacca 1920

tgagcacagc cgtgctggaa aaccccggcc tgggcagaaa gctgagcgac ttcggccagg 1980

aaaccagcta catcgaggac aactgcaacc agaacggcgc catcagcctg atcttcagcc 2040

tgaaagaaga agtgggcgcc ctggccaagg tgctgcggct gttcgaggag aacgacgtga 2100

acctgaccca catcgagagc cggcccagca gactgaagaa ggacgagtac gagttcttca 2160

cccacctgga caagcggagc ctgcccgccc tgaccaacat catcaagatc ctgcggcacg 2220

acatcggcgc caccgtgcac gagctgagcc gggacaagaa aaaggacacc gtgccctggt 2280

tccccagaac catccaggaa ctggacagat tcgccaacca gatcctgtcc tacggcgccg 2340

agctggatgc cgaccaccct ggcttcaagg accccgtgta ccgggccaga cggaagcagt 2400

tcgccgatat cgcctacaac taccggcacg gccagcccat ccccagagtc gagtacaccg 2460

aagagggcaa gaaaacctgg ggcaccgtgt tcaagaccct gaagtccctg taccccaccc 2520

acgcctgcta cgagtacaac cacatcttcc cactgctcga aaagtactgc ggcttccacg 2580

aggacaatat ccctcagctg gaggacgtgt cccagtttct gcagacctgc accggcttca 2640

gactcaggcc tgtggccggc ctgctgccca gcagagattt tctggccgga ctggccttcc 2700

gggtgttcca ctgcacccag tacatcagac acggcagcaa gcccatgtac acccctgagc 2760

ccgacatctg ccacgagctg ctgggacatg tgcccctgtt cagcgacaga agcttcgccc 2820

agttcagcca ggaaatcggc ctggcctctc tgggcgctcc cgacgagtat atcgagaagc 2880

tggccaccat ctactggttc accgtggaat tcggcctgtg caagcagggc gacagcatca 2940

aggcctatgg cgccggactc ctgtccagct tcggcgagct gcagtactgt ctgagcgaga 3000

agcccaagct gctgcccctg gaactggaaa agaccgccat ccagaactac accgtgaccg 3060

agttccagcc cctgtactac gtggccgaga gcttcaacga cgccaaagaa aaagtgcgga 3120

acttcgccgc caccatccct cggcccttca gcgtcagata cgacccctac acccagcgga 3180

tcgaggtgct ggacaacaca cagcagctga aaattctggc cgactccatc aacagcgaga 3240

tcggcatcct gtgcagcgcc ctgcagaaaa tcaagtgacc taggtgatca agatctgcta 3300

gcttaattaa cccgggacta gtgcggccgc tcgagactag tctgtgcctt ctagttgcca 3360

gccatctgtt gtttgcccct cccccgtgcc ttccttgacc ctggaaggtg ccactcccac 3420

tgtcctttcc taataaaatg aggaaattgc atcgcattgt ctgagtaggt gtcattctat 3480

tctggggggt ggggtggggc aggacagcaa gggggaggat tgggaagaca atagcaggca 3540

tgctggggat gcggtgggct ctatggtacc aggaacccct agtgatggag ttggccactc 3600

cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc cgacgcccgg 3660

gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagggagtg gcc 3713

<210> 6

<211> 4561

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 6

ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgcccgggc aaagcccggg 60

cgtcgggcga cctttggtcg cccggcctca gtgagcgagc gagcgcgcag agagggagtg 120

gccaactcca tcactagggg ttccttaccg cgtggcccca ggttaatttt taaaaagcag 180

tcaaaggtca aagtggccct tggcagcatt tactctctct attgactttg gttaataatc 240

tcaggagcac aaacattcct ggaggcagga gaagaaatca acatcctgga cttatcctct 300

gggcctctcc ccaccttcga tggccccagg ttaattttta aaaagcagtc aaaggtcaaa 360

gtggcccttg gcagcattta ctctctctat tgactttggt taataatctc aggagcacaa 420

acattcctgg aggcaggaga agaaatcaac atcctggact tatcctctgg gcctctcccc 480

accgatatct acctgctgat cgcccggccc ctgttcaaac atgtcctaat actctgtcgg 540

ggcaaaggtc ggcagtagtt ttccatctta ctcaacatcc tcccagtgta cgtaggatcc 600

tgtctgtctg cacatttcgt agagcgagtg ttccgatact ctaatctccc ggggcaaagg 660

tcgtattgac ttaggttact tattctcctt ttgttgacta agtcaataat cagaatcagc 720

aggtttggag tcagcttggc agggatcagc agcctgggtt ggaaggaggg ggtataaaag 780

ccccttcacc aggagaagcc gtcacacaga tccacaagct cctgctagcc aattgagtcg 840

ctgcgcgctg ccttcgcccc gtgccccgct ccgccgccgc ctcgcgccgc ccgccccggc 900

tctgactgac cgcgttactc ccacaggtga gcgggcggga cggcccttct cctccgggct 960

gtaattagcg cttggtttat tgacggcttg tttcttttct gtggctgcgt gaaagccttg 1020

aggggctccg ggaaggccct ttgtgcgggg ggagcggctc ggggggtgcg tgcgtgtgtg 1080

tgtgcgtggg gagcgccgcg tgcggctccg cgctgcccgg cggctgtgag cgctgcgggc 1140

gcggcgcggg gctttgtgcg ctccgcagtg tgcgcgaggg gagcggggcc gggggcggtg 1200

ccccgcggtg cggggggggc tgcgagggga acaaaggctg cgtgcggggt gtgtgcgtgg 1260

gggggtgagc agggggtgtg ggcgcgtcgg tcgggctgca accccccctg cacccccctc 1320

cccgagttgc tgagcacggc ccggcttcgg gtgcggggct ccgtacgggg cgtggcgcgg 1380

ggctcgccgt gccgggcggg gggtggcggc aggtgggggt gccgggcggg gcggggccgc 1440

ctcgggccgg ggagggctcg ggggaggggc gcggcggccc ccggagcgcc ggcggctgtc 1500

gaggcgcggc gagccgcagc cattgccttt tttggtaatc gtgcgagagg gcgcagggac 1560

ttcctttgtc ccaaatctgt gcggagccga aatctgggag gcgccgccgc accccctcta 1620

gcgggcgcgg ggcgaagcgg tgcggcgccg gcaggaagga attgggcggg gagggccttc 1680

gtgcgtcgcc gcgccgccgt ccccttctcc ctctccagcc tcggggctgt ccgcgggggg 1740

acggctgcct tcggggggga cggggcaggg cggggttcgg cttctggcgt gtgaccggcg 1800

gctctagagc ctctgctaac cttgttcttg ccttcttctt tttcctacag ctcctgggca 1860

acgtgctggt tattgtgctg tctcatcatt ttggcaaaga attcatttcg aagccgccac 1920

catgagcaca gccgtgctgg aaaaccccgg cctgggcaga aagctgagcg acttcggcca 1980

ggaaaccagc tacatcgagg acaactgcaa ccagaacggc gccatcagcc tgatcttcag 2040

cctgaaagaa gaagtgggcg ccctggccaa ggtgctgcgg ctgttcgagg agaacgacgt 2100

gaacctgacc cacatcgaga gccggcccag cagactgaag aaggacgagt acgagttctt 2160

cacccacctg gacaagcgga gcctgcccgc cctgaccaac atcatcaaga tcctgcggca 2220

cgacatcggc gccaccgtgc acgagctgag ccgggacaag aaaaaggaca ccgtgccctg 2280

gttccccaga accatccagg aactggacag attcgccaac cagatcctgt cctacggcgc 2340

cgagctggat gccgaccacc ctggcttcaa ggaccccgtg taccgggcca gacggaagca 2400

gttcgccgat atcgcctaca actaccggca cggccagccc atccccagag tcgagtacac 2460

cgaagagggc aagaaaacct ggggcaccgt gttcaagacc ctgaagtccc tgtaccccac 2520

ccacgcctgc tacgagtaca accacatctt cccactgctc gaaaagtact gcggcttcca 2580

cgaggacaat atccctcagc tggaggacgt gtcccagttt ctgcagacct gcaccggctt 2640

cagactcagg cctgtggccg gcctgctgcc cagcagagat tttctggccg gactggcctt 2700

ccgggtgttc cactgcaccc agtacatcag acacggcagc aagcccatgt acacccctga 2760

gcccgacatc tgccacgagc tgctgggaca tgtgcccctg ttcagcgaca gaagcttcgc 2820

ccagttcagc caggaaatcg gcctggcctc tctgggcgct cccgacgagt atatcgagaa 2880

gctggccacc atctactggt tcaccgtgga attcggcctg tgcaagcagg gcgacagcat 2940

caaggcctat ggcgccggac tcctgtccag cttcggcgag ctgcagtact gtctgagcga 3000

gaagcccaag ctgctgcccc tggaactgga aaagaccgcc atccagaact acaccgtgac 3060

cgagttccag cccctgtact acgtggccga gagcttcaac gacgccaaag aaaaagtgcg 3120

gaacttcgcc gccaccatcc ctcggccctt cagcgtcaga tacgacccct acacccagcg 3180

gatcgaggtg ctggacaaca cacagcagct gaaaattctg gccgactcca tcaacagcga 3240

gatcggcatc ctgtgcagcg ccctgcagaa aatcaagtga actagtctgt gccttctagt 3300

tgccagccat ctgttgtttg cccctccccc gtgccttcct tgaccctgga aggtgccact 3360

cccactgtcc tttcctaata aaatgaggaa attgcatcgc attgtctgag taggtgtcat 3420

tctattctgg ggggtggggt ggggcaggac agcaaggggg aggattggga agacaatagc 3480

aggcatgctg gggatgcggt gggctctata ccggtccagg ggtgagtgaa ggtttggaag 3540

agtgtagcag aataagaaac catgagtccc ctccctgaga agccctgagc ccccttgacg 3600

acacacatcc ctcgaggctc agcttcatca tctgtaaaag gtgctgaaac tgaccatcca 3660

agctgccgaa aaagattgtg tggggataat tcaaaactag aggaagatgc agaatttcta 3720

catcgtggcg atgtcaggct aagagttgcc atcgtggctg tccatcgatt ttattggaat 3780

catatgttta tttgagggtg tcttggatat tacaaataaa ttgttggagc atcaggcata 3840

tttggtaatt ctgtctaagg ctccctgccc cttgttaatt ggcagctcag ttattcatcc 3900

agggcaaaca ttctgcttac tattcctgag agctttcctc atcctctaga ttggcagggg 3960

aattgcagtt gcctgagcag cctcccctct gccataccaa cagagcttca ccatcgaggc 4020

ttgcagagtg gacaggggcc tcagggaccc ctgatcccag ctttctcatt ggacagaagg 4080

aggagactgg ggctggagag ggacctgggc ccccactaag gccacagcag agccaggact 4140

ttagctgtgc tgactgcagc ctggcttgcc tccactgccc tcctttgcct caagagcaag 4200

ggagcctcag agtggaggaa gcagcccctg gccttgcctc ccacctcccc tcccctttgc 4260

tgttttcctg ggacagtggg agctggctta gattgccctg gggcccccag gaccctggca 4320

ttttaacccc tcaggggcag gaaggcagcc tgagatacag aagagtccat cacctgctgt 4380

atgccacaca ccatccccac agtcgacatt taaattagga acccctagtg atggagttgg 4440

ccactccctc tctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 4500

gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 4560

a 4561

<210> 7

<211> 204

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 7

gcgagaactt gtgcctcccc gtgttcctga cctttgaccc tctgtcctac ttagactaat 60

attgactttg ggtactgcaa acaggaaatg ggggagggat tcgatgcgag aacttgtgcc 120

tccccgtgtt cctgaccttt gaccctctgt cctacttaga ctaatattga ctttgggtac 180

tgcaaacagg aaatggggga ggga 204

<210> 8

<211> 330

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 8

ggccccaggt taatttttaa aaagcagtca aaggtcaaag tggcccttgg cagcatttac 60

tctctctatt gactttggtt aataatctca ggagcacaaa cattcctgga ggcaggagaa 120

gaaatcaaca tcctggactt atcctctggg cctctcccca ccttcgatgg ccccaggtta 180

atttttaaaa agcagtcaaa ggtcaaagtg gcccttggca gcatttactc tctctattga 240

ctttggttaa taatctcagg agcacaaaca ttcctggagg caggagaaga aatcaacatc 300

ctggacttat cctctgggcc tctccccacc 330

<210> 9

<211> 377

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 9

gttcctagat tacattacac attctgcaag catagcacag gtcaaagttc aactttaatt 60

actttcattt tcttgtatcc tcacagccta gaaaataacc tgcgttacag catccactca 120

gtatcccttg agcatgaggt gacactactt aacataggga cgagatggta ctttgtgtct 180

cctgctctgt cagcagggca ctgtacttgc tgataccagg gaatattgat ttgtaaatac 240

catcattccg aacgtgtttg ccttggccag ttttccatgt acatgcagaa agaagtttgg 300

gactgatcaa tacagtcctc tgcctttaaa gcaataggaa aaggccaact tgtctacgtt 360

tagtatgtgg ctgtaga 377

<210> 10

<211> 156

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 10

ccatcagatc ctgcccaagg tcttacataa gaggactctt ggactcccag caatgtcaac 60

gaccgacctt gaggcctact tcaaagactg tgtgtttaag gactgggagg agctggggga 120

ggagattagg ttaaaggtct ttgtattagg aggctg 156

<210> 11

<211> 71

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 11

ggggaggctg ctggtgaata ttaaccaagg tcaccccagt tatcggagga gcaaacaggg 60

gctaagtcca c 71

<210> 12

<211> 869

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 12

ctcaattgga tgacactagt catcacattt aaaagcatct caggtaacta tattttgaat 60

tttttaaaaa agtaactata atagttatta ttaaaatagc aaagattgac catttccaag 120

agccatatag accagcaccg accactattc taaactattt atgtatgtaa atattagctt 180

ttaaaattct caaaatagtt gctgagttgg gaaccactat tatttctatc gattcagcag 240

ccgtaagtct aggacaggct taaattgttt tcactggtgt aaattgcaga aagatgatct 300

aagtaatttg gcatttattt taataggttt gaaaaacaca tgccatttta caaataagac 360

ttatatttgt ccttttgttt ttcagcctac catgagaata agagaaagaa aatgaagatc 420

aaaagcttat tcatctgttt ttctttttcg ttggtgtaaa gccaacaccc tgtctaaaaa 480

acataaattt ctttaatcat tttgcctctt ttctctgtgc ttcaattaat aaaaaatgga 540

aagaatctaa tagagtggta cagcactgtt atttttcaaa gatgtgttgc tatcctgaaa 600

attctgtagg ttctgtggaa gttccagtgt tctctcttat tccacttcgg tagaggattt 660

ctagtttctt gtgggctaat taaataaatc attaatactc ttctaagtta tggattataa 720

acattcaaaa taatattttg acattatgat aattctgaat aaaagaacaa aaaccatggt 780

ataggtaagg aatataaaac atggctttta ccttagaaaa aacaattcta aaattcatat 840

ggaatcaaaa aagagcctgc aggtaccct 869

<210> 13

<211> 1302

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 13

ctcaattgga tgacactagt catcacattt aaaagcatct caggtaacta tattttgaat 60

tttttaaaaa agtaactata atagttatta ttaaaatagc aaagattgac catttccaag 120

agccatatag accagcaccg accactattc taaactattt atgtatgtaa atattagctt 180

ttaaaattct caaaatagtt gctgagttgg gaaccactat tatttctatc tactgtttta 240

attaaaatta tctctaaggc atgtgaactg gctgtcttgg ttttcatctg tacttcatct 300

gctacctctg tgacctgaaa catatttata attccattaa gctgtgcata tgatagattt 360

atcatatgta ttttccttaa aggatttttg taagaactaa ttgaattgat acctgtaaag 420

tctttatcac actacccaat aaataataaa tctctttgtt cagctctctg tttctataaa 480

tatgtaccag ttttattgtt tttagtggta gtgattttat tctctttcta tatatataca 540

cacacatgtg tgcattcata aatatataca atttttatga ataaaaaatt attagcaatc 600

aatattgaaa accactgatt tttgtttatg tgagcaaaca gcagattaaa aggaattcct 660

gcagattcag cagccgtaag tctaggacag gcttaaattg ttttcactgg tgtaaattgc 720

agaaagatga tctaagtaat ttggcattta ttttaatagg tttgaaaaac acatgccatt 780

ttacaaataa gacttatatt tgtccttttg tttttcagcc taccatgaga ataagagaaa 840

gaaaatgaag atcaaaagct tattcatctg tttttctttt tcgttggtgt aaagccaaca 900

ccctgtctaa aaaacataaa tttctttaat cattttgcct cttttctctg tgcttcaatt 960

aataaaaaat ggaaagaatc taatagagtg gtacagcact gttatttttc aaagatgtgt 1020

tgctatcctg aaaattctgt aggttctgtg gaagttccag tgttctctct tattccactt 1080

cggtagagga tttctagttt cttgtgggct aattaaataa atcattaata ctcttctaag 1140

ttatggatta taaacattca aaataatatt ttgacattat gataattctg aataaaagaa 1200

caaaaaccat ggtataggta aggaatataa aacatggctt ttaccttaga aaaaacaatt 1260

ctaaaattca tatggaatca aaaaagagcc tgcaggtacc ct 1302

<210> 14

<211> 1359

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 14

atgagcacag ccgtgctgga aaaccccggc ctgggcagaa agctgagcga cttcggccag 60

gaaaccagct acatcgagga caactgcaac cagaacggcg ccatcagcct gatcttcagc 120

ctgaaagaag aagtgggcgc cctggccaag gtgctgcggc tgttcgaaga gaacgacgtg 180

aacctgaccc acatcgagag ccggcccagc agactgaaga aggacgagta cgagttcttc 240

acccacctgg acaagcggag cctgcccgcc ctgaccaaca tcatcaagat cctgcggcac 300

gacatcggcg ccaccgtgca cgagctgagc cgggacaaga aaaaggacac cgtgccctgg 360

ttccccagaa ccatccagga actggacaga ttcgccaacc agatcctgtc ctacggcgcc 420

gagctggatg ccgaccaccc tggcttcaag gaccccgtgt accgggccag acggaagcag 480

ttcgccgata tcgcctacaa ctaccggcac ggccagccca tccccagagt cgagtacatg 540

gaagagggca agaaaacctg gggcaccgtg ttcaagaccc tgaagtccct gtacaagacc 600

cacgcctgct acgagtacaa ccacatcttc ccactgctcg agaagtactg cggcttccac 660

gaggacaata tccctcagct cgaggacgtg tcccagtttc tgcagacctg caccggcttc 720

agactcaggc ctgtggccgg cctgctgagc agcagagatt ttctgggcgg actggccttc 780

cgggtgttcc actgcaccca gtacatcaga cacggcagca agcccatgta cacccctgag 840

cccgacatct gccacgagct gctgggacat gtgcccctgt tcagcgacag aagcttcgcc 900

cagttcagcc aggaaatcgg cctggcctct ctgggcgctc ccgacgagta tatcgagaag 960

ctggccacca tctactggtt caccgtggaa ttcggcctgt gcaagcaggg cgacagcatc 1020

aaggcctatg gcgccggact cctgtccagc ttcggcgagc tgcagtactg tctgagcgag 1080

aagcccaagc tgctgcccct ggaactggaa aagaccgcca tccagaacta caccgtgacc 1140

gagttccagc ccctgtacta cgtggccgag agcttcaacg acgccaaaga aaaagtgcgg 1200

aacttcgccg ccaccatccc tcggcccttc agcgtcagat acgaccccta cacccagcgg 1260

atcgaggtgc tggacaacac acagcagctg aaaattctgg ccgactccat caacagcgag 1320

atcggcatcc tgtgcagcgc cctgcagaaa atcaagtga 1359

<210> 15

<211> 1069

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 15

agtcgctgcg cgctgccttc gccccgtgcc ccgctccgcc gccgcctcgc gccgcccgcc 60

ccggctctga ctgaccgcgt tactcccaca ggtgagcggg cgggacggcc cttctcctcc 120

gggctgtaat tagcgcttgg tttattgacg gcttgtttct tttctgtggc tgcgtgaaag 180

ccttgagggg ctccgggaag gccctttgtg cggggggagc ggctcggggg gtgcgtgcgt 240

gtgtgtgtgc gtggggagcg ccgcgtgcgg ctccgcgctg cccggcggct gtgagcgctg 300

cgggcgcggc gcggggcttt gtgcgctccg cagtgtgcgc gaggggagcg gggccggggg 360

cggtgccccg cggtgcgggg ggggctgcga ggggaacaaa ggctgcgtgc ggggtgtgtg 420

cgtggggggg tgagcagggg gtgtgggcgc gtcggtcggg ctgcaacccc ccctgcaccc 480

ccctccccga gttgctgagc acggcccggc ttcgggtgcg gggctccgta cggggcgtgg 540

cgcggggctc gccgtgccgg gcggggggtg gcggcaggtg ggggtgccgg gcggggcggg 600

gccgcctcgg gccggggagg gctcggggga ggggcgcggc ggcccccgga gcgccggcgg 660

ctgtcgaggc gcggcgagcc gcagccattg ccttttttgg taatcgtgcg agagggcgca 720

gggacttcct ttgtcccaaa tctgtgcgga gccgaaatct gggaggcgcc gccgcacccc 780

ctctagcggg cgcggggcga agcggtgcgg cgccggcagg aaggaattgg gcggggaggg 840

ccttcgtgcg tcgccgcgcc gccgtcccct tctccctctc cagcctcggg gctgtccgcg 900

gggggacggc tgccttcggg ggggacgggg cagggcgggg ttcggcttct ggcgtgtgac 960

cggcggctct agagcctctg ctaaccttgt tcttgccttc ttctttttcc tacagctcct 1020

gggcaacgtg ctggttattg tgctgtctca tcattttggc aaagaattc 1069

<210> 16

<211> 901

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 16

ccaggggtga gtgaaggttt ggaagagtgt agcagaataa gaaaccatga gtcccctccc 60

tgagaagccc tgagccccct tgacgacaca catccctcga ggctcagctt catcatctgt 120

aaaaggtgct gaaactgacc atccaagctg ccgaaaaaga ttgtgtgggg ataattcaaa 180

actagaggaa gatgcagaat ttctacatcg tggcgatgtc aggctaagag ttgccatcgt 240

ggctgtccat cgattttatt ggaatcatat gtttatttga gggtgtcttg gatattacaa 300

ataaattgtt ggagcatcag gcatatttgg taattctgtc taaggctccc tgccccttgt 360

taattggcag ctcagttatt catccagggc aaacattctg cttactattc ctgagagctt 420

tcctcatcct ctagattggc aggggaattg cagttgcctg agcagcctcc cctctgccat 480

accaacagag cttcaccatc gaggcttgca gagtggacag gggcctcagg gacccctgat 540

cccagctttc tcattggaca gaaggaggag actggggctg gagagggacc tgggccccca 600

ctaaggccac agcagagcca ggactttagc tgtgctgact gcagcctggc ttgcctccac 660

tgccctcctt tgcctcaaga gcaagggagc ctcagagtgg aggaagcagc ccctggcctt 720

gcctcccacc tcccctcccc tttgctgttt tcctgggaca gtgggagctg gcttagattg 780

ccctggggcc cccaggaccc tggcatttta acccctcagg ggcaggaagg cagcctgaga 840

tacagaagag tccatcacct gctgtatgcc acacaccatc cccacagtcg acatttaaat 900

t 901

<210> 17

<211> 78

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 17

cactccctct ctgcgcgctc gctcgctcac tgaggccggg cgaccaaagg tcgcccacgc 60

ccgggctttg cccgggcg 78

<210> 18

<211> 23

<212> PRT

<213> 人工序列

<220>

<223> 合成构建体

<400> 18

Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp

1 5 10 15

Tyr Lys Asp Asp Asp Asp Lys

20

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号