首页> 中国专利> 减轻FKRP心脏毒性的基因治疗表达系统

减轻FKRP心脏毒性的基因治疗表达系统

摘要

本发明涉及用于全身施用的表达系统,其包含编码FKRP蛋白的序列,和:‑允许在骨骼肌中以治疗上可接受的水平表达FKRP的启动子序列和在心脏中表达的miRNA的靶序列;或,‑允许在骨骼肌中以治疗上可接受的水平表达FKRP并在心脏中以毒性上可接受的水平呈现启动子活性的启动子序列;及其用于治疗与FKRP缺陷相关的各种疾病的用途。

著录项

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2022-05-20

    公开

    国际专利申请公布

说明书

技术领域

本发明基于FKRP(Fukutin相关蛋白)转基因表达的心脏毒性的鉴定。它提供了一种用于减轻心脏中FKRP毒性的表达系统,特别是通过调节,即部分去靶向(detarget)FKRP心脏表达。然后,它为与FKRP缺陷相关的各种疾病(例如肢带型肌营养不良症2I型(LGMD2I)、新命名的肢带型肌营养不良症R9型(LGMD2 R9))的治疗提供了有价值且安全的治疗工具。

背景技术

“肌营养不良蛋白聚糖病(Dystroglycanopathies)”对导致α-肌营养不良蛋白聚糖(α-dystroglycan,αDG)的继发性异常糖基化的不同遗传病理进行了重新组合。这种蛋白质主要存在于骨骼肌、心脏、眼睛和脑组织中,是一种高度糖基化的膜蛋白,糖基化过程将其在肌肉中的重量从70kDa提高到156kDa。它是肌营养不良蛋白-糖蛋白复合物的一部分,将细胞骨架连接到细胞外基质(ECM)。其高糖基化水平使αDG能够直接与一些ECM蛋白(例如心肌和骨骼肌中的层粘连蛋白、神经肌肉接头处的集聚蛋白(agrin)和基底膜蛋白多糖(perlecan)、大脑中的神经粘联分子(neurexin)和视网膜中的皮卡丘素(pikachurin))的层粘连蛋白球状结构域结合。αDG的糖基化是一种尚未完全了解的复杂过程。事实上,许多基因已被鉴定为参与αDG糖基化。由于使用高通量测序方法对显示αDG糖基化缺陷的患者进行突变检测,这些发现最近得到了加速。其中一种蛋白质是Fukutin相关蛋白(FKRP)。它最初被归类为推定的αDG糖基转移酶,因为它的序列中存在许多糖基转移酶共有的DxD基序,以及在FKRP基因突变的患者中存在αDG低糖基化的证据(Breton等人,1999;Brockington等人,2001)。最近,FKRP及其同源物fukutin被鉴定为核糖醇-5-磷酸(Rbo5P)转移酶,形成添加配体结合部分所必需的di-Rbo5P接头(Kanagawa等人,2016)。

从肢带型肌营养不良症2I型(LGMD2I;Muller等人,2005;新名称:肢带型肌营养不良症R9型或LGMD2 R9)、先天性肌营养不良症1C型(MDC1C;Brockington等人,2001)到Walker-Warburg综合征(WWS)和肌肉-眼-脑病(MEB;Beltran-Valero de Bernabe等人,2004),FKRP基因中的突变可以产生由αDG糖基化缺陷导致的全部病理范围。疾病严重程度与患者数量呈负相关,越严重,患者越少(患病率见www.orphanet.fr:WWS(all genes):1-9/1,000,000and LGMD2I:1-9/100,000)。病理类型似乎至少部分与FKRP突变的性质相关。特别是,在蛋白质的276位用异亮氨酸替换亮氨酸的纯合L276I突变总是与LGMD2I相关(Mercuri等人,2003)。LGMD2I是一种隐性常染色体肌营养不良症,虽然不均一,但优先影响肩部和骨盆带的肌肉。它是欧洲最常见的LGMD2之一,特别是由于北欧L276I突变的高患病率(Sveen等人,2006)。病理的严重程度非常不均一。肌肉症状可能出现在1-30岁之间,从杜兴氏样病到相对良性的病程不等。心脏也可能受到严重心力衰竭和死亡等后果的影响(Muller等人,2005)。使用心脏磁共振成像的研究表明,非常高比例的LGMD2I患者(60-80%)会出现心肌功能障碍,例如射血分数降低(Wahbi等人,2008)。有趣的是,心脏异常的严重程度与骨骼肌受累无关。基于7名患者的队列,Rosales等人(2011)得出结论,LGMD2I通常会导致轻微的结构和功能性心脏异常,尽管可能会出现严重的扩张型心肌病(一名患者)。Petri等人(2015)还观察到,在LGMD2患者中,LGMD 2I型患者(n=28)的LVEF(左心室射血分数)从59%(15-72)显著下降至55%(20-61),p=0.03,即每年下降0.4%,并且LVEF≤50%与该亚组中死亡率增加相关。

Gicquel等人(Hum Mol Genet,2017Mar 3.doi:10.1093/hmg/ddx066)报道了FKRP

因此,基于FKRP的基因替代疗法似乎是对FKRP缺陷引起的病理的一种有希望的治疗。然而,仍然需要安全有效的治疗。

关于基因疗法,安全表达系统被定义为确保在靶组织中产生治疗有效量的蛋白质的表达系统,即在需要所述蛋白质以治愈与天然蛋白质缺陷相关的异常的组织中,而没有任何毒性,特别是在基本和重要的器官或组织中。

例如,关于神经肌肉疾病,WO2014/167253报道了编码肌微管素(myotubularin)和钙蛋白酶(calpain)3的表达系统在全身施用时具有心脏毒性,而通过在所述构建体中引入在心脏中表达的miRNA的靶序列或通过使用在心脏中呈现毒性上可接受的水平的启动子活性或甚至没有活性的启动子序列可以减轻所述毒性。

发明内容

本发明旨在通过提供一种确保在靶组织(主要是骨骼组织)中产生治疗有效量的蛋白质并在心脏中产生毒性上可接受的量的蛋白质的表达系统来减轻或治愈与fukutin相关蛋白(FKRP)缺陷相关的破坏性病理,如肢带型肌营养不良症2I型(LGMD2I)。

实际上,发明人已经检测到编码FKRP的表达系统的潜在心脏毒性。这是意料之外的,因为患有与fukutin相关蛋白(FKRP)缺陷相关的病理的患者,例如肢带型肌营养不良症2I型(LGMD2I)也经常表现出心脏异常。因此,根据常识,心脏中持续水平的FKRP表达被认为是有益的,特别是减轻FKRP相关疾病的心脏症状。

值得注意的是,提供了候选基因和相关病理的列表的文件WO2014/167253对FKRP完全没有提及。另一方面,文件WO2016/138387仅提到了FKRP的推定肝毒性以及在表达系统中可能使用mir122靶序列以降低肝脏中的表达。最后,文件WO2019/008157公开了添加miRNA靶序列以抑制组织中的表达的可能性,在这些组织中表达是不希望的,甚至是有毒的,但不鼓励去靶向(detarget)心脏。

除非另有定义,否则本文所用的所有技术和科学术语具有与本领域普通技术人员通常理解的相同含义。描述中使用的术语仅出于描述特定实施方案的目的,并不旨在进行限制。

冠词“一个/一种(a)”和“一个/一种(an)”在本文中用于指代冠词的语法对象中的一个或多于一个(即,至少一个)。举例来说,“一个要素”是指一个要素或多于一个要素。

在提及可测量的值(例如数量、持续时间等)时,本文所用的“约/大约(about)”或“约/大约(approximately)”是指涵盖指定值的±20%或±10%、更优选±5%、甚至更优选±1%、并且还更优选±0.1%的变化,因为这样的变化适合于执行所公开的方法。

范围:在整个本公开中,本发明的各个方面可以以范围格式呈现。应当理解,范围格式的描述仅仅是为了方便和简洁,不应被解释为对本发明范围的不可更改的限制。因此,范围的描述应该被认为已经具体公开了所有可能的子范围以及该范围内的各个数值。例如,对诸如从1到6的范围的描述应该被认为已经具体公开了子范围,例如从1到3、从1到4、从1到5、从2到4、从2到6、从3到6等,以及该范围内的各个数字,例如1、2、2.7、3、4、5、5.3和6。无论范围的广度如何,这都适用。

“分离的”是指从天然状态改变或取出。例如,活体动物中天然存在的核酸或肽不是“分离的”,而从其天然状态的共存材料部分或完全分离的相同核酸或肽是“分离的”。分离的核酸或蛋白质可以以基本上纯化的形式存在,或者可以存在于非天然环境(例如宿主细胞)中。

在本发明的背景中,使用以下常见核酸碱基的缩写。“A”是指腺苷,“C”是指胞嘧啶,“G”是指鸟苷,“T”是指胸苷,“U”是指尿苷。

“编码氨基酸序列的核苷酸序列”包括彼此为简并版本并且编码相同氨基酸序列的所有核苷酸序列。编码蛋白质或RNA或cDNA的短语核苷酸序列也可以包括内含子,以至于编码蛋白质的核苷酸序列在一些版本中可以包含内含子。

“编码”是指多核苷酸(例如基因、cDNA或mRNA)中的特定核苷酸序列用作合成生物过程中的具有限定的核苷酸序列(即rRNA、tRNA和mRNA)或限定的氨基酸序列的其他聚合物和大分子的模板的固有特性以及由此产生的生物学特性。因此,如果基因所对应的mRNA能在细胞或其他生物系统中转录和翻译产生蛋白质,则该基因编码蛋白质。编码链(其核苷酸序列与mRNA序列相同,通常在序列表中提供)和非编码链(用作基因或cDNA转录的模板)都可以称为编码蛋白质或该基因或cDNA的其他产物。

如本文所用的术语“多核苷酸”被定义为核苷酸链。此外,核酸是核苷酸的聚合物。因此,本文所用的核酸和多核苷酸是可互换的。本领域技术人员的常识是,核酸是可以水解成单体“核苷酸”的多核苷酸。单体核苷酸可以水解成核苷。如本文所用,多核苷酸包括但不限于通过本领域可用的任何方法(包括但不限于重组方法,即使用普通克隆技术和PCR等从重组文库或细胞基因组中克隆核酸序列,以及通过合成方法)获得的所有核酸序列。

如本文所用,术语“肽”、“多肽”和“蛋白质”可互换使用,是指由通过肽键共价连接的氨基酸残基组成的化合物。蛋白质或肽必须包含至少两个氨基酸,并且对可以构成蛋白质或肽序列的氨基酸的最大数目没有限制。多肽包括包含通过肽键彼此连接的两个或更多个氨基酸的任何肽或蛋白质。如本文所用,该术语既指短链,其在本领域中也通常称为例如肽、寡肽和寡聚体,也指更长链,其在本领域中通常称为蛋白质,其中有很多类型。“多肽”包括例如生物活性片段、基本上同源的多肽、寡肽、同二聚体、异二聚体、多肽的变体、修饰的多肽、衍生物、类似物、融合蛋白等。多肽包括天然肽、重组肽、合成肽或其组合。

蛋白质可能会被“改变”并包含氨基酸残基的缺失、插入或取代,这种氨基酸残基的缺失、插入或取代产生沉默的变化并导致功能等同。只要保留生物活性,可以基于残基的极性、电荷、溶解性、疏水性、亲水性和/或两亲性质的相似性进行有意的氨基酸取代。例如,带负电荷的氨基酸可以包括天冬氨酸和谷氨酸;带正电荷的氨基酸可以包括赖氨酸和精氨酸;具有相似亲水性值的含有不带电荷的极性头基团的氨基酸可以包括亮氨酸、异亮氨酸和缬氨酸、甘氨酸和丙氨酸、天冬酰胺和谷氨酰胺、丝氨酸和苏氨酸以及苯丙氨酸和酪氨酸。

如本文所用,“变体”是指被一个或多个氨基酸改变的氨基酸序列。变体可以具有“保守”变化,其中取代的氨基酸具有相似的结构或化学性质,例如用异亮氨酸替换亮氨酸。变体也可以具有“非保守”变化,例如用色氨酸替换甘氨酸。类似的微小变化也可以包括氨基酸缺失或插入或两者。可以使用本领域众所周知的计算机程序找到确定哪些氨基酸残基可以被取代、插入或缺失而不消除生物学或免疫学活性的指导。

“同一的”或“同源的”是指两个多肽之间或两个核酸分子之间的序列同一性或序列相似性。当所比较的两个序列的每一个中的一个位置被相同的碱基或氨基酸单体亚基占据时,例如,如果两个DNA分子的每一个中的一个位置被腺嘌呤占据,那么分子在该位置是同源的或同一的。两个序列之间的同源性/同一性百分比是两个序列共有的匹配位置数除以所比较的位置数乘以100的函数。例如,如果两个序列的10个位置中有6个匹配,则两个序列是60%同一的。通常,当比对两个序列时进行比较,以获得最大同源性/同一性。

“载体”是包含分离的核酸并且可用于将分离的核酸递送至细胞内部的物质组合物。许多载体是本领域已知的,包括但不限于线性多核苷酸、与离子或两亲化合物相关的多核苷酸、质粒和病毒。因此,术语“载体”包括自主复制的质粒或病毒。该术语还应当被解释为包括促进核酸转移到细胞中的非质粒和非病毒化合物,例如聚赖氨酸化合物、脂质体等。病毒载体的实例包括但不限于腺病毒载体、腺相关病毒载体、逆转录病毒载体等。

“表达载体”是指包含重组多核苷酸的载体,其包含与待表达的核苷酸序列可操作地连接的表达控制序列。表达载体包含足够的用于表达的顺式作用元件;用于表达的其他元件可以由宿主细胞或在体外表达系统中提供。表达载体包括本领域已知的所有那些,例如掺入重组多核苷酸的粘粒、质粒(例如,裸露的或包含在脂质体中)和病毒(例如,慢病毒、逆转录病毒、腺病毒和腺相关病毒)。

如本文所用的术语“启动子”被定义为由细胞的转录机制或引入的转录机制识别的DNA序列,这对于启动多核苷酸序列的特异性转录是必需的。

如本文所用,术语“启动子/调控序列”是指与启动子/调控序列可操作地连接的基因产物的表达所需的核酸序列。在一些情况下,该序列可以是核心启动子序列,而在其他情况下,该序列还可以包括基因产物的表达所需的增强子序列和其他调控元件。启动子/调控序列可以例如是一种以组织特异性方式表达基因产物的序列。

“组成型”启动子是一种核苷酸序列,当其与编码或指定基因产物的多核苷酸可操作地连接时,导致基因产物在细胞的大部分或所有生理条件下在细胞中产生。

“诱导型”启动子是一种核苷酸序列,当其与编码或指定基因产物的多核苷酸可操作地连接时,基本上仅当细胞中存在与该启动子相对应的诱导物时,才会导致基因产物在该细胞中产生。

“组织特异性”启动子是一种核苷酸序列,当其与编码基因或由基因指定的多核苷酸可操作地连接时,如果细胞是与该启动子相对应的组织类型的细胞,则导致基因产物优先在该细胞中产生。

当在生物体、组织、细胞或其成分的背景中使用时,术语“异常的”是指与那些表现出“正常的”(预期的)各自特征的生物体、组织、细胞或其成分相比,在至少一个可观察或可检测的特征(例如,年龄、治疗、一天中的时间等)上不同的那些生物体、组织、细胞或其成分。一种细胞或组织类型的正常或预期的特征对于不同的细胞或组织类型可能是异常的。

术语“患者”、“受试者”、“个体”等在本文中可互换使用,是指任何动物或其细胞,无论在体外还是在体都适用于本文所述的方法。受试者可以是哺乳动物,例如人、狗,还可以是小鼠、大鼠或非人类灵长类动物。在某些非限制性实施方案中,患者、受试者或个体是人。

“疾病”或“病理”是受试者的这样一种健康状况,其中受试者不能维持体内平衡,并且如果疾病没有得到改善,则受试者的健康继续恶化。相反,受试者的“病症(disorder)”是这样一种健康状况,其中受试者能够维持体内平衡,但受试者的健康状况不如没有病症时那样良好。如果不进行治疗,病症不一定会导致受试者的健康状况进一步下降。

如果疾病或病症的症状的严重程度、患者经历这种症状的频率或两者都降低,则疾病或病症“减轻”或“改善”。这还包括阻止疾病或病症的进展。如果疾病或病症的症状的严重程度、患者经历这种症状的频率或两者都被消除,则疾病或病症被“治愈”。

“治疗性”治疗是对表现出病理体征的受试者施用的治疗,目的是减少或消除这些体征。“预防性”治疗是对未表现出病理体征或尚未诊断出病理的受试者施用的治疗,目的是预防或推迟这些体征的发生。

如本文所用,“治疗疾病或病症”是指降低受试者所经历的疾病或病症的至少一种体征或症状的频率或严重程度。在治疗的背景中,疾病和病症在本文中可互换使用。

化合物的“有效量”是足以为施用化合物的受试者提供有益效果的化合物的量。如本文所用,短语“治疗有效量”是指足以或有效预防或治疗(延迟或预防其发作、阻止其进展、抑制、减少或逆转)疾病或病况(包括减轻此类疾病的症状)的量。递送载体的“有效量”是足以有效结合或递送化合物的量。

附图说明

图1:载体构建体的图:

A/没有miRNA-208a的靶序列的FKRP表达盒(AAV-FKRP);

B/在FKRP基因的3’端包含1个(AAV-FKRP-单个)或2个(AAV-FKRP-串联)miRNA-208a的靶序列(箭头)的FKRP表达盒。

图2:静脉内注射AAV-FKRP载体的大鼠心脏截面:如所示在以3种剂量注射AAV-FKRP(1e12 vg/kg;5e12 vg/kg;7.5e13 vg/kg)和HES染色(顶部,比例尺=50μm)或天狼星红染色(底部)后第15天的心肌组织学分析。

图3:静脉内施用AAV-FKRP载体的小鼠心脏截面:在以剂量1e14 vg/kg注射AAV-FKRP和HPS染色(顶部,比例=200μm)或天狼星红染色(底部)后六周的心肌组织学分析。

图4:注射PBS(缓冲液)、AAV-FKRP、AV-FKRP-单个或AAV-FKRP-串联的大鼠的体重曲线。

图5:注射后2周,大鼠TA(胫骨前肌)肌肉中AAV-FKRP、AAV-FKRP-单个和AAV-FKRP-串联的每个细胞核的载体拷贝数(VCN)。

图6:注射PBS(缓冲液)、AAV-FKRP、AV-FKRP-单个或AAV-FKRP-串联2周后对大鼠心脏中的FKRP mRNA(A)或蛋白质(B)的评估。星号(*)表示统计学差异。

图7:在以剂量7.5e13 vg/kg注射AAV-FKRP、AAV-FKRP-单个或AAV-FKRP-串联(如所示)和HES染色(顶部,比例=50μm)或天狼星红染色(底部)后第15天的大鼠心肌组织学分析)。

图8:在注射PBS(缓冲液)、AAV-FKRP、AV-FKRP-单个或AAV-FKRP-串联2周后,对大鼠TA肌肉中的FKRP mRNA(A)或蛋白质(B)的评估。

图9:注射AV-FKRP-单个或AAV-FKRP-串联的大鼠的体重曲线。

图10:在以剂量7.5e13 vg/kg注射AAV-FKRP-单个和AAV-FKRP-串联和HES染色(顶部,比例=50μm)或天狼星红染色(底部)后11周的大鼠心肌组织学分析。

具体实施方式

本发明基于发明人的发现,即在全身施用后,旨在在骨骼肌中以高水平产生FKRP蛋白的表达系统可同时导致在心脏中的表达具有潜在毒性,从而使所述系统不适合用于治疗用途。

本发明为这个新发现的问题提供了技术解决方案,特别是关于除了FKRP转基因的骨骼肌表达之外的过度心脏渗漏。

因此,一般而言,本发明涉及包含编码FKRP蛋白的序列的表达系统,所述表达系统允许:

-蛋白质在靶组织中(有利地在骨骼肌中)以治疗上可接受的水平表达;和

-蛋白质在所有组织中(特别是在心脏中)以毒性上可接受的水平表达。

在本发明的框架中,表达系统通常被定义为允许体内产生FKRP的多核苷酸。根据一方面,所述系统包含编码FKRP蛋白的核酸以及其表达所需的调控元件(至少包含启动子)。所述表达系统然后可以对应于表达盒。或者,所述表达盒可以由载体或质粒携带。本文中使用的“表达系统”一词覆盖了所有方面。

根据本发明,靶组织被定义为蛋白质将在其中发挥治疗作用的组织或器官,尤其是在编码该蛋白质的天然基因有缺陷的情况下。根据本发明的特定实施方案,靶组织指横纹骨骼肌,以下称为骨骼肌,即运动能力中涉及的所有肌肉和膈肌。其他潜在的靶组织是视网膜和大脑。

如上所述,心脏也会受到与FKRP缺陷相关的各种疾病的影响,因此也是潜在的靶组织。然而,在本申请的框架中,据显示,FKRP在过表达时可显示心脏毒性。因此,关于基因转移,表达系统应该有利于FKRP在心脏中以毒性上可接受的水平而不是以治疗上可接受的水平表达,因为可以使用不同的策略(例如β-阻断剂利尿剂或ACE(血管紧张素转化酶)抑制剂)治疗心脏异常。

如本申请中所证明的,即使FKRP可以在心脏中发挥治疗作用,它的表达水平也应该受到严格调节,因为这种蛋白质在该组织中的过量(尤其是超过内源量的量)可能证明是有害的甚至是致命的,因此是有毒的。

因此,在本发明的背景中,必须保护心脏免受这种潜在毒性的危害。根据特定实施方案,本发明的表达系统确保FKRP在心脏中以毒性上可接受的蛋白质水平表达。

因此,根据特定方面,本发明涉及包含编码FKRP蛋白的序列的表达系统,所述表达系统允许:

-蛋白质在包括骨骼肌和可能的视网膜和大脑在内的靶组织中以治疗上可接受的水平表达;和

-蛋白质在所有组织中(特别是在心脏中)以毒性上可接受的水平表达。

有利地,本发明涉及用于全身施用的表达系统,所述表达系统包含编码FKRP蛋白的序列,其中:

-FKRP在骨骼肌中以治疗上可接受的水平表达;和

-FKRP在心脏中以毒性上可接受的水平表达。

根据第一个特征,本发明的表达系统包含编码FKRP蛋白的序列,所述序列对应于转基因。在本发明的背景中,术语“转基因”是指使用本发明的表达系统反式提供的序列,优选开放阅读框。

根据特定实施方案,该序列是引入表达系统的相同或等同于机体基因组中存在的内源序列的拷贝。

根据另一个特定实施方案,所述内源序列具有一个或多个使蛋白质部分或完全无功能或甚至不存在(缺乏内源蛋白质的表达或活性)或未正确定位在期望的亚细胞区室中的突变。换言之,优选地,本发明的表达系统旨在施用于具有编码蛋白质的序列的缺陷拷贝并具有相关病理的受试者。在该背景中,由本发明的表达系统携带的序列编码的蛋白质因此可以被定义为其突变导致与FKRP缺陷相关的病理的蛋白质。

因此,更一般地,本发明的表达系统携带的序列可以被定义为编码在与FKRP缺陷相关的病理的背景中具有治疗活性的蛋白质。治疗活性的概念结合术语“治疗上可接受的水平”被定义如下。

编码FKRP蛋白的序列(也称为“开放阅读框”的ORF)是核酸序列或多核苷酸,尤其可以是单链或双链DNA(脱氧核糖核酸)、RNA(核糖核酸)或cDNA(互补脱氧核糖核酸)。

有利地,所述序列编码功能性蛋白质,即能够确保其天然或基本功能的蛋白质,尤其是在骨骼肌中。这意味着使用本发明的表达系统产生的蛋白质被适当地表达和定位,并且是有活性的。

根据优选实施方案,所述序列编码天然蛋白质,所述蛋白质优选是人类来源的。它也可以是该蛋白质的衍生物或片段,只要衍生物或片段保留所需的活性。优选地,术语“衍生物”或“片段”是指与人FKRP序列具有至少60%、优选70%、甚至更优选80%或甚至90%、95%或99%同一性的蛋白质序列。例如,来自另一来源(非人类哺乳动物等)的蛋白质或截短的、甚至突变的但有活性的蛋白质也包含在内。因此,在本发明的背景中,术语“蛋白质”被理解为全长蛋白质(无论其来源如何),以及其功能衍生物和片段。

在特定方面,由根据本发明的表达系统治疗的疾病是由至少一种基因中的突变引起的,该突变导致不产生FKRP蛋白或产生完全或部分无功能的蛋白质。根据本发明,表达系统有助于以至少部分地补偿天然蛋白质缺乏的活性形式或量产生该蛋白,或者产生能够补偿天然蛋白质缺乏的另一种蛋白质。因此,表达系统的施用可以在活动性和呼吸方面改善或恢复靶组织(特别是骨骼肌)中的正常表型。

本发明的背景中的目的蛋白质有利地是人类来源的FKRP(SEQ ID NO:5),即使例如可以使用鼠、大鼠或犬的版本(其序列可从数据库中获得)。

根据具体实施方案,FKRP蛋白是由SEQ ID NO:5中所示的序列组成或包含SEQ IDNO:5(对应于495个氨基酸的蛋白质)中所示的序列的蛋白质。根据具体实施方案,FKRP是与由SEQ ID NO:5编码的天然人类FKRP具有相同功能的蛋白质,尤其是使α-肌营养不良蛋白聚糖(αDG)糖基化和/或至少部分减轻一种或多种与FKRP缺陷相关的症状的能力,尤其是如上所述的LGMD2I表型。它可以是其片段和/或衍生物。根据一个实施方案,所述FKRP序列与序列SEQ ID NO:5具有大于或等于60%、70%、80%、90%、95%或甚至99%的同一性。

任何编码这些蛋白质、其功能性治疗衍生物或片段的序列都可以作为本发明的表达系统的一部分来实施。举例来说,对应的核苷酸序列(cDNA)是被鉴定为WO2019/008157中的序列SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:NO:7或SEQ ID NO:8的序列。

根据具体实施方案,编码FKRP的序列包含序列SEQ ID NO:1、SEQ ID NO:3或SEQID NO:4的核苷酸1659至3146或由序列SEQ ID NO:1、SEQ ID NO:3或SEQ ID NO:4的核苷酸1659至3146组成。

以已知方式的FKRP基因突变可以产生由αDG糖基化缺陷引起的全部病理范围,从肢带型肌营养不良症2I型(LGMD2I;Muller等人,2005)、先天性肌营养不良症1C型(MDC1C;Brockington等人,2001)到Walker-Warburg综合征(WWS)和肌肉-眼-脑病(MEB;Beltran-Valero de Bernabe等人,2004)。因此,根据用于替换或转移基因的策略,反式提供编码治疗性FKRP的序列(其例如是天然的)有助于治疗所述病理。

本发明涉及FKRP,其突变导致一种或多种靶组织(尤其是骨骼肌)中的疾病,并且从表达系统产生的FKRP在至少一种组织(尤其是心脏)中表现出毒性。

根据本发明,有利地,表达系统必须允许FKRP蛋白在骨骼肌中以治疗上可接受的水平表达。

此外,根据另一个优选实施方案,它必须允许FKRP蛋白在心脏中以毒性上可接受的水平表达。

在本发明的背景中,术语“蛋白质表达”可以理解为“蛋白质产生”。因此,表达系统必须允许蛋白质以上述水平进行转录和翻译。同样重要的是所述蛋白质的正确折叠和定位。

在本发明的背景中定义的水平,即“治疗上可接受的”和“毒性上可接受的”,与蛋白质的量及其活性有关。

可以通过使用针对所述蛋白质的抗体进行免疫检测(例如通过蛋白质印迹或ELISA,或通过质谱法)对给定组织中产生的蛋白质的量进行评估。或者,可以对相应的信使RNA进行定量,例如通过PCR或RT-PCR。这种定量可以在一种组织样本或几种样本上进行。因此,在靶组织是骨骼肌的情况下,它可以在一种肌肉类型或几种肌肉类型(例如四头肌、膈肌、胫骨前肌、三头肌等)上进行。

在本发明的背景中,术语“治疗上可接受的水平”是指由本发明的表达系统产生的蛋白质有助于改善患者的病理状况(特别是在生活质量或寿命方面)的事实。因此,与影响骨骼肌的疾病有关,这涉及改善受疾病影响的受试者的肌肉状况或恢复与健康受试者相似的肌肉表型。如上所述,主要由肌肉的力量、大小、组织学和功能限定的肌肉状态可以通过以下方法之一进行评估:活检,测量肌肉的力量、肌张力、体积或活动性,临床检查,医学影像学,生物标志物等。

因此,有助于评估关于骨骼肌的治疗益处并且可以在治疗后的不同时间进行评估的标准特别是以下中的至少一种:

-增加的预期寿命;

-增加的肌肉力量;

-改善的组织学;和/或

-改善的膈肌功能。

在本发明的背景中,术语“毒性上可接受的水平”是指由本发明的表达系统产生的蛋白质不会引起组织的显著改变(特别是在组织学、生理学和/或功能上)的事实。特别是,蛋白质的表达可能不是致命的。在一个特定实施方案中,在所述组织中产生的蛋白质的量必须不超过该组织中所述蛋白质的内源水平,特别是与健康受试者相比。可以从组织学、生理学和功能上评估组织中的毒性。

在心脏的特定情况下,蛋白质的任何毒性都可以通过形态学和心脏功能的研究、临床检查、电生理学、影像学、生物标志物、预期寿命监测或组织学分析来评估,包括检测纤维化和/或细胞浸润和/或炎症,例如通过用天狼星红或苏木精(例如苏木精-伊红-藏红花(HES)或苏木精-根皮红(Phloxin)-藏红花(HFS))染色。

有利地,根据本发明的表达系统的功效和/或毒性水平在动物体内进行评估,可能在具有编码蛋白质的基因的缺陷拷贝并因此受到相关病理影响的动物中进行评估。优选地,表达系统被全身施用,例如通过静脉内(i.v.)注射。

根据本发明,优选地,表达系统包含至少一个序列,其允许:

-阻止蛋白质在蛋白质表达具有毒性的组织中(特别是在心脏中)的表达或降低其表达水平;和/或

-维持蛋白质在靶组织中(特别是在骨骼肌中,并且可能在视网膜和/或大脑中)的表达或提高其表达水平。

根据特定实施方案,本发明涉及一种表达系统,其中它包含至少一个序列:

-阻止FKRP在心脏中的表达或降低其表达水平;和/或

-维持FKRP在骨骼肌中的表达或提高其表达水平。

在本发明的背景中,术语“阻止表达”优选是指甚至在没有所述序列的情况下没有表达的情况,而术语“降低表达水平”是指通过提供所述序列来降低(或减少)表达的情况。

类似地,术语“维持表达”优选是指甚至在没有所述序列的情况下存在相当的表达水平的情况,而术语“提高表达水平”是指通过提供所述序列来提高表达的情况。

在本发明的背景中,存在至少三种可以组合的方式来实现期望的目标:

-使用能够阻止蛋白质在蛋白质表达具有毒性的组织中的表达或降低其表达水平而不降低在靶组织中的表达水平的序列;

-使用能够确保在靶组织中的高表达水平并在蛋白质表达出现毒性的组织中低表达或不表达的启动子序列;

-使用具有合适趋向性的载体(优选病毒载体),即对靶组织的趋向性高于对蛋白质表达出现毒性的组织的趋向性。

根据一个方面,本发明涉及一种用于全身施用的表达系统,其包含编码FKRP蛋白的序列,和:

-允许在骨骼肌中以治疗上可接受的水平表达FKRP的启动子序列和在心脏中表达的miRNA的靶序列;或

-允许在骨骼肌中以治疗上可接受的水平表达FKRP并在心脏中以毒性上可接受的水平呈现启动子活性的启动子序列。

适当地,本发明的表达系统包含控制编码蛋白质的序列的转录的启动子序列,优选位于转基因的5’并且与其功能性连接。优选地,这确保了骨骼肌中的治疗上可接受的水平的蛋白质表达。

这可以包括诱导型或组成型、天然或合成(人工)启动子。类似地,它们可以是任何来源,包括人类,与转基因具有相同来源或是其他来源。

根据第一个实施方案,启动子序列对应于非选择性启动子,即具有低组织特异性并确保在不同组织中(可能在骨骼肌和心脏中)的广泛相似的表达水平的启动子。以下可以作为实例被引用:巨细胞病毒(CMV)、磷酸甘油酸激酶1(PGK)、EF1或CMV早期增强子/鸡β-肌动蛋白(CAG)启动子。

根据特定实施方案,这是指适合骨骼肌表达但可以在其他组织中,特别在其他肌肉中(例如在心脏中)引起表达的启动子序列。这样的启动子被认为是肌肉特异性的,但它们不是肌肉专有的。以下可以作为实例被引用:来自结蛋白启动子的启动子序列(优选为序列SEQ ID NO:6)、骨骼α-肌动蛋白启动子(ACTA1)、肌肉肌酸激酶(MCK)启动子或肌球蛋白重链启动子及其衍生物(例如CK4和MHCK7启动子)、或C5-12合成启动子。

根据本发明的优选实施方案,出于其在不同组织中的不同启动子活性而选择表达系统的启动子序列。在这种情况下,该序列有助于提高蛋白质在骨骼肌中的表达,同时防止在蛋白质表达具有毒性的组织中(主要在心脏中)的表达。

例如,在靶组织是骨骼肌的情况下,启动子优选是肌肉特异性启动子。根据另一个有利特征,所述启动子在心脏中具有低启动子活性或没有启动子活性,从而使蛋白质在该组织中的表达处于毒性上可接受的水平。更有利地,心脏中的低启动子活性是优选的。

根据特定实施方案,所述启动子序列可以对应于来自钙蛋白酶3基因的启动子的序列,优选为人类来源,甚至更优选为序列SEQ ID NO:7。另一个合适的启动子序列是miRNA206(miR206)的启动子序列,优选为人类来源,更优选为序列SEQ ID NO:8。这2个启动子已在文件WO2014/167253中报道,能够确保钙蛋白酶3在骨骼肌中以治疗上可接受的水平表达,并且所述蛋白质在心脏中以毒性上可接受的水平表达。

根据具体实施方案,本发明因此涉及一种表达系统,其包含编码FKRP蛋白的序列,所述序列置于具有序列SEQ ID NO:7或SEQ ID NO:8的启动子的控制下。衍生自序列SEQ IDNO:7和SEQ ID NO:8或对应于其片段但具有相似的启动子活性(特别是在组织特异性和可选地有效性方面)的启动子序列也被覆盖在本发明内。

可以使用显示上述限定的表达谱的任何启动子,有利地在心脏中非常低但在骨骼肌中足够强或甚至非常强。

候选启动子序列可以来源于已报道的在骨骼肌中具有高活性并且可能具有所需的表达谱的基因,例如:

-γ-肌聚糖基因的启动子;

-骨骼α-肌动蛋白(ACTA1)启动子或其衍生版本;

-肌肉杂合(MH)启动子,如Piekarowicz等人(2017,European Society Of Gene&Cell Therapy conference,poster P096;HUMAN GENE THERAPY 28:A44(2017),DOI:10.1089/hum.2017.29055.abstracts)公开的;

-肌肉肌酸激酶启动子的衍生物,尤其是具有双(dMCK)或三(tMCK)串联MCK增强子的截短的MCK启动子,或CK6和CK8启动子,如Hauser等人(2000,Molecular Therapy,Vol.2,No 1,pages 16-24)和Wang等人(2008,Gene Therapy,Vol.15,pages 1489-99)公开的;

-包含至少一个序列USE(上游增强子)的启动子,例如在肌钙蛋白I启动子序列(Corin等人,1995,Proc.Natl.Acad.Sci.,Vol.92,pages 6185-89)或其100-bp缺失(ΔUSE;Blain等人,2010,Human Gene Therapy,Vol.21,pages 127-34)中鉴定的,可能有3(x3)或4(x4)个拷贝。特别感兴趣的是DeltaUSEx3(DUSEx3)启动子和DeltaUSEx4(DUSEx4)启动子。

其他基因的启动子可以进一步提及:肌钙蛋白、肌原性因子5(Myf5)、肌球蛋白轻链1/3快(MLC1/3f)、肌原性分化1(MyoD1)、肌细胞生成素(Myog)、成对的盒基因7(Pax7)、MEF2。

衍生自所述序列或对应于其片段但具有相似的启动子活性(特别是在组织特异性和可能的有效性方面)的启动子序列也被覆盖在本发明内。优选地,术语“衍生物”或“片段”是指与所述序列具有至少60%、优选70%、甚至更优选80%或甚至90%、95%或99%的同一性的序列。特别感兴趣的是如上文所限定的允许在骨骼肌和心脏中适当表达FKRP的启动子序列。

根据一个实施方案,本发明的表达系统包含:

-编码FKRP蛋白的序列,和

-允许在骨骼肌中以治疗上可接受的水平表达FKRP并且在心脏中以毒性上可接受的水平呈现启动子活性或甚至没有活性的启动子序列,可能是上文列出的这些之一。

如果该启动子序列不允许FKRP蛋白在所有组织中(尤其是在心脏中)以毒性上可接受的水平表达,则它有利地与具有降低FKRP蛋白在所述组织中的表达水平的功能的序列相关联,在所述组织中蛋白质表达是有毒的。

因此,本申请报道了使用结蛋白启动子来表达FKRP导致心脏毒性。相比之下,根据本发明,使用与至少一个miRNA-208a靶序列(优选为序列SEQ ID NO:2)相关联的结蛋白启动子(优选为序列SEQ ID NO:6)允许以下两者:

-骨骼肌中治疗上可接受的水平的蛋白质表达;

-心脏中毒性上可接受的水平的蛋白质表达。

如已经陈述的,所述序列能够阻止FKRP蛋白在蛋白质表达具有毒性的组织中(尤其是在心脏中)的表达或降低其表达水平。该行为可以根据各种机制发生,特别是:

-根据编码蛋白质的序列的转录水平;

-根据由编码蛋白质的序列转录产生的转录物,例如通过它们的降解;

-根据转录物向蛋白质的翻译。

这样的序列优选是例如选自以下组中的小RNA分子的靶标:

-microRNA;

-内源性小干扰RNA或siRNA;

-转移RNA(tRNA)的小片段;

-基因间区域的RNA;

-核糖体RNA(rRNA);

-小核RNA(snRNA);

-小核仁RNA(snoRNA);

-与piwi蛋白相互作用的RNA(piRNA)。

有利地,该序列有助于维持FKRP蛋白在靶组织中(优选在骨骼肌中)的表达,甚至提高其表达水平。

优选地,根据它在蛋白质表达具有毒性的组织中的有效性选择这样的序列。由于该序列的有效性可能因组织而异,因此可能需要组合这些序列中的几个,根据它们在所有已证明毒性的靶组织中的有效性选择。

根据优选实施方案,该序列是microRNA(miRNA)的靶序列。众所周知,这种明智选择的序列有助于特异性抑制选定组织中的基因表达。

因此,根据特定实施方案,本发明的表达系统包含在蛋白质表达具有毒性的组织中(尤其是在心脏中)表达或存在的microRNA(miRNA)的靶序列。适当地,在靶组织(优选骨骼肌)中存在的该miRNA的量少于在其中FKRP有毒的组织中存在的量,或者该miRNA甚至可能不在靶组织中表达。根据特定实施方案,靶标miRNA不在骨骼肌中表达。根据另一个特定实施方案,它在心脏中特异性或甚至排他性地表达。

如本领域技术人员已知的,miRNA的存在或表达水平(特别是在给定组织中)可以通过PCR(优选通过RT-PCR)或通过Northern印迹来评估。

不同的miRNA以及它们的靶序列和它们的组织特异性是本领域技术人员已知的,并且例如在文件WO 2007/000668中进行了描述。在心脏中表达的miRNA是例如miR-1、miR133a、miR-206、miR-499和miR-208a。特别感兴趣的是在心脏中排他性地表达的miRNA,例如序列SEQ ID NO:21的miR208a。

根据特定实施方案,本发明的表达系统包含miRNA-208a(也称为miR208a;SEQ IDNO:21)的靶序列。因此,在本发明的框架内已经表明,使用这种与FKRP相关的靶序列可以解决其心脏毒性问题。优选地,在人、狗和小鼠中相同的该靶序列具有22pb的序列SEQ ID NO:2。当然,任何被miRNA-208a识别的衍生或截短序列都可以作为本发明的一部分来实施。特别地,可以使用与SEQ ID NO:2在一个或几个核苷酸上不同的序列,例如与SEQ ID NO:2具有至少60%、70%、80%、90%或甚至95%的同一性,只要它能够结合miR208a,即它是miR208a的靶序列,考虑优选与其种子序列同源。

如已经陈述的,microRNA的靶序列可以单独使用或与其他序列(有利地microRNA的靶序列,其可以相同或不同)组合使用。这些序列可以串联或在相反方向上使用。关于FKRP,已经建议使用在肝脏中表达的mir122的靶序列。

根据优选实施方案,特别是对于miRNA208a的靶序列,可以实施一个(1)或多个(特别是两个(2)或四个(4))序列。优选地,它们串联使用,也就是说,都在相同方向上。在实施多个靶序列的情况下,它们可以以本领域技术人员已知的方式被随机序列的DNA间隔区分开。

优选地,在miRNA(特别是miR208a)的靶序列的情况下,它位于编码蛋白质的序列的3’,更有利地插入表达系统的3’UTR(“非翻译区”)区域。甚至更优选地,当表达系统在编码蛋白质的cDNA的3’处包含多聚腺苷酸化信号时,该序列被插入在开放阅读框的终止密码子和多聚腺苷酸化信号之间。

在本发明的背景中,已经证明,miRNA-208a的至少一个靶序列适于至少在心脏中获得毒性上可接受的水平的FKRP蛋白。

根据一个实施方案,本发明的表达系统包含:

-编码FKRP蛋白的序列;和

-在心脏中表达的miRNA的靶序列。

此外,优选地,它进一步包含控制FKRP表达的启动子序列。所述启动子优选是允许FKRP在骨骼肌中以治疗上可接受的水平表达的启动子序列,例如结蛋白启动子,优选人结蛋白的启动子(SEQ ID NO:6)。

根据特定实施方案,表达系统包含:

-编码FKRP的序列,置于允许肌肉表达的启动子(例如结蛋白的启动子,优选人结蛋白的启动子,例如为序列SEQ ID NO:6)的控制下;

-在心脏中表达的至少一个miRNA的靶序列,优选miRNA-208a的靶序列,优选靶序列SEQ ID NO:2。

根据具体实施方案,根据本发明的表达系统包含以下或由以下组成:

-SEQ ID NO:3的核苷酸146至3946;或

-SEQ ID NO:4的核苷酸146至3974。

在另一个特定形式的实施方案中,表达系统可以包含:

-编码FKRP的序列,置于启动子的控制下,例如结蛋白的启动子,优选人结蛋白的启动子,例如为序列SEQ ID NO:6,或钙蛋白酶3的启动子,优选人钙蛋白酶3的启动子,例如为序列SEQ ID NO:7,或miRNA206的启动子,优选人miRNA206的启动子,例如为SEQ ID NO:8;

-在心脏中表达的至少一个miRNA的靶序列,优选miRNA-208a的靶序列,例如序列SEQ ID NO:2,可能两个靶序列有利地串联。

因此,上文详述的不同类型的序列可以组合在相同的表达系统中。

根据本发明,表达系统或表达盒包含表达存在的转基因所必需的元件。除了如上文定义以确保和调节转基因表达的那些序列外,这样的系统可以包括其他序列,例如:

-多聚腺苷酸化信号,例如SV40或人血红蛋白的polyA,优选插入编码序列的3’或miRNA的靶序列的3’;

-稳定转录本的序列,例如人血红蛋白的内含子1;

-增强子序列。

可以将根据本发明的表达系统引入细胞、组织或身体中,特别是人类中。以本领域技术人员已知的方式,可以离体或体内进行引入,例如通过转染或转导。根据另一方面,本发明因此包含优选人类来源的细胞或组织,其包含本发明的表达系统。

根据本发明的表达系统(在该情况下是分离的核酸)可以在受试者中施用,即以裸DNA的形式。为了促进这种核酸向细胞中的引入,它可以与不同的化学方法相结合,例如胶体分散系统(大分子复合物、纳米胶囊、微球、珠粒)或基于脂质的系统(水包油乳液、胶束、脂质体)。

或者,根据另一个优选实施方案,本发明的表达系统包含质粒或载体。有利地,这样的载体是病毒载体。通常用于哺乳动物(包括人类)基因治疗的病毒载体是本领域技术人员已知的。这样的病毒载体优选选自以下列表:源自疱疹病毒的载体、杆状病毒载体、慢病毒载体、逆转录病毒载体、腺病毒载体和腺相关病毒载体(AAV)。

根据本发明的具体实施方案,包含表达系统的病毒载体是腺相关病毒(AAV)载体。

腺相关病毒(AAV)载体已成为治疗各种病症的强大的基因递送工具。AAV载体具有许多使其理想地适合基因治疗的特征,包括致病性的缺乏、中等免疫原性以及以稳定和有效的方式转导有丝分裂后的细胞和组织的能力。通过选择AAV血清型、启动子和递送方法的适当组合,可以将AAV载体中包含的特定基因的表达特异性靶向至一种或多种类型的细胞。

在一个实施方案中,编码序列包含在AAV载体中。已知有100多种天然存在的AAV血清型。AAV衣壳中存在许多天然变体,允许鉴定和使用具有特别适合营养不良病理的特性的AAV。可以使用传统的分子生物学技术对AAV病毒进行工程化,从而可以优化这些颗粒以用于核酸序列的细胞特异性递送、最小化免疫原性、调节稳定性和颗粒寿命、有效降解、准确递送至细胞核。

如上所述,AAV载体的使用是DNA外源递送的常见模式,因为它相对无毒,可提供有效的基因转移,并且可以轻松针对特定目的进行优化。在从人类或非人类灵长类动物(NHP)分离并良好表征的AAV血清型中,人类血清型2是第一个被开发为基因转移载体的AAV。目前使用的其他AAV血清型包括AAV1、AAV3、AAV4、AAV5、AAV6、AAV7、AAV8、AAV9、AAVrh10、AAVrh74、AAV11和AAV12。此外,非天然的工程化的变体和嵌合AAV也可以有用。

用于组装成载体的理想AAV片段包括cap蛋白(包括vp1、vp2、vp3和高变区)、rep蛋白(包括rep 78、rep 68、rep 52和rep 40)以及编码这些蛋白质的序列。这些片段可以很容易地用于各种载体系统和宿主细胞。

这样的片段可以单独使用,与其他AAV血清型序列或片段组合使用,或与来自其他AAV或非AAV病毒序列的元件组合使用。如本文所用,人工AAV血清型包括但不限于具有非天然存在的衣壳蛋白的AAV。这样的人工衣壳可以通过任何合适的技术产生,使用所选的AAV序列(例如,vp1衣壳蛋白的片段)与异源序列相结合,所述异源序列可以从所选的不同AAV血清型、相同AAV血清型的非连续部分、非AAV病毒来源或非病毒来源获得。人工AAV血清型可以是但不限于嵌合AAV衣壳、重组AAV衣壳或“人源化”AAV衣壳。因此,示例性AAV或人工AAV包括AAV2/8(US 7,282,199)、AAV2/5(可从美国国立卫生研究院获得)、AAV2/9(WO2005/033321)、AAV2/6(US 6,156,303)、AAVrh10(WO2003/042397)、AAVrh74(WO2003/123503)、AAV9-rh74杂合体或AAV9-rh74-P1杂合体(WO2019/193119)、PCT/EP2020/061380中公开的AAV变体等。在一个实施方案中,可用于本文所述的组合物和方法的载体至少包含编码所选AAV血清型衣壳(例如AAV8衣壳)的序列或其片段。在另一个实施方案中,有用的载体至少包含编码所选AAV血清型rep蛋白(例如AAV8 rep蛋白)的序列或其片段。任选地,这样的载体可以同时包含AAV cap和rep蛋白。在同时提供AAV rep和cap的载体中,AAV rep和AAV cap序列都可以是一种血清型来源,例如,所有AAV8来源。或者,可以使用其中rep序列来自AAV血清型的载体,其不同于提供cap序列的载体。在一个实施方案中,rep和cap序列从不同的来源(例如,不同的载体,或宿主细胞和载体)表达。在另一个实施方案中,这些rep序列在框内融合至不同AAV血清型的cap序列以形成嵌合AAV载体,例如AAV2/8(US 7,282,199)。

根据一个实施方案,组合物包含血清型2、5、8或9的AAV,或AAVrh74。有利地,要求保护的载体是AAV8或AAV9载体,尤其是AAV2/8或AAV2/9载体。更有利地,要求保护的载体是AAV9载体或AAV2/9载体。

在本发明使用的AAV载体中,AAV基因组可以是单链(ss)核酸或双链(ds)/自互补(sc)核酸分子。

有利地,将编码FKRP蛋白的多核苷酸插入AAV载体的ITR(“反向末端重复”)序列之间。典型的ITR序列对应于SEQ ID NO:1的核苷酸1至145(5’ITR序列)和SEQ ID NO:1的核苷酸3913至4057(3’ITR序列)。

重组病毒颗粒可以通过本领域技术人员已知的任何方法获得,例如通过单纯疱疹病毒系统和杆状病毒系统共转染293HEK细胞。载体滴度通常表示为每毫升病毒基因组(vg/mL)。

在一个实施方案中,载体包含调控序列,尤其是启动子序列,有利地如上所述。

其他可能的调控序列的非详尽列表是:

-用于转录稳定的序列,例如血红蛋白(HBB2)的内含子1,例如对应于SEQ ID NO:1的核苷酸1207至1652。如在序列SEQ ID NO:1中所示,所述HBB2内含子有利地随后是在mRNA内的AUG起始密码子之前包括的共有Kozak序列(GCCACC),以改进翻译的起始;

-多聚腺苷酸化信号,例如目的基因的polyA、SV40或β血红蛋白(HBB2)的polyA,有利地位于编码人FKRP的序列的3’。作为优选的实例,HBB2的poly A对应于SEQ ID NO:1的核苷酸3147至3912;

-增强子序列;

-miRNA靶序列,其可以抑制编码人FKRP的序列在非靶组织中的表达,其中所述表达是不期望的,例如在它可能有毒的情况下。作为实例,它可以是miR122的靶序列以避免肝毒性。优选地,相应的miRNA不存在于骨骼肌中。

关于编码序列SEQ ID NO:5和例如与SEQ ID NO:1的核苷酸1659至3146相对应的多核苷酸,本发明的载体可以分别包含SEQ ID NO:1、SEQ ID NO:3和SEQ ID NO:4中所示的序列。

根据优选实施方案,本发明的表达系统包括具有合适趋向性的载体,在这种情况下对靶组织(有利地是骨骼肌)的趋向性比对蛋白质表达出现毒性的组织的趋向性更高。有利地,本发明的表达系统包括对骨骼肌的趋向性高于对心脏的趋向性的载体。它可以是含有衣壳的AAV载体,该衣壳被选择用于最小化或不靶向/转导心脏或优先或甚至排他性地靶向/转导骨骼肌。

本发明的进一步的方面涉及:

-如上所公开的包含本发明的表达系统的细胞或包含所述表达系统的载体。

细胞可以是任何类型的细胞,即原核细胞或真核细胞。细胞可用于载体的增殖或可以进一步引入(例如移植)到宿主或受试者中。可以通过本领域已知的任何方式将表达系统或载体引入细胞中,例如通过转化、电穿孔或转染。也可以使用源自细胞的囊泡。

-如上所公开的包含本发明的表达系统的转基因动物(有利地是非人类)、包含所述表达系统的载体、或包含所述表达系统或所述载体的细胞。

本发明的另一方面涉及包含如上所公开的表达系统、载体或细胞的组合物用作药物。

根据实施方案,组合物至少包含所述基因治疗产物(表达系统、载体或细胞),以及可能的其他专门用于治疗同一种疾病或另一种疾病的活性分子(其他基因治疗产物、化学分子、肽、蛋白质……)。

根据具体实施方案,根据本发明的表达系统的使用与抗炎药或核糖醇的使用相结合。

本发明然后提供包含本发明的表达系统、载体或细胞的药物组合物。这样的组合物包含治疗有效量的治疗剂(本发明的表达系统或载体或细胞)以及药学上可接受的载体。在具体实施方案中,术语“药学上可接受的”是指由联邦或州政府的监管机构批准或在美国或欧洲药典或其他公认的用于动物和人类的药典中列出。术语“载体”是指与治疗剂一起施用的稀释剂、佐剂、赋形剂或载体。这样的药物载体可以是无菌液体,例如水和油,包括石油、动物、植物或合成来源的那些,例如花生油、大豆油、矿物油、芝麻油等。当药物组合物被静脉内施用时,水是优选的载体。盐水溶液和右旋糖和甘油水溶液也可以用作液体载体,特别是用于可注射溶液。合适的药物赋形剂包括淀粉、葡萄糖、乳糖、蔗糖、硬脂酸钠、单硬脂酸甘油酯、滑石粉、氯化钠、脱脂奶粉、甘油、丙二醇、水、乙醇等。

如果需要,组合物还可以含有少量的润湿剂或乳化剂或pH缓冲剂。这些组合物可以采取溶液、悬浮液、乳液、缓释制剂等形式。合适的药物载体的实例在E.W.Martin的“Remington’s Pharmaceutical Sciences”中进行了描述。这样的组合物将包含治疗有效量的治疗剂,优选以纯化形式,以及合适量的载体,以便为受试者提供适当施用的形式。

在优选实施方案中,根据常规程序将组合物配制为适合于向人静脉内施用的药物组合物。通常,用于静脉内施用的组合物是无菌等渗水性缓冲液中的溶液。必要时,组合物还可以包括增溶剂和局部麻醉剂,例如利多卡因,以缓解注射部位的疼痛。

在一个实施方案中,根据本发明的组合物适用于在人类中施用。组合物优选为液体形式,有利地为盐水组合物,更有利地为磷酸盐缓冲盐水(PBS)组合物或Ringer-乳酸溶液。

可以通过标准临床技术确定将有效治疗靶标疾病的本发明治疗剂(即表达系统或载体或细胞)的量。此外,可任选地采用体内和/或体外测定来帮助预测最佳剂量范围。制剂中使用的精确剂量还取决于施用途径、体重以及疾病的严重程度,应根据从业者的判断和每位患者的情况来决定。

合适的施用应该允许将治疗有效量的基因治疗产物递送至靶组织,尤其是骨骼肌和可能的心脏。在本发明的背景中,当基因治疗产物是包含编码人FKRP的多核苷酸的病毒载体时,治疗剂量被定义为向每千克(kg)受试者施用的含有FKRP序列的病毒颗粒的数量(对于病毒基因组是vg)。

可用的施用途径是局部、肠内(全系统作用,但通过胃肠道(GI)递送)或肠胃外(全身作用,但通过胃肠道以外的途径递送)。本文公开的组合物的优选施用途径是肠胃外,包括肌内施用(即进入肌肉)和全身施用(即进入循环系统)。在该背景中,术语“注射”(或“灌注”或“输注”)涵盖血管内,特别是静脉内(IV)、肌内(IM)、眼内、鞘内或脑内施用。通常使用注射器或导管进行注射。

在一个实施方案中,组合物的全身递送包括在局部治疗部位附近施用组合物,即在虚弱的肌肉附近的静脉或动脉中。在某些实施方案中,本发明包括组合物的局部递送,其产生全身作用。这种施用途径(通常称为“局部(限于局部)输注”、“通过孤立(isolated)肢体灌注施用”或“高压经静脉肢体灌注”)已成功用作肌营养不良症的基因递送方法。

根据一方面,通过输注或灌注将组合物施用于孤立肢体(限于局部)。换言之,本发明包括在压力下通过血管内施用途径(即静脉(经静脉)或动脉)在腿和/或手臂中局部递送组合物。这通常通过使用止血带暂时阻止血液循环同时允许注入产物的局部扩散来实现,例如Toromanoff等人(2008)披露的。

在一个实施方案中,将组合物注射到受试者的肢体中。当受试者是人时,肢体可以是手臂或腿。根据一个实施方案,组合物在受试者身体的下部(例如膝盖以下)或在受试者身体的上部(例如肘部以下)施用。

根据本发明的优选施用方法是全身施用。全身注射开辟了注射整个身体以到达受试者身体的整个肌肉(包括心脏和膈肌)以及然后真正治疗这些全身性的且仍然无法治愈的疾病的途径。在某些实施方案中,全身递送包括将组合物递送至受试者,使得组合物可遍及受试者的身体。

根据优选实施方案,全身施用通过在血管中注射组合物(即血管内(静脉内或动脉内)施用)进行。根据一个实施方案,组合物通过外周静脉通过静脉注射施用。

全身施用通常在以下条件下进行:

-1至10mL/min之间的流速,有利地1至5mL/min之间的流速,例如3mL/min;

-总注射量可以在1至20mL之间变化,优选为每kg受试者5mL的载体制剂。注射量不应超过总血量的10%,优选约为6%。

当全身递送时,组合物优选以小于或等于10

在具体实施方案中,治疗包括组合物的单次施用。

“肌营养不良蛋白聚糖病”是指与α-肌营养不良蛋白聚糖(αDG)的异常糖基化有关的疾病或病理。该缺陷可能是由FKRP缺陷引起的。根据具体实施方案,病理选自由以下组成的组:肢带型肌营养不良症2I型或R9型(LGMD2I或LGMD2 R9)、先天性肌营养不良症1C型(MDC1C)、Walker-Warburg综合征(WWS)和肌肉-眼-脑病(MEB),有利地是LGMD2I。

可以从本发明的组合物受益的受试者包括所有被诊断患有此类疾病或有发展此类疾病的风险的患者。然后可以通过本领域技术人员已知的任何方法(包括例如FKRP基因测序)基于FKRP基因中的突变或缺失的鉴定,和/或通过本领域技术人员已知的任何方法评估FKRP表达水平或活性,来选择待治疗的受试者。因此,所述受试者包括已经表现出这种疾病的症状的受试者和有患上所述疾病的风险的受试者。在一个实施方案中,所述受试者包括已经表现出此类疾病的症状的受试者和有发展此类疾病的风险的受试者。在另一个实施方案中,所述受试者是能走动的患者和早期不能走动的患者。

此类组合物尤其旨在用于基因治疗,特别是用于治疗肢带型肌营养不良症2I型(LGMD2I)、先天性肌营养不良症1C型(MDC1C)、Walker-Warburg综合征(WWS)和肌肉-眼-脑病(MEB),有利地是LGMD2I。

根据一个实施方案,本发明涉及治疗肌营养不良蛋白聚糖病的方法,包括向受试者施用如上所述的基因治疗产物(表达系统、载体或细胞)。

有利地,肌营养不良蛋白聚糖病是与α-肌营养不良蛋白聚糖(αDG)的异常糖基化和/或FKRP缺陷相关的病理。更有利地,病理是肢带型肌营养不良症2I型(LGMD2I)、先天性肌营养不良症1C型(MDC1C)、Walker-Warburg综合征(WWS)或肌肉-眼-脑病(MEB)。

在另外的方面,本发明提供了增加细胞中α-肌营养不良蛋白聚糖(αDG)的糖基化的方法,包括将本发明的表达系统或载体递送至所述细胞,其中FKRP多核苷酸在所述细胞中表达,从而产生FKRP并增加αDG的糖基化。

有利地,表达系统在体内全身施用,特别是在动物中,有利地在哺乳动物中并且更优选在人类中。

除非另有说明,本发明的实践采用分子生物学(包括重组技术)、微生物学、细胞生物学、生物化学和免疫学的常规技术,这些技术完全在本领域技术人员的视界内。此类技术在文献中得到了充分解释,例如“Molecular Cloning:A Laboratory Manual”,fourthedition(Sambrook,2012);“Oligonucleotide Synthesis”(Gait,1984);“Culture ofAnimal Cells”(Freshney,2010);“Methods in Enzymology”“Handbook of ExperimentalImmunology”(Weir,1997);“Gene Transfer Vectors for Mammalian Cells”(Miller andCalos,1987);“Short Protocols in Molecular Biology”(Ausubel,2002);“PolymeraseChain Reaction:Principles,Applications and Troubleshooting”,(Babar,2011);“Current Protocols in Immunology”(Coligan,2002)。这些技术适用于本发明的多核苷酸和多肽的生产,因此可以在制备和实践本发明时被考虑。用于特定实施方案的特别有用的技术将在以下部分中讨论。

本文引用的每篇专利、专利申请和出版物的公开内容均通过引用整体并入本文。

在没有进一步描述的情况下,相信本领域的普通技术人员可以使用前面的描述和下面的说明性实施例来制备和利用本发明的化合物并实施要求保护的方法。

实验性实施例

参考下面的实验性实施例和附图对本发明作进一步详细描述。提供这些实施例仅用于说明目的,并不旨在进行限制。

在申请中,本发明关于AAV9载体进行了说明,该AAV9载体包含置于结蛋白启动子控制下的编码FKRP的序列和一个或两个miR208a的靶序列。

1)重组AAV载体的产生:

载体AAV-FKRP中包含的表达盒(SEQ ID NO:1;参见图1A)对应于WO2019/008157中公开的序列SEQ ID NO:11的核苷酸496至4550。22pb的miRNA-208a的靶序列(SEQ ID NO:2)(分别为1或2个序列),每个由DNA间隔区隔开,已被添加到FKRP cDNA的3’UTR区域。相应的表达盒(图1B)分别具有序列SEQ ID NO:3和SEQ ID NO:4,分别产生载体AAV-FKRP-单个和AAV-FKRP-串联。

详细地,SEQ ID NO:1的表达盒包含:

-对应于SEQ ID NO:1的核苷酸1至145的5’ITR序列;随后是

-对应于SEQ ID NO:1的核苷酸146至1206的人结蛋白启动子(SEQ ID NO:6);随后是

-对应于SEQ ID NO:1的核苷酸1207至1652的HBB2内含子;随后是之前插入的共有Kozak序列(GCCACC)

-对应于SEQ ID NO:1的核苷酸1659至3146的编码人FKRP的多核苷酸(SEQ ID NO:5);随后是

-对应于SEQ ID NO:1的核苷酸3147至3912的HBB2 polyA序列;随后是

-对应于SEQ ID NO:1的核苷酸3913至4057的3’ITR序列。

详细地,SEQ ID NO:3的表达盒包含:

-对应于SEQ ID NO:3的核苷酸1至145的5’ITR序列;随后是

-对应于SEQ ID NO:3的核苷酸146至1206的人结蛋白启动子(SEQ ID NO:6);随后是

-对应于SEQ ID NO:3的核苷酸1207至1652的HBB2内含子;随后是之前插入的共有Kozak序列(GCCACC)

-对应于SEQ ID NO:3的核苷酸1659至3146的编码人FKRP的多核苷酸(SEQ ID NO:5);随后是

-对应于SEQ ID NO:3的核苷酸3153至3174的miR208a的靶序列(SEQ ID NO:2);随后是

-对应于SEQ ID NO:3的核苷酸3181至3946的HBB2 polyA序列;随后是

-对应于SEQ ID NO:3的核苷酸3947至4091的3’ITR序列。

详细地,SEQ ID NO:4的表达盒包含:

-对应于SEQ ID NO:4的核苷酸1至145的5’ITR序列;随后是

-对应于SEQ ID NO:4的核苷酸146至1206的人结蛋白启动子(SEQ ID NO:6);随后是

-对应于SEQ ID NO:4的核苷酸1207至1652的HBB2内含子;随后是之前插入的共有Kozak序列(GCCACC)

-对应于SEQ ID NO:4的核苷酸1659至3146的编码人FKRP的多核苷酸(SEQ ID NO:5);随后是

-对应于SEQ ID NO:4的核苷酸3153至3174和核苷酸3181至3202的两个串联的miR208a的靶序列(SEQ ID NO:2);随后是

-对应于SEQ ID NO:4的核苷酸3209至3974的HBB2 polyA序列;其次是

-对应于SEQ ID NO:4的核苷酸3975至4119的3’ITR序列。

使用如前所述的三质粒转染方案(Bartoli等人,2006),通过将AAV2-ITR重组基因组包装在AAV9衣壳中来产生无腺病毒的rAAV2/9病毒制剂。简而言之,将HEK293细胞与pAAV-h结蛋白-hFKRP、RepCap质粒(pAAV2.9,Dr J.Wilson,UPenn)和腺病毒辅助质粒(pXX6;Apparailly等人,2005)以1:1:2的比例共转染。在转染后60小时收获粗病毒裂解物,并通过冻融循环进行裂解。通过两轮CsCl超速离心随后透析来纯化病毒裂解物。使用AAV载体基因组中包含的FKRP编码序列特异性的引物和探针,通过TaqMan实时PCR分析对病毒基因组进行定量。用于扩增的引物对和TaqMan探针是:

FKRPopt正向:GCCCTTCTACCCCAGGAATG(SEQ ID NO:9)

FKRPopt反向:AAACTTCAGCTCCAGGAACCTC(SEQ ID NO:10);和

FKRPopt探针:TGCCCTTTGCTGGCTTTGTGGCCCAGGC(SEQ ID NO:11)。

载体滴度以每毫升病毒基因组(vg/ml)表示。

2)体内实验:

根据法国和欧洲有关动物试验的立法对大鼠和小鼠进行处理。在这项研究中,使用10-12周龄的Sprague-Dawley雄性大鼠和4周龄的雄性FKRP缺陷小鼠(Gicquel等人,P094,Conférence European Society Of Gene&Cell Therapy 2017,doi:10.1089/hum.2017.29055.abstracts)。

按照所示剂量,将重组载体注射到如所示的大鼠和小鼠的尾静脉中。施用等体积的盐水缓冲液(PBS)作为对照。定期监测临床状态和动物体重。在指定时间处死动物(大鼠为2周或11周;小鼠为6周)。

3)蛋白质印迹:

心脏和肌肉组织在补充有不含EDTA的完全蛋白酶抑制剂混合物(Roche,

使用预制的聚丙烯酰胺凝胶(4-15%,BioRad,Hercules,CA,USA)分离蛋白质,然后将蛋白质转移到硝酸纤维素膜上。

先前已经描述了针对FKRP的兔多克隆抗体(Gicquel等人,2017)。用针对FKRP(1:100)和GAPDH(Santa Cruz Biotechnologies,Dallas,TX,USA,1:5000)的抗体在室温下探测(probed)硝酸纤维素膜2小时以进行标准化。

最后,将膜与

4)PCR:

通过对包含在载体基因组中的HBB2 polyA序列进行定量RT-PCR,对TA肌肉中的载体拷贝数(VCN)进行定量,并使用肌联蛋白基因(TTN)进行标准化。

HBB2pA正向:CTTGACTCCACTCAGTTCTCTTGCT(SEQ ID NO:12);

HBB2pA反向:CCAGGCGAGGAGAAACCA(SEQ ID NO:13);和

HBB2pA探针:CTCGCCGTAAAACATGGAAGGAACACTTC(SEQ ID NO:14)。

TTN正向:GTCCCCTGCGTATCTGCTATG(SEQ ID NO:15);

TTN反向:CGCTCGTTTTCAATACTACCTCTCT(SEQ ID NO:16);和

TTN探针:TCCGCAGCTCTAGTGGAAGAACCACC(SEQ ID NO:17)。

使用TriZOL方法从TA肌肉和心脏中提取FKRP mRNA,然后使用在密码子优化的FKRP序列上设计的寡核苷酸和探针通过定量RT-PCR进行定量,并通过P0基因的表达进行标准化。

P0正向:CTCCAAGCAGATGCAGCAGA(SEQ ID NO:18);

P0反向:ATAGCCTTGCGCATCATGGT(SEQ ID NO:19);和

P0探针:CCGTGGTGCTGATGGGCAAGAA(SEQ ID NO:20)。

FKRPopt正向(SEQ ID NO:9)、FKRPopt反向(SEQ ID NO:10)和FKRPopt探针(SEQID NO:11)如上所述。

5)组织学:

使用标准方案用苏木精-伊红-藏红花(HES)、天狼星红或苏木精-根皮红-藏红花(HFS)对心肌的截面冷冻切片(8μm厚)进行染色。

切片用PERTEX介质(Leica)固定。使用Axio Scan Z1幻灯片扫描仪(Zeiss)捕获数字图像。

在5只10-12周龄的雄性大鼠(Sprague-Dawley)中以以下3种不同剂量进行了AAV-FKRP(图1A;含有SEQ ID NO:1)的全身施用:1

施用AAV-FKRP后大鼠心脏组织学显示心脏损伤:如图2所示,大鼠在以7.5

由于小鼠是唯一开发了FKRP缺陷动物模型的哺乳动物物种,因此是唯一可以探索表达系统的治疗效果的物种,还研究了该模型中AAV-FKRP载体的潜在心脏毒性。

在6只4周龄的雄性FKRP缺陷小鼠中以以下4种剂量进行了AAV-FKRP的全身施用:5

即使是最高剂量(1

然而,AAV-FKRP施用后小鼠心脏组织学揭示了心脏损伤:如图3所示,在以剂量1

总体而言,所展示的数据揭示了AAV-FKRP的心脏毒性作用,这在2个物种(大鼠和小鼠)中得到证实,这是完全出乎意料的。

作为预防FKRP心脏毒性的概念证明,在AAV-FKRP载体中引入了心脏特异性micro-RNA的靶序列(即miR-208a的靶序列)的一个或两个拷贝。如此获得的载体(图1B)被命名为AAV-FKRP-单个(包含一个miR-208a的靶序列并含有SEQ ID NO:3)和AAV-FKRP-串联(包含相同方向的两个miR-208a的靶序列并含有SEQ ID NO:4)。

根据之前的数据,选择大鼠模型进行进一步的实验,因为该动物模型以快速和明确的方式揭示了心脏毒性,尤其是在剂量7.5

在5只10-12周龄的雄性大鼠(Sprague-Dawley)中以7.5

a)存活和体重随访:

存活数据如下表所示:

数据显示,唯一的死亡发生在施用AAV-FKRP的队列中,可能是因为该构建体的心脏毒性。

此外,图4显示注射AAV-FKRP的大鼠不随时间增加体重,而注射AAV-FKRP-单个或注射AAV-FKRP-串联的大鼠随时间增加体重。

作为结论,在2周后,看起来施用AAV-FKRP-单个或AAV-FKRP-串联的大鼠比施用AAV-FKRP的大鼠更健康。

b)TA肌肉中的载体拷贝数定量:

使用肌联蛋白基因(TTN)对图5中显示的基于每个载体基因组中包含的HBB2polyA序列的定量的数据进一步标准化,揭示了骨骼肌组织(即TA肌肉)与3个载体的相似感染水平。

重要的是,这证实了miR208a的靶序列的引入对肌肉中载体转移的效率没有任何负面影响,其中所述蛋白质应该以治疗水平产生以治愈与FKRP缺陷相关的肌肉异常。

c)基因转移后心脏中的FKRP表达:

如图6所示,在mRNA水平(A)以及蛋白质水平(B)上,与AAV-FKRP相比,使用构建体AAV-FKRP-单个和AAV-FKRP-串联观察到FKRP转基因表达显著降低。

值得注意的是,一个miR208a的靶序列足以观察到这种降低。

d)基因转移后的心脏损伤:

图7中显示的数据揭示了,与AAV-FKRP相比,构建体AAV-FKRP-单个和AAV-FKRP-串联的心脏损伤大大降低。换言之,当心脏中FKRP转基因表达降低时(即使通过足够的micro-RNA进行调控),毒性作用就会消失。

e)基因转移后骨骼肌中的FKRP表达:

如图8所示,与TA肌肉有关,在mRNA水平(A)以及蛋白质水平(B)上,与AAV-FKRP相比,构建体AAV-FKRP-单个和AAV-FKRP-串联没有观察到FKRP转基因表达的降低。

这证实了使用miR208a可以特异性地去靶向(detarget)心脏。重要的是,引入miR208a的靶序列不会对骨骼肌中FKRP表达的效率产生任何负面影响,其中所述蛋白质应以治疗水平产生以治愈与其缺陷相关的肌肉异常。

已在大鼠上进行了与上述报道相同的实验,但在注射后11周进行。

a)存活和体重随访:

注意,在施用AAV-FKRP后2周处死时,有1只大鼠死亡,而所有大鼠都有严重的心脏损伤。相反,所有注射AAV-FKRP-单个或AAV-FKRP-串联的大鼠在施用后甚至存活11周。

此外,图9显示注射AAV-FKRP-单个或AAV-FKRP-串联的大鼠体重确实随时间增加。

作为结论,11周后,看起来所有施用AAV-FKRP-单个或AAV-FKRP-串联的大鼠都处于良好状态。

b)基因转移后的心脏损伤:

此外,图10证实即使在11周后,也没有观察到心脏损伤。

总之,载体AAV-FKRP-单个和AAV-FKRP-串联不显示任何心脏毒性。

Apparailly,F.,Khoury,M.,Vervoordeldonk,M.J.,Adriaansen,J.,Gicquel,E.,Perez,N.,Riviere,C.,Louis-Plence,P.,Noel,D.,Danos,O.et al.(2005)Adeno-associated virus pseudotype 5vector improves gene transfer in arthriticjoints.Hum.Gene Ther.,16,426-434.

Bartoli,M.,Poupiot,J.,Goyenvalle,A.,Perez,N.,Garcia,L.,Danos,O.andRichard,I.(2006)Noninvasive monitoring of therapeutic gene transfer in animalmodels of muscular dystrophies.Gene Ther.,13,20-28.

Beltran-Valero de Bernabe,D.,Voit,T.,Longman,C.,Steinbrecher,A.,Straub,V.,Yuva,Y.,Herrmann,R.,Sperner,J.,Korenke,C.,Diesen,C.et al.(2004)Mutations in the FKRP gene can cause muscle-eye-brain disease and Walker-Warburg syndrome.J.Med.Genet.,41,e61.

Breton,C.and Imberty,A.(1999)Structure/function studies of glycosyltransferases.Curr.Opin.Struct.Biol.,9,563-571.

Brockington,M.,Blake,D.J.,Prandini,P.,Brown,S.C.,Torelli,S.,Benson,M.A.,Ponting,C.P.,Estournet,B.,Romero,N.B.,Mercuri,E.et al.(2001)Mutations inthe fukutin-related protein gene(FKRP)cause a form of congenital musculardystrophy with secondary laminin alpha2 deficiency and abnormal glycosylationof alpha-dystroglycan.Am.J.Hum.Genet.,69,1198-1209.

Gicquel et al.(2017)Hum Mol Genet,doi:10.1093/hmg/ddx066.

Kanagawa,M.,Kobayashi,K.,Tajiri,M.,Manya,H.,Kuga,A.,Yamaguchi,Y.,Akasaka-Manya,K.,Furukawa,J.I.,Mizuno,M.,Kawakami,H.et al.(2016)Identification of a Post-translational Modification with Ribitol-Phosphateand Its Defect in Muscular Dystrophy.Cell reports,in press.

Mercuri,E.,Brockington,M.,Straub,V.,Quijano-Roy,S.,Yuva,Y.,Herrmann,R.,Brown,S.C.,Torelli,S.,Dubowitz,V.,Blake,D.J.et al.(2003)Phenotypicspectrum associated with mutations in the fukutin-related proteingene.Ann.Neurol.,53,537-542.

Muller,T.,Krasnianski,M.,Witthaut,R.,Deschauer,M.and Zierz,S.(2005)Dilated cardiomyopathy may be an early sign of the C826A Fukutin-relatedprotein mutation.Neuromuscul.Disord.,15,372-376.

Petri et al.(2015),International Journal of Cardiology,182(2015)403–411.

Rosales et al.(2011),Journal of Cardiovascular Magnetic Resonance,13:39.

Sveen,M.L.,Schwartz,M.and Vissing,J.(2006)High prevalence andphenotype-genotype correlations of limb girdle muscular dystrophy type 2I inDenmark.Ann.Neurol.,59,808-815.

Toromanoff et al.(2008),Molecular Therapy 16(7):1291-99.

Wahbi,K.,Meune,C.,Hamouda el,H.,Stojkovic,T.,Laforet,P.,Becane,H.M.,Eymard,B.and Duboc,D.(2008)Cardiac assessment of limb-girdle musculardystrophy 2I patients:an echography,Holter ECG and magnetic resonance imagingstudy.Neuromuscul.Disord.,18,650-655.

序列表

<110> 吉尼松公司

埃夫里-瓦尔德艾松大学

国家健康与医学研究院

<120> 减轻FKRP心脏毒性的基因治疗表达系统

<130> G143-B-57711 PCT

<150> EP19306134.8

<151> 2019-09-19

<160> 21

<170> BiSSAP 1.3.6

<210> 1

<211> 4057

<212> DNA

<213> 人工序列

<220>

<223> K7 AAV-FKRP

<400> 1

ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60

cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagggagtg 120

gccaactcca tcactagggg ttccttaccc cctgcccccc acagctcctc tcctgtgcct 180

tgtttcccag ccatgcgttc tcctctataa atacccgctc tggtatttgg ggttggcagc 240

tgttgctgcc agggagatgg ttgggttgac atgcggctcc tgacaaaaca caaacccctg 300

gtgtgtgtgg gcgtgggtgg tgtgagtagg gggatgaatc agggaggggg cgggggaccc 360

agggggcagg agccacacaa agtctgtgcg ggggtgggag cgcacatagc aattggaaac 420

tgaaagctta tcagaccctt tctggaaatc agcccactgt ttataaactt gaggccccac 480

cctcgacagt accggggagg aagagggcct gcactagtcc agagggaaac tgaggctcag 540

ggctagctcg cccatagaca tacatggcag gcaggctttg gccaggatcc ctccgcctgc 600

caggcgtctc cctgccctcc cttcctgcct agagaccccc accctcaagc ctggctggtc 660

tttgcctgag acccaaacct cttcgacttc aagagaatat ttaggaacaa ggtggtttag 720

ggcctttcct gggaacaggc cttgaccctt taagaaatga cccaaagtct ctccttgacc 780

aaaaagggga ccctcaaact aaagggaagc ctctcttctg ctgtctcccc tgaccccact 840

cccccccacc ccaggacgag gagataacca gggctgaaag aggcccgcct gggggctgca 900

gacatgcttg ctgcctgccc tggcgaagga ttggcaggct tgcccgtcac aggacccccg 960

ctggctgact caggggcgca ggcctcttgc gggggagctg gcctccccgc ccccacggcc 1020

acgggccgcc ctttcctggc aggacagcgg gatcttgcag ctgtcagggg aggggaggcg 1080

ggggctgatg tcaggaggga tacaaatagt gccgacggct gggggccctg tctcccctcg 1140

ccgcatccac tctccggccg gccgcctgcc cgccgcctcc tccgtgcgcc cgccagcctc 1200

gcccgcgtac acatattgac caaatcaggg taattttgca tttgtaattt taaaaaatgc 1260

tttcttcttt taatatactt ttttgtttat cttatttcta atactttccc taatctcttt 1320

ctttcagggc aataatgata caatgtatca tgcctctttg caccattcta aagaataaca 1380

gtgataattt ctgggttaag gcaatagcaa tatttctgca tataaatatt tctgcatata 1440

aattgtaact gatgtaagag gtttcatatt gctaatagca gctacaatcc agctaccatt 1500

ctgcttttat tttttggttg ggataaggct ggattattct gagtccaagc taggcccttt 1560

tgctaatctt gttcatacct cttatcttcc tcccacagct cctgggcaac gtgctggtct 1620

ctgtgctggc ccatcacttt ggcaaagaat tcgccaccat gagactgacc aggtgccagg 1680

ctgccctggc tgctgccatc accctgaacc tgctggtgct gttctatgtg agctggctgc 1740

agcaccagcc caggaacagc agggccaggg gccccaggag ggcctctgct gctggcccca 1800

gggtgacagt gctggtgagg gagtttgagg cctttgacaa tgctgtgcct gagctggtgg 1860

acagcttcct gcagcaggac cctgcccagc ctgtggtggt ggctgctgat accctgccct 1920

acccccccct ggccctgccc aggatcccca atgtgaggct ggccctgctg cagcctgccc 1980

tggacaggcc tgctgctgcc agcaggcctg agacctatgt ggccacagag tttgtggccc 2040

tggtgcctga tggggccagg gctgaggccc ctggcctgct ggagaggatg gtggaggccc 2100

tgagggctgg ctctgccagg ctggtggctg cccctgtggc cacagccaac cctgccaggt 2160

gcctggccct gaatgtgagc ctgagagagt ggacagccag gtatggggct gcccctgctg 2220

cccccaggtg tgatgccctg gatggagatg ctgtggtgct gctgagggcc agggacctgt 2280

tcaacctgtc tgcccccctg gccaggcctg tggggaccag cctgtttctg cagacagccc 2340

tgaggggctg ggctgtgcag ctgctggacc tgacctttgc tgctgccagg cagccccccc 2400

tggctacagc ccacgccagg tggaaggctg agagggaggg cagggccagg agggctgccc 2460

tgctgagggc cctggggatc aggctggtga gctgggaggg gggcaggctg gagtggtttg 2520

gctgcaacaa ggagacaacc aggtgctttg ggacagtggt gggggatacc cctgcctacc 2580

tgtatgagga gaggtggacc cccccctgct gcctgagggc cctgagggag acagccaggt 2640

atgtggtggg ggtgctggag gctgctgggg tgaggtactg gctggagggg ggcagcctgc 2700

tgggggctgc caggcacggg gacattatcc cctgggacta tgatgtggac ctgggcatct 2760

acctggagga tgtgggcaac tgtgagcagc tgaggggggc tgaggctggc tctgtggtgg 2820

atgagagggg ctttgtgtgg gagaaggctg tggaggggga ctttttcagg gtgcagtact 2880

ctgagagcaa ccacctgcac gtggacctgt ggcccttcta ccccaggaat ggggtgatga 2940

ccaaggacac ctggctggac cacaggcagg atgtggagtt ccctgagcac ttcctgcagc 3000

ccctggtgcc cctgcccttt gctggctttg tggcccaggc ccccaacaac tacaggaggt 3060

tcctggagct gaagtttggc cctggggtga ttgagaaccc ccagtacccc aaccctgccc 3120

tgctgagcct gacaggctct ggctgaattc accccaccag tgcaggctgc ctatcagaaa 3180

gtggtggctg gtgtggctaa tgccctggcc cacaagtatc actaagctcg ctttcttgct 3240

gtccaatttc tattaaaggt tcctttgttc cctaagtcca actactaaac tgggggatat 3300

tatgaagggc cttgagcatc tggattctgc ctaataaaaa acatttattt tcattgcaat 3360

gatgtattta aattatttct gaatatttta ctaaaaaggg aatgtgggag gtcagtgcat 3420

ttaaaacata aagaaatgaa gagctagttc aaaccttggg aaaatacact atatcttaaa 3480

ctccatgaaa gaaggtgagg ctgcaaacag ctaatgcaca ttggcaacag ccctgatgcc 3540

tatgccttat tcatccctca gaaaaggatt caagtagagg cttgatttgg aggttaaagt 3600

tttgctatgc tgtattttac attacttatt gttttagctg tcctcatgaa tgtcttttca 3660

ctacccattt gcttatcctg catctctcag ccttgactcc actcagttct cttgcttaga 3720

gataccacct ttcccctgaa gtgttccttc catgttttac ggcgagatgg tttctcctcg 3780

cctggccact cagccttagt tgtctctgtt gtcttataga ggtctacttg aagaaggaaa 3840

aacagggggc atggtttgac tgtcctgtga gcccttcttc cctgcctccc ccactcacag 3900

tgacccggaa tcaggaaccc ctagtgatgg agttggccac tccctctctg cgcgctcgct 3960

cgctcactga ggccgggcga ccaaaggtcg cccgacgccc gggctttgcc cgggcggcct 4020

cagtgagcga gcgagcgcgc agagagggag tggccaa 4057

<210> 2

<211> 22

<212> DNA

<213> 人工序列

<220>

<223> miR208a靶序列

<400> 2

acaagctttt tgctcgtctt at 22

<210> 3

<211> 4091

<212> DNA

<213> 人工序列

<220>

<223> K7 AAV-FKRP-单个

<400> 3

ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60

cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagggagtg 120

gccaactcca tcactagggg ttccttaccc cctgcccccc acagctcctc tcctgtgcct 180

tgtttcccag ccatgcgttc tcctctataa atacccgctc tggtatttgg ggttggcagc 240

tgttgctgcc agggagatgg ttgggttgac atgcggctcc tgacaaaaca caaacccctg 300

gtgtgtgtgg gcgtgggtgg tgtgagtagg gggatgaatc agggaggggg cgggggaccc 360

agggggcagg agccacacaa agtctgtgcg ggggtgggag cgcacatagc aattggaaac 420

tgaaagctta tcagaccctt tctggaaatc agcccactgt ttataaactt gaggccccac 480

cctcgacagt accggggagg aagagggcct gcactagtcc agagggaaac tgaggctcag 540

ggctagctcg cccatagaca tacatggcag gcaggctttg gccaggatcc ctccgcctgc 600

caggcgtctc cctgccctcc cttcctgcct agagaccccc accctcaagc ctggctggtc 660

tttgcctgag acccaaacct cttcgacttc aagagaatat ttaggaacaa ggtggtttag 720

ggcctttcct gggaacaggc cttgaccctt taagaaatga cccaaagtct ctccttgacc 780

aaaaagggga ccctcaaact aaagggaagc ctctcttctg ctgtctcccc tgaccccact 840

cccccccacc ccaggacgag gagataacca gggctgaaag aggcccgcct gggggctgca 900

gacatgcttg ctgcctgccc tggcgaagga ttggcaggct tgcccgtcac aggacccccg 960

ctggctgact caggggcgca ggcctcttgc gggggagctg gcctccccgc ccccacggcc 1020

acgggccgcc ctttcctggc aggacagcgg gatcttgcag ctgtcagggg aggggaggcg 1080

ggggctgatg tcaggaggga tacaaatagt gccgacggct gggggccctg tctcccctcg 1140

ccgcatccac tctccggccg gccgcctgcc cgccgcctcc tccgtgcgcc cgccagcctc 1200

gcccgcgtac acatattgac caaatcaggg taattttgca tttgtaattt taaaaaatgc 1260

tttcttcttt taatatactt ttttgtttat cttatttcta atactttccc taatctcttt 1320

ctttcagggc aataatgata caatgtatca tgcctctttg caccattcta aagaataaca 1380

gtgataattt ctgggttaag gcaatagcaa tatttctgca tataaatatt tctgcatata 1440

aattgtaact gatgtaagag gtttcatatt gctaatagca gctacaatcc agctaccatt 1500

ctgcttttat tttttggttg ggataaggct ggattattct gagtccaagc taggcccttt 1560

tgctaatctt gttcatacct cttatcttcc tcccacagct cctgggcaac gtgctggtct 1620

ctgtgctggc ccatcacttt ggcaaagaat tcgccaccat gagactgacc aggtgccagg 1680

ctgccctggc tgctgccatc accctgaacc tgctggtgct gttctatgtg agctggctgc 1740

agcaccagcc caggaacagc agggccaggg gccccaggag ggcctctgct gctggcccca 1800

gggtgacagt gctggtgagg gagtttgagg cctttgacaa tgctgtgcct gagctggtgg 1860

acagcttcct gcagcaggac cctgcccagc ctgtggtggt ggctgctgat accctgccct 1920

acccccccct ggccctgccc aggatcccca atgtgaggct ggccctgctg cagcctgccc 1980

tggacaggcc tgctgctgcc agcaggcctg agacctatgt ggccacagag tttgtggccc 2040

tggtgcctga tggggccagg gctgaggccc ctggcctgct ggagaggatg gtggaggccc 2100

tgagggctgg ctctgccagg ctggtggctg cccctgtggc cacagccaac cctgccaggt 2160

gcctggccct gaatgtgagc ctgagagagt ggacagccag gtatggggct gcccctgctg 2220

cccccaggtg tgatgccctg gatggagatg ctgtggtgct gctgagggcc agggacctgt 2280

tcaacctgtc tgcccccctg gccaggcctg tggggaccag cctgtttctg cagacagccc 2340

tgaggggctg ggctgtgcag ctgctggacc tgacctttgc tgctgccagg cagccccccc 2400

tggctacagc ccacgccagg tggaaggctg agagggaggg cagggccagg agggctgccc 2460

tgctgagggc cctggggatc aggctggtga gctgggaggg gggcaggctg gagtggtttg 2520

gctgcaacaa ggagacaacc aggtgctttg ggacagtggt gggggatacc cctgcctacc 2580

tgtatgagga gaggtggacc cccccctgct gcctgagggc cctgagggag acagccaggt 2640

atgtggtggg ggtgctggag gctgctgggg tgaggtactg gctggagggg ggcagcctgc 2700

tgggggctgc caggcacggg gacattatcc cctgggacta tgatgtggac ctgggcatct 2760

acctggagga tgtgggcaac tgtgagcagc tgaggggggc tgaggctggc tctgtggtgg 2820

atgagagggg ctttgtgtgg gagaaggctg tggaggggga ctttttcagg gtgcagtact 2880

ctgagagcaa ccacctgcac gtggacctgt ggcccttcta ccccaggaat ggggtgatga 2940

ccaaggacac ctggctggac cacaggcagg atgtggagtt ccctgagcac ttcctgcagc 3000

ccctggtgcc cctgcccttt gctggctttg tggcccaggc ccccaacaac tacaggaggt 3060

tcctggagct gaagtttggc cctggggtga ttgagaaccc ccagtacccc aaccctgccc 3120

tgctgagcct gacaggctct ggctgatcta gaacaagctt tttgctcgtc ttatctcgag 3180

attcacccca ccagtgcagg ctgcctatca gaaagtggtg gctggtgtgg ctaatgccct 3240

ggcccacaag tatcactaag ctcgctttct tgctgtccaa tttctattaa aggttccttt 3300

gttccctaag tccaactact aaactggggg atattatgaa gggccttgag catctggatt 3360

ctgcctaata aaaaacattt attttcattg caatgatgta tttaaattat ttctgaatat 3420

tttactaaaa agggaatgtg ggaggtcagt gcatttaaaa cataaagaaa tgaagagcta 3480

gttcaaacct tgggaaaata cactatatct taaactccat gaaagaaggt gaggctgcaa 3540

acagctaatg cacattggca acagccctga tgcctatgcc ttattcatcc ctcagaaaag 3600

gattcaagta gaggcttgat ttggaggtta aagttttgct atgctgtatt ttacattact 3660

tattgtttta gctgtcctca tgaatgtctt ttcactaccc atttgcttat cctgcatctc 3720

tcagccttga ctccactcag ttctcttgct tagagatacc acctttcccc tgaagtgttc 3780

cttccatgtt ttacggcgag atggtttctc ctcgcctggc cactcagcct tagttgtctc 3840

tgttgtctta tagaggtcta cttgaagaag gaaaaacagg gggcatggtt tgactgtcct 3900

gtgagccctt cttccctgcc tcccccactc acagtgaccc ggaatcagga acccctagtg 3960

atggagttgg ccactccctc tctgcgcgct cgctcgctca ctgaggccgg gcgaccaaag 4020

gtcgcccgac gcccgggctt tgcccgggcg gcctcagtga gcgagcgagc gcgcagagag 4080

ggagtggcca a 4091

<210> 4

<211> 4119

<212> DNA

<213> 人工序列

<220>

<223> K7 AAV-FKRP-串联

<400> 4

ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60

cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagggagtg 120

gccaactcca tcactagggg ttccttaccc cctgcccccc acagctcctc tcctgtgcct 180

tgtttcccag ccatgcgttc tcctctataa atacccgctc tggtatttgg ggttggcagc 240

tgttgctgcc agggagatgg ttgggttgac atgcggctcc tgacaaaaca caaacccctg 300

gtgtgtgtgg gcgtgggtgg tgtgagtagg gggatgaatc agggaggggg cgggggaccc 360

agggggcagg agccacacaa agtctgtgcg ggggtgggag cgcacatagc aattggaaac 420

tgaaagctta tcagaccctt tctggaaatc agcccactgt ttataaactt gaggccccac 480

cctcgacagt accggggagg aagagggcct gcactagtcc agagggaaac tgaggctcag 540

ggctagctcg cccatagaca tacatggcag gcaggctttg gccaggatcc ctccgcctgc 600

caggcgtctc cctgccctcc cttcctgcct agagaccccc accctcaagc ctggctggtc 660

tttgcctgag acccaaacct cttcgacttc aagagaatat ttaggaacaa ggtggtttag 720

ggcctttcct gggaacaggc cttgaccctt taagaaatga cccaaagtct ctccttgacc 780

aaaaagggga ccctcaaact aaagggaagc ctctcttctg ctgtctcccc tgaccccact 840

cccccccacc ccaggacgag gagataacca gggctgaaag aggcccgcct gggggctgca 900

gacatgcttg ctgcctgccc tggcgaagga ttggcaggct tgcccgtcac aggacccccg 960

ctggctgact caggggcgca ggcctcttgc gggggagctg gcctccccgc ccccacggcc 1020

acgggccgcc ctttcctggc aggacagcgg gatcttgcag ctgtcagggg aggggaggcg 1080

ggggctgatg tcaggaggga tacaaatagt gccgacggct gggggccctg tctcccctcg 1140

ccgcatccac tctccggccg gccgcctgcc cgccgcctcc tccgtgcgcc cgccagcctc 1200

gcccgcgtac acatattgac caaatcaggg taattttgca tttgtaattt taaaaaatgc 1260

tttcttcttt taatatactt ttttgtttat cttatttcta atactttccc taatctcttt 1320

ctttcagggc aataatgata caatgtatca tgcctctttg caccattcta aagaataaca 1380

gtgataattt ctgggttaag gcaatagcaa tatttctgca tataaatatt tctgcatata 1440

aattgtaact gatgtaagag gtttcatatt gctaatagca gctacaatcc agctaccatt 1500

ctgcttttat tttttggttg ggataaggct ggattattct gagtccaagc taggcccttt 1560

tgctaatctt gttcatacct cttatcttcc tcccacagct cctgggcaac gtgctggtct 1620

ctgtgctggc ccatcacttt ggcaaagaat tcgccaccat gagactgacc aggtgccagg 1680

ctgccctggc tgctgccatc accctgaacc tgctggtgct gttctatgtg agctggctgc 1740

agcaccagcc caggaacagc agggccaggg gccccaggag ggcctctgct gctggcccca 1800

gggtgacagt gctggtgagg gagtttgagg cctttgacaa tgctgtgcct gagctggtgg 1860

acagcttcct gcagcaggac cctgcccagc ctgtggtggt ggctgctgat accctgccct 1920

acccccccct ggccctgccc aggatcccca atgtgaggct ggccctgctg cagcctgccc 1980

tggacaggcc tgctgctgcc agcaggcctg agacctatgt ggccacagag tttgtggccc 2040

tggtgcctga tggggccagg gctgaggccc ctggcctgct ggagaggatg gtggaggccc 2100

tgagggctgg ctctgccagg ctggtggctg cccctgtggc cacagccaac cctgccaggt 2160

gcctggccct gaatgtgagc ctgagagagt ggacagccag gtatggggct gcccctgctg 2220

cccccaggtg tgatgccctg gatggagatg ctgtggtgct gctgagggcc agggacctgt 2280

tcaacctgtc tgcccccctg gccaggcctg tggggaccag cctgtttctg cagacagccc 2340

tgaggggctg ggctgtgcag ctgctggacc tgacctttgc tgctgccagg cagccccccc 2400

tggctacagc ccacgccagg tggaaggctg agagggaggg cagggccagg agggctgccc 2460

tgctgagggc cctggggatc aggctggtga gctgggaggg gggcaggctg gagtggtttg 2520

gctgcaacaa ggagacaacc aggtgctttg ggacagtggt gggggatacc cctgcctacc 2580

tgtatgagga gaggtggacc cccccctgct gcctgagggc cctgagggag acagccaggt 2640

atgtggtggg ggtgctggag gctgctgggg tgaggtactg gctggagggg ggcagcctgc 2700

tgggggctgc caggcacggg gacattatcc cctgggacta tgatgtggac ctgggcatct 2760

acctggagga tgtgggcaac tgtgagcagc tgaggggggc tgaggctggc tctgtggtgg 2820

atgagagggg ctttgtgtgg gagaaggctg tggaggggga ctttttcagg gtgcagtact 2880

ctgagagcaa ccacctgcac gtggacctgt ggcccttcta ccccaggaat ggggtgatga 2940

ccaaggacac ctggctggac cacaggcagg atgtggagtt ccctgagcac ttcctgcagc 3000

ccctggtgcc cctgcccttt gctggctttg tggcccaggc ccccaacaac tacaggaggt 3060

tcctggagct gaagtttggc cctggggtga ttgagaaccc ccagtacccc aaccctgccc 3120

tgctgagcct gacaggctct ggctgatcta gaacaagctt tttgctcgtc ttatcctagg 3180

acaagctttt tgctcgtctt atctcgagat tcaccccacc agtgcaggct gcctatcaga 3240

aagtggtggc tggtgtggct aatgccctgg cccacaagta tcactaagct cgctttcttg 3300

ctgtccaatt tctattaaag gttcctttgt tccctaagtc caactactaa actgggggat 3360

attatgaagg gccttgagca tctggattct gcctaataaa aaacatttat tttcattgca 3420

atgatgtatt taaattattt ctgaatattt tactaaaaag ggaatgtggg aggtcagtgc 3480

atttaaaaca taaagaaatg aagagctagt tcaaaccttg ggaaaataca ctatatctta 3540

aactccatga aagaaggtga ggctgcaaac agctaatgca cattggcaac agccctgatg 3600

cctatgcctt attcatccct cagaaaagga ttcaagtaga ggcttgattt ggaggttaaa 3660

gttttgctat gctgtatttt acattactta ttgttttagc tgtcctcatg aatgtctttt 3720

cactacccat ttgcttatcc tgcatctctc agccttgact ccactcagtt ctcttgctta 3780

gagataccac ctttcccctg aagtgttcct tccatgtttt acggcgagat ggtttctcct 3840

cgcctggcca ctcagcctta gttgtctctg ttgtcttata gaggtctact tgaagaagga 3900

aaaacagggg gcatggtttg actgtcctgt gagcccttct tccctgcctc ccccactcac 3960

agtgacccgg aatcaggaac ccctagtgat ggagttggcc actccctctc tgcgcgctcg 4020

ctcgctcact gaggccgggc gaccaaaggt cgcccgacgc ccgggctttg cccgggcggc 4080

ctcagtgagc gagcgagcgc gcagagaggg agtggccaa 4119

<210> 5

<211> 495

<212> PRT

<213> 智人

<220>

<223> FKRP

<400> 5

Met Arg Leu Thr Arg Cys Gln Ala Ala Leu Ala Ala Ala Ile Thr Leu

1 5 10 15

Asn Leu Leu Val Leu Phe Tyr Val Ser Trp Leu Gln His Gln Pro Arg

20 25 30

Asn Ser Arg Ala Arg Gly Pro Arg Arg Ala Ser Ala Ala Gly Pro Arg

35 40 45

Val Thr Val Leu Val Arg Glu Phe Glu Ala Phe Asp Asn Ala Val Pro

50 55 60

Glu Leu Val Asp Ser Phe Leu Gln Gln Asp Pro Ala Gln Pro Val Val

65 70 75 80

Val Ala Ala Asp Thr Leu Pro Tyr Pro Pro Leu Ala Leu Pro Arg Ile

85 90 95

Pro Asn Val Arg Leu Ala Leu Leu Gln Pro Ala Leu Asp Arg Pro Ala

100 105 110

Ala Ala Ser Arg Pro Glu Thr Tyr Val Ala Thr Glu Phe Val Ala Leu

115 120 125

Val Pro Asp Gly Ala Arg Ala Glu Ala Pro Gly Leu Leu Glu Arg Met

130 135 140

Val Glu Ala Leu Arg Ala Gly Ser Ala Arg Leu Val Ala Ala Pro Val

145 150 155 160

Ala Thr Ala Asn Pro Ala Arg Cys Leu Ala Leu Asn Val Ser Leu Arg

165 170 175

Glu Trp Thr Ala Arg Tyr Gly Ala Ala Pro Ala Ala Pro Arg Cys Asp

180 185 190

Ala Leu Asp Gly Asp Ala Val Val Leu Leu Arg Ala Arg Asp Leu Phe

195 200 205

Asn Leu Ser Ala Pro Leu Ala Arg Pro Val Gly Thr Ser Leu Phe Leu

210 215 220

Gln Thr Ala Leu Arg Gly Trp Ala Val Gln Leu Leu Asp Leu Thr Phe

225 230 235 240

Ala Ala Ala Arg Gln Pro Pro Leu Ala Thr Ala His Ala Arg Trp Lys

245 250 255

Ala Glu Arg Glu Gly Arg Ala Arg Arg Ala Ala Leu Leu Arg Ala Leu

260 265 270

Gly Ile Arg Leu Val Ser Trp Glu Gly Gly Arg Leu Glu Trp Phe Gly

275 280 285

Cys Asn Lys Glu Thr Thr Arg Cys Phe Gly Thr Val Val Gly Asp Thr

290 295 300

Pro Ala Tyr Leu Tyr Glu Glu Arg Trp Thr Pro Pro Cys Cys Leu Arg

305 310 315 320

Ala Leu Arg Glu Thr Ala Arg Tyr Val Val Gly Val Leu Glu Ala Ala

325 330 335

Gly Val Arg Tyr Trp Leu Glu Gly Gly Ser Leu Leu Gly Ala Ala Arg

340 345 350

His Gly Asp Ile Ile Pro Trp Asp Tyr Asp Val Asp Leu Gly Ile Tyr

355 360 365

Leu Glu Asp Val Gly Asn Cys Glu Gln Leu Arg Gly Ala Glu Ala Gly

370 375 380

Ser Val Val Asp Glu Arg Gly Phe Val Trp Glu Lys Ala Val Glu Gly

385 390 395 400

Asp Phe Phe Arg Val Gln Tyr Ser Glu Ser Asn His Leu His Val Asp

405 410 415

Leu Trp Pro Phe Tyr Pro Arg Asn Gly Val Met Thr Lys Asp Thr Trp

420 425 430

Leu Asp His Arg Gln Asp Val Glu Phe Pro Glu His Phe Leu Gln Pro

435 440 445

Leu Val Pro Leu Pro Phe Ala Gly Phe Val Ala Gln Ala Pro Asn Asn

450 455 460

Tyr Arg Arg Phe Leu Glu Leu Lys Phe Gly Pro Gly Val Ile Glu Asn

465 470 475 480

Pro Gln Tyr Pro Asn Pro Ala Leu Leu Ser Leu Thr Gly Ser Gly

485 490 495

<210> 6

<211> 1061

<212> DNA

<213> 人工序列

<220>

<223> 结蛋白启动子

<400> 6

taccccctgc cccccacagc tcctctcctg tgccttgttt cccagccatg cgttctcctc 60

tataaatacc cgctctggta tttggggttg gcagctgttg ctgccaggga gatggttggg 120

ttgacatgcg gctcctgaca aaacacaaac ccctggtgtg tgtgggcgtg ggtggtgtga 180

gtagggggat gaatcaggga gggggcgggg gacccagggg gcaggagcca cacaaagtct 240

gtgcgggggt gggagcgcac atagcaattg gaaactgaaa gcttatcaga ccctttctgg 300

aaatcagccc actgtttata aacttgaggc cccaccctcg acagtaccgg ggaggaagag 360

ggcctgcact agtccagagg gaaactgagg ctcagggcta gctcgcccat agacatacat 420

ggcaggcagg ctttggccag gatccctccg cctgccaggc gtctccctgc cctcccttcc 480

tgcctagaga cccccaccct caagcctggc tggtctttgc ctgagaccca aacctcttcg 540

acttcaagag aatatttagg aacaaggtgg tttagggcct ttcctgggaa caggccttga 600

ccctttaaga aatgacccaa agtctctcct tgaccaaaaa ggggaccctc aaactaaagg 660

gaagcctctc ttctgctgtc tcccctgacc ccactccccc ccaccccagg acgaggagat 720

aaccagggct gaaagaggcc cgcctggggg ctgcagacat gcttgctgcc tgccctggcg 780

aaggattggc aggcttgccc gtcacaggac ccccgctggc tgactcaggg gcgcaggcct 840

cttgcggggg agctggcctc cccgccccca cggccacggg ccgccctttc ctggcaggac 900

agcgggatct tgcagctgtc aggggagggg aggcgggggc tgatgtcagg agggatacaa 960

atagtgccga cggctggggg ccctgtctcc cctcgccgca tccactctcc ggccggccgc 1020

ctgcccgccg cctcctccgt gcgcccgcca gcctcgcccg c 1061

<210> 7

<211> 1654

<212> DNA

<213> 人工序列

<220>

<223> 钙蛋白酶3启动子

<400> 7

cacatgcctc cactctgcca tacttgaaat gtgctcatct ccttacagcc cagggagcag 60

ctattgtggg tagaagacaa ggtggaggcc aggcaggcac ttcccttccc cagagccact 120

tatgctctca tctaagagcc ctgaaaccag gtgtgacatc ccaggagttg acagacagtc 180

tggttcagta tctaattcca acttctgtct cagatgccta atgtggcatg gctgaatgag 240

tcaacatata acctgtacag taagtcctca cttaacatca ttgataggtg cttgtaaact 300

gtgactttaa cgaaaacata ccgtgtgctg tagggactta actcttgttt atatcagtta 360

gcctggtttc actatacagt acatcatttt gcttaaagtc acagcttacg agaacctatc 420

gatgatgtta agtgaggatt ttctctgctc aggtgcactt tttttttttt tttaagacgg 480

agtctctttc tgtcacctgg gctggagtgc agtggcgcga tctgggttca ctacaacctc 540

tgcctcctgg gttcaagcaa ttcttctgtc tcagcctccc aagtagctgg gattacaggc 600

acccgccgcc acacccggct tatttttgta tttttagtag agacagggtt tcactattgt 660

tggccatgct ggtctcgaac tcctgacctc atgtgatcca cccgcctcgg cctcccaaag 720

tgcagagatt agagacgtga gccacatggc ccagcaggac cactttttag cagattcagt 780

cccagtgttc attttgtgga tggggagaga caagaggtgg caaggtcaag tgtgcaggta 840

gagacaggga ttttctcaaa tgaggactct gctgagtagc attttccatg cagacatttc 900

caatgagcgc tgacccaaga acattctaaa aaagatacca aatctaacat tgaataatgt 960

tctgatatcc taaaatttta ggactaaaaa tcatgttctc taaaattcac agaatatttt 1020

tgtagaattc agtacctccc gttcacccta actagctttt ttgcaatatt gttttccatt 1080

catttgatgg ccagtagttg ggtggtctgt ataactgcct actcaataac atgtcagcag 1140

ttctcagctt ctttccagtg ttcaccttac tcagatactc ccttttcatt ttctggcaac 1200

accagcactt catggcaaca gaaatgtccc tagccaggtt ctctctctac catgcagtct 1260

ctcttgctct catactcaca gtgtttcttc acatctattt ttagttttcc tggctcaagc 1320

atcttcaggc cactgaaaca caaccctcac tctctttctc tctccctctg gcatgcatgc 1380

tgctggtagg agacccccaa gtcaacattg cttcagaaat cctttagcac tcatttctca 1440

ggagaactta tggcttcaga atcacagctc ggtttttaag atggacataa cctgtacgac 1500

cttctgatgg gctttcaact ttgaactgga tgtggacact tttctctcag atgacagaat 1560

tactccaact tcccctttgc agttgcttcc tttccttgaa ggtagctgta tcttattttc 1620

tttaaaaagc tttttcttcc aaagccactt gcca 1654

<210> 8

<211> 805

<212> DNA

<213> 人工序列

<220>

<223> miR206启动子

<400> 8

gggggccaac tcttcctttg gcatatgttt ccccattttc tggcagagaa tcagatacca 60

caaagttcaa aaccccatct ccctccagcc agggtggcca tccagaccct gagtggctca 120

acagctgcca atgtccctca tccttctgag gctcaggcct cacagattgt ggggcaggtg 180

atgggctagg gggagcagaa gcccgacaaa aggatccttc ccacagtgaa caatggtgct 240

tggaatgctg gatgggcagc tgctgcccat caacaagcac ccaaaacaga tagacgtaca 300

gtaggaagta caggagggcc ggtgtgtttc taagcatgag tggctctctg cgtgaatgtg 360

gaaaatttct ctgttggatt ctctcttctt tttaattttc ccttcactgg atcccaaaca 420

ttaaaaaaga atcacattca aaatgcacaa aaacagcagc agtgaattaa ttagtagtaa 480

taacaaagga ctggatagac tgtagctgca caagaataag ccagggaaac gtggtgctgc 540

ttatctgtga acaaacagta ggaaggattt ggtcccaagc agcactgcca ttcctcacaa 600

cagatttatt tcagcatgat ttggtcgggc gggggggatt taggatgagt tgagatccca 660

gtgatcttct cgctaagagt ttcctgcctg ggcaaggagg aaagatgcta caagtggccc 720

acttctgaga tgcgggctgc ttctggatga cactgcttcc cgaggccaca tgcttcttta 780

tatccccata tggattactt tgcta 805

<210> 9

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> FKRPopt正向

<400> 9

gcccttctac cccaggaatg 20

<210> 10

<211> 22

<212> DNA

<213> 人工序列

<220>

<223> FKRPopt反向

<400> 10

aaacttcagc tccaggaacc tc 22

<210> 11

<211> 28

<212> DNA

<213> 人工序列

<220>

<223> FKRPopt探针

<400> 11

tgccctttgc tggctttgtg gcccaggc 28

<210> 12

<211> 25

<212> DNA

<213> 人工序列

<220>

<223> HBB2pA正向

<400> 12

cttgactcca ctcagttctc ttgct 25

<210> 13

<211> 18

<212> DNA

<213> 人工序列

<220>

<223> HBB2pA反向

<400> 13

ccaggcgagg agaaacca 18

<210> 14

<211> 29

<212> DNA

<213> 人工序列

<220>

<223> HBB2pA探针

<400> 14

ctcgccgtaa aacatggaag gaacacttc 29

<210> 15

<211> 21

<212> DNA

<213> 人工序列

<220>

<223> TTN正向

<400> 15

gtcccctgcg tatctgctat g 21

<210> 16

<211> 25

<212> DNA

<213> 人工序列

<220>

<223> TTN反向

<400> 16

cgctcgtttt caatactacc tctct 25

<210> 17

<211> 26

<212> DNA

<213> 人工序列

<220>

<223> TTN探针

<400> 17

tccgcagctc tagtggaaga accacc 26

<210> 18

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> P0正向

<400> 18

ctccaagcag atgcagcaga 20

<210> 19

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> P0反向

<400> 19

atagccttgc gcatcatggt 20

<210> 20

<211> 22

<212> DNA

<213> 人工序列

<220>

<223> P0探针

<400> 20

ccgtggtgct gatgggcaag aa 22

<210> 21

<211> 22

<212> RNA

<213> 人工序列

<220>

<223> miR208a

<400> 21

auaagacgag caaaaagcuu gu 22

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号