首页> 中国专利> 通过基于CRISPR/CAS9的转录激活物获得的骨骼肌成肌细胞祖细胞谱系的特化

通过基于CRISPR/CAS9的转录激活物获得的骨骼肌成肌细胞祖细胞谱系的特化

摘要

本文公开了用于提高Pax7表达的方法和系统,在细胞中激活内源成肌转录因子Pax7的方法,将干细胞分化成骨骼肌祖细胞的方法,以及用于治疗需要再生的肌肉祖细胞的对象的组合物和方法。所述组合物和方法可以包括基于Cas9的转录激活蛋白和至少一种靶向Pax7的指导RNA(gRNA)。

著录项

  • 公开/公告号CN114599403A

    专利类型发明专利

  • 公开/公告日2022-06-07

    原文格式PDF

  • 申请/专利权人 杜克大学;

    申请/专利号CN202080058261.2

  • 发明设计人 查尔斯·A·格斯巴赫;詹妮弗·权;

    申请日2020-08-19

  • 分类号A61K48/00;A61P21/00;C12N15/113;C12N15/85;

  • 代理机构中原信达知识产权代理有限责任公司;

  • 代理人金海霞;刘慧

  • 地址 美国北卡罗来纳州

  • 入库时间 2023-06-19 15:35:18

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2022-06-07

    公开

    国际专利申请公布

说明书

与相关申请的交叉引用

本申请要求2019年8月19日提交的美国临时专利申请号62/888,916和2020年1月31日提交的美国临时专利申请号62/968,743的优先权,每个所述临时申请整体通过参考并入本文。

关于联邦资助研究的陈述

本发明在美国国立卫生研究院(National Institutes of Health)授予的资助号为1DP2-OD008586和1R01DA036865的政府支持下做出。美国政府在本发明中具有一定权利。

技术领域

本公开涉及用于提高Pax7在干细胞中的表达、诱导干细胞分化成骨骼肌祖细胞和使用这些骨骼肌祖细胞再生受损肌肉组织的组合物和方法。

背景技术

人类多能干细胞(hPSC)是一种有希望用于再生医学、疾病建模和肌肉疾病病理学中的药物发现的细胞来源。hPSC向骨骼肌细胞的定向分化可以通过基于小分子的逐步方案或转入基因的异位表达来实现。尽管具有无转入基因的益处,但基于小分子的方案往往相对冗长、低效,并缺少细胞疗法或药物筛选应用所需的可扩展性。基于转入基因的方法依赖于包括Pax3、Pax7和MyoD在内的关键成肌转录因子的过表达。这些方案在产生成肌细胞群体方面非常高效,并且比无转入基因的方法快很多。对成肌细胞疗法来说,卫星细胞例如骨骼肌干细胞群体的产生特别有吸引力。尽管卫星细胞可以在体内有力地再生受损肌肉,但它们不能在不损失其干细胞性的情况下离体分离并扩增,导致植入能力的丧失。因此,已尝试通过与外源Pax7 cDNA过表达配对的各种不同分化方案从hPSC产生有功能的Pax7+卫星细胞。对用于产生成肌细胞群体的可选方法,存在着需求。

发明内容

一方面,本公开涉及一种指导RNA(gRNA)分子,其靶向Pax7或Pax7基因的启动子或调控元件。所述gRNA可以包含对应于SEQ ID NO:1-8或69-76中的任一者或其变体的多核苷酸序列。

另一方面,本公开涉及一种用于提高Pax7表达的DNA靶向系统。所述DNA靶向系统可以包含结合并靶向Pax7基因或其一部分的至少一种gRNA。在某些实施方式中,所述至少一种gRNA包含对应于SEQ ID NO:1-8或69-76中的任一者或其变体的多核苷酸序列。

在某些实施方式中,所述DNA靶向系统还包括簇集规则间隔短回文重复序列相关(Cas)蛋白或融合蛋白,其中所述融合蛋白包含两个异源多肽结构域,其中所述第一多肽结构域包含Cas蛋白、锌指蛋白或TALE蛋白,并且所述第二多肽结构域具有转录激活活性。在某些实施方式中,所述Cas蛋白包含酿脓链球菌(Streptococcus pyogenes)Cas9分子或其变体。在某些实施方式中,所述融合蛋白包含VP64-dCas9-VP64(

本公开的另一方面提供了一种分离的多核苷酸序列,其包含本文所公开的gRNA分子。

本公开的另一方面提供了一种分离的多核苷酸序列,其编码本文所公开的DNA靶向系统。

本公开的另一方面提供了一种载体,其包含本文所公开的分离的多核苷酸序列。

本公开的另一方面提供了一种载体,其编码本文所公开的gRNA分子和簇集规则间隔短回文重复序列相关(Cas)蛋白。

本公开的另一方面提供了一种细胞,其包含本文所公开的gRNA、本文所公开的DNA靶向系统、本文所公开的分离的多核苷酸序列或本文所公开的载体或其组合。

本公开的另一方面提供了一种药物组合物,其包含本文所公开的gRNA、本文所公开的DNA靶向系统、本文所公开的分离的多核苷酸序列、本文所公开的载体或本文所公开的细胞或其组合。

本公开的另一方面提供了一种在细胞中激活内源成肌转录因子Pax7的方法。所述方法包括向所述细胞给药本文所公开的gRNA、本文所公开的DNA靶向系统、本文所公开的分离的多核苷酸序列或本文所公开的载体。

本公开的另一方面提供了一种将干细胞分化成骨骼肌祖细胞的方法。所述方法包括向所述干细胞给药本文所公开的gRNA、本文所公开的DNA靶向系统、本文所公开的分离的多核苷酸序列或本文所公开的载体。

在某些实施方式中,所述骨骼肌祖细胞中Pax7 mRNA的内源表达被提高。在某些实施方式中,所述骨骼肌祖细胞中Myf5、MyoD、MyoG或其组合的表达被提高。在某些实施方式中,所述干细胞被诱导进入成肌分化。在某些实施方式中,所述骨骼肌祖细胞在至少约6次传代后维持Pax7表达。

本公开的另一方面提供了一种治疗需要的对象的方法。所述方法可以包括向所述对象给药本文所公开的细胞。

在某些实施方式中,所述对象中肌营养不良蛋白+纤维的水平被提高。在某些实施方式中,所述对象中的肌肉再生被提高。

本公开还提供了其他方面和实施方式,它们根据下述具体实施方式和附图将变得显而易见。

附图说明

图1A-1G.通过VP64-dCas9-VP64介导的内源PAX7的激活从hPSC产生成肌祖细胞。(图1A)使用PAX7的小分子和慢病毒激活进行的hPSC成肌分化的示意图。(图1B)用于gRNA和可诱导VP64-dCas9-VP64和PAX7 cDNA表达的慢病毒构建物。(图1C)示出了分化的前10天中的形态变化的代表性相差图像。比例尺=200μm。(图1D)在第0天和第2天收获RNA用于中胚层标志物的qRT-PCR分析。结果被表示为相对于第0天的变化倍数(平均值±SEM,n=3个独立平行样)。(图1E)第14天的代表性FACS图,此时分拣VP64-dCas9-VP64-2a-mCherry+细胞用于扩增。(图1F)分拣后第5天PAX7的代表性免疫染色。比例尺=100μm。(图1G)在分拣后扩增阶段中对源自于iPSC分化的纯化的成肌祖细胞的生长进行2周监测。与PAX7 cDNA处理的细胞相比,在VP64-dCas9-VP64处理的细胞中两周内的生长倍数明显更大。P值通过单向ANOVA和随后的Tukey事后检验来确定(平均值±SEM,n=3个独立平行样)。

图2A-2F.通过VP64-dCas9-VP64介导的内源PAX7或外源PAX7cDNA表达的激活从iPSC衍生的成肌祖细胞的表征。(图2A)使用与基因主体中存在的序列互补的引物通过qRT-PCR确定总PAX7mRNA的相对量。(图2B)使用与同工型PAX7-A或PAX7-B的3’UTR中的序列互补的引物检测内源PAX7 mRNA。(图2C)在扩增阶段中成肌标志物MYF5、MYOD和MYOG的mRNA表达水平。(图2D)早期和成熟成肌标志物MYF5、MYOD和MYOG和肌球蛋白重链(MHC)的免疫荧光染色。(图2E)扩增阶段中CD29和CD56表面标志物表达的代表性FACS分析。(图2F)不同处理之间CD56染色强度的平均荧光强度(MFI)。所有P值均通过单向ANOVA和随后的Tukey事后检验来确定(平均值±SEM,n=3个独立平行样)。

图3A-3C.VP64-dCas9-VP64产生的成肌祖细胞在免疫缺陷小鼠中的移植证实了体内再生潜力。(图3A)在将5x10

图4A-4D.在多次传代和dox撤除后内源PAX7表达的诱导得以维持。(图4A)在dox存在下4次传代后分化的iPSC中的PAX7和MHC的代表性免疫染色。比例尺=200μm。(图4B)在通过dox撤除诱导分化7天后PAX7和肌球蛋白重链(MHC)的代表性免疫染色。比例尺=200μm。(图4C)在0次传代后和使用dox的平均4次额外传代后或dox撤除后PAX7+细胞核的定量(平均值±SEM,n=3个独立实验)。(图4D)在dox撤除7天后VP64-dCas9-VP64的FLAG表位的代表性免疫染色。比例尺=100μm。

图5A-5D.VP64-dCas9-VP64导致持续的PAX7表达和靶基因座处稳定的染色质重塑。(图5A)跨越PAX7 TSS区域的人类基因组轨迹描绘了人骨骼肌成肌细胞(HSMM)中H3K4me3和H3K27ac的富集。数据来自于ENCODE(GEO:GSM733637;GEO:GSM733755)。黑色条指示ChIP-qPCR靶区域。(图5B)在增殖条件中,在dox存在下,内源PAX7的靶向激活诱导TSS周围H3K4me3和H3K27ac的显著富集。(图5C)在增殖条件中,在不存在dox的情况下15天后组蛋白标志物的富集得以维持(平均值±SEM,n=3个独立平行样)。(图5D)使用N-端FLAG表位标签来核实在不存在dox的情况下15天后VP64-dCas9-VP64的耗竭并伴有持续的PAX7蛋白表达。

图6A-6E.内源相比于外源PAX7诱导的全局转录变化的鉴定。(图6A)在4个组及其平行样中使用全基因表达谱确定的矩阵中样品间距离的表达热图。(图6B)示出了在过滤掉低读出计数的基因后在所有4个组之间变化最大的200个基因的差异表达的热图。彩色条指示z-分值。(图6C)每个组中相对于仅仅gRNA组过表达的基因的维恩图(变化倍数>2并且padj<0.05)。(图6D)源自于图4C中的维恩图的3个组之间共有的基因的GO生物学过程条目。条目表使用Enrichr产生;P-值使用Fisher精确检验来计算。(图6E)来自于RNA-seq数据的所选成肌前、成肌和卫星细胞标志物基因的表达谱(平均值±SEM,n=3个独立平行样)。TPM:每百万个转录本。

图7A-7C.筛选用于与图1A-1G相关的使用VP64-dCas9-VP64的PAX7激活的gRNA。(图7A)gRNA靶位点相对于人类PAX7基因的基因组浏览器位置。(图7B)将表达VP64-dCas9-VP64的细胞用CHIRON99021处理两天并用靶向PAX7的gRNA脂转染。6天后收获细胞用于qRT-PCR分析。gRNA 3、4、5和8与模拟转染相比显著上调PAX7,但彼此之间没有显著差异。(图7C)将gRNA在表达P64-dCas9-VP64和gRNA的近轴中胚层细胞中慢病毒转导1周。gRNA4的表现显著优于其他gRNA。P-值通过单向ANOVA和随后的Tukey事后检验来确定;p<0.05(平均值±SEM,n=3个独立平行样)。

图8A-8J.通过与图2A-2F和图3A-3C相关的VP64dCas9VP64介导的内源PAX7或外源PAX7 cDNA表达的激活从H9 ESC衍生的成肌祖细胞的表征和移植。(图8A)分拣后第5天PAX7的代表性免疫染色。比例尺=100μm。(图8B)在分拣后扩增阶段中对纯化的成肌祖细胞的生长曲线进行2周的监测。(图8C)使用与基因主体中存在的序列互补的引物通过qRT-PCR确定总PAX7 mRNA的相对量。(图8D)使用与PAX7-A或PAX7-B同工型的3’UTR中的序列互补的引物检测内源PAX7 mRNA。(图8E)扩增阶段中成肌标志物MYF5、MYOD和MYOG的mRNA表达水平。(图8F)扩增阶段中CD29和CD56表面标志物表达的代表性FACS分析。(图8G)不同处理之间CD56染色强度的平均荧光强度(MFI)。(图8H)在dox存在下4次传代后分化的H9 ESC中PAX7和MHC的代表性免疫染色。比例尺=200μm。(图8I)在将5x10

图9A-9E.与图6A-6E相关的RNA-seq分析。(图9A)排名前500的差异表达的基因的多维标度(MDS)。(图9B)示出了在3个表达PAX7的组之间变化最大的50个基因的差异表达的热图。彩色条指示z-分值。(图9C)来自于RNA-seq的对编码PAX7-A的cDNA做出响应过表达的所选基因的表达谱(平均值±SEM,n=3个独立平行样)。(图9D)对应于图4C中的维恩图的在VP64dCas9VP64+gRNA、PAX7-AcDNA或PAX7-B cDNA处理的细胞中特异性富集的基因的GO生物学过程条目。(图9E)已知卫星细胞表面标志物的额外表达谱。

具体实施方式

本文公开了各种不同的DNA靶向系统及其使用方法,并且可以包括例如使用CRISPR/Cas、锌指或TALE的DNA靶向系统。

基因组工程技术的进步已确立II型簇集规则间隔短回文重复序列(CRISPR)/Cas9系统作为一种能够靶向激活或阻遏内源基因的可编程转录调控物。Cas9蛋白的催化残基的突变产生一种无核酸酶活性的Cas9(dCas9),其可以被融合到各种不同的效应物结构域,以在由指导RNA(gRNA)定义的精确基因组位点上发挥其功能。例如,将dCas9融合到反式激活结构域VP64,在gRNA被设计在靶基因启动子处时可以有效地激活处于其天然染色体背景中的基因。与转入基因的异位表达相反,内源基因的激活促进染色质重塑和自主维持的基因网络的诱导。靶向内源基因也可以捕获转录本同工型的全部复杂性、mRNA定位和非编码调控元件的其他效应,这对于适当的细胞重编程可能是至关重要的。在体细胞重编程以及多能干细胞向各种不同细胞类型的定向分化的背景中,细胞重编程可以使用基于CRISPR/Cas9的转录调控物来实现。然而,在本文详述的工作之前,尚未证实使用基于CRISPR/Cas9的转录激活物来分化hPSC可以产生能够在体内移植、植入和组织再生的细胞,或通过内源Pax7基因的激活来产生成肌祖细胞的任何尝试。

工程化改造的基于CRISPR/Cas9的转录激活物可以有效且特异性地激活决定命运的内源基因,以指导多能干细胞的分化。正如本文中详述的,在人类ES和iPS细胞两者中,VP64-dCas9-VP64被用于激活内源成肌转录因子Pax7,以直接重编程人类多能干细胞并指导它们分化成骨骼肌祖细胞。所述有功能的骨骼肌祖细胞可以被诱导以在体外分化,并且在移植到小鼠中时也可以在体内参与受损肌肉的再生。与Pax7 cDNA的外源过表达相比,内源激活导致产生更具增殖性的成肌祖细胞,其可以在无血清条件下在多次传代后维持Pax7表达,同时维持终末成肌分化的能力。与外源Pax7过表达相比,源自于Pax7的内源激活的成肌祖细胞在免疫缺陷小鼠中的移植产生更大数量的人肌营养不良蛋白+肌纤维。本文详述的结果也揭示出通过基于CRISPR的Pax7的内源激活和外源Pax7 cDNA过表达产生的成肌祖细胞之间的功能差异。这些研究证实了基于CRISPR/Cas9的转录激活物用于成肌祖细胞分化的用途及其它们用于细胞疗法和肌肉骨骼再生医学的潜力。这些研究的方法可以利用与Cas蛋白相似的任何DNA结合结构域例如锌指蛋白或TALE蛋白来应用。

本文描述了用于提高Pax7表达的系统,其可以包括Cas9蛋白例如VP64-dCas9-VP64和至少一种靶向Pax7或Pax7基因的启动子或调控元件的指导RNA(gRNA)。本文还提供了激活细胞中的内源成肌转录因子Pax7的方法,将干细胞分化成骨骼肌祖细胞的方法,以及治疗需要的对象的方法。所述方法可以包括向所述细胞或对象给药所述提高Pax7表达的系统,或给药通过所述系统转导或转染的细胞。

1.定义

除非另有定义,否则本文中使用的所有技术和科学术语均具有与本领域普通技术人员通常理解的相同的含义。在有冲突的情况下,以包括定义在内的本文件为准。下文描述优选的方法和材料,尽管与本文中描述的相似或等效的方法和材料也可用于本发明的实践和试验。本文中提到的所有出版物、专利申请、专利和其他参考文献整体通过参考并入本文。本文公开的材料、方法和实例仅仅是说明性的而不打算是限制性的。

当在本文中使用时,术语“包含”、“包括”、“具有”、“可以”、“含有”及其变化形式打算作为开放性过渡短语、术语或词语,其不排除其他行动或结构的可能性。没有具体数目的指称包括复数指称物,除非上下文明确叙述不是如此。本公开还设想了“包含”本文中呈现的实施方式或要素、“由它们组成”和“基本上由它们组成”的其他实施方式,不论是否明确阐述。

对于本文中的数字范围的叙述来说,明确设想了在其间具有相同精度的每个居间数字。例如,对于6-9的范围来说,除了6和9之外还设想了数字7和8,并且对于6.0-7.0的范围来说,明确设想了数字6.0、6.1、6.2、6.3、6.4、6.5、6.6、6.7、6.8、6.9和7.0。

当在本文中使用时,术语“约”或“大约”在应用于一个或多个感兴趣的值时,是指与所陈述的参比值相近的值。在某些情况下,术语“约”是指落于所陈述的参比值在任一方向上(大于或小于)的20%、19%、18%、17%、16%、15%、14%、13%、12%、11%、10%、9%、8%、7%、6%、5%、4%、3%、2%、1%或更小范围之内的值的范围,除非另有陈述或从上下文明确看出不是如此(除了这样的数字将超过可能值的100%的情况之外)。或者,根据本领域中的实践,“约”可以指在3个或超过3个标准偏差以内。或者,例如对于生物学系统或过程来说,术语“约”可以指在值的一个数量级以内,优选地在5倍以内,更优选地在2倍以内。

在本文中可互换使用的“腺相关病毒”或“AAV”是指属于细小病毒科的依赖病毒属的一种感染人类和一些其他灵长类动物的小病毒。目前尚不知道AAV会引起疾病,因此所述病毒引起非常温和的免疫应答。

当在本文中使用时,“氨基酸”是指天然存在的氨基酸和非天然的合成氨基酸,以及以与天然存在的氨基酸相似的方式起作用的氨基酸类似物和氨基酸模拟物。天然存在的氨基酸是由遗传密码编码的氨基酸。氨基酸在本文中可以通过它们通常已知的三字母符号或由IUPAC-IUB生物化学命名委员会推荐的单字母符号指称。氨基酸包括侧链和多肽骨架部分。

当在本文中使用时,“结合区”是指核酸酶靶区域内被所述核酸酶识别并结合的区域。

在本文中可互换使用的“簇集规则间隔短回文重复序列”和“CRISPR”是指含有在大约40%的已测序细菌和90%的已测序古菌的基因组中存在的多个短直接重复序列的基因座。

当在本文中使用时,“编码序列”或“编码核酸”意味着包含编码蛋白质的核苷酸序列的核酸(RNA或DNA分子)。编码序列还可以包括可操作连接到调控元件的起始和终止信号,包括启动子和多聚腺苷化信号,其能够在所述核酸给药到的个体或哺乳动物的细胞中指导表达。编码序列可以是密码子优化的。

当在本文中使用时,“互补体”或“互补的”意味着核酸可以在所述核酸分子的核苷酸或核苷酸类似物之间包含Watson-Crick(例如A-T/U和C-G)或Hoogsteen碱基配对。“互补性”是指两个核酸序列之间享有的性质,使得当它们彼此反平行对齐时,每个位置处的核苷酸碱基将是互补的。

术语“对照”、“参比水平”和“参比”在本文中可互换使用。所述参比水平可以是预定的值或范围,其被用作评估测量结果的基准。当在本文中使用时,“对照组”是指对照对象的组。所述预定水平可以是来自于对照组的截止值。所述预定水平可以是来自于对照组的平均值。截止值(或预定截止值)可以通过自适应指数模型(AIM)方法来确定。截止值(或预定截止值)可以通过来自于患者组的生物样品的对象工作曲线(ROC)分析来确定。正如生物学技术领域中公知的,ROC分析是某种测试区分一种情况与另一种情况、例如确定每种标志物在鉴定CRC患者中的表现的能力的确定。ROC分析的描述提供在P.J.Heagerty等(Biometrics 2000,56,337-44)中,其公开内容整体通过参考并入本文。或者,截止值可以通过患者组的生物学样品的四分位数分析来确定。例如,截止值可以通过选择对应于第25至75百分位数范围之内的任何值的值,优选为对应于第25百分位数、第50百分位数或第75百分位数、更优选为第75百分位数的值来确定。此类统计分析可以使用本领域中已知的任何方法来进行,并且可以通过任何数目的可商购的软件包(例如来自于Analyse-itSoftware Ltd.,Leeds,UK;StataCorp LP,College Station,TX;SAS Institute Inc.,Cary,NC.)来进行。靶或蛋白质活性的健康或正常水平或范围可以根据标准实践来定义。对照可以是不具有本文详述的系统的对象或细胞。对照可以是疾病状态已知的对象或来自于其的样品。所述对象或来自于其的样品可能是健康的、患病的、在治疗前患病的、在治疗期间患病的或在治疗后患病的或其组合。

当在本文中使用时,“融合蛋白”是指通过两个或更多个联结的最初编码独立蛋白质的基因的翻译产生的嵌合蛋白。所述融合基因的翻译产生单一多肽,其具有源自于每个最初的独立蛋白质的功能特性。

当在本文中使用时,“遗传构建物”是指包含编码蛋白的多核苷酸的DNA或RNA分子。所述编码序列包括可操作连接到调控元件的起始和终止信号,包括启动子和多聚腺苷化信号,其能够在所述核酸分子给药到的个体的细胞中指导表达。当在本文中使用时,术语“可表达形式”是指含有可操作连接到编码蛋白的编码序列的必需调控元件的基因构建物,使得当存在于个体的细胞中时,所述编码序列被表达。

当在本文中使用时,“基因组编辑”或“基因编辑”是指改变基因。基因组编辑可以包括校正或恢复突变基因。基因组编辑可以包括敲除基因例如突变基因或正常基因。基因组编辑可用于通过改变感兴趣的基因来治疗疾病或增强肌肉修复。

当在本文中使用时,“同一的”或“同一性”在两个或更多个核酸或多肽序列的情形中意味着所述序列在规定的区域内具有规定百分数的相同残基。所述百分数可以如下计算:将所述两个序列最佳比对,在所述规定区域内比较所述两个序列,确定在两个序列中存在相同残基的位置的数目以得到匹配位置数,将所述匹配位置数除以所述规定区域中的总位置数并将结果乘以100,以得到序列同一性百分数。在所述两个序列具有不同长度或所述比对产生一个或多个交错末端和所述比较的规定区域只包括单个序列的情况下,单个序列的残基包括在所述计算的分母中但不包括在分子中。当比较DNA和RNA时,胸腺嘧啶(T)和尿嘧啶(U)可以被认为是等同的。同一性分析可以人工或通过使用计算机序列算法例如BLAST或BLAST 2.0来进行。

在本文中可互换使用的“突变基因”和“突变的基因”是指已经历可检测突变的基因。突变基因已经历影响基因的正常传递和表达的变化,例如遗传物质的丧失、获得或交换。当在本文中使用时,“破坏的基因”是指具有导致过早终止密码子的突变的突变基因。所述破坏的基因的产物相对于全长未破坏基因的产物被截短。

当在本文中使用时,“正常基因”是指尚未经历变化例如遗传物质的丧失、获得或交换的基因。所述正常基因经历正常的基因传递和基因表达。例如,正常基因可以是野生型基因。

当在本文中使用时,“核酸”或“寡核苷酸”或“多核苷酸”意味着共价连接在一起的至少两个核苷酸。单链的描绘也定义了互补链的序列。因此,多核苷酸也涵盖所描绘的单链的互补链。多核苷酸的许多变体可用于与给定多核苷酸相同的目的。因此,多核苷酸也涵盖基本上同一的多核苷酸及其互补体。单链提供了可以在严紧杂交条件下与靶序列杂交的探针。因此,多核苷酸还涵盖在严紧杂交条件下杂交的探针。多核苷酸可以是单链或双链的,或者可能含有双链和单链序列两者的部分。多核苷酸可以是天然或合成的核酸、DNA、基因组DNA、cDNA、RNA或杂合体,其中所述多核苷酸可以含有脱氧核糖核苷酸和核糖核苷酸的组合以及包括尿嘧啶、腺嘌呤、胸腺嘧啶、胞嘧啶、鸟嘌呤、肌苷、黄嘌呤、次黄嘌呤、异胞嘧啶和异鸟嘌呤在内的碱基的组合。多核苷酸可以通过化学合成方法或通过重组方法来获得。

“开放阅读框”是指始于起始密码子并终于终止密码子的一段密码子。在具有多个外显子的真核基因中,在转录后内含子被去除,然后将外显子联结在一起,得到用于蛋白质翻译的最终mRNA。开放阅读框可以是一段连续的密码子。在某些实施方式中,开放阅读框仅适用于剪接后的mRNA而不适用于基因组DNA,用于蛋白质的表达。

当在本文中使用时,“可操作连接的”意味着基因的表达在空间上与其相连的启动子的控制之下。启动子可能位于在其控制之下的基因的5'(上游)或3'(下游)。启动子与基因之间的距离可以与在所述启动子所源自的基因中所述启动子与其控制的基因之间的距离大致相同。正如本领域中已知的,可以容许这个距离的变动而不丧失启动子功能。

当在本文中使用时,“部分有功能的”描述了由突变基因编码并具有比有功能蛋白质更低但比无功能蛋白质更高的生物学活性的蛋白质。

“肽”或“多肽”是通过肽键相连的两个或更多个氨基酸的连接的序列。多肽可以是天然多肽、合成多肽或天然和合成多肽的修饰或组合。肽和多肽包括蛋白质例如结合蛋白、受体和抗体。术语“多肽”、“蛋白质”和“肽”在本文中可互换使用。“一级结构”是指特定肽的氨基酸序列。“二级结构”是指多肽内局部有序的三维结构。这些结构通常被称为结构域,例如酶结构域、细胞外结构域、跨膜结构域、孔结构域和胞质尾部结构域。“结构域”是多肽的形成所述多肽的紧凑单元的部分,通常为15至350个氨基酸长。示例性结构域包括具有酶活性或配体结合活性的结构域。典型的结构域由组织化较低的区段例如β-折叠和α-螺旋的区段组成。“三级结构”是指多肽单体的完整三维结构。“四级结构”是指由独立的三级单元的非共价缔合形成的三维结构。“基序”是多肽序列的一部分,并包括至少两个氨基酸。基序的长度可以是2至20、2至15或2至10个氨基酸。在某些实施方式中,基序包括3、4、5、6或7个连续氨基酸。结构域可以由一系列相同类型的基序组成。

在本文中可互换使用的“过早终止密码子”或“框外终止密码子”是指DNA序列中的无义突变,其在野生型基因中通常不存在的位置中产生终止密码子。过早终止密码子可以产生与全长版本的蛋白质相比被截短或更短的蛋白质。

当在本文中使用时,“启动子”意味着能够在细胞中赋予、激活或增强核酸表达的合成或天然来源的分子。启动子可以包含一个或多个特定的转录调控序列,以进一步增强表达和/或改变其空间表达和/或时间表达。启动子还可以包含远端增强子或阻遏蛋白元件,它们可以位于距转录起始位点多达数千碱基对处。启动子可以源自于包括病毒、细菌、真菌、植物、昆虫和动物在内的来源。启动子可以组成性地或相对于在其中进行表达的细胞、组织或器官或相对于发生表达的发育阶段或对外部刺激例如生理胁迫、病原体、金属离子或诱导剂做出响应而差异性地调节基因组分的表达。启动子的代表性实例包括噬菌体T7启动子、噬菌体T3启动子、SP6启动子、lac操纵基因-启动子、tac启动子、SV40晚期启动子、SV40早期启动子、RSV-LTR启动子、CMV IE启动子、SV40早期启动子或SV40晚期启动子、人类U6(hU6)启动子和CMV IE启动子。

术语“重组的”当用于指称例如细胞、核酸、蛋白质或载体时,表明所述细胞、核酸、蛋白质或载体已通过引入异源核酸或蛋白质或改变本源核酸或蛋白质进行过修饰,或者所述细胞源自于如此修饰过的细胞。因此,例如,重组细胞表达在所述细胞的本源(天然存在的)形式中不存在的基因,或表达原本正常或异常表达、低表达或完全不表达的本源基因的第二拷贝。

当在本文中使用时,“样品”或“试验样品”可以指要在其中检测或确定靶的存在和/或水平的任何样品,或包含本文中详述的DNA靶向系统或其组分的任何样品。样品可以包括液体、溶液、乳液或悬液。样品可以包括医学样品。样品可以包括任何生物学流体或组织,例如血液、全血、血液级分例如血浆和血清、肌肉、组织间隙液、汗液、唾液、尿液、泪液、滑膜液、骨髓、脑脊液、鼻分泌物、痰液、羊水、支气管肺泡灌洗液、胃灌洗液、呕吐物、粪便、肺组织、外周血单核细胞、总白细胞、淋巴结细胞、脾细胞、扁桃体细胞、癌细胞、肿瘤细胞、胆汁、消化液、皮肤或其组合。在某些实施方式中,样品包含等分试样。在其他实施方式中,样品包含生物学流体。样品可以通过本领域中已知的任何手段来获得。样品可以在从患者获得时直接使用,或者可以进行预处理,例如通过过滤、蒸馏、提取、浓缩、离心、干扰组分的失活、添加试剂等,以便以本文中讨论的或本领域中已知的某种方式改变所述样品的特性。

在本文中可互换使用的“间隔物”和“间隔区”是指TALE或锌指靶区域中位于两个TALE或锌指蛋白的结合区之间但不是所述结合区的一部分的区域。

当在本文中使用时,“对象”或“患者”可以指想要或需要本文中描述的组合物或方法的动物。对象可以是人类或非人类。对象可以是任何脊椎动物。对象可以是哺乳动物。哺乳动物可以是灵长动物或非灵长动物。哺乳动物可以是非灵长动物例如奶牛、猪、骆驼、美洲驼、刺猬、食蚁兽、鸭嘴兽、象、羊驼、马、山羊、兔、绵羊、仓鼠、豚鼠、猫、狗、大鼠和小鼠。哺乳动物可以是灵长动物例如人类。哺乳动物可以是非人类灵长动物例如猴、食蟹猴、恒河猴、黑猩猩、大猩猩、猩猩和长臂猿。对象可以处于任何年龄或发育阶段,例如成人、青少年或婴儿。对象可以是雄性。对象可以是雌性。在某些实施方式中,对象具有特定遗传标志物。对象可能正经历其他形式的治疗。

“基本上同一的”可以指第一和第二氨基酸或多核苷酸序列分别在1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、200、300、400、500、600、700、800、900、1000、1100个氨基酸或核苷酸的区域内至少具有60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%的同一性。

“转录激活因子样效应物”或“TALE”是指识别并结合特定DNA序列的蛋白质结构。“TALE DNA结合结构域”是指包括串联的被称为RVD模块的33-35个氨基酸的重复序列的阵列的DNA结合结构域,每个所述模块特异性识别DNA的单个碱基对。RVD模块可以以任何顺序排列,以组装识别限定序列的阵列。TALE DNA结合结构域的结合特异性由所述RVD阵列和随后的单个20个氨基酸的截短的重复序列决定。“重复序列可变双残基”或“RVD”是指TALEDNA结合结构域的包括33-35个氨基酸的DNA识别基序(也被称为“RVD模块”)内的一对相邻氨基酸残基。所述RVD决定RVD模块的核苷酸特异性。可以将RVD模块组合以产生RVD阵列。当在本文中使用时,“RVD阵列长度”是指RVD模块的数目,其对应于被TALEN识别的TALEN靶区域、即结合区内的核苷酸序列的长度。TALE DNA结合结构域可以具有12至27个RVD模块,每个模块含有一个RVD并识别DNA的单个碱基对。已鉴定到识别四种可能的DNA核苷酸(A、T、C和G)的特异性RVD。由于TALE DNA结合结构域是模块式的,因此可以将识别所述四种不同DNA核苷酸的重复序列连接在一起以识别任何特定DNA序列。然后可以将这些靶向的DNA结合结构域与催化结构域组合以产生有功能的酶,包括人造转录因子、甲基转移酶、整合酶、核酸酶和重组酶。

当在本文中使用时,“靶基因”是指编码已知或假设基因产物的任何核苷酸序列。靶基因可以是参与遗传疾病的突变的基因。在某些实施方式中,所述靶基因是Pax7或Pax7的转录因子或Pax7的调控元件。

当在本文中使用时,“靶区域”是指基于CRISPR/Cas9的基因编辑系统被设计与其结合的靶基因的区域。

当在本文中使用时,“转入基因”是指含有已从一个生物体分离并被引入到不同生物体中的基因序列的基因或遗传物质。这个非本源DNA区段可以在转基因生物体中保留产生RNA或蛋白质的能力,或者它可以改变所述转基因生物体的遗传密码的正常功能。转入基因的引入具有改变生物体的表型的潜力。

“治疗”在指称保护对象对抗疾病时,是指抑制、阻遏、改善或完全消除所述疾病。预防疾病涉及在所述疾病发作之前向对象给药本发明的组合物。抑制疾病涉及在诱导所述疾病之后但在其临床表现出现之前向对象给药本发明的组合物。阻遏或改善疾病涉及在所述疾病临床表现出现之后向对象给药本发明的组合物。

对于多核苷酸来说,本文使用的“变体”意味着(i)参比核苷酸序列的一部分或片段;(ii)参比核苷酸序列或其部分的互补体;(iii)与参比核酸或其互补体基本上同一的核酸;或(iv)在严紧条件下与参比核酸、其互补体或与其基本上同一的序列杂交的核酸。

对于肽或多肽来说,“变体”通过氨基酸的插入、缺失或保守替换而在氨基酸序列上有差异,但保留至少一种生物学活性。变体也可以指具有与参比蛋白质所具有的氨基酸序列基本上同一的氨基酸序列,并保留至少一种生物学活性的蛋白质。“生物学活性”的代表性实例包括被特异性抗体或多肽结合的能力或促进免疫应答的能力。变体可以指其功能性片段。变体也可以指多肽的多个拷贝。所述多个拷贝可以是串联的或者被连接物分开。氨基酸的保守替换,即将氨基酸用性质(例如亲水性、带电荷区域的程度和分布)相近的不同氨基酸代替,在本领域中被认为通常涉及微小改变。这些微小改变可以部分地通过考虑氨基酸的亲水指数来鉴定,正如本领域中所理解的(Kyte等,J.Mol.Biol.1982,157,105-132)。氨基酸的亲水指数基于对其疏水性和电荷的考虑。在本领域中,已知亲水指数相近的氨基酸可以被替换并仍保留蛋白质功能。在一种情况下,具有±2的亲水指数的氨基酸被替换。氨基酸的亲水性也可用于揭示导致蛋白质保留生物学功能的替换。在肽的背景中考虑氨基酸的亲水性允许计算该肽的最大局部平均亲水性。替换可以使用彼此之间亲水性值在±2以内的氨基酸来进行。氨基酸的疏水指数和亲水性值两者均受到该氨基酸的具体侧链的影响。与该观察相一致,与生物学功能相容的氨基酸替换被理解为取决于氨基酸的相对相似性,特别是那些氨基酸的侧链,正如由疏水性、亲水性、电荷、尺寸和其他性质所揭示的。

当在本文中使用时,“载体”意味着含有复制原点的核酸序列。载体可以是病毒载体、噬菌体、细菌人工染色体或酵母人工染色体。载体可以是DNA或RNA载体。载体可以是自身复制的染色体外载体,并且优选为DNA质粒。例如,载体可以编码Cas9蛋白和至少一种gRNA分子。

当在本文中使用时,“锌指”是指一种识别并结合DNA序列的蛋白质。锌指结构域是人类蛋白质组中最常见的DNA结合基序。单个锌指含有大约30个氨基酸,并且所述结构域通常通过每个碱基对与单个氨基酸侧链的相互作用,通过结合DNA的3个连续碱基对来发挥作用。

除非在本文中另有定义,否则与本公开相结合使用的科学和技术术语均应具有本领域普通技术人员通常理解的含义。例如,本文描述的与细胞和组织培养、分子生物学、免疫学、微生物学、遗传学和蛋白质和核酸化学以及杂交相结合使用的任何术语及其技术,在本领域中是公知且常用的。所述术语的含义和范围应该是清晰的;然而,在存在任何潜在歧义的情况下,本文提供的定义优先于任何字典或外来定义。此外,除非上下文另有需要,否则单数术语应包括复数,并且复数术语应包括单数。

2.Pax7

Pax7(配对盒基因7)是一种起到成肌转录因子作用的蛋白质。Pax7可以是神经嵴标志物例如Slug、Sox9、Sox10和HNK-1表达中的因子。Pax7可以在上颌骨的腭突、美克耳氏软骨、中脑、鼻腔、鼻上皮、鼻囊和脑桥中表达。Pax7可以作为与Pax3的异二聚体结合到DNA。Pax7也可以与PAXBP1和/或DAXX相互作用。

Pax7是一种通过调控肌肉前体细胞增殖而在肌生成中发挥作用的转录因子。骨骼肌的生长和再生归因于卫星细胞,它们是位于围绕每个肌纤维的基底膜下方的肌肉干细胞。静止期卫星细胞表达转录因子Pax7,并且在被激活时,静止期卫星细胞可以共表达Pax7和MyoD。随后大多数细胞可以增殖,下调Pax7并分化。相比之下,其他细胞可以维持Pax7的表达但失去MyoD的表达,并返回到类似于静止期的状态。在干细胞中的Pax表达或激活后,所述干细胞可以分化成骨骼肌祖细胞。所述干细胞可以是例如诱导多能干细胞(iPSC)或胚胎干细胞(ESC)。干细胞可以被诱导进入成肌分化。在某些实施方式中,Pax7的表达或激活导致Myf5、MyoD、MyoG或其组合的表达。在某些实施方式中,Pax7的表达或激活导致肌肉再生。在某些实施方式中,Pax7的表达或激活导致肌肉干细胞的增加,这可能对肌营养不良蛋白+纤维有贡献。

3.基于CRISPR/Cas的基因编辑系统

本文提供了用于基因组编辑、基因组改变或改变基因例如编码Pax7的基因的基因表达的遗传构建物。所述遗传构建物包括至少一种靶向基因序列的gRNA。所述公开的gRNA可以被包含在基于CRISPR/Cas9的基因编辑系统中,以靶向Pax7基因或Pax7基因的启动子或调控元件中的区域,导致Pax7的内源表达的激活。

基于CRISPR/Cas的基因编辑系统可能特异性针对Pax7基因或Pax7基因的启动子或调控元件。所述基于CRISPR/Cas的基因编辑系统可以是特异性针对Pax7基因或Pax7基因的启动子或调控元件的基于CRISPR/Cas9的基因编辑系统。在本文中可互换使用的“簇集规则间隔短回文重复序列”和“CRISPR”是指含有在大约40%的被测序细菌和90%的被测序古菌的基因组中存在的多个短直接重复序列的基因座。CRISPR系统是一种微生物的核酸酶系统,参与针对入侵噬菌体和质粒的防御,提供了一种形式的获得性免疫。。微生物宿主中的CRISPR基因座含有CRISPR相关(Cas)基因与能够编程CRISPR介导的核酸切割的特异性的非编码RNA元件的组合。被称为间隔物的短的外来DNA区段被并入到基因组中CRISPR重复序列之间,并充当过去暴露的“记忆”。Cas蛋白例如Cas9蛋白与sgRNA(在本文中也可互换地称为“gRNA”)的3’末端形成复合体,并且所述蛋白质-RNA对通过所述sgRNA序列的5’末端与被称为前间区序列的预定的20bp DNA序列之间的互补碱基配对来识别它的基因组靶。这种复合体通过crRNA内编码的区域即前间区序列和病原体基因组内的前间区序列邻近基序(PAM),被导向病原体DNA的同源基因座。所述非编码CRISPR阵列被转录,并在直接重复序列内被切割成含有单个间隔物序列的短crRNA,其将Cas核酸酶导向靶位点(前间区序列)。通过简单地交换所述表达的sgDNA的20bp识别序列,可以将Cas9核酸酶导向新的基因组靶。CRISPR间隔物以与真核生物体中的RNAi类似的方式被用于识别并沉默外源遗传元件。

已知三种类型的CRISPR系统(I、II和III型效应物系统)。II型效应物系统在4个顺序步骤中进行靶向DNA双链断裂,并使用单个效应物酶例如Cas9来切割dsDNA。与需要多个不同效应物作为复合体起作用的I型和III型效应物系统相比,II型效应物系统可以在可选背景例如真核细胞中起作用。所述II型效应物系统由从含有间隔物的CRISPR基因座转录的长的pre-crRNA、Cas9蛋白和参与pre-crRNA加工的tracrRNA组成。所述tracrRNA杂交到分隔pre-crRNA的间隔物的重复序列区,从而通过内源RNA酶III启动dsRNA切割。这个切割之后是每个间隔物内由Cas9进行的第二个切割事件,产生保持与tracrRNA和Cas9结合的成熟的crRNA,形成Cas9:crRNA-tracrRNA复合体。

所述Cas9:crRNA-tracrRNA复合体解开DNA双链体并搜索与crRNA匹配的序列进行切割。当检测到靶DNA中的“前间区”序列与crRNA中的剩余间隔物序列之间的互补性时,发生靶识别。如果在前间区序列的3’末端处也存在正确的前间区序列邻近基序(PAM),则Cas9介导靶DNA的切割。对于前间区序列靶向来说,在所述序列后必须紧跟前间区序列邻近基序(PAM),这是被DNA切割所需的Cas9核酸酶识别的短序列。不同的II型系统具有不同的PAM要求。酿脓链球菌CRISPR系统可以具有5’-NRG-3’作为这种Cas9(SpCas9)的PAM序列,其中R是A或G,并以这种系统在人类细胞中的特异性为特征。基于CRISPR/Cas9的基因编辑系统的独特能力是能够通过单个Cas9蛋白与两个或更多个sgRNA的共表达直接地同时靶向多个不同基因组基因座。例如,酿脓链球菌II型系统天然偏好使用“NGG”序列,其中“N”可以是任何核苷酸,但是在工程化改造的系统中也接受其他PAM序列例如“NAG”(Hsu等,NatureBiotechnology 2013doi:10.1038/nbt.2647)。同样地,源自于脑膜炎奈瑟氏菌(Neisseriameningitidis)的Cas9(NmCas9)正常情况下具有NNNNGATT的天然PAM,但具有跨多种PAM的活性,包括高度简并的NNNNGNNN PAM(Esvelt等,Nature Methods 2013doi:10.1038/nmeth.2681)。

金黄色葡萄球菌(S.aureus)的Cas9分子识别序列基序NNGRR(R=A或G)(SEQ IDNO:38),并指导靶核酸序列1至10在例如该序列上游3至5bp处的切割。在某些实施方式中,金黄色葡萄球菌的Cas9分子识别序列基序NNGRRN(R=A或G)(SEQ ID NO:39),并指导靶核酸序列1至10在例如该序列上游3至5bp处的切割。在某些实施方式中,金黄色葡萄球菌的Cas9分子识别序列基序NNGRRT(R=A或G)(SEQ ID NO:40),并指导靶核酸序列1至10在例如该序列上游3至5bp处的切割。在某些实施方式中,金黄色葡萄球菌的Cas9分子识别序列基序NNGRRV(R=A或G)(SEQ ID NO:41),并指导靶核酸序列1至10在例如该序列上游3至5bp处的切割。在上述实施方式中,N可以是任何核苷酸残基,例如A、G、C或T中的任一者。Cas9分子可以被工程化改造,以改变所述Cas9分子的PAM特异性。

一种工程化改造形式的酿脓链球菌II型效应物系统显示出在人类细胞中具有基因组工程化改造的功能。在这个系统中,通过一种合成重构的“指导RNA”(“gRNA”,在本文中也可与嵌合单一指导RNA(“sgRNA”)互换使用)将Cas9蛋白导向基因组靶位点,所述指导RNA是crRNA-tracrRNA融合体,免除了一般而言对RNA酶III和crRNA加工的需求。本文中提供了用于基因组编辑和治疗遗传疾病的基于CRISPR/Cas9的工程化改造的系统。所述基于CRISPR/Cas9的工程化改造的系统可以被设计成靶向任何基因,包括参与遗传疾病、衰老、组织再生或伤口愈合的基因。所述基于CRISPR/Cas9的基因编辑系统可以包括Cas9蛋白或Cas9融合蛋白和至少一种gRNA。在某些实施方式中,所述系统包含两种gRNA分子。所述Cas9融合蛋白可以例如包括与Cas9内源的结构域具有不同活性的结构域,例如反式激活结构域。

所述靶基因(例如Pax7基因或Pax7基因的调控元件)可以参与细胞的分化或其中可能需要激活基因的任何其他过程,或者可以具有突变例如移码突变或无义突变。在某些实施方式中,所述靶或靶基因包括Pax7基因的调控元件。所述基于CRISPR/Cas9的基因编辑系统可以介导也可以不介导基因组的蛋白质编码区的脱靶变化。所述基于CRISPR/Cas9的基因编辑系统可以结合并识别靶区域。所述被靶向的基因可以是Pax7基因。

a.Cas蛋白

所述基于CRISPR/Cas的基因编辑系统可以包括Cas蛋白或Cas融合蛋白。在某些实施方式中,所述Cas蛋白是Cas12蛋白(也被称为Cpf1),例如Cas12a蛋白。所述Cas12蛋白可以来自于任何细菌或古菌物种,包括但不限于新凶手弗朗西丝氏菌(Francisellanovicida)、氨基酸球菌属菌种(Acidaminococcus sp.)、毛螺菌科菌种(Lachnospiraceaesp.)和普氏菌属菌种(Prevotella sp)。在某些实施方式中,所述Cas蛋白是Cas9蛋白。Cas9蛋白是一种内切核苷酸,其可以切割核酸,由CRISPR基因座编码,并参与II型CRISPR系统。所述Cas9蛋白可以来自于任何细菌或古菌物种,包括但不限于酿脓链球菌、金黄色葡萄球菌(Staphylococcus aureus(S.aureus))、燕麦食酸菌(Acidovorax avenae)、胸膜肺炎放线杆菌(Actinobacillus pleuropneumoniae)、产琥珀酸放线杆菌(Actinobacillussuccinogenes)、猪放线杆菌(Actinobacillus suis)、放线菌属菌种(Actinomyces sp.)、cycliphilus denitrificans、Aminomonas paucivorans、蜡样芽孢杆菌(Bacilluscereus)、斯密氏芽孢杆菌(Bacillus smithii)、苏云金芽孢杆菌(Bacillusthuringiensis)、拟杆菌属菌种(Bacteroides sp.)、Blastopirellula marina、慢生根瘤菌属菌种(Bradyrhizobium sp.)、侧孢短芽孢杆菌(Brevibacillus laterosporus)、大肠弯曲杆菌(Campylobacter coli)、空肠弯曲杆菌(Campylobacter jejuni)、红嘴鸥弯曲杆菌(Campylobacter lari)、Candidatus Puniceispirillum、解纤维素梭菌(Clostridiumcellulolyticum)、产气荚膜梭菌(Clostridium perfringens)、拥挤棒状杆菌(Corynebacterium accolens)、白喉棒状杆菌(Corynebacterium diphtheria)、马氏棒状杆菌(Corynebacteriummatruchotii)、Dinoroseobacter shibae、细长真杆菌(Eubacterium dolichum)、γ变形杆菌(gamma proteobacterium)、重氮营养葡糖醋杆菌(Gluconacetobacter diazotrophicus)、副流感嗜血杆菌(Haemophilusparainfluenzae)、Haemophilus sputorum、加拿大螺旋杆菌(Helicobacter canadensis)、Helicobacter cinaedi、Helicobacter mustelae、Ilyobacter polytropus、Kingellakingae、卷曲乳杆菌(Lactobacillus crispatus)、Listeria ivanovii、单核细胞增多性李斯特菌(Listeria monocytogenes)、李斯特氏菌科(Listeriaceae)细菌、甲基孢囊菌属菌种(Methylocystis sp.)、Methylosinus trichosporium、羞怯动弯杆菌(Mobiluncusmulieris)、Neisseria bacilliformis、灰色奈瑟氏菌(Neisseria cinerea)、金黄奈瑟氏菌(Neisseria flavescens)、乳糖奈瑟氏菌(Neisseria lactamica)、奈瑟氏菌属菌种(Neisseria sp.)、Neisseria wadsworthii、亚硝化单胞菌属菌种(Nitrosomonas sp.)、Parvibaculum lavamentivorans、多杀巴氏杆菌(Pasteurella multocida)、Phascolarctobacterium succinatutens、Ralstonia syzygii、沼泽红假单胞菌(Rhodopseudomonas palustris)、小红卵菌属菌种(Rhodovulum sp.)、Simonsiellamuelleri、鞘氨醇单胞菌属菌种(Sphingomonas sp.)、Sporolactobacillus vineae、路邓葡萄球菌(Staphylococcus lugdunensis)、链球菌属菌种(Streptococcus sp.)、Subdoligranulum sp.、Tistrella mobilis、密螺旋体属菌种(Treponema sp.)或Verminephrobacter eiseniae。在某些实施方式中,所述Cas9分子是酿脓链球菌Cas9分子(在本文中也被称为“SpCas9”)。在某些实施方式中,所述Cas9分子是金黄色葡萄球菌(Staphylococcus aureus)Cas9分子(在本文中也被称为“SaCas9”)。

Cas分子或Cas融合蛋白可以与一种或多种gRNA分子相互作用,并且与所述gRNA分子合作,可以定位到包含靶结构域并且在某些实施方式中PAM序列的位点。Cas分子或Cas融合蛋白识别PAM序列的能力可以例如使用本领域中已知的转化测定法来确定。

在某些实施方式中,Cas分子或Cas融合蛋白与靶核酸相互作用并切割靶核酸的能力是前间区序列邻近基序(PAM)序列依赖性的。PAM序列是靶核酸中的序列。在某些实施方式中,所述靶核酸的切割发生在PAM序列上游。来自于不同细菌菌种的Cas分子可以识别不同的序列基序(例如PAM序列)。在某些实施方式中,新凶手弗朗西丝氏菌的Cas12分子识别序列基序TTTN(SEQ ID NO:56)。在某些实施方式中,酿脓链球菌的Cas9分子识别序列基序NGG,并指导靶核酸序列1至10在例如该序列上游3至5bp处的切割。在某些实施方式中,嗜热链球菌(S.thermophilus)的Cas9分子识别序列基序NGGNG(SEQ ID NO:35)和/或NNAGAAW(W=A或T)(SEQ ID NO:36),并指导靶核酸序列1至10在例如这些序列上游3至5bp处的切割。在某些实施方式中,变形链球菌(S.mutans)的Cas9分子识别序列基序NGG(SEQ ID NO:31)和/或NAAR(R=A或G)(SEQ ID NO:37),并指导靶核酸序列1至10在例如这个序列上游3至5bp处的切割。在某些实施方式中,金黄色葡萄球菌的Cas9分子识别序列基序NNGRR(R=A或G)(SEQ ID NO:38),并指导靶核酸序列1至10在例如该序列上游3至5bp处的切割。在某些实施方式中,金黄色葡萄球菌的Cas9分子识别序列基序NNGRRN(R=A或G)(SEQ ID NO:39),并指导靶核酸序列1至10在例如该序列上游3至5bp处的切割。在某些实施方式中,金黄色葡萄球菌的Cas9分子识别序列基序NNGRRT(R=A或G)(SEQ ID NO:40),并指导靶核酸序列1至10在例如该序列上游3至5bp处的切割。在某些实施方式中,金黄色葡萄球菌的Cas9分子识别序列基序NNGRRV(R=A或G;V=A或C或G)(SEQ ID NO:41),并指导靶核酸序列1至10在例如该序列上游3至5bp处的切割。在上述实施方式中,N可以是任何核苷酸残基,例如A、G、C或T中的任一者。Cas9分子可以被工程化改造,以改变所述Cas9分子的PAM特异性。

在某些实施方式中,所述载体编码至少一个识别NNGRRT(SEQ ID NO:40)或NNGRRV(SEQ ID NO:41)的前间区序列邻近基序(PAM)的Cas9分子。在某些实施方式中,所述至少一个Cas9分子是金黄色葡萄球菌Cas9分子。在某些实施方式中,所述至少一个Cas9分子是突变的金黄色葡萄球菌Cas9分子。

所述Cas蛋白可以被突变,使得核酸酶活性失活。所述没有内切核酸酶活性的失活的Cas9蛋白(“iCas9”,也被称为“dCas9”)已通过gRNA靶向细菌、酵母和人类细胞中的基因,以通过空间位阻沉默基因表达。参考酿脓链球菌Cas9序列,示例性突变包括D10A、E762A、H840A、N854A、N863A和/或D986A。参考金黄色葡萄球菌Cas9序列,示例性突变包括D10A和N580A.。在某些实施方式中,所述Cas9分子是突变的金黄色葡萄球菌Cas9分子。在某些实施方式中,所述dCas9是参考酿脓链球菌Cas9序列包括选自D10A、E762A、H840A、N854A、N863A和/或D986A的至少两个突变的Cas9分子。在某些实施方式中,所述Cas蛋白是dCas9蛋白。在某些实施方式中,所述Cas蛋白是dCas12蛋白。

在某些实施方式中,所述突变的金黄色葡萄球菌Cas9分子包含D10A突变。编码这种突变的金黄色葡萄球菌Cas9分子的核苷酸序列阐述在SEQ ID NO:50中。

在某些实施方式中,所述突变的金黄色葡萄球菌Cas9分子包含N580A突变。编码这种突变的金黄色葡萄球菌Cas9分子的核苷酸序列阐述在SEQ ID NO:51中。

编码Cas分子的多核苷酸可以是合成多核苷酸。例如,所述合成多核苷酸可以被化学修饰。所述合成多核苷酸可以被密码子优化,例如至少一个不常用密码子或使用频率较低的密码子已被常用密码子代替。例如,所述合成多核苷酸可以指导优化的信使mRNA的合成,例如被优化以在例如本文中所描述的哺乳动物表达系统中表达。

此外或可选地,编码Cas分子或Cas多肽的核酸可以包含核定位序列(NLS)。核定位序列在本领域中是已知的。编码酿脓链球菌的Cas9分子的示例性密码子优化的核酸序列阐述在SEQ ID NO:42中。相应的酿脓链球菌Cas9分子的氨基酸序列阐述在SEQ ID NO:43中。

编码金黄色葡萄球菌的Cas9分子并任选地含有核定位序列(NLS)的示例性密码子优化的核酸序列阐述在SEQ ID NO:44-48、52和53中,它们在下文提供。编码金黄色葡萄球菌的Cas9分子的另一个示例性密码子优化的核酸序列包含SEQ ID NO:55的第1293-4451位核苷酸。金黄色葡萄球菌Cas9分子的氨基酸序列阐述在SEQ ID NO:49中。酿脓链球菌Cas9(带有D10A、H849A突变)的氨基酸序列阐述在SEQ ID NO:54中。

b.融合蛋白

可选地或此外,所述基于CRISPR/Cas的基因编辑系统可以包括融合蛋白。所述融合蛋白可以包含两个异源多肽结构域,其中所述第一多肽结构域包含DNA结合蛋白例如Cas蛋白、锌指蛋白或TALE蛋白,并且所述第二多肽结构域具有诸如转录激活活性、转录阻遏活性、转录释放因子活性、组蛋白修饰活性、核酸酶活性、核酸结合活性、甲基化酶活性或脱甲基化酶活性的活性。所述融合蛋白可以包括第一多肽结构域例如Cas9蛋白或突变的Cas9蛋白,其融合到具有诸如转录激活活性、转录阻遏活性、转录释放因子活性、组蛋白修饰活性、核酸酶活性、核酸结合活性、甲基化酶活性或脱甲基化酶活性的活性的第二多肽结构域。在某些实施方式中,所述第二多肽结构域具有转录激活活性。在某些实施方式中,所述第二多肽结构域包含合成转录因子。所述融合蛋白可以包括一个第二多肽结构域。所述融合蛋白可以包括两个所述第二多肽结构域。例如,所述融合蛋白可以包括在所述第一多肽结构域的N-端末端处的第二多肽结构域以及在所述第一多肽结构域的C-端末端处的第二多肽结构域。在其他实施方式中,所述融合蛋白可以包括单个第一多肽结构域和超过一个(例如两个或三个)串联的第二多肽结构域。

i)转录激活活性

所述第二多肽结构域可以具有转录激活活性,即反式激活结构域。例如,内源哺乳动物基因例如人类基因的表达,可以通过将第一多肽结构域例如dCas9或dCas12和反式激活结构域的融合蛋白通过gRNA的组合靶向哺乳动物启动子来实现。所述反式激活结构域可以包括VP16蛋白、多个VP 16蛋白例如VP48结构域或VP64结构域、NFκB转录激活物活性的p65结构域或p300。例如,所述融合蛋白可以是dCas9-VP64。在其他实施方式中,所述Cas9蛋白可以是VP64-dCas9-VP64(SEQ ID NO:57,由SEQ ID NO:58编码)。在其他实施方式中,所述激活转录的融合蛋白可以是dCas9-p300。在某些实施方式中,p300可以包含SEQ ID NO:59或SEQ ID NO:60的多肽。

ii)转录阻遏活性

所述第二多肽结构域可以具有转录阻遏活性。所述第二多肽结构域可以具有Kruppel结合盒活性,例如KRAB结构域、ERF阻遏结构域活性、Mxil阻遏结构域活性、SID4X阻遏结构域活性、Mad-SID阻遏结构域活性或TATA盒结合蛋白活性。例如,所述融合蛋白可以是dCas9-KRAB。

iii)转录释放因子活性

所述第二多肽结构域可以具有转录释放因子活性。所述第二多肽结构域可以具有真核释放因子1(ERF1)活性或真核释放因子3(ERF3)活性。

iv)组蛋白修饰活性

所述第二多肽结构域可以具有组蛋白修饰活性。所述第二多肽结构域可以具有组蛋白脱乙酰酶、组蛋白乙酰转移酶、组蛋白脱甲基化酶或组蛋白甲基转移酶活性。所述组蛋白乙酰转移酶可以是p300或CREB结合蛋白(CBP)或其片段。例如,所述融合蛋白可以是dCas9-p300。在某些实施方式中,p300可以包含SEQ ID NO:59或SEQ ID NO:60的多肽。

v)核酸酶活性

所述第二多肽结构域可以具有不同于Cas9蛋白的核酸酶活性的核酸酶活性。核酸酶或具有核酸酶活性的蛋白质是能够切割核酸的核苷酸亚基之间的磷酸二酯键的酶。核酸酶通常被进一步分成内切核酸酶和外切核酸酶,尽管某些酶可以落于两个类别内。公知的核酸酶包括脱氧核糖核酸酶和核糖核酸酶。

vi)核酸结合活性

所述第二多肽结构域可以具有核酸结合活性或核酸结合蛋白-DNA结合结构域(DBD)。DBD是独立折叠的蛋白质结构域,其含有至少一个识别双链或单链DNA的基序。DBD可以识别特定DNA序列(识别序列)或对DNA具有普遍亲和性。核酸结合区可以选自螺旋-转角-螺旋区、亮氨酸拉链区、有翼螺旋区、有翼螺旋-转角-螺旋区、螺旋-环-螺旋区、免疫球蛋白折叠、B3结构域、锌指、HMG盒、Wor3结构域、TAL效应物DNA结合结构域。

vii)甲基化酶活性

所述第二多肽结构域可以具有甲基化酶活性,其参与甲基向DNA、RNA、蛋白质、小分子、胞嘧啶或腺嘌呤的转移。在某些实施方式中,所述第二多肽结构域包括DNA甲基转移酶。

viii)脱甲基化酶活性

所述第二多肽结构域可以具有脱甲基化酶活性。所述第二多肽结构域可以包括从核酸、蛋白质(特别是组蛋白)和其他分子移除甲基(CH3-)的酶。或者,所述第二多肽可以通过使DNA脱甲基化的机制将甲基转变成羟甲基胞嘧啶。所述第二多肽可以催化这个反应。例如,催化这个反应的第二多肽可以是Tet1。

c.gRNA

所述基于CRISPR/Cas的基因编辑系统包括至少一种gRNA分子。例如,所述基于CRISPR/Cas的基因编辑系统可以包括两种gRNA分子。所述gRNA提供基于CRISPR/Cas的基因编辑系统的靶向。所述gRNA是两个非编码RNA即crRNA和tracrRNA的融合体。在某些实施方式中,所述多核苷酸包括crRNA和/或tracrRNA。所述sgRNA可以通过交换编码20bp前间区序列的序列来靶向任何所需DNA序列,所述前间区序列通过与所需DNA靶的互补碱基配对而提供靶向特异性。gRNA模拟参与II型效应物系统的天然存在的crRNA:tracrRNA双链体。这个可以包括例如42个核苷酸的crRNA和75个核苷酸的tracrRNA的双链体充当Cas9切割靶核酸的指导物。“靶区域”、“靶序列”或“前间区序列”是指所述基于CRISPR/Cas9的基因编辑系统靶向并结合的靶基因(例如Pax7基因)的区域。所述gRNA的靶向基因组中的靶序列的部分可以被称为“靶向序列”或“靶向部分”或“靶向结构域”。“前间区序列”或“gRNA间隔物”可以是指所述基于CRISPR/Cas9的基因编辑系统靶向并结合的靶基因的区域;“前间区序列”或“gRNA间隔物”也可以是指所述gRNA的与基因组中的被靶向序列互补的部分。所述gRNA可以包括gRNA支架。gRNA支架促进Cas9与所述gRNA结合并且可以促进内切核酸酶活性。所述gRNA支架是在所述gRNA的对应于gRNA所靶向的序列的部分之后的多核苷酸序列。所述gRNA靶向部分和gRNA支架合在一起形成一个多核苷酸。所述支架可以包含SEQ ID NO:85的多核苷酸序列。所述基于CRISPR/Cas9的基因编辑系统可以包括至少一种gRNA,其中所述gRNA靶向不同的DNA序列。所述靶DNA序列可以是交叠的。所述靶序列或前间区序列后面跟有基因组中所述前间区序列的3’末端处的PAM序列。不同的II型系统具有不同的PAM要求。例如,酿脓链球菌II型系统使用“NGG”序列,其中“N”可以是任何核苷酸。在某些实施方式中,所述PAM序列可以是“NGG”,其中“N”可以是任何核苷酸。在某些实施方式中,所述PAM序列可以是NNGRRT(SEQ ID NO:40)或NNGRRV(SEQ ID NO:41)。

由遗传构建物(例如AAV载体)编码的gRNA分子的数目可以是至少1种gRNA、至少2种不同的gRNA、至少3种不同的gRNA、至少4种不同的gRNA、至少5种不同的gRNA、至少6种不同的gRNA、至少7种不同的gRNA、至少8种不同的gRNA、至少9种不同的gRNA、至少10种不同的gRNA、至少11种不同的gRNA、至少12种不同的gRNA、至少13种不同的gRNA、至少14种不同的gRNA、至少15种不同的gRNA、至少16种不同的gRNA、至少17种不同的gRNA、至少18种不同的gRNA、至少18种不同的gRNA、至少20种不同的gRNA、至少25种不同的gRNA、至少30种不同的gRNA、至少35种不同的gRNA、至少40种不同的gRNA、至少45种不同的gRNA或至少50种不同的gRNA。由本文公开的载体编码的gRNA的数目可以在至少1种gRNA到至少50种不同的gRNA、至少1种gRNA到至少45种不同的gRNA、至少1种gRNA到至少40种不同的gRNA、至少1种gRNA到至少35种不同的gRNA、至少1种gRNA到至少30种不同的gRNA、至少1种gRNA到至少25种不同的gRNA、至少1种gRNA到至少20种不同的gRNA、至少1种gRNA到至少16种不同的gRNA、至少1种gRNA到至少12种不同的gRNA、至少1种gRNA到至少8种不同的gRNA、至少1种gRNA到至少4种不同的gRNA、至少4种gRNA到至少50种不同的gRNA、至少4种不同的gRNA到至少45种不同的gRNA、至少4种不同的gRNA到至少40种不同的gRNA、至少4种不同的gRNA到至少35种不同的gRNA、至少4种不同的gRNA到至少30种不同的gRNA、至少4种不同的gRNA到至少25种不同的gRNA、至少4种不同的gRNA到至少20种不同的gRNA、至少4种不同的gRNA到至少16种不同的gRNA、至少4种不同的gRNA到至少12种不同的gRNA、至少4种不同的gRNA到至少8种不同的gRNA、至少8种不同的gRNA到至少50种不同的gRNA、至少8种不同的gRNA到至少45种不同的gRNA、至少8种不同的gRNA到至少40种不同的gRNA、至少8种不同的gRNA到至少35种不同的gRNA、8种不同的gRNA到至少30种不同的gRNA、至少8种不同的gRNA到至少25种不同的gRNA、8种不同的gRNA到至少20种不同的gRNA、至少8种不同的gRNA到至少16种不同的gRNA或8种不同的gRNA到至少12种不同的gRNA之间。在某些实施方式中,所述遗传构建物(例如AAV载体)编码一种gRNA分子即第一gRNA分子和任选的Cas9分子。在某些实施方式中,第一遗传构建物(例如第一AAV载体)编码一种gRNA分子即第一gRNA分子和任选的Cas9分子,并且第二遗传构建物(例如第二AAV载体)编码一种gRNA分子即第二gRNA分子和任选的Cas9分子。

所述gRNA分子包含靶向结构域,其是与靶DNA序列互补的多核苷酸序列,后面跟有PAM序列。所述gRNA可以在所述靶向结构域或互补多核苷酸序列的5’末端处包含“G”。gRNA分子的靶向结构域可以包含至少10个碱基对、至少11个碱基对、至少12个碱基对、至少13个碱基对、至少14个碱基对、至少15个碱基对、至少16个碱基对、至少17个碱基对、至少18个碱基对、至少19个碱基对、至少20个碱基对、至少21个碱基对、至少22个碱基对、至少23个碱基对、至少24个碱基对、至少25个碱基对、至少30个碱基对或至少35个碱基对的靶DNA序列的互补多核苷酸序列,后面跟有PAM序列。在某些实施方式中,gRNA分子的靶向结构域具有19-25个核苷酸的长度。在某些实施方式中,gRNA分子的靶向结构域具有20个核苷酸的长度。在某些实施方式中,gRNA分子的靶向结构域具有21个核苷酸的长度。在某些实施方式中,gRNA分子的靶向结构域具有22个核苷酸的长度。在某些实施方式中,gRNA分子的靶向结构域具有23个核苷酸的长度。

所述gRNA可以靶向Pax7基因内或其附近或Pax7基因的调控元件或启动子内或其附近的区域。在某些实施方式中,所述gRNA可以靶向所述基因的外显子、内含子、启动子区、增强子区或转录区中的至少一者。所述gRNA可以靶向Pax7或Pax7基因的启动子或调控元件。在某些实施方式中,所述gRNA靶向Pax7启动子。所述gRNA可以包括靶向结构域,其包含对应于SEQ ID NO:1-8或69-76或77-84中的至少一者或其互补体或其变体的多核苷酸序列,如表1中所示。在某些实施方式中,所述gRNA靶向包含SEQ ID NO:1-8中的至少一者的互补体的多核苷酸序列。在某些实施方式中,所述gRNA由包含SEQ ID NO:1-8中的至少一者的多核苷酸序列编码。在某些实施方式中,所述gRNA包含选自SEQ ID NO:69-76的多核苷酸序列。在某些实施方式中,所述gRNA结合并靶向分别包含选自表4中的SEQ ID NO:77-84的序列的多核苷酸。

可以设计单个或多重化的gRNA来激活Pax7的表达,从而将干细胞分化成骨骼肌祖细胞。在用本文中详述的构建物或系统处理后,干细胞可以分化成骨骼肌祖细胞。可以将遗传校正的干细胞或患者细胞移植到对象中。

d.DNA靶向系统

本文还提供了包含此类遗传构建物的DNA靶向系统或组合物。所述DNA靶向组合物包括如上所述靶向基因的至少一种gRNA分子(例如两种gRNA分子)。所述至少一种gRNA分子可以结合并识别靶区域。

在某些实施方式中,所述DNA靶向组合物包括第一gRNA和第二gRNA。在某些实施方式中,所述第一gRNA分子和第二gRNA分子包含不同的靶向结构域。

所述DNA靶向组合物还可以包括至少一种Cas分子或融合蛋白。在如上详述的某些实施方式中,所述DNA靶向组合物还包括至少一种dCas9蛋白或融合蛋白。在某些实施方式中,所述Cas9分子或融合蛋白识别NNGRRT(SEQ ID NO:40)或NNGRRV(SEQ ID NO:41)的PAM。在某些实施方式中,所述DNA靶向组合物包括SEQ ID NO:55中阐述的核苷酸序列。在某些实施方式中,所述载体被配置成在Pax7基因内或其附近的区段中形成第一和第二双链断裂。

所述DNA靶向组合物还可以包含供体DNA或转入基因。

4.遗传构建物

所述DNA靶向系统或其一种或多种组分可以由遗传构建物编码或者包含在遗传构建物内。遗传构建物可以包括多核苷酸例如载体和质粒。所述构建物可以是重组的。在某些实施方式中,所述遗传构建物包含可操作连接到所述编码至少一种gRNA分子和/或Cas分子或融合蛋白的多核苷酸的启动子。在某些实施方式中,所述遗传构建物包含可操作连接到所述编码至少一种gRNA分子和/或dCas分子或融合蛋白的多核苷酸的启动子。在某些实施方式中,所述遗传构建物包含可操作连接到所述编码至少一种gRNA分子和/或Cas9分子或融合蛋白的启动子。在某些实施方式中,所述启动子被可操作连接到所述编码第一gRNA分子、第二gRNA分子和/或Cas9分子或融合蛋白的多核苷酸。所述遗传构建物可以作为有功能的染色体外分子存在于细胞中。所述遗传构建物可以是包括着丝粒、端粒的线性微型染色体,或质粒或粘粒。所述遗传构建物可以被转化或转导到细胞中。所述遗传构建物可以被配制成任何适合类型的递送介质,包括例如病毒载体、慢病毒表达、mRNA电穿孔和脂质介导的转染。本文还提供了一种用本文中详细描述的DNA靶向系统或其组分转化或转导的细胞。所述细胞可以是例如干细胞或成纤维细胞。在某些实施方式中,所述干细胞是多能干细胞。在某些实施方式中,所述成纤维细胞是皮肤成纤维细胞。

本文中提供了一种病毒递送系统。在某些实施方式中,所述载体是腺相关病毒(AAV)载体。所述AAV载体是属于细小病毒科依赖病毒属的小病毒,感染人类和一些其他的灵长动物物种。AAV载体可用于利用各种不同的构建物配置来递送基于CRISPR/Cas9的基因编辑系统。例如,AAV载体可以在分开的载体上或在同一载体上递送Cas9和gRNA表达盒。或者,如果使用源自于诸如金黄色葡萄球菌或脑膜炎奈瑟氏菌的物种的小Cas9蛋白,则可以将在4.7kb包装限度内的Cas9和至多两个gRNA表达盒合并在单个AAV载体中。

在某些实施方式中,所述AAV载体是修饰的AAV载体。所述修饰的AAV载体可以具有增强的心肌和/或骨骼肌组织嗜性。所述修饰的AAV载体可能能够在哺乳动物细胞中递送和表达所述基于CRISPR/Cas9的基因编辑系统。例如,所述修饰的AAV载体可以是AAV-SASTG载体(Piacentino等,Human Gene Therapy 2012,23,635–646)。所述修饰的AAV载体可以基于几种衣壳类型中的一者或多者,包括AAV1、AAV2、AAV5、AAV6、AAV8和AAV9。所述修饰的AAV载体可以基于具有可选的肌肉嗜性AAV衣壳的AAV2假型,例如AAV2/1、AAV2/6、AAV2/7、AAV2/8、AAV2/9、AAV2.5和AAV/SASTG载体,其通过系统性或局部递送高效转导骨骼肌或心肌(Seto等,Current Gene Therapy 2012,12,139-151)。所述修饰的AAV载体可以是AAV2i8G9(Shen等,J.Biol.Chem.2013,288,28814-28823)。

5.药物组合物

本文中提供了包含上述遗传构建物或DNA靶向系统的药物组合物。本文中所描述的DNA靶向系统或其至少一种组分可以按照制药领域中的专业技术人员公知的标准技术配制成药物组合物。所述药物组合物可以按照待使用的给药方式来配制。在药物组合物是注射用药物组合物的情况下,它们是无菌、无热原且无颗粒物的。优选地使用等渗剂型。通常,用于等渗的添加剂可以包括氯化钠、右旋糖、甘露糖醇、山梨糖醇和乳糖。在某些情况下,等渗溶液例如磷酸盐缓冲盐水是优选的。稳定剂包括明胶和白蛋白。在某些实施方式中,向所述剂型添加血管收缩剂。

所述组合物还可以包含可药用赋形剂。所述可药用赋形剂可以是功能性分子例如介质、佐剂、载体或稀释剂。术语“可药用载体”可以是无毒惰性的固体、半固体或液体填充剂、稀释剂、包封材料或任何类型的配制辅料。可药用载体包括例如稀释剂、润滑剂、粘合剂、崩解剂、着色剂、调味剂、甜味剂、抗氧化剂、防腐剂、助流剂、溶剂、悬浮剂、润湿剂、表面活性剂、润肤剂、推进剂、保湿剂、粉末、pH调节剂及其组合。所述可药用赋形剂可以是转染促进剂,其可以包括表面活性剂例如免疫刺激复合物(ISCOMS)、弗氏不完全佐剂、LPS类似物包括单磷酰脂A、胞壁酰肽、醌类似物、囊泡例如角鲨烯和角鲨烯、透明质酸、脂质、脂质体、钙离子、病毒蛋白、聚阴离子、聚阳离子或纳米粒子,或其他已知的转染促进剂。

所述转染促进剂可以是聚阴离子、聚阳离子包括聚L-谷氨酸(LGS)或脂质。所述转染促进剂是聚L-谷氨酸,并且更优选地,所述聚L-谷氨酸以低于6mg/mL的浓度存在于所述用于在骨骼肌和心肌中进行基因组编辑的组合物中。所述转染促进剂还可以包括表面活性剂例如免疫刺激复合物(ISCOMS)、弗氏不完全佐剂、LPS类似物包括单磷酰脂A、胞壁酰肽、醌类似物和囊泡例如角鲨烯和角鲨烯,并且也可以使用透明质酸与所述遗传构建物联合给药。在某些实施方式中,编码所述组合物的DNA载体也可以包括转染促进剂例如脂质、脂质体包括卵磷脂脂质体或本领域中已知的其他脂质体作为DNA-脂质体混合物(参见例如国际专利申请号W09324640)、钙离子、病毒蛋白、聚阴离子、聚阳离子或纳米粒子或其他已知的转染促进剂。在某些实施方式中,所述转染促进剂是聚阴离子、聚阳离子包括聚L-谷氨酸(LGS)或脂质。

6.给药

本文中详述的DNA靶向系统或其至少一种组分或包含它们的药物组合物可以被给药到对象。此类组合物可以以医学领域的专业技术人员公知的剂量和技术,将诸如特定对象的年龄、性别、体重和状况和给药途径等因素考虑在内来给药。本文公开的DNA靶向系统或其至少一种组分、遗传构建物或包含它们的组合物可以通过不同途径给药到对象,所述途径包括口服、肠胃外、舌下、透皮、直肠、透黏膜、局部、鼻内、阴道内、通过吸入、通过颊给药、胸膜内、静脉内、动脉内、腹膜内、皮下、真皮内、表皮、肌肉内、鼻内、鞘内、颅内和关节内或其组合。在某些实施方式中,所述DNA靶向系统、遗传构建物或包含它们的组合物肌肉内、静脉内或其组合给药到对象。对于兽医用途来说,所述DNA靶向系统、遗传构建物或包含它们的组合物可以按照常用兽医实践适合可接受的剂型给药。兽医可以容易地确定最适合于特定动物的给药方案和给药途径。所述DNA靶向系统、遗传构建物或包含它们的组合物可以通过传统注射器、无针注射装置、“微弹道轰击基因枪”或其他物理方法例如电穿孔(“EP”)、“流体动力学方法”或超声来给药。

所述DNA靶向系统、遗传构建物或包含它们的组合物可以通过几种技术递送到对象,包括使用和不使用体内电穿孔、脂质体介导、纳米粒子辅助、重组载体例如重组慢病毒、重组腺病毒和重组腺相关病毒的DNA注射(也被称为DNA疫苗接种)。所述组合物可以被注射到骨骼肌或心肌中。例如,所述组合物可以被注射到胫骨前肌或尾部中。

在某些实施方式中,所述DNA靶向系统、遗传构建物或包含它们的组合物如下所述给药:1)尾静脉注射(系统性)到成年小鼠中;2)肌肉内注射,例如局部注射到成年小鼠的肌肉例如TA或腓肠肌中;3)腹膜内注射到P2小鼠中;或4)面部静脉注射(系统性)到P2小鼠中。在某些实施方式中,所述DNA靶向系统、遗传构建物或包含它们的组合物通过静脉内或肌肉内注射给药到人类。

在将本文中详述的本公开的系统或遗传构建物或其至少一种组分或包含它们的药物组合物以及因此载体递送到对象的细胞中后,所述被转染的细胞可以表达所述gRNA分子和Cas9分子或融合蛋白。在某些实施方式中,所述Cas9是dCas9或融合蛋白。

本文中详述的任何递送方法和/或给药途径可以与众多的细胞类型一起使用,例如目前正在研究的用于基于细胞的疗法的细胞类型,包括但不限于永生化成肌细胞例如野生型和患者来源的细胞系、原始真皮成纤维细胞、干细胞例如诱导多能干细胞、骨髓来源的祖细胞、骨骼肌祖细胞、来自于患者的人骨骼肌成肌细胞、CD 133+细胞、中胚层成血管细胞(mesoangioblast)、心肌细胞、肝细胞、软骨细胞、间充质祖细胞、造血干细胞、平滑肌细胞和MyoD或Pax7转导的细胞或其他成肌祖细胞。所述干细胞可以是人类多能干细胞。所述干细胞可以是诱导多能干细胞(iPSC)。所述干细胞可以是胚胎干细胞(ESC)。

7.方法

a.激活内源成肌转录因子Pax7的方法

本文中提供了激活细胞中的内源成肌转录因子Pax7的方法。所述方法可以包括向所述细胞给药本文中详述的DNA靶向系统、本文中详细的分离的多核苷酸序列、本文中详述的载体、本文中详述的细胞或其组合。在某些实施方式中,在所述骨骼肌祖细胞中Pax7mRNA的内源表达提高。在某些实施方式中,在所述骨骼肌祖细胞中Myf5、MyoD、MyoG或其组合的表达提高。在某些实施方式中,所述干细胞被诱导进入成肌分化。在某些实施方式中,所述骨骼肌祖细胞在至少约2次、至少约3次、至少约4次、至少约5次、至少约6次、至少约7次、至少约8次、至少约9次、至少约10次、至少约11次、至少约12次、至少约13次、至少约14次或至少约15次传代后维持Pax7表达。

b.将干细胞分化成骨骼肌祖细胞的方法

本文中提供了将干细胞分化成骨骼肌祖细胞的方法。所述方法可以包括向所述细胞给药本文中详述的DNA靶向系统、本文中详细的分离的多核苷酸序列、本文中详述的载体、本文中详述的细胞或其组合。在某些实施方式中,在所述骨骼肌祖细胞中Pax7 mRNA的内源表达提高。在某些实施方式中,在所述骨骼肌祖细胞中Myf5、MyoD、MyoG或其组合的表达提高。在某些实施方式中,所述干细胞被诱导进入成肌分化。在某些实施方式中,所述骨骼肌祖细胞在至少约2次、至少约3次、至少约4次、至少约5次、至少约6次、至少约7次、至少约8次、至少约9次、至少约10次、至少约11次、至少约12次、至少约13次、至少约14次或至少约15次传代后维持Pax7表达。

c.治疗对象的方法

本文中提供了在细胞中激活内源成肌转录因子Pax7的方法。所述方法可以包括向所述细胞给药本文中详述的DNA靶向系统、本文中详细的分离的多核苷酸序列、本文中详述的载体、本文中详述的细胞或其组合。在某些实施方式中,在所述对象中Pax7 mRNA的内源表达提高。在某些实施方式中,在所述对象中Myf5、MyoD、MyoG或其组合的表达提高。在某些实施方式中,所述对象中的细胞被诱导进入成肌分化。在某些实施方式中,所述对象中肌营养不良蛋白+纤维的水平被提高。在某些实施方式中,所述对象中的肌肉再生被提高。

8.实施例

实施例1

材料和方法

gRNA设计、转染和质粒构建。靶向Pax7启动子的gRNA使用crispr.mit.edu设计并被克隆到gRNA载体(Addgene质粒41824)中。在组成性表达VP64-dCas9-VP64的H9 ESC的CHIRON99021诱导的分化的第二天,使用Lipofectamine 3000瞬时转染候选Pax7 gRNA。6天后收获细胞,用于Pax7的qRT-PCR分析。对于VP64-dCas9-VP64的强力霉素(dox)诱导的表达来说,将pLV-hUBC-VP64dCas9VP64-T2A-GFP质粒(Addgene质粒59791)用作源载体用于产生pLV-tightTRE-VP64dCas9VP64-T2A-mCherry。将Pax7 gRNA克隆到使用pLV-CMV-rtTA3-Blast作为源载体(Addgene质粒26429)产生的pLV-hU6-gRNA-PGK-rtTA3-Blast中。将Pax7cDNA(DNASU质粒HsCD00443491)克隆到慢病毒构建物中,以产生pLV-tightTRE-Pax7-P2A-mCherry构建物。所述PAX7-A序列被确认与在以前的定向分化论文中使用的PAX7序列相同。PAX7-B序列通过从用VP64dCas9VP64+gRNA处理的细胞分离的mRNA的PCR获得,并克隆到慢病毒tightTRE-PAX7-B-P2A-mCherry构建物中。所述gRNA的靶序列的序列示出在表2中。使用的引物示出在表3中。

慢病毒产生。HEK293T细胞从美国组织保藏中心(American Tissue CollectionCenter)(ATCC)获得并通过杜克大学癌症中心部门(Duke University Cancer CenterFacilities)购买,并在增补有10%FBS(Sigma)和1%青霉素/链霉素(Invitrogen)的Dulbecco改良的Eagle’s培养基(Invitrogen)中,在37℃和5%CO

细胞培养。将H9 ESC(从WiCell干细胞库获得)和DU11 iPSC用于这些研究。DU11iPSC由Duke iPSC共享资源部门通过来自于健康男性新生儿的BJ成纤维细胞(ATCC细胞系CRL-2522)的游离基因重编程产生。所述细胞的稳定且正确的核型和多能性得以确认。将hPSC维持在mTeSR(Stem Cell Technologies)中,并在包被有ES合格基质胶的组织培养处理板(Corning)上铺板。对于分化来说,使用Accutase(Stem Cell Technologies)将hPSC解离成单细胞,并在增补有10μM Y27632(Stem Cell Technologies)的mTeSR培养基中以2.3-3.3x10

荧光活化细胞分拣和分拣的细胞的扩增。在诱导分化后第14天,使用0.25%胰蛋白酶-EDTA(Thermo)将细胞解离并用中和培养基(含有10%FBS的DMEM/F12)清洗。通过离心沉积细胞,并将细胞重悬浮在流动培养基(含有5%FBS的PBS)中。针对mCherry表达对细胞进行分拣,离心沉积,重悬浮在生长培养基(增补有10ng/mL FGF2和1μg/mL dox的E6)中,并铺于基质胶包被的板上。将细胞每3-4天在~80%合生时传代。终末分化通过在100%合生培养物中从培养基中撤除dox来诱导。

流式细胞术分析。对于表面标志物的流式细胞术分析来说,在分化的第20天时的增殖期间收获细胞。将细胞用0.25%胰蛋白酶-EDTA解离,用PBS清洗,然后重悬浮在流动缓冲液(含有5%FBS的PBS)中。将细胞与下述偶联的抗体以0.25μg/10

细胞在免疫缺陷小鼠中的移植。所有动物实验在杜克大学学术动物护理和使用委员会(Duke Institutional Animal Care and Use Committee)批准的方案下进行。将7周龄雌性NOD.SCID.gamma小鼠(Duke CCIF Breeding Core)用于这些体内研究。在肌肉内细胞移植之前,将小鼠用30μL 1.2%BaCl

培养的细胞和组织切片的免疫荧光染色。将培养的细胞在增殖期间铺于用于免疫荧光染色的基质胶包被的压热灭菌的玻璃盖片(1mm,Thermo)上。对于分化来说,将细胞生长至合生并在基质胶包被的24孔组织培养板上分化,并在孔中直接进行免疫荧光染色。将细胞用4%PFA固定15min,并在阻断缓冲液(增补有3%BSA和0.2%Triton X-100的PBS)中在室温通透化1hr。将样品与下述抗体在4℃温育过夜:Pax7(1:20,Developmental StudiesHybridoma Bank),肌球蛋白重链MF20(1:200,DSHB),Myf5(1:200,Santa Cruz sc-302)和MyoD 5.8A(1:200,Santa Cruz sc-32758)。将样品用PBS清洗15min,并与1:500稀释的来自于Invitrogen的相容的第二抗体和DAPI在室温温育1hr。将样品用PBS清洗15min,并将盖片用ProLong Gold抗衰减试剂(Invitrogen)封片,或将孔保持在PBS中并使用常规荧光显微镜成像。将收获的TA肌固定并在液氮中冷却的最佳切割温度(OCT)化合物中冷冻。收集连续的10μm冷冻切片。将冷冻切片用2%PFA固定5min并用PBS+0.2%Triton-X通透化10分钟。施加阻断缓冲液(增补有5%山羊血清、2%BSA和0.1%Triton X-100的PBS),在室温下1hr。将样品与下述抗体的组合在4℃温育过夜:人特异性MANDYS106(1:200,Sigma MABT827),人特异性核纤层蛋白A/C(1:100,Thermo MA31000),Pax7(1:10,Developmental StudiesHybridoma Bank)或层粘连蛋白(1:200,Sigma L9393)。将样品用PBS清洗15min,并与1:500稀释的来自于Invitrogen的相容的第二抗体和DAPI在室温温育1hr。将样品用PBS清洗15min,并将载片用ProLong Gold抗衰减试剂(Invitrogen)封片,并使用常规荧光显微镜成像。

定量反转录PCR。使用RNeasy Plus RNA分离试剂盒(Qiagen)分离RNA。使用SuperScript VILO cDNA合成试剂盒(Invitrogen)合成cDNA。使用PerfeCTa SYBR GreenFastMix(Quanta Biosciences)的实时PCR使用CFX96实时PCR检测系统(Bio-Rad)来进行。结果被表示成使用ΔΔCt方法归一化到GAPDH表达的感兴趣的基因表达的提高倍数。

染色质免疫沉淀(ChIP)qPCR。ChIP使用EpiQuik ChIP试剂盒(EpiGentek),按照制造商的说明书来进行。将可溶性染色质用针对H3K27ac和H3K4me3的抗体(abcam)免疫沉淀,并纯化gDNA用于qPCR分析。ChIP-qPCR引物的所有序列可以在表3中找到。qPCR使用PerfeCTa SYBR Green FastMix(Quanta BioSciences)来进行,并将数据呈现为相对于阴性对照(仅仅gRNA)的gDNA的变化倍数并归一化到GAPDH基因座的区域。

RNA-Seq。在分化的第14天使用总RNA纯化Plus Micro试剂盒(Norgen)从新鲜分拣的细胞提取RNA。文库制备和测序由GENEWIZ在Illumina HiSeq上以2x150bp测序配置来进行。首先使用FastQC v0.11.2(Babraham Institute)验证所有RNA-seq样品的质量一致。使用Trimmomatic v0.32,使用4bp滑动窗口(滑动窗口:4:20)对原始读出进行修剪,以除去接头和平均质量分值(Q)(Phred33)<20的碱基(Bolger等,Bioinformatics 2014,30,2114–2120)。随后使用STAR v2.4.1a将修剪过的读出与GRCh38人类基因组的原始组装体进行比对(Dobin等,Bioinformatics 2013,29,15–21),除去含有非规范剪接接点的比对(--outFilterIntronMotifs RemoveNoncanonical)。在GENCODE v19综合基因注释(Harrow等,Genome Res.2012,22,1760–1774)中,使用具有默认设置的子读出软件包(v1.4.6-p4)中的featureCounts命令,将对齐的读出指派到基因(Liao等,Nucleic Acids Res.2013,41,e108–e108)。在过滤掉未充分定量的基因后,使用R软件包DESeq2对每个平行样的后续计数进行归一化,并将归一化的值用于分析。使用R软件中的pheatmap软件包产生热图。生物学过程和途径使用基于网络的在线工具Enrichr来产生(Chen等,BMC Bioinformatics 2013,14,128)。为了估算转录本和基因丰度,使用RSEM v1.2.21软件包中的重复一次-计算-表达功能来计算每百万的转录本(TPM)(Li和Dewey,BMC Bioinformatics 2011,12,323)。

实施例2

开发用于hPSC中VP64-dCas9-VP64介导的内源Pax7激活的条件

在胚胎分化过程中,PAX7及其旁系同源物PAX3指定近轴中胚层中的成肌细胞。hPSC向近轴中胚层细胞的分化可以由GSK3抑制剂CHIR99021启动(Tan等,Stem CellsDev.2013,22,1893–1906)。两种人类多能干细胞系H9 ESC和DU11 iPSC被用于分化研究。对于靶向基因激活来说,我们使用了在N-和C-端均融合有VP64结构域的dCas9(VP64-dCas9-VP64),我们以前已显示它的效力比单VP64融合体高~10倍。为了测试VP64-dCas9-VP64介导的PAX7激活的效能,我们设计了横跨相对于人类PAX7基因的转录起始位点-490至+158碱基对的8种gRNA(图7A)。如以前所述,将稳定表达VP64-dCas9-VP64的H9 ESC在添加CHIR99021的E6培养基中2天,分化成近轴中胚层细胞(Shelton等,Stem Cells Rep.2014,3,516–529)。将细胞用各个gRNA转染,并在6天后收获样品,用于使用qRT-PCR进行基因表达分析。与模拟转染的细胞相比,8种gRNA中的4种显著上调PAX7(图7B)。在第二次筛选中,我们将在转染实验中表现最好的4种单独的gRNA包装在慢病毒中,以实现更稳定和鲁棒的表达。在转导后8天收获细胞。gRNA#4被鉴定为是最有效的gRNA,并被用于后续研究(图7C)。

实施例3

VP64-dCas9-VP64介导的hPSC向成肌祖细胞的分化

接下来,我们试验了下述假说,即近轴中胚层细胞中的内源PAX7激活足以产生具有在体外分化成肌管的潜力的成肌祖细胞(MPC)(图1A)。在分化之前,将hPSC用表达靶向PAX7启动子的gRNA、反向四环素反式激活因子(rtTA)和杀稻瘟菌素抗性基因的慢病毒转导。用杀稻瘟菌素选择稳定表达所述载体的细胞,然后用编码强力霉素(dox)可诱导的VP64-dCas9-VP64或PAX7 cDNA并且也包括共转录的mCherry报告基因的另外的慢病毒转导(图1B)。用CHIR99021将hPSC分化2天,然后在含有dox和FGF2的E6培养基中维持,以支持MPC增殖(图1C)(Pawlikowski等,Dev.Dyn.2017,246,359–367)。CHIR99021的添加诱导近轴中胚层分化,正如由泛中胚层标志物Brachyury(T)、近轴中胚层标志物MSGN1和TBX6和成肌前中胚层标志物PAX3在mRNA水平上的高水平所指示的(图1D)。在生长两周后将转导的细胞在mCherry表达的基础上分拣(图1E)。mCherry+细胞在用VP64-dCas9-VP64转导的细胞中占~20%,与此相比在用PAX7cDNA转导的细胞中占~50%。这可能是由于VP64-dCas9-VP64载体与PAX7 cDNA载体相比尺寸更大(LTR之间7.9kb相比于4.9kb),导致慢病毒滴度降低。将这些纯化的MPC维持在增补有dox和FGF2的无血清E6培养基中,并在细胞达到~80%合生时传代。当在分拣后5天通过免疫荧光染色评估蛋白质表达时,在内源激活的细胞和表达外源cDNA的细胞两者中,分拣的细胞均表现为高纯度的PAX7+细胞(图1F和图8A)。VP64-dCas9-VP64处理的iPSC和ESC两者均表现出显著的扩增潜力,在纯化后2周细胞数目分别平均增加85倍和95倍。此外,这些细胞的生长潜力优于过表达PAX7 cDNA的细胞(图1G,图8B)。

实施例4

源自于内源或外源PAX7表达的成肌祖细胞的表征

在分拣后5天的增殖期间通过qRT-PCR评估PAX7 mRNA水平。使用不同引物对,可以将来自于内源染色体基因座的PAX7 mRNA与从慢病毒或内源染色体基因座制造的总PAX7mRNA区分开。尽管PAX7cDNA的过表达产生更多的总PAX7 mRNA(图2A和图8C),但仅在VP64-dCas9-VP64处理的细胞中观察到任何内源PAX7同工型的稳健检测(图2B和图8D)。人类PAX7基因编码多种同工型,它们的差异序列已被鉴定,但独特的生物学功能仍不清楚。外显子8或外显子9中的差异转录终止分别产生PAX7-A和PAX7-B同工型。这些转录本的3’末端的差异允许使用独特的qRT-PCR引物进行差异检测。

也通过qRT-PCR在mRNA水平上检测了下游成肌调控因子MYF5、MYOD和MYOG(图2C、图8E)。在蛋白质水平上,在表达内源和外源PAX7的细胞两者中大多数细胞共表达激活的卫星细胞标志物MYF5(>90%)。在表达内源PAX7的细胞中成肌细胞标志物MYOD的表达高于表达外源PAX7 cDNA的细胞,分别为15.9%和6.8%。在某些细胞中可检测的成熟成肌标志物MYOG和肌球蛋白重链(MHC)低(图2D)。

人类卫星细胞共表达PAX7以及CD29和CD56表面标志物。在分拣后大约10天,我们评估了我们的MPC的CD29和CD56表达,并发现在所有组中100%的细胞独立于PAX7表达而表达CD29。我们发现CD56表达更依赖于PAX7表达,在仅仅gRNA的组中仅有27.4%的细胞表达CD56,与此相比在PAX7 cDNA和VP64-dCas9-VP64处理的组中分别有69.2%和87.5%的细胞(图2E和图8F)。CD56染色的平均荧光强度(MFI)的评估也揭示出在VP64-dCas9-VP64处理组中每个细胞的平均CD56表达水平明显更高(图2F和图8G)。

实施例5

VP64-dCas9-VP64产生的成肌祖细胞在免疫缺陷小鼠中的移植证实了体内再生潜力

接下来我们确定了源自于VP64-dCas9-VP64介导的PAX7激活得MPC是否具有体内再生潜力。将在分拣后已被扩增并传代3次的细胞移植到预先用氯化钡(BaCl

实施例6

在多次传代和dox撤除后内源PAX7表达的诱导得以维持

在分拣的细胞的扩增期间,我们注意到在在三个独立实验中,在跨越平均32天的平均4次传代后,cDNA过表达的组中PAX7+细胞显著减少。尽管在分拣后5天表达PAX7蛋白的细胞的起始数目>90%,但在初始的流式分拣后大约4次传代后PAX7+细胞核的定量揭示出仅有少部分细胞(35.8%)表达PAX7蛋白,尽管在所述扩增期间维持在dox中。相反,大部分(93%)内源激活的PAX7细胞保持PAX7蛋白表达,在多次传代中没有过早分化(图4A和图4C)。正如缺少MHC+细胞所指示的,在所述cDNA过表达的组中PAX7+细胞的耗竭并不对应于采纳成肌命运(图4A)。我们推测这可能是由于高水平的PAX7蛋白阻碍了细胞增殖,允许启动子已被沉默的细胞或来自于分拣的污染细胞占据了细胞群体。与这种可能性相一致,以前已暗示Pax7 cDNA过表达牵涉诱导细胞周期退出而不是定型到成肌分化。有趣的是,以前发表的研究在使用tet诱导型PAX7 cDNA过表达系统时也观察到这种在多次传代后PAX7损失的现象。该研究需要将无血清分化方案修改成含有高促有丝分裂的20%胎牛血清的培养基条件,以在过表达cDNA的细胞中提高PAX7蛋白表达的保留。

当细胞达到100%合生时,通过撤除dox诱导前成肌细胞的分化。在VP64-dCas9-VP64处理的细胞中观察到丰富的MHC+肌纤维(图4B、图8H)。有趣的是,在这些内源基因已被激活的细胞中,即使在dox撤除后1周时,50%的细胞仍保持PAX7+,与此相比在PAX7 cDNA处理的细胞中,在没有dox一周后5.2%的细胞为PAX7+(图4C)。对FLAG表位的染色证实了在这个时间点,在分化的细胞中不存在VP64-dCas9-VP64(图4D)。

实施例7

VP64-dCas9-VP64导致持续的PAX7表达和靶基因座处稳定的染色质重塑

我们假设内源PAX7启动子的表观遗传重塑允许细胞在不继续存在VP64-dCas9-VP64的情况下自主上调PAX7。为了调查这一点,我们在dox给药期间和dox撤除后15天时对细胞进行了染色质免疫沉淀(ChIP)-qPCR。对于+dox条件来说,在分化的第30天对细胞进行分析,然后在不存在dox的情况下扩增并在15天内再传代3次。我们使用作为DNA元件百科全书(Encyclopedia of DNA Elements)(ENCODE)计划的一部分产生的ChIP-seq数据来鉴定在人类骨骼肌成肌细胞(HSMM)中转录激活的PAX7处富集的组蛋白修饰,包括H3K4me3和H3K27ac(图5A)。设计了4个qPCR引物来覆盖相对于PAX7转录起始位点(TSS)-731bp至+926bp的区域。+dox条件的ChIP qPCR证实了仅对VP64-dCas9-VP64处理做出响应,在内源PAX7基因座处存在H3K4me3和H3K27ac的显著富集(图5B)。此外,在dox撤除后这些组蛋白修饰维持15天(图5C)。为了确保在dox撤除后不存在VP64-dCas9-VP64的渗漏表达,我们对FLAG表位标签进行了western印迹分析,并且在dox撤除15天后不能检测到VP64-dCas9-VP64(图5D)。相反,在不存在VP64-dCas9-VP64的情况下仍可通过western印迹检测到PAX7,对应于活性组蛋白标记的ChIP-qPCR富集。

实施例8

内源与外源PAX7诱导的全局转录变化的鉴定

为了评估由PAX7的内源激活相比于外源cDNA过表达诱导的转录组广度的基因表达变化,我们进行了RNA测序(RNA-seq)分析。在第14天,对已用仅仅gRNA、VP64-dCas9-VP64和gRNA、编码PAX7-A同工型的cDNA或编码PAX7-B同工型的cDNA处理的分化的细胞进行mCherry表达的分拣,并提取RNA用于测序。我们将PAX7-B包括在内是因为它在VP64-dCas9-VP64处理的细胞中高表达(图2B),但对它与PAX7-A的关系了解甚少。为了衡量样品之间的差异,我们产生了RNA-seq数据的样品距离矩阵(图6A)。这揭示出四种处理之间的明显差异,并且尽管在四个组中的三个组中诱导的PAX7表达存在共性,但四个独特的簇显而易见。前500个差异表达的基因的多维标度(MDS)也显示出具有PAX7 cDNA过表达的样品组的趋异聚类对转录组谱之间的差异贡献最大(图9A)。我们考虑了所述四个组中变化最大的前200个基因,并提交了在热图上明显的基因簇的名单用于GO条目分析(图6B)。这些分析揭示出在仅仅gRNA的组中过表达的包括中胚层发育和WNT信号传导途径在内的通用发育途径的基因。此外,该组过表达的基因参与心脏发育,例如HAND1和HAND2,这表明该组分化成心脏细胞谱系的倾向性略高。与这个观察相一致,CHIR99021也被用作hPSC分化成心肌细胞的引发剂。

在VP64-dCas9-VP64组中差异表达的基因的GO分析与肌发生强烈相关(图6B和图9B)。该组中的代表性基因包括胚胎成肌细胞标志物HOXC12、胚胎肌球蛋白重链MYH3以及其他成肌调控因子MYOD和MYOG。

在用PAX7-A处理后富集的基因与CNS发育和NOTCH1信号传导途径相关。有趣的是,该组中差异上调最大的基因之一是正常的胚胎骨骼肌发育所需的DLK1(图9B和图9C)。然而,DLK1的体外过表达抑制卫星细胞增殖并诱导细胞周期退出和早期分化。相反,Dlk1敲除在体外提高Pax7+成肌祖细胞增殖并在体内增强出生后肌肉再生。这表明DLK1参与维持卫星细胞的静止期与激活之间的平衡。此外,在这些细胞中DLK1和DIO3两者的特异性上调(图9B和图9C)表明了DLK1-DIO3基因簇的活性。这个DLK1-DIO3基因座编码最大的哺乳动物microRNA(miRNA)宏簇(megacluster),其在新鲜分离的卫星细胞中强烈表达并在增殖的卫星细胞中强烈下降。这种DLK1-DIO3的下降伴有肌肉特异性miRNA的上调,包括靶向PAX7 3’UTR以精细调节它的表达并控制卫星细胞分化的miR-1。因此,仅仅过表达PAX7-A同工型可能引起调控静止期的基因和miRNA的负反馈和表达。

对PAX7-B做出响应特异性过表达的基因包括脑发育基因VIT和OTP以及参与肾发育的其他PAX基因PAX2和PAX8。尽管未暗示PAX7参与肾发育,但CHIR99021以前已被用于将hPSC分化成肾谱系。

接下来,我们将三个表达PAX7的组中的每一组与仅仅gRNA的组进行比较,并提取出在过滤掉具有低读出计数的基因后变化超过两倍并且padj<0.05的基因的名单。我们比较了这些基因名单,并发现在所有三个组中共有的56个基因富集到参与骨骼肌发育的GO条目(图6C和图6D)。这表明与使用仅仅gRNA的处理和14天的CHIR介导的分化相比,所有三个组与单独的小分子方案相比均能更有效地引导hPSC进入骨骼肌生成程序。然而,当检查单个基因时,VP64-dCas9-VP64组在成肌前基因和成肌基因的表达方面优于其他组(图6E)。与其他组相比,在VP64-dCas9-VP64组中许多已知的卫星细胞表面标志物和基因的表达也更高,证实了更特异性且稳固地定型到肌生成和卫星细胞分化中(图6E和图9D)。

实施例9

讨论

本文中详细描述了基于CRISPR/Cas9的转录激活物通过内源Pax7基因的靶向激活将hPSC分化成成肌祖细胞的用途。这种方法可以充当以前已被用于成肌祖细胞分化的转入基因过表达模型的替代方案。使用包括使用CHIR99021进行初始近轴中胚层分化并在无血清培养基条件下用FGF2维持的最低小分子分化方案,证实了内源PAX7基因的靶向激活产生了成肌祖细胞群体,其可以传代至少6次并在同时维持PAX7表达,在dox撤除和随后的dCas9激活物表达丧失后可以容易地分化,并且可以被植入到小鼠肌肉中以产生人类肌营养不良蛋白+纤维,并且还占据卫星细胞生态位。证实了靶向内源PAX7启动子导致H3K4me3和H3K27ac组蛋白修饰的富集,其在dox撤除后维持15天。在PAX7 cDNA的过表达期间没有观察到这些染色质标记的富集。尽管来自于hPSC的PAX7 cDNA过表达以前已在NSG小鼠中获得各种不同程度的植入,但在本文使用的条件下我们没有类似的使用PAX7 cDNA过表达的阳性植入结果。然而,以前的研究使用的分化方案产生拟胚体、并入额外的小分子或在培养基中含有动物血清,因此不同于本研究中使用的方案。本文中详细描述了是内源PAX7的激活而不是外源PAX7 cDNA过表达提高了hPSC分化成具有鲁棒的生长和分化潜力,同时在植入后保留再生性能的成肌祖细胞的效能。

以前的使用外源PAX7 cDNA的研究依赖于仅仅PAX7-A同工型的过表达。然而,不同的RNA切割和多聚腺苷化产生PAX7-B,其含有高度保守的配对尾部结构域,并被认为是典范序列。两种同工型均在人类成肌细胞中表达,并且这些PAX7蛋白变体的直向同源物也存在于小鼠肌肉中,指示了两种同工型的生物学重要性。尽管这些蛋白质变体的不同功能尚未被破译,但它们可能在肌生成中发挥不同作用,这对于正确的卫星干细胞功能和成肌分化来说可能是必需的。RNA-seq分析证实了通过VP64-dCas9-VP64内源激活或任一同工型的PAX7cDNA过表达产生的细胞具有交叠的成肌功能;然而,与PAX7-A相比,VP64-dCas9-VP64组与PAX7-B享有更多的通常上调的基因(分别为89和30个基因),指示了更高的相似性程度,这也被描绘在样品距离矩阵中。所述两种cDNA的过表达之间的不相似性表明它们具有不同的功能,并且可以以独立的方式影响全局基因表达。例如,PAX7-B比PAX7-A更有效地上调前成肌基因PAX3、DMRT2和卫星细胞基因CXCR4和HEY1。相反,参与卫星细胞静止期的DLK1-DIO3基因座的表达对PAX7-A的响应比对PAX7-B的响应更强。因此,VP64-dCas9-VP64介导的PAX7诱导可以允许两种同工型的表达,以更可能在生理范围内的表达水平适合地诱导肌生成。此外,PAX7的内源激活可以保护3’UTR,它们是在协调适当的肌肉发育和再生中发挥作用的许多肌肉特异性miRNA的结合靶点。

尽管通过慢病毒转导实现PAX7在hPSC中的条件表达可能是产生可植入MPC的均质群体的最有前途的方法,但最终可能使用无整合重编程以避免病毒载体的基因组整合这种不想要的结果。当gRNA被瞬时递送以实现神经元分化时,VP64-dCas9-VP64已被证明可快速重塑靶基因座的表观遗传特征。本文证实,在不存在VP64-dCas9-VP64的情况下表观遗传特征得以稳定维持。这些靶向转录激活物通过mRNA/gRNA或纯化的核糖核蛋白复合体的转染、电穿孔或非病毒纳米粒子递送的瞬时递送,可以为倾向于整合的方法提供一种替代方案。

广泛的CRISPR基因组工程工具箱为操纵细胞命运提供了许多可能性,以改进我们对成肌细胞、卫星细胞和从hPSC产生的MPC之间的分子差异的理解。细胞命运的强制转变可能依赖于在很大程度上仍然难以捉摸的随机因素,但通常包括激活内源网络以产生稳定的新特性并同时也反对旧特性的表观遗传记忆。对组织特异性祖细胞从多能细胞的分化的进一步研究可能会揭示出基础性指导,这些指导可能为产生能够长期重新占据祖细胞生态位的明确定义的细胞群体的修订模型提供信息。

本文中详细描述的结果介绍了一种用于从hPSC分化和扩增成肌祖细胞的新方法,所述方法使用新的基因组工程工具对转录调控进行确定性编辑,这可能使新疾病建模和骨骼肌再生障碍中的细胞疗法成为可能。

上面对特定方面的描述如此充分地揭示出本发明的总体性质,使得其他人通过应用本领域技术内的知识,无需过多实验即可容易地修改和/或改编这些特定方面以适应于各种不同的应用,而不背离本公开的总体概念。因此,基于本文中呈现的教导和指导,此类改编和修改旨在落于所公开的方面的含义和等同性范围之内。应该理解,本文中的短语或术语是出于描述而不是限制的目的,使得本说明书的术语或短语应该由专业技术人员根据所述教导和指导来解释。

本公开的广度和范围不应受任何上述示例性方面的限制,而是应该仅根据权利要求书及其等同物来定义。

本申请中引用的所有出版物、专利、专利申请和/或其他文献为所有目的整体通过参考并入本文,其程度如同每个单独的出版物、专利、专利申请和/或其他文献被单独地指明为所有目的通过参考并入本文。

为完整起见,本发明的各个不同方面被阐述在下述编号的条款中:

条款1.一种靶向Pax7的指导RNA(gRNA)分子,所述gRNA包含对应于SEQ ID NO:1-8或69-76中的至少一者或其变体的多核苷酸序列。

条款2.条款1所述的gRNA,其中所述gRNA包含crRNA、tracrRNA或其组合。

条款3.一种用于提高Pax7表达的DNA靶向系统,所述DNA靶向系统包含结合并靶向Pax7基因、Pax7基因的调控区、Pax7基因的启动子区或其一部分的至少一种gRNA。

条款4.条款3所述的DNA靶向系统,其中所述至少一种gRNA包含对应于SEQ ID NO:1-8或69-76中的至少一者或其变体的多核苷酸序列。

条款5.条款3或4所述的DNA靶向系统,其中所述gRNA包含crRNA、tracrRNA或其组合。

条款6.条款3-5中的任一项所述的DNA靶向系统,其还包含簇集规则间隔短回文重复序列相关(Cas)蛋白或融合蛋白,其中所述融合蛋白包含两个异源多肽结构域,其中第一多肽结构域包含Cas蛋白、锌指蛋白或TALE蛋白,并且第二多肽结构域具有转录激活活性。

条款7.条款6所述的DNA靶向系统,其中所述Cas蛋白包含酿脓链球菌(Streptococcus pyogenes)Cas9分子或其变体。

条款8.条款6所述的DNA靶向系统,其中所述融合蛋白包含VP64-dCas9-VP64。

条款9.条款6所述的DNA靶向系统,其中所述Cas蛋白包含识别NGG(SEQ ID NO:31)、NGA(SEQ ID NO:32)、NGAN(SEQ ID NO:33)或NGNG(SEQ ID NO:34)的前间区序列邻近基序(PAM)的Cas9。

条款10.一种分离的多核苷酸序列,其包含条款1或2所述的gRNA分子。

条款11.一种分离的多核苷酸序列,其编码条款3-9中的任一项所述的DNA靶向系统。

条款12.一种载体,其包含条款10或11所述的分离的多核苷酸序列。

条款13.一种载体,其编码条款1或2所述的gRNA分子和簇集规则间隔短回文重复序列相关(Cas)蛋白。

条款14.一种细胞,其包含条款1或2所述的gRNA、条款3-9中的任一项所述的DNA靶向系统、条款10或11所述的分离的多核苷酸序列或条款12或13所述的载体或其组合。

条款15.一种药物组合物,其包含条款1或2所述的gRNA、条款3-9中的任一项所述的DNA靶向系统、条款10或11所述的分离的多核苷酸序列、条款12或13所述的载体或条款14所述的细胞或其组合。

条款16.一种在细胞中激活内源成肌转录因子Pax7的方法,所述方法包括向所述细胞给药条款1或2所述的gRNA、条款3-9中的任一项所述的DNA靶向系统、条款10或11所述的分离的多核苷酸序列或条款12或13所述的载体。

条款17.一种将干细胞分化成骨骼肌祖细胞的方法,所述方法包括向所述干细胞给药条款1或2所述的gRNA、条款3-9中的任一项所述的DNA靶向系统、条款10或11所述的分离的多核苷酸序列或条款12或13所述的载体。

条款18.条款17所述的方法,其中在所述骨骼肌祖细胞中Pax7mRNA的内源表达被提高。

条款19.条款17-18中的任一项所述的方法,其中在所述骨骼肌祖细胞中Myf5、MyoD、MyoG或其组合的表达被提高。

条款20.条款17-19中的任一项所述的方法,其中所述干细胞被诱导进入成肌分化。

条款21.条款17-20中的任一项所述的方法,其中所述骨骼肌祖细胞在至少约6次传代后维持Pax7表达。

条款22.一种治疗需要的对象的方法,所述方法包括向所述对象给药条款14所述的细胞。

条款23.条款22所述的方法,其中所述对象中肌营养不良蛋白+纤维的水平被提高。

条款24.条款22所述的方法,其中所述对象中的肌肉再生被提高。

序列

SEQ ID NO:31

ngg

SEQ ID NO:32

nga

SEQ ID NO:33

ngan

SEQ ID NO:34

ngng

SEQ ID NO:35

nggng

SEQ ID NO:36

nnagaaw(W=A或T)

SEQ ID NO:37

naar(R=A或G)

SEQ ID NO:38

nngrr(R=A或G;N可以是任何核苷酸残基,例如A、G、C或T中的任一者)

SEQ ID NO:39

nngrrn(R=A或G;N可以是任何核苷酸残基,例如A、G、C或T中的任一者)

SEQ ID NO:40

nngrrt(R=A或G;N可以是任何核苷酸残基,例如A、G、C或T中的任一者)

SEQ ID NO:41

nngrrv(R=A或G;N可以是任何核苷酸残基,例如A、G、C或T中的任一者)

SEQ ID NO:42

编码酿脓链球菌Cas9的密码子优化的多核苷酸

atggataaaa agtacagcat cgggctggac atcggtacaa actcagtggg gtgggccgtgattacggacg agtacaaggt accctccaaa aaatttaaag tgctgggtaa cacggacaga cactctataaagaaaaatct tattggagcc ttgctgttcg actcaggcga gacagccgaa gccacaaggt tgaagcggaccgccaggagg cggtatacca ggagaaagaa ccgcatatgc tacctgcaag aaatcttcag taacgagatggcaaaggttg acgatagctt tttccatcgc ctggaagaat cctttcttgt tgaggaagac aagaagcacgaacggcaccc catctttggc aatattgtcg acgaagtggc atatcacgaa aagtacccga ctatctaccacctcaggaag aagctggtgg actctaccga taaggcggac ctcagactta tttatttggc actcgcccacatgattaaat ttagaggaca tttcttgatc gagggcgacc tgaacccgga caacagtgac gtcgataagctgttcatcca acttgtgcag acctacaatc aactgttcga agaaaaccct ataaatgctt caggagtcgacgctaaagca atcctgtccg cgcgcctctc aaaatctaga agacttgaga atctgattgc tcagttgcccggggaaaaga aaaatggatt gtttggcaac ctgatcgccc tcagtctcgg actgacccca aatttcaaaagtaacttcga cctggccgaa gacgctaagc tccagctgtc caaggacaca tacgatgacg acctcgacaatctgctggcc cagattgggg atcagtacgc cgatctcttt ttggcagcaa agaacctgtc cgacgccatcctgttgagcg atatcttgag agtgaacacc gaaattacta aagcacccct tagcgcatct atgatcaagcggtacgacga gcatcatcag gatctgaccc tgctgaaggc tcttgtgagg caacagctcc ccgaaaaatacaaggaaatc ttctttgacc agagcaaaaa cggctacgct ggctatatag atggtggggc cagtcaggaggaattctata aattcatcaa gcccattctc gagaaaatgg acggcacaga ggagttgctg gtcaaacttaacagggagga cctgctgcgg aagcagcgga cctttgacaa cgggtctatc ccccaccaga ttcatctgggcgaactgcac gcaatcctga ggaggcagga ggatttttat ccttttctta aagataaccg cgagaaaatagaaaagattc ttacattcag gatcccgtac tacgtgggac ctctcgcccg gggcaattca cggtttgcctggatgacaag gaagtcagag gagactatta caccttggaa cttcgaagaa gtggtggaca agggtgcatctgcccagtct ttcatcgagc ggatgacaaa ttttgacaag aacctcccta atgagaaggt gctgcccaaacattctctgc tctacgagta ctttaccgtc tacaatgaac tgactaaagt caagtacgtc accgagggaatgaggaagcc ggcattcctt agtggagaac agaagaaggc gattgtagac ctgttgttca agaccaacaggaaggtgact gtgaagcaac ttaaagaaga ctactttaag aagatcgaat gttttgacag tgtggaaatttcaggggttg aagaccgctt caatgcgtca ttggggactt accatgatct tctcaagatc ataaaggacaaagacttcct ggacaacgaa gaaaatgagg atattctcga agacatcgtc ctcaccctga ccctgttcgaagacagggaa atgatagaag agcgcttgaa aacctatgcc cacctcttcg acgataaagt tatgaagcagctgaagcgca ggagatacac aggatgggga agattgtcaa ggaagctgat caatggaatt agggataaacagagtggcaa gaccatactg gatttcctca aatctgatgg cttcgccaat aggaacttca tgcaactgattcacgatgac tctcttacct tcaaggagga cattcaaaag gctcaggtga gcgggcaggg agactcccttcatgaacaca tcgcgaattt ggcaggttcc cccgctatta aaaagggcat ccttcaaact gtcaaggtggtggatgaatt ggtcaaggta atgggcagac ataagccaga aaatattgtg atcgagatgg cccgcgaaaaccagaccaca cagaagggcc agaaaaatag tagagagcgg atgaagagga tcgaggaggg catcaaagagctgggatctc agattctcaa agaacacccc gtagaaaaca cacagctgca gaacgaaaaa ttgtacttgtactatctgca gaacggcaga gacatgtacg tcgaccaaga acttgatatt aatagactgt ccgactatgacgtagaccat atcgtgcccc agtccttcct gaaggacgac tccattgata acaaagtctt gacaagaagcgacaagaaca ggggtaaaag tgataatgtg cctagcgagg aggtggtgaa aaaaatgaag aactactggcgacagctgct taatgcaaag ctcattacac aacggaagtt cgataatctg acgaaagcag agagaggtggcttgtctgag ttggacaagg cagggtttat taagcggcag ctggtggaaa ctaggcagat cacaaagcacgtggcgcaga ttttggacag ccggatgaac acaaaatacg acgaaaatga taaactgata cgagaggtcaaagttatcac gctgaaaagc aagctggtgt ccgattttcg gaaagacttc cagttctaca aagttcgcgagattaataac taccatcatg ctcacgatgc gtacctgaac gctgttgtcg ggaccgcctt gataaagaagtacccaaagc tggaatccga gttcgtatac ggggattaca aagtgtacga tgtgaggaaa atgatagccaagtccgagca ggagattgga aaggccacag ctaagtactt cttttattct aacatcatga atttttttaagacggaaatt accctggcca acggagagat cagaaagcgg ccccttatag agacaaatgg tgaaacaggtgaaatcgtct gggataaggg cagggatttc gctactgtga ggaaggtgct gagtatgcca caggtaaatatcgtgaaaaa aaccgaagta cagaccggag gattttccaa ggaaagcatt ttgcctaaaa gaaactcagacaagctcatc gcccgcaaga aagattggga ccctaagaaa tacgggggat ttgactcacc caccgtagcctattctgtgc tggtggtagc taaggtggaa aaaggaaagt ctaagaagct gaagtccgtg aaggaactcttgggaatcac tatcatggaa agatcatcct ttgaaaagaa ccctatcgat ttcctggagg ctaagggttacaaggaggtc aagaaagacc tcatcattaa actgccaaaa tactctctct tcgagctgga aaatggcaggaagagaatgt tggccagcgc cggagagctg caaaagggaa acgagcttgc tctgccctcc aaatatgttaattttctcta tctcgcttcc cactatgaaa agctgaaagg gtctcccgaa gataacgagc agaagcagctgttcgtcgaa cagcacaagc actatctgga tgaaataatc gaacaaataa gcgagttcag caaaagggttatcctggcgg atgctaattt ggacaaagta ctgtctgctt ataacaagca ccgggataag cctattagggaacaagccga gaatataatt cacctcttta cactcacgaa tctcggagcccccgccgcct tcaaatactttgatacgact atcgaccgga aacggtatac cagtaccaaa gaggtcctcg atgccaccct catccaccagtcaattactg gcctgtacga aacacggatcgacctctctc aactgggcgg cgactag

SEQ ID NO:43

酿脓链球菌Cas9的氨基酸序列

MDKKYSIGLDIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD

SEQ ID NO:44

编码金黄色葡萄球菌Cas9的密码子优化的核酸序列

atgaaaagga actacattct ggggctggac atcgggatta caagcgtggg gtatgggattattgactatg aaacaaggga cgtgatcgac gcaggcgtca gactgttcaa ggaggccaac gtggaaaacaatgagggacg gagaagcaag aggggagcca ggcgcctgaa acgacggaga aggcacagaa tccagagggtgaagaaactg ctgttcgatt acaacctgct gaccgaccat tctgagctga gtggaattaa tccttatgaagccagggtga aaggcctgag tcagaagctg tcagaggaag agttttccgc agctctgctg cacctggctaagcgccgagg agtgcataac gtcaatgagg tggaagagga caccggcaac gagctgtcta caaaggaacagatctcacgc aatagcaaag ctctggaaga gaagtatgtc gcagagctgc agctggaacg gctgaagaaagatggcgagg tgagagggtc aattaatagg ttcaagacaa gcgactacgt caaagaagcc aagcagctgctgaaagtgca gaaggcttac caccagctgg atcagagctt catcgatact tatatcgacc tgctggagactcggagaacc tactatgagg gaccaggaga agggagcccc ttcggatgga aagacatcaa ggaatggtacgagatgctga tgggacattg cacctatttt ccagaagagc tgagaagcgt caagtacgct tataacgcagatctgtacaa cgccctgaat gacctgaaca acctggtcat caccagggat gaaaacgaga aactggaatactatgagaag ttccagatca tcgaaaacgt gtttaagcag aagaaaaagc ctacactgaa acagattgctaaggagatcc tggtcaacga agaggacatc aagggctacc gggtgacaag cactggaaaa ccagagttcaccaatctgaa agtgtatcac gatattaagg acatcacagc acggaaagaa atcattgaga acgccgaactgctggatcag attgctaaga tcctgactat ctaccagagc tccgaggaca tccaggaaga gctgactaacctgaacagcg agctgaccca ggaagagatc gaacagatta gtaatctgaa ggggtacacc ggaacacacaacctgtccct gaaagctatc aatctgattc tggatgagct gtggcataca aacgacaatc agattgcaatctttaaccgg ctgaagctgg tcccaaaaaa ggtggacctg agtcagcaga aagagatccc aaccacactggtggacgatt tcattctgtc acccgtggtc aagcggagct tcatccagag catcaaagtg atcaacgccatcatcaagaa gtacggcctg cccaatgata tcattatcga gctggctagg gagaagaaca gcaaggacgcacagaagatg atcaatgaga tgcagaaacg aaaccggcag accaatgaac gcattgaaga gattatccgaactaccggga aagagaacgc aaagtacctg attgaaaaaa tcaagctgca cgatatgcag gagggaaagtgtctgtattc tctggaggcc tccccctgg aggacctgct gaacaatcca ttcaactacg aggtcgatcatattatcccc agaagcgtgt ccttcgacaa ttcctttaac aacaaggtgc tggtcaagca ggaagagaactctaaaaagg gcaataggac tcctttccag tacctgtcta gttcagattc caagatctct tacgaaacctttaaaaagca cattctgaat ctggccaaag gaaagggccg catcagcaag accaaaaagg agtacctgctggaagagcgg gacatcaaca gattctccgt ccagaaggat tttattaacc ggaatctggt ggacacaagatacgctactc gcggcctgat gaatctgctg cgatcctatt tccgggtgaa caatctggat gtgaaagtcaagtccatcaa cggcgggttc acatcttttc tgaggcgcaa atggaagttt aaaaaggagc gcaacaaagggtacaagcac catgccgaag atgctctgat tatcgcaaat gccgacttca tctttaagga gtggaaaaagctggacaaag ccaagaaagt gatggagaac cagatgttcg aagagaagca ggccgaatct atgcccgaaatcgagacaga acaggagtac aaggagattt tcatcactcc tcaccagatc aagcatatca aggatttcaaggactacaag tactctcacc gggtggataa aaagcccaac agagagctga tcaatgacac cctgtatagtacaagaaaag acgataaggg gaataccctg attgtgaaca atctgaacgg actgtacgac aaagataatgacaagctgaa aaagctgatc aacaaaagtc ccgagaagct gctgatgtac caccatgatc ctcagacatatcagaaactg aagctgatta tggagcagta cggcgacgag aagaacccac tgtataagta ctatgaagagactgggaact acctgaccaa gtatagcaaa aaggataatg gccccgtgat caagaagatc aagtactatgggaacaagct gaatgcccat ctggacatca cagacgatta ccctaacagt cgcaacaagg tggtcaagctgtcactgaag ccatacagat tcgatgtcta tctggacaac ggcgtgtata aatttgtgac tgtcaagaatctggatgtca tcaaaaagga gaactactat gaagtgaata gcaagtgcta cgaagaggct aaaaagctgaaaaagattag caaccaggca gagttcatcg cctcctttta caacaacgac ctgattaaga tcaatggcgaactgtatagg gtcatcgggg tgaacaatga tctgctgaac cgcattgaag tgaatatgat tgacatcacttaccgagagt atctggaaaa catgaatgat aagcgccccc ctcgaattat caaaacaatt gcctctaagactcagagtat caaaaagtac tcaaccgaca ttctgggaaa cctgtatgag gtgaagagca aaaagcaccctcagattatc aaaaagggc

SEQ ID NO:45

编码金黄色葡萄球菌Cas9的密码子优化的核酸序列

atgaagcgga actacatcct gggcctggac atcggcatca ccagcgtggg ctacggcatcatcgactacg agacacggga cgtgatcgat gccggcgtgc ggctgttcaa agaggccaac gtggaaaacaacgagggcag gcggagcaag agaggcgcca gaaggctgaa gcggcggagg cggcatagaa tccagagagtgaagaagctg ctgttcgact acaacctgct gaccgaccac agcgagctga gcggcatcaa cccctacgaggccagagtga agggcctgag ccagaagctg agcgaggaag agttctctgc cgccctgctg cacctggccaagagaagagg cgtgcacaac gtgaacgagg tggaagagga caccggcaac gagctgtcca ccaaagagcagatcagccgg aacagcaagg ccctggaaga gaaatacgtg gccgaactgc agctggaacg gctgaagaaagacggcgaag tgcggggcag catcaacaga ttcaagacca gcgactacgt gaaagaagcc aaacagctgctgaaggtgca gaaggcctac caccagctgg accagagctt catcgacacc tacatcgacc tgctggaaacccggcggacc tactatgagg gacctggcga gggcagcccc ttcggctgga aggacatcaa agaatggtacgagatgctga tgggccactg cacctacttc cccgaggaac tgcggagcgt gaagtacgcc tacaacgccgacctgtacaa cgccctgaac gacctgaaca atctcgtgat caccagggac gagaacgaga agctggaatattacgagaag ttccagatca tcgagaacgt gttcaagcag aagaagaagc ccaccctgaa gcagatcgccaaagaaatcc tcgtgaacga agaggatatt aagggctaca gagtgaccag caccggcaag cccgagttcaccaacctgaa ggtgtaccac gacatcaagg acattaccgc ccggaaagag attattgaga acgccgagctgctggatcag attgccaaga tcctgaccat ctaccagagc agcgaggaca tccaggaaga actgaccaatctgaactccg agctgaccca ggaagagatc gagcagatct ctaatctgaa gggctatacc ggcacccacaacctgagcct gaaggccatc aacctgatcc tggacgagct gtggcacacc aacgacaacc agatcgctatcttcaaccgg ctgaagctgg tgcccaagaa ggtggacctg tcccagcaga aagagatccc caccaccctggtggacgact tcatcctgag ccccgtcgtg aagagaagct tcatccagag catcaaagtg atcaacgccatcatcaagaa gtacggcctg cccaacgaca tcattatcga gctggcccgc gagaagaact ccaaggacgcccagaaaatg atcaacgaga tgcagaagcg gaaccggcag accaacgagc ggatcgagga aatcatccggaccaccggca aagagaacgc caagtacctg atcgagaaga tcaagctgca cgacatgcag gaaggcaagtgcctgtacag cctggaagcc atccctctgg aagatctgct gaacaacccc ttcaactatg aggtggaccacatcatcccc agaagcgtgt ccttcgacaa cagcttcaac aacaaggtgc tcgtgaagca ggaagaaaacagcaagaagg gcaaccggac cccattccag tacctgagca gcagcgacag caagatcagc tacgaaaccttcaagaagca catcctgaat ctggccaagg gcaagggcag aatcagcaag accaagaaag agtatctgctggaagaacgg gacatcaaca ggttctccgt gcagaaagac ttcatcaacc ggaacctggt ggataccagatacgccacca gaggcctgat gaacctgctg cggagctact tcagagtgaa caacctggac gtgaaagtgaagtccatcaa tggcggcttc accagctttc tgcggcggaa gtggaagttt aagaaagagc ggaacaaggggtacaagcac cacgccgagg acgccctgat cattgccaac gccgatttca tcttcaaaga gtggaagaaactggacaagg ccaaaaaagt gatggaaaac cagatgttcg aggaaaagca ggccgagagc atgcccgagatcgaaaccga gcaggagtac aaagagatct tcatcacccc ccaccagatc aagcacatta aggacttcaaggactacaag tacagccacc gggtggacaa gaagcctaat agagagctga ttaacgacac cctgtactccacccggaagg acgacaaggg caacaccctg atcgtgaaca atctgaacgg cctgtacgac aaggacaatgacaagctgaa aaagctgatc aacaagagcc ccgaaaagct gctgatgtac caccacgacc cccagacctaccagaaactg aagctgatta tggaacagta cggcgacgag aagaatcccc tgtacaagta ctacgaggaaaccgggaact acctgaccaa gtactccaaa aaggacaacg gccccgtgat caagaagatt aagtattacggcaacaaact gaacgcccat ctggacatca ccgacgacta ccccaacagc agaaacaagg tcgtgaagctgtccctgaag ccctacagat tcgacgtgta cctggacaat ggcgtgtaca agttcgtgac cgtgaagaatctggatgtga tcaaaaaaga aaactactac gaagtgaata gcaagtgcta tgaggaagct aagaagctgaagaagatcag caaccaggcc gagtttatcg cctccttcta caacaacgat ctgatcaaga tcaacggcgagctgtataga gtgatcggcg tgaacaacga cctgctgaac cggatcgaag tgaacatgat cgacatcacctaccgcgagt acctggaaaa catgaacgac aagaggcccc ccaggatcat taagacaatc gcctccaagacccagagcat taagaagtac agcacagaca ttctgggcaa cctgtatgaa gtgaaatcta agaagcaccctcagatcatc aaaaagggc

SEQ ID NO:46

编码金黄色葡萄球菌Cas9的密码子优化的核酸序列

atgaagcgca actacatcct cggactggac atcggcatta cctccgtggg atacggcatcatcgattacg aaactaggga tgtgatcgac gctggagtca ggctgttcaa agaggcgaac gtggagaacaacgaggggcg gcgctcaaag aggggggccc gccggctgaa gcgccgccgc agacatagaa tccagcgcgtgaagaagctg ctgttcgact acaaccttct gaccgaccac tccgaacttt ccggcatcaa cccatatgaggctagagtga agggattgtc ccaaaagctg tccgaggaag agttctccgc cgcgttgctc cacctcgccaagcgcagggg agtgcacaat gtgaacgaag tggaagaaga taccggaaac gagctgtcca ccaaggagcagatcagccgg aactccaagg ccctggaaga gaaatacgtg gcggaactgc aactggagcg gctgaagaaagacggagaag tgcgcggctc gatcaaccgc ttcaagacct cggactacgt gaaggaggcc aagcagctcctgaaagtgca aaaggcctat caccaacttg accagtcctt tatcgatacc tacatcgatc tgctcgagactcggcggact tactacgagg gtccagggga gggctcccca tttggttgga aggatattaa ggagtggtacgaaatgctga tgggacactg cacatacttc cctgaggagc tgcggagcgt gaaatacgca tacaacgcagacctgtacaa cgcgctgaac gacctgaaca atctcgtgat cacccgggac gagaacgaaa agctcgagtattacgaaaag ttccagatta ttgagaacgt gttcaaacag aagaagaagc cgacactgaa gcagattgccaaggaaatcc tcgtgaacga agaggacatc aagggctatc gagtgacctc aacgggaaag ccggagttcaccaatctgaa ggtctaccac gacatcaaag acattaccgc ccggaaggag atcattgaga acgcggagctgttggaccag attgcgaaga ttctgaccat ctaccaatcc tccgaggata ttcaggaaga actcaccaacctcaacagcg aactgaccca ggaggagata gagcaaatct ccaacctgaa gggctacacc ggaactcataacctgagcct gaaggccatc aacttgatcc tggacgagct gtggcacacc aacgataacc agatcgctattttcaatcgg ctgaagctgg tccccaagaa agtggacctc tcacaacaaa aggagatccc tactacccttgtggacgatt tcattctgtc ccccgtggtc aagagaagct tcatacagtc aatcaaagtg atcaatgccattatcaagaa atacggtctg cccaacgaca ttatcattga gctcgcccgc gagaagaact cgaaggacgcccagaagatg attaacgaaa tgcagaagag gaaccgacag actaacgaac ggatcgaaga aatcatccggaccaccggga aggaaaacgc gaagtacctg atcgaaaaga tcaagctcca tgacatgcag gaaggaaagtgtctgtactc gctggaggcc attccgctgg aggacttgct gaacaaccct tttaactacg aagtggatcatatcattccg aggagcgtgt cattcgacaa ttccttcaac aacaaggtcc tcgtgaagca ggaggaaaactcgaagaagg gaaaccgcac gccgttccag tacctgagca gcagcgactc caagatttcc tacgaaaccttcaagaagca catcctcaac ctggcaaagg ggaagggtcg catctccaag accaagaagg aatatctgctggaagaaaga gacatcaaca gattctccgt gcaaaaggac ttcatcaacc gcaacctcgt ggatactagatacgctactc ggggtctgat gaacctcctg agaagctact ttagagtgaa caatctggac gtgaaggtcaagtcgattaa cggaggtttc acctccttcc tgcggcgcaa gtggaagttc aagaaggaac ggaacaagggctacaagcac cacgccgagg acgccctgat cattgccaac gccgacttca tcttcaaaga atggaagaaacttgacaagg ctaagaaggt catggaaaac cagatgttcg aagaaaagca ggccgagtct atgcctgaaatcgagactga acaggagtac aaggaaatct ttattacgcc acaccagatc aaacacatca aggatttcaaggattacaag tactcacatc gcgtggacaa aaagccgaac agggaactga tcaacgacac cctctactccacccggaagg atgacaaagg gaataccctc atcgtcaaca accttaacgg cctgtacgac aaggacaacgataagctgaa gaagctcatt aacaagtcgc ccgaaaagtt gctgatgtac caccacgacc ctcagacttaccagaagctc aagctgatca tggagcagta tggggacgag aaaaacccgt tgtacaagta ctacgaagaaactgggaatt atctgactaa gtactccaag aaagataacg gccccgtgat taagaagatt aagtactacggcaacaagct gaacgcccat ctggacatca ccgatgacta ccctaattcc cgcaacaagg tcgtcaagctgagcctcaag ccctaccggt ttgatgtgta ccttgacaat ggagtgtaca agttcgtgac tgtgaagaaccttgacgtga tcaagaagga gaactactac gaagtcaact ccaagtgcta cgaggaagca aagaagttgaagaagatctc gaaccaggcc gagttcattg cctccttcta taacaacgac ctgattaaga tcaacggcgaactgtaccgc gtcattggcg tgaacaacga tctcctgaac cgcatcgaag tgaacatgat cgacatcacttaccgggaat acctggagaa tatgaacgac aagcgcccgc cccggatcat taagactatc gcctcaaagacccagtcgat caagaagtac agcaccgaca tcctgggcaa cctgtacgag gtcaaatcga agaagcacccccagatcatc aagaaggga

SEQ ID NO:47

编码金黄色葡萄球菌Cas9的密码子优化的核酸序列

atggccccaaagaagaagcggaaggtcggtatccacggagtcccagcagccaagcggaactacatcctgggcctggacatcggcatcaccagcgtgggctacggcatcatcgactacgagacacgggacgtgatcgatgccggcgtgcggctgttcaaagaggccaacgtggaaaacaacgagggcaggcggagcaagagaggcgccagaaggctgaagcggcggaggcggcatagaatccagagagtgaagaagctgctgttcgactacaacctgctgaccgaccacagcgagctgagcggcatcaacccctacgaggccagagtgaagggcctgagccagaagctgagcgaggaagagttctctgccgccctgctgcacctggccaagagaagaggcgtgcacaacgtgaacgaggtggaagaggacaccggcaacgagctgtccaccagagagcagatcagccggaacagcaaggccctggaagagaaatacgtggccgaactgcagctggaacggctgaagaaagacggcgaagtgcggggcagcatcaacagattcaagaccagcgactacgtgaaagaagccaaacagctgctgaaggtgcagaaggcctaccaccagctggaccagagcttcatcgacacctacatcgacctgctggaaacccggcggacctactatgagggacctggcgagggcagccccttcggctggaaggacatcaaagaatggtacgagatgctgatgggccactgcacctacttccccgaggaactgcggagcgtgaagtacgcctacaacgccgacctgtacaacgccctgaacgacctgaacaatctcgtgatcaccagggacgagaacgagaagctggaatattacgagaagttccagatcatcgagaacgtgttcaagcagaagaagaagcccaccctgaagcagatcgccaaagaaatcctcgtgaacgaagaggatattaagggctacagagtgaccagcaccggcaagcccgagttcaccaacctgaaggtgtaccacgacatcaaggacattaccgcccggaaagagattattgagaacgccgagctgctggatcagattgccaagatcctgaccatctaccagagcagcgaggacatccaggaagaactgaccaatctgaactccgagctgacccaggaagagatcgagcagatctctaatctgaagggctataccggcacccacaacctgagcctgaaggccatcaacctgatcctggacgagctgtggcacaccaacgacaaccagatcgctatcttcaaccggctgaagctggtgcccaagaaggtggacctgtcccagcagaaagagatccccaccaccctggtggacgacttcatcctgagccccgtcgtgaagagaagcttcatccagagcatcaaagtgatcaacgccatcatcaagaagtacggcctgcccaacgacatcattatcgagctggcccgcgagaagaactccaaggacgcccagaaaatgatcaacgagatgcagaagcggaaccggcagaccaacgagcggatcgaggaaatcatccggaccaccggcaaagagaacgccaagtacctgatcgagaagatcaagctgcacgacatgcaggaaggcaagtgcctgtacagcctggaagccatccctctggaagatctgctgaacaaccccttcaactatgaggtggaccacatcatccccagaagcgtgtccttcgacaacagcttcaacaacaaggtgctcgtgaagcaggaagaaaacagcaagaagggcaaccggaccccattccagtacctgagcagcagcgacagcaagatcagctacgaaaccttcaagaagcacatcctgaatctggccaagggcaagggcagaatcagcaagaccaagaaagagtatctgctggaagaacgggacatcaacaggttctccgtgcagaaagacttcatcaaccggaacctggtggataccagatacgccaccagaggcctgatgaacctgctgcggagctacttcagagtgaacaacctggacgtgaaagtgaagtccatcaatggcggcttcaccagctttctgcggcggaagtggaagtttaagaaagagcggaacaaggggtacaagcaccacgccgaggacgccctgatcattgccaacgccgatttcatcttcaaagagtggaagaaactggacaaggccaaaaaagtgatggaaaaccagatgttcgaggaaaggcaggccgagagcatgcccgagatcgaaaccgagcaggagtacaaagagatcttcatcaccccccaccagatcaagcacattaaggacttcaaggactacaagtacagccaccgggtggacaagaagcctaatagagagctgattaacgacaccctgtactccacccggaaggacgacaagggcaacaccctgatcgtgaacaatctgaacggcctgtacgacaaggacaatgacaagctgaaaaagctgatcaacaagagccccgaaaagctgctgatgtaccaccacgacccccagacctaccagaaactgaagctgattatggaacagtacggcgacgagaagaatcccctgtacaagtactacgaggaaaccgggaactacctgaccaagtactccaaaaaggacaacggccccgtgatcaagaagattaagtattacggcaacaaactgaacgcccatctggacatcaccgacgactaccccaacagcagaaacaaggtcgtgaagctgtccctgaagccctacagattcgacgtgtacctggacaatggcgtgtacaagttcgtgaccgtgaagaatctggatgtgatcaaaaaagaaaactactacgaagtgaatagcaagtgctatgaggaagctaagaagctgaagaagatcagcaaccaggccgagtttatcgcctccttctacaacaacgatctgatcaagatcaacggcgagctgtatagagtgatcggcgtgaacaacgacctgctgaaccggatcgaagtgaacatgatcgacatcacctaccgcgagtacctggaaaacatgaacgacaagaggccccccaggatcattaagacaatcgcctccaagacccagagcattaagaagtacagcacagacattctgggcaacctgtatgaagtgaaatctaagaagcaccctcagatcatcaaaaagggcaaaaggccggcggccacgaaaaaggccggccaggcaaaaaagaaaaag

SEQ ID NO:48

编码金黄色葡萄球菌Cas9的密码子优化的核酸序列

accggtgcca ccatgtaccc atacgatgtt ccagattacg cttcgccgaa gaaaaagcgcaaggtcgaag cgtccatgaa aaggaactac attctggggc tggacatcgg gattacaagc gtggggtatgggattattga ctatgaaaca agggacgtga tcgacgcagg cgtcagactg ttcaaggagg ccaacgtggaaaacaatgag ggacggagaa gcaagagggg agccaggcgc ctgaaacgac ggagaaggca cagaatccagagggtgaaga aactgctgtt cgattacaac ctgctgaccg accattctga gctgagtgga attaatccttatgaagccag ggtgaaaggc ctgagtcaga agctgtcaga ggaagagttt tccgcagctc tgctgcacctggctaagcgc cgaggagtgc ataacgtcaa tgaggtggaa gaggacaccg gcaacgagct gtctacaaaggaacagatct cacgcaatag caaagctctg gaagagaagt atgtcgcaga gctgcagctg gaacggctgaagaaagatgg cgaggtgaga gggtcaatta ataggttcaa gacaagcgac tacgtcaaag aagccaagcagctgctgaaa gtgcagaagg cttaccacca gctggatcag agcttcatcg atacttatat cgacctgctggagactcgga gaacctacta tgagggacca ggagaaggga gccccttcgg atggaaagac atcaaggaatggtacgagat gctgatggga cattgcacct attttccaga agagctgaga agcgtcaagt acgcttataacgcagatct tacaacgccc tgaatgacct gaacaacctg gtcatcacca gggatgaaaa cgagaaactggaatactatg agaagttcca gatcatcgaa aacgtgttta agcagaagaa aaagcctaca ctgaaacagattgctaagga gatcctggtc aacgaagagg acatcaaggg ctaccgggtg acaagcactg gaaaaccagagttcaccaat ctgaaagtgt atcacgatat taaggacatc acagcacgga aagaaatcat tgagaacgccgaactgctgg atcagattgc taagatcctg actatctacc agagctccga ggacatccag gaagagctgactaacctgaa cagcgagctg acccaggaag agatcgaaca gattagtaat ctgaaggggt acaccggaacacacaacctg tccctgaaag ctatcaatct gattctggat gagctgtggc atacaaacga caatcagattgcaatcttta accggctgaa gctggtccca aaaaaggtgg acctgagtca gcagaaagag atcccaaccacactggtgga cgatttcatt ctgtcacccg tggtcaagcg gagcttcatc cagagcatca aagtgatcaacgccatcatc aagaagtacg gcctgcccaa tgatatcatt atcgagctgg ctagggagaa gaacagcaaggacgcacaga agatgatcaa tgagatgcag aaacgaaacc ggcagaccaa tgaacgcatt gaagagattatccgaactac cgggaaagag aacgcaaagt acctgattga aaaaatcaag ctgcacgata tgcaggagggaaagtgtctg tattctctgg aggccatccc cctggaggac ctgctgaaca atccattcaa ctacgaggtcgatcatatta tccccagaag cgtgtccttc gacaattcct ttaacaacaa ggtgctggtc aagcaggaagagaactctaa aaagggcaat aggactcctt tccagtacct gtctagttca gattccaaga tctcttacgaaacctttaaa aagcacattc tgaatctggc caaaggaaag ggccgcatca gcaagaccaa aaaggagtacctgctggaag agcgggacat caacagattc tccgtccaga aggattttat taaccggaat ctggtggacacaagatacgc tactcgcggc ctgatgaatc tgctgcgatc ctatttccgg gtgaacaatc tggatgtgaaagtcaagtcc atcaacggcg ggttcacatc ttttctgagg cgcaaatgga agtttaaaaa ggagcgcaacaaagggtaca agcaccatgc cgaagatgct ctgattatcg caaatgccga cttcatcttt aaggagtggaaaaagctgga caaagccaag aaagtgatgg agaaccagat gttcgaagag aagcaggccg aatctatgcccgaaatcgag acagaacagg agtacaagga gattttcatc actcctcacc agatcaagca tatcaaggatttcaaggact acaagtactc tcaccgggtg gataaaaagc ccaacagaga gctgatcaat gacaccctgtatagtacaag aaaagacgat aaggggaata ccctgattgt gaacaatctg aacggactgt acgacaaagataatgacaag ctgaaaaagc tgatcaacaa aagtcccgag aagctgctga tgtaccacca tgatcctcagacatatcaga aactgaagct gattatggag cagtacggcg acgagaagaa cccactgtat aagtactatgaagagactgg gaactacctg accaagtata gcaaaaagga taatggcccc gtgatcaaga agatcaagtactatgggaac aagctgaatg cccatctgga catcacagac gattacccta acagtcgcaa caaggtggtcaagctgtcac tgaagccata cagattcgat gtctatctgg acaacggcgt gtataaattt gtgactgtcaagaatctgga tgtcatcaaa aaggagaact actatgaagt gaatagcaag tgctacgaag aggctaaaaagctgaaaaag attagcaacc aggcagagtt catcgcctcc ttttacaaca acgacctgat taagatcaatggcgaactgt atagggtcat cggggtgaac aatgatctgc tgaaccgcat tgaagtgaat atgattgacatcacttaccg agagtatctg gaaaacatga atgataagcg cccccctcga attatcaaaa caattgcctctaagactcag agtatcaaaa agtactcaac cgacattctg ggaaacctgt atgaggtgaa gagcaaaaagcaccctcaga ttatcaaaaa gggctaagaa ttcSEQ ID NO:49

金黄色葡萄球菌Cas9的氨基酸序列

MKRNYILGLDIGITSVGYGIIDYETRDVIDAGVRLFKEANVENNEGRRSKRGARRLKRRRRHRIQRVKKLLFDYNLLTDHSELSGINPYEARVKGLSQKLSEEEFSAALLHLAKRRGVHNVNEVEEDTGNELSTKEQISRNSKALEEKYVAELQLERLKKDGEVRGSINRFKTSDYVKEAKQLLKVQKAYHQLDQSFIDTYIDLLETRRTYYEGPGEGSPFGWKDIKEWYEMLMGHCTYFPEELRSVKYAYNADLYNALNDLNNLVITRDENEKLEYYEKFQIIENVFKQKKKPTLKQIAKEILVNEEDIKGYRVTSTGKPEFTNLKVYHDIKDITARKEIIENAELLDQIAKILTIYQSSEDIQEELTNLNSELTQEEIEQISNLKGYTGTHNLSLKAINLILDELWHTNDNQIAIFNRLKLVPKKVDLSQQKEIPTTLVDDFILSPVVKRSFIQSIKVINAIIKKYGLPNDIIIELAREKNSKDAQKMINEMQKRNRQTNERIEEIIRTTGKENAKYLIEKIKLHDMQEGKCLYSLEAIPLEDLLNNPFNYEVDHIIPRSVSFDNSFNNKVLVKQEENSKKGNRTPFQYLSSSDSKISYETFKKHILNLAKGKGRISKTKKEYLLEERDINRFSVQKDFINRNLVDTRYATRGLMNLLRSYFRVNNLDVKVKSINGGFTSFLRRKWKFKKERNKGYKHHAEDALIIANADFIFKEWKKLDKAKKVMENQMFEEKQAESMPEIETEQEYKEIFITPHQIKHIKDFKDYKYSHRVDKKPNRELINDTLYSTRKDDKGNTLIVNNLNGLYDKDNDKLKKLINKSPEKLLMYHHDPQTYQKLKLIMEQYGDEKNPLYKYYEETGNYLTKYSKKDNGPVIKKIKYYGNKLNAHLDITDDYPNSRNKVVKLSLKPYRFDVYLDNGVYKFVTVKNLDVIKKENYYEVNSKCYEEAKKLKKISNQAEFIASFYNNDLIKINGELYRVIGVNNDLLNRIEVNMIDITYREYLENMNDKRPPRIIKTIASKTQSIKKYSTDILGNLYEVKSKKHPQIIKKG

SEQ ID NO:50

编码金黄色葡萄球菌Cas9的D10A突变体的核酸序列

atgaaaagga actacattct ggggctggcc atcgggatta caagcgtggg gtatgggattattgactatg aaacaaggga cgtgatcgac gcaggcgtca gactgttcaa ggaggccaac gtggaaaacaatgagggacg gagaagcaag aggggagcca ggcgcctgaa acgacggaga aggcacagaa tccagagggtgaagaaactg ctgttcgatt acaacctgct gaccgaccat tctgagctga gtggaattaa tccttatgaagccagggtga aaggcctgag tcagaagctg tcagaggaag agttttccgc agctctgctg cacctggctaagcgccgagg agtgcataac gtcaatgagg tggaagagga caccggcaac gagctgtcta caaaggaacagatctcacgc aatagcaaag ctctggaaga gaagtatgtc gcagagctgc agctggaacg gctgaagaaagatggcgagg tgagagggtc aattaatagg ttcaagacaa gcgactacgt caaagaagcc aagcagctgctgaaagtgca gaaggcttac caccagctgg atcagagctt catcgatact tatatcgacc tgctggagactcggagaacc tactatgagg gaccaggaga agggagcccc ttcggatgga aagacatcaa ggaatggtacgagatgctga tgggacattg cacctatttt ccagaagagc tgagaagcgt caagtacgct tataacgcagatctgtacaa cgccctgaat gacctgaaca acctggtcat caccagggat gaaaacgaga aactggaatactatgagaag ttccagatca tcgaaaacgt gtttaagcag aagaaaaagc ctacactgaa acagattgctaaggagatcc tggtcaacga agaggacatc aagggctacc gggtgacaag cactggaaaa ccagagttcaccaatctgaa agtgtatcac gatattaagg acatcacagc acggaaagaa atcattgaga acgccgaactgctggatcag attgctaaga tcctgactat ctaccagagc tccgaggaca tccaggaaga gctgactaacctgaacagcg agctgaccca ggaagagatc gaacagatta gtaatctgaa ggggtacacc ggaacacacaacctgtccct gaaagctatc aatctgattc tggatgagct gtggcataca aacgacaatc agattgcaatctttaaccgg ctgaagctgg tcccaaaaaa ggtggacctg agtcagcaga aagagatccc aaccacactggtggacgatt tcattctgtc acccgtggtc aagcggagct tcatccagag catcaaagtg atcaacgccatcatcaagaa gtacggcctg cccaatgata tcattatcga gctggctagg gagaagaaca gcaaggacgcacagaagatg atcaatgaga tgcagaaacg aaaccggcag accaatgaac gcattgaaga gattatccgaactaccggga aagagaacgc aaagtacctg attgaaaaaa tcaagctgca cgatatgcag gagggaaagtgtctgtattc tctggaggcc atccccctgg aggacctgct gaacaatcca ttcaactacg aggtcgatcatattatcccc agaagcgtgt ccttcgacaa ttcctttaac aacaaggtgc tggtcaagca ggaagagaactctaaaaagg gcaataggac tcctttccag tacctgtcta gttcagattc caagatctct tacgaaacctttaaaaagca cattctgaat ctggccaaag gaaagggccg catcagcaag accaaaaagg agtacctgctggaagagcgg gacatcaaca gattctccgt ccagaaggat tttattaacc ggaatctggt ggacacaagatacgctactc gcggcctgat gaatctgctg cgatcctatt tccgggtgaa caatctggat gtgaaagtcaagtccatcaa cggcgggttc acatcttttc tgaggcgcaa atggaagttt aaaaaggagc gcaacaaagggtacaagcac catgccgaag atgctctgat tatcgcaaat gccgacttca tctttaagga gtggaaaaagctggacaaag ccaagaaagt gatggagaac cagatgttcg aagagaagca ggccgaatct atgcccgaaatcgagacaga acaggagtac aaggagattt tcatcactcc tcaccagatc aagcatatca aggatttcaaggactacaag tactctcacc gggtggataa aaagcccaac agagagctga tcaatgacac cctgtatagtacaagaaaag acgataaggg gaataccctg attgtgaaca atctgaacgg actgtacgac aaagataatgacaagctgaa aaagctgatc aacaaaagtc ccgagaagct gctgatgtac caccatgatc ctcagacatatcagaaactg aagctgatta tggagcagta cggcgacgag aagaacccac tgtataagta ctatgaagagactgggaact acctgaccaa gtatagcaaa aaggataatg gccccgtgat caagaagatc aagtactatgggaacaagct gaatgcccat ctggacatca cagacgatta ccctaacagt cgcaacaagg tggtcaagctgtcactgaag ccatacagat tcgatgtcta tctggacaac ggcgtgtata aatttgtgac tgtcaagaatctggatgtca tcaaaaagga gaactactat gaagtgaata gcaagtgcta cgaagaggct aaaaagctgaaaaagattag caaccaggca gagttcatcg cctcctttta caacaacgac ctgattaaga tcaatggcgaactgtatagg gtcatcgggg tgaacaatga tctgctgaac cgcattgaag tgaatatgat tgacatcacttaccgagagt atctggaaaa catgaatgat aagcgccccc ctcgaattat caaaacaatt gcctctaagactcagagtat caaaaagtac tcaaccgaca ttctgggaaa cctgtatgag gtgaagagca aaaagcaccctcagattatc aaaaagggc

SEQ ID NO:51

编码金黄色葡萄球菌Cas9的N580A突变体的核酸序列

atgaaaagga actacattct ggggctggac atcgggatta caagcgtggg gtatgggattattgactatg aaacaaggga cgtgatcgac gcaggcgtca gactgttcaa ggaggccaac gtggaaaacaatgagggacg gagaagcaag aggggagcca ggcgcctgaa acgacggaga aggcacagaa tccagagggtgaagaaactg ctgttcgatt acaacctgct gaccgaccat tctgagctga gtggaattaa tccttatgaagccagggtga aaggcctgag tcagaagctg tcagaggaag agttttccgc agctctgctg cacctggctaagcgccgagg agtgcataac gtcaatgagg tggaagagga caccggcaac gagctgtcta caaaggaacagatctcacgc aatagcaaag ctctggaaga gaagtatgtc gcagagctgc agctggaacg gctgaagaaagatggcgagg tgagagggtc aattaatagg ttcaagacaa gcgactacgt caaagaagcc aagcagctgctgaaagtgca gaaggcttac caccagctgg atcagagctt catcgatact tatatcgacc tgctggagactcggagaacc tactatgagg gaccaggaga agggagcccc ttcggatgga aagacatcaa ggaatggtacgagatgctga tgggacattg cacctatttt ccagaagagc tgagaagcgt caagtacgct tataacgcagatctgtacaa cgccctgaat gacctgaaca acctggtcat caccagggat gaaaacgaga aactggaatactatgagaag ttccagatca tcgaaaacgt gtttaagcag aagaaaaagc ctacactgaa acagattgctaaggagatcc tggtcaacga agaggacatc aagggctacc gggtgacaag cactggaaaa ccagagttcaccaatctgaa agtgtatcac gatattaagg acatcacagc acggaaagaa atcattgaga acgccgaactgctggatcag attgctaaga tcctgactat ctaccagagc tccgaggaca tccaggaaga gctgactaacctgaacagcg agctgaccca ggaagagatc gaacagatta gtaatctgaa ggggtacacc ggaacacacaacctgtccct gaaagctatc aatctgattc tggatgagct gtggcataca aacgacaatc agattgcaatctttaaccgg ctgaagctgg tcccaaaaaa ggtggacctg agtcagcaga aagagatccc aaccacactggtggacgatt tcattctgtc acccgtggtc aagcggagct tcatccagag catcaaagtg atcaacgccatcatcaagaa gtacggcctg cccaatgata tcattatcga gctggctagg gagaagaaca gcaaggacgcacagaagatg atcaatgaga tgcagaaacg aaaccggcag accaatgaac gcattgaaga gattatccgaactaccggga aagagaacgc aaagtacctg attgaaaaaa tcaagctgca cgatatgcag gagggaaagtgtctgtattc tctggaggcc atccccctgg aggacctgct gaacaatcca ttcaactacg aggtcgatcatattatcccc agaagcgtgt ccttcgacaa ttcctttaac aacaaggtgc tggtcaagca ggaagaggcctctaaaaagg gcaataggac tcctttccag tacctgtcta gttcagattc caagatctct tacgaaacctttaaaaagca cattctgaat ctggccaaag gaaagggccg catcagcaag accaaaaagg agtacctgctggaagagcgg gacatcaaca gattctccgt ccagaaggat tttattaacc ggaatctggt ggacacaagatacgctactc gcggcctgat gaatctgctg cgatcctatt tccgggtgaa caatctggat gtgaaagtcaagtccatcaa cggcgggttc acatcttttc tgaggcgcaa atggaagttt aaaaaggagc gcaacaaagggtacaagcac catgccgaag atgctctgat tatcgcaaat gccgacttca tctttaagga gtggaaaaagctggacaaag ccaagaaagt gatggagaac cagatgttcg aagagaagca ggccgaatct atgcccgaaatcgagacaga acaggagtac aaggagattt tcatcactcc tcaccagatc aagcatatca aggatttcaaggactacaag tactctcacc gggtggataa aaagcccaac agagagctga tcaatgacac cctgtatagtacaagaaaag acgataaggg gaataccctg attgtgaaca atctgaacgg actgtacgac aaagataatgacaagctgaa aaagctgatc aacaaaagtc ccgagaagct gctgatgtac caccatgatc ctcagacatatcagaaactg aagctgatta tggagcagta cggcgacgag aagaacccac tgtataagta ctatgaagagactgggaact acctgaccaa gtatagcaaa aaggataatg gccccgtgat caagaagatc aagtactatgggaacaagct gaatgcccat ctggacatca cagacgatta ccctaacagt cgcaacaagg tggtcaagctgtcactgaag ccatacagat tcgatgtcta tctggacaac ggcgtgtata aatttgtgac tgtcaagaatctggatgtca tcaaaaagga gaactactat gaagtgaata gcaagtgcta cgaagaggct aaaaagctgaaaaagattag caaccaggca gagttcatcg cctcctttta caacaacgac ctgattaaga tcaatggcgaactgtatagg gtcatcgggg tgaacaatga tctgctgaac cgcattgaag tgaatatgat tgacatcacttaccgagagt atctggaaaa catgaatgat aagcgccccc ctcgaattat caaaacaatt gcctctaagactcagagtat caaaaagtac tcaaccgaca ttctgggaaa cctgtatgag gtgaagagca aaaagcaccctcagattatc aaaaagggc

SEQ ID NO:52

编码金黄色葡萄球菌Cas9的密码子优化的核酸序列

atggccccaaagaagaagcggaaggtcggtatccacggagtcccagcagccaagcggaactacatcctgggcctggacatcggcatcaccagcgtgggctacggcatcatcgactacgagacacgggacgtgatcgatgccggcgtgcggctgttcaaagaggccaacgtggaaaacaacgagggcaggcggagcaagagaggcgccagaaggctgaagcggcggaggcggcatagaatccagagagtgaagaagctgctgttcgactacaacctgctgaccgaccacagcgagctgagcggcatcaacccctacgaggccagagtgaagggcctgagccagaagctgagcgaggaagagttctctgccgccctgctgcacctggccaagagaagaggcgtgcacaacgtgaacgaggtggaagaggacaccggcaacgagctgtccaccaaagagcagatcagccggaacagcaaggccctggaagagaaatacgtggccgaactgcagctggaacggctgaagaaagacggcgaagtgcggggcagcatcaacagattcaagaccagcgactacgtgaaagaagccaaacagctgctgaaggtgcagaaggcctaccaccagctggaccagagcttcatcgacacctacatcgacctgctggaaacccggcggacctactatgagggacctggcgagggcagccccttcggctggaaggacatcaaagaatggtacgagatgctgatgggccactgcacctacttccccgaggaactgcggagcgtgaagtacgcctacaacgccgacctgtacaacgccctgaacgacctgaacaatctcgtgatcaccagggacgagaacgagaagctggaatattacgagaagttccagatcatcgagaacgtgttcaagcagaagaagaagcccaccctgaagcagatcgccaaagaaatcctcgtgaacgaagaggatattaagggctacagagtgaccagcaccggcaagcccgagttcaccaacctgaaggtgtaccacgacatcaaggacattaccgcccggaaagagattattgagaacgccgagctgctggatcagattgccaagatcctgaccatctaccagagcagcgaggacatccaggaagaactgaccaatctgaactccgagctgacccaggaagagatcgagcagatctctaatctgaagggctataccggcacccacaacctgagcctgaaggccatcaacctgatcctggacgagctgtggcacaccaacgacaaccagatcgctatcttcaaccggctgaagctggtgcccaagaaggtggacctgtcccagcagaaagagatccccaccaccctggtggacgacttcatcctgagccccgtcgtgaagagaagcttcatccagagcatcaaagtgatcaacgccatcatcaagaagtacggcctgcccaacgacatcattatcgagctggcccgcgagaagaactccaaggacgcccagaaaatgatcaacgagatgcagaagcggaaccggcagaccaacgagcggatcgaggaaatcatccggaccaccggcaaagagaacgccaagtacctgatcgagaagatcaagctgcacgacatgcaggaaggcaagtgcctgtacagcctggaagccatccctctggaagatctgctgaacaaccccttcaactatgaggtggaccacatcatccccagaagcgtgtccttcgacaacagcttcaacaacaaggtgctcgtgaagcaggaagaaaacagcaagaagggcaaccggaccccattccagtacctgagcagcagcgacagcaagatcagctacgaaaccttcaagaagcacatcctgaatctggccaagggcaagggcagaatcagcaagaccaagaaagagtatctgctggaagaacgggacatcaacaggttctccgtgcagaaagacttcatcaaccggaacctggtggataccagatacgccaccagaggcctgatgaacctgctgcggagctacttcagagtgaacaacctggacgtgaaagtgaagtccatcaatggcggcttcaccagctttctgcggcggaagtggaagtttaagaaagagcggaacaaggggtacaagcaccacgccgaggacgccctgatcattgccaacgccgatttcatcttcaaagagtggaagaaactggacaaggccaaaaaagtgatggaaaaccagatgttcgaggaaaagcaggccgagagcatgcccgagatcgaaaccgagcaggagtacaaagagatcttcatcaccccccaccagatcaagcacattaaggacttcaaggactacaagtacagccaccgggtggacaagaagcctaatagagagctgattaacgacaccctgtactccacccggaaggacgacaagggcaacaccctgatcgtgaacaatctgaacggcctgtacgacaaggacaatgacaagctgaaaaagctgatcaacaagagccccgaaaagctgctgatgtaccaccacgacccccagacctaccagaaactgaagctgattatggaacagtacggcgacgagaagaatcccctgtacaagtactacgaggaaaccgggaactacctgaccaagtactccaaaaaggacaacggccccgtgatcaagaagattaagtattacggcaacaaactgaacgcccatctggacatcaccgacgactaccccaacagcagaaacaaggtcgtgaagctgtccctgaagccctacagattcgacgtgtacctggacaatggcgtgtacaagttcgtgaccgtgaagaatctggatgtgatcaaaaaagaaaactactacgaagtgaatagcaagtgctatgaggaagctaagaagctgaagaagatcagcaaccaggccgagtttatcgcctccttctacaacaacgatctgatcaagatcaacggcgagctgtatagagtgatcggcgtgaacaacgacctgctgaaccggatcgaagtgaacatgatcgacatcacctaccgcgagtacctggaaaacatgaacgacaagaggccccccaggatcattaagacaatcgcctccaagacccagagcattaagaagtacagcacagacattctgggcaacctgtatgaagtgaaatctaagaagcaccctcagatcatcaaaaagggcaaaaggccggcggccacgaaaaaggccggccaggcaaaaaagaaaaag

SEQ ID NO:53

编码金黄色葡萄球菌Cas9的密码子优化的核酸序列

aagcggaactacatcctgggcctggacatcggcatcaccagcgtgggctacggcatcatcgactacgagacacgggacgtgatcgatgccggcgtgcggctgttcaaagaggccaacgtggaaaacaacgagggcaggcggagcaagagaggcgccagaaggctgaagcggcggaggcggcatagaatccagagagtgaagaagctgctgttcgactacaacctgctgaccgaccacagcgagctgagcggcatcaacccctacgaggccagagtgaagggcctgagccagaagctgagcgaggaagagttctctgccgccctgctgcacctggccaagagaagaggcgtgcacaacgtgaacgaggtggaagaggacaccggcaacgagctgtccaccaaagagcagatcagccggaacagcaaggccctggaagagaaatacgtggccgaactgcagctggaacggctgaagaaagacggcgaagtgcggggcagcatcaacagattcaagaccagcgactacgtgaaagaagccaaacagctgctgaaggtgcagaaggcctaccaccagctggaccagagcttcatcgacacctacatcgacctgctggaaacccggcggacctactatgagggacctggcgagggcagccccttcggctggaaggacatcaaagaatggtacgagatgctgatgggccactgcacctacttccccgaggaactgcggagcgtgaagtacgcctacaacgccgacctgtacaacgccctgaacgacctgaacaatctcgtgatcaccagggacgagaacgagaagctggaatattacgagaagttccagatcatcgagaacgtgttcaagcagaagaagaagcccaccctgaagcagatcgccaaagaaatcctcgtgaacgaagaggatattaagggctacagagtgaccagcaccggcaagcccgagttcaccaacctgaaggtgtaccacgacatcaaggacattaccgcccggaaagagattattgagaacgccgagctgctggatcagattgccaagatcctgaccatctaccagagcagcgaggacatccaggaagaactgaccaatctgaactccgagctgacccaggaagagatcgagcagatctctaatctgaagggctataccggcacccacaacctgagcctgaaggccatcaacctgatcctggacgagctgtggcacaccaacgacaaccagatcgctatcttcaaccggctgaagctggtgcccaagaaggtggacctgtcccagcagaaagagatccccaccaccctggtggacgacttcatcctgagccccgtcgtgaagagaagcttcatccagagcatcaaagtgatcaacgccatcatcaagaagtacggcctgcccaacgacatcattatcgagctggcccgcgagaagaactccaaggacgcccagaaaatgatcaacgagatgcagaagcggaaccggcagaccaacgagcggatcgaggaaatcatccggaccaccggcaaagagaacgccaagtacctgatcgagaagatcaagctgcacgacatgcaggaaggcaagtgcctgtacagcctggaagccatccctctggaagatctgctgaacaaccccttcaactatgaggtggaccacatcatccccagaagcgtgtccttcgacaacagcttcaacaacaaggtgctcgtgaagcaggaagaaaacagcaagaagggcaaccggaccccattccagtacctgagcagcagcgacagcaagatcagctacgaaaccttcaagaagcacatcctgaatctggccaagggcaagggcagaatcagcaagaccaagaaagagtatctgctggaagaacgggacatcaacaggttctccgtgcagaaagacttcatcaaccggaacctggtggataccagatacgccaccagaggcctgatgaacctgctgcggagctacttcagagtgaacaacctggacgtgaaagtgaagtccatcaatggcggcttcaccagctttctgcggcggaagtggaagtttaagaaagagcggaacaaggggtacaagcaccacgccgaggacgccctgatcattgccaacgccgatttcatcttcaaagagtggaagaaactggacaaggccaaaaaagtgatggaaaaccagatgttcgaggaaaagcaggccgagagcatgcccgagatcgaaaccgagcaggagtacaaagagatcttcatcaccccccaccagatcaagcacattaaggacttcaaggactacaagtacagccaccgggtggacaagaagcctaatagagagctgattaacgacaccctgtactccacccggaaggacgacaagggcaacaccctgatcgtgaacaatctgaacggcctgtacgacaaggacaatgacaagctgaaaaagctgatcaacaagagccccgaaaagctgctgatgtaccaccacgacccccagacctaccagaaactgaagctgattatggaacagtacggcgacgagaagaatcccctgtacaagtactacgaggaaaccgggaactacctgaccaagtactccaaaaaggacaacggccccgtgatcaagaagattaagtattacggcaacaaactgaacgcccatctggacatcaccgacgactaccccaacagcagaaacaaggtcgtgaagctgtccctgaagccctacagattcgacgtgtacctggacaatggcgtgtacaagttcgtgaccgtgaagaatctggatgtgatcaaaaaagaaaactactacgaagtgaatagcaagtgctatgaggaagctaagaagctgaagaagatcagcaaccaggccgagtttatcgcctccttctacaacaacgatctgatcaagatcaacggcgagctgtatagagtgatcggcgtgaacaacgacctgctgaaccggatcgaagtgaacatgatcgacatcacctaccgcgagtacctggaaaacatgaacgacaagaggccccccaggatcattaagacaatcgcctccaagacccagagcattaagaagtacagcacagacattctgggcaacctgtatgaagtgaaatctaagaagcaccctcagatcatcaaaaagggc

SEQ ID NO:54

酿脓链球菌Cas9(具有D10A、H849A)

MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDAIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD

SEQ ID NO:55

编码金黄色葡萄球菌Cas9的密码子优化的核酸序列的编码载体(pDO242)

ctaaattgtaagcgttaatattttgttaaaattcgcgttaaatttttgttaaatcagctcattttttaaccaataggccgaaatcggcaaaatcccttataaatcaaaagaatagaccgagatagggttgagtgttgttccagtttggaacaagagtccactattaaagaacgtggactccaacgtcaaagggcgaaaaaccgtctatcagggcgatggcccactacgtgaaccatcaccctaatcaagttttttggggtcgaggtgccgtaaagcactaaatcggaaccctaaagggagcccccgatttagagcttgacggggaaagccggcgaacgtggcgagaaaggaagggaagaaagcgaaaggagcgggcgctagggcgctggcaagtgtagcggtcacgctgcgcgtaaccaccacacccgccgcgcttaatgcgccgctacagggcgcgtcccattcgccattcaggctgcgcaactgttgggaagggcgatcggtgcgggcctcttcgctattacgccagctggcgaaagggggatgtgctgcaaggcgattaagttgggtaacgccagggttttcccagtcacgacgttgtaaaacgacggccagtgagcgcgcgtaatacgactcactatagggcgaattgggtacCtttaattctagtactatgcaTgcgttgacattgattattgactagttattaatagtaatcaattacggggtcattagttcatagcccatatatggagttccgcgttacataacttacggtaaatggcccgcctggctgaccgcccaacgacccccgcccattgacgtcaataatgacgtatgttcccatagtaacgccaatagggactttccattgacgtcaatgggtggagtatttacggtaaactgcccacttggcagtacatcaagtgtatcatatgccaagtacgccccctattgacgtcaatgacggtaaatggcccgcctggcattatgcccagtacatgaccttatgggactttcctacttggcagtacatctacgtattagtcatcgctattaccatggtgatgcggttttggcagtacatcaatgggcgtggatagcggtttgactcacggggatttccaagtctccaccccattgacgtcaatgggagtttgttttggcaccaaaatcaacgggactttccaaaatgtcgtaacaactccgccccattgacgcaaatgggcggtaggcgtgtacggtgggaggtctatataagcagagctctctggctaactaccggtgccaccATGAAAAGGAACTACATTCTGGGGCTGGACATCGGGATTACAAGCGTGGGGTATGGGATTATTGACTATGAAACAAGGGACGTGATCGACGCAGGCGTCAGACTGTTCAAGGAGGCCAACGTGGAAAACAATGAGGGACGGAGAAGCAAGAGGGGAGCCAGGCGCCTGAAACGACGGAGAAGGCACAGAATCCAGAGGGTGAAGAAACTGCTGTTCGATTACAACCTGCTGACCGACCATTCTGAGCTGAGTGGAATTAATCCTTATGAAGCCAGGGTGAAAGGCCTGAGTCAGAAGCTGTCAGAGGAAGAGTTTTCCGCAGCTCTGCTGCACCTGGCTAAGCGCCGAGGAGTGCATAACGTCAATGAGGTGGAAGAGGACACCGGCAACGAGCTGTCTACAAAGGAACAGATCTCACGCAATAGCAAAGCTCTGGAAGAGAAGTATGTCGCAGAGCTGCAGCTGGAACGGCTGAAGAAAGATGGCGAGGTGAGAGGGTCAATTAATAGGTTCAAGACAAGCGACTACGTCAAAGAAGCCAAGCAGCTGCTGAAAGTGCAGAAGGCTTACCACCAGCTGGATCAGAGCTTCATCGATACTTATATCGACCTGCTGGAGACTCGGAGAACCTACTATGAGGGACCAGGAGAAGGGAGCCCCTTCGGATGGAAAGACATCAAGGAATGGTACGAGATGCTGATGGGACATTGCACCTATTTTCCAGAAGAGCTGAGAAGCGTCAAGTACGCTTATAACGCAGATCTGTACAACGCCCTGAATGACCTGAACAACCTGGTCATCACCAGGGATGAAAACGAGAAACTGGAATACTATGAGAAGTTCCAGATCATCGAAAACGTGTTTAAGCAGAAGAAAAAGCCTACACTGAAACAGATTGCTAAGGAGATCCTGGTCAACGAAGAGGACATCAAGGGCTACCGGGTGACAAGCACTGGAAAACCAGAGTTCACCAATCTGAAAGTGTATCACGATATTAAGGACATCACAGCACGGAAAGAAATCATTGAGAACGCCGAACTGCTGGATCAGATTGCTAAGATCCTGACTATCTACCAGAGCTCCGAGGACATCCAGGAAGAGCTGACTAACCTGAACAGCGAGCTGACCCAGGAAGAGATCGAACAGATTAGTAATCTGAAGGGGTACACCGGAACACACAACCTGTCCCTGAAAGCTATCAATCTGATTCTGGATGAGCTGTGGCATACAAACGACAATCAGATTGCAATCTTTAACCGGCTGAAGCTGGTCCCAAAAAAGGTGGACCTGAGTCAGCAGAAAGAGATCCCAACCACACTGGTGGACGATTTCATTCTGTCACCCGTGGTCAAGCGGAGCTTCATCCAGAGCATCAAAGTGATCAACGCCATCATCAAGAAGTACGGCCTGCCCAATGATATCATTATCGAGCTGGCTAGGGAGAAGAACAGCAAGGACGCACAGAAGATGATCAATGAGATGCAGAAACGAAACCGGCAGACCAATGAACGCATTGAAGAGATTATCCGAACTACCGGGAAAGAGAACGCAAAGTACCTGATTGAAAAAATCAAGCTGCACGATATGCAGGAGGGAAAGTGTCTGTATTCTCTGGAGGCCATCCCCCTGGAGGACCTGCTGAACAATCCATTCAACTACGAGGTCGATCATATTATCCCCAGAAGCGTGTCCTTCGACAATTCCTTTAACAACAAGGTGCTGGTCAAGCAGGAAGAGAACTCTAAAAAGGGCAATAGGACTCCTTTCCAGTACCTGTCTAGTTCAGATTCCAAGATCTCTTACGAAACCTTTAAAAAGCACATTCTGAATCTGGCCAAAGGAAAGGGCCGCATCAGCAAGACCAAAAAGGAGTACCTGCTGGAAGAGCGGGACATCAACAGATTCTCCGTCCAGAAGGATTTTATTAACCGGAATCTGGTGGACACAAGATACGCTACTCGCGGCCTGATGAATCTGCTGCGATCCTATTTCCGGGTGAACAATCTGGATGTGAAAGTCAAGTCCATCAACGGCGGGTTCACATCTTTTCTGAGGCGCAAATGGAAGTTTAAAAAGGAGCGCAACAAAGGGTACAAGCACCATGCCGAAGATGCTCTGATTATCGCAAATGCCGACTTCATCTTTAAGGAGTGGAAAAAGCTGGACAAAGCCAAGAAAGTGATGGAGAACCAGATGTTCGAAGAGAAGCAGGCCGAATCTATGCCCGAAATCGAGACAGAACAGGAGTACAAGGAGATTTTCATCACTCCTCACCAGATCAAGCATATCAAGGATTTCAAGGACTACAAGTACTCTCACCGGGTGGATAAAAAGCCCAACAGAGAGCTGATCAATGACACCCTGTATAGTACAAGAAAAGACGATAAGGGGAATACCCTGATTGTGAACAATCTGAACGGACTGTACGACAAAGATAATGACAAGCTGAAAAAGCTGATCAACAAAAGTCCCGAGAAGCTGCTGATGTACCACCATGATCCTCAGACATATCAGAAACTGAAGCTGATTATGGAGCAGTACGGCGACGAGAAGAACCCACTGTATAAGTACTATGAAGAGACTGGGAACTACCTGACCAAGTATAGCAAAAAGGATAATGGCCCCGTGATCAAGAAGATCAAGTACTATGGGAACAAGCTGAATGCCCATCTGGACATCACAGACGATTACCCTAACAGTCGCAACAAGGTGGTCAAGCTGTCACTGAAGCCATACAGATTCGATGTCTATCTGGACAACGGCGTGTATAAATTTGTGACTGTCAAGAATCTGGATGTCATCAAAAAGGAGAACTACTATGAAGTGAATAGCAAGTGCTACGAAGAGGCTAAAAAGCTGAAAAAGATTAGCAACCAGGCAGAGTTCATCGCCTCCTTTTACAACAACGACCTGATTAAGATCAATGGCGAACTGTATAGGGTCATCGGGGTGAACAATGATCTGCTGAACCGCATTGAAGTGAATATGATTGACATCACTTACCGAGAGTATCTGGAAAACATGAATGATAAGCGCCCCCCTCGAATTATCAAAACAATTGCCTCTAAGACTCAGAGTATCAAAAAGTACTCAACCGACATTCTGGGAAACCTGTATGAGGTGAAGAGCAAAAAGCACCCTCAGATTATCAAAAAGGGCagcggaggcaagcgtcctgctgctactaagaaagctggtcaagctaagaaaaagaaaggatcctacccatacgatgttccagattacgcttaagaattcctagagctcgctgatcagcctcgactgtgccttctagttgccagccatctgttgtttgcccctcccccgtgccttccttgaccctggaaggtgccactcccactgtcctttcctaataaaatgaggaaattgcatcgcattgtctgagtaggtgtcattctattctggggggtggggtggggcaggacagcaagggggaggattgggaagagaatagcaggcatgctggggaggtagcggccgcCCgcggtggagctccagcttttgttccctttagtgagggttaattgcgcgcttggcgtaatcatggtcatagctgtttcctgtgtgaaattgttatccgctcacaattccacacaacatacgagccggaagcataaagtgtaaagcctggggtgcctaatgagtgagctaactcacattaattgcgttgcgctcactgcccgctttccagtcgggaaacctgtcgtgccagctgcattaatgaatcggccaacgcgcggggagaggcggtttgcgtattgggcgctcttccgcttcctcgctcactgactcgctgcgctcggtcgttcggctgcggcgagcggtatcagctcactcaaaggcggtaatacggttatccacagaatcaggggataacgcaggaaagaacatgtgagcaaaaggccagcaaaaggccaggaaccgtaaaaaggccgcgttgctggcgtttttccataggctccgcccccctgacgagcatcacaaaaatcgacgctcaagtcagaggtggcgaaacccgacaggactataaagataccaggcgtttccccctggaagctccctcgtgcgctctcctgttccgaccctgccgcttaccggatacctgtccgcctttctcccttcgggaagcgtggcgctttctcatagctcacgctgtaggtatctcagttcggtgtaggtcgttcgctccaagctgggctgtgtgcacgaaccccccgttcagcccgaccgctgcgccttatccggtaactatcgtcttgagtccaacccggtaagacacgacttatcgccactggcagcagccactggtaacaggattagcagagcgaggtatgtaggcggtgctacagagttcttgaagtggtggcctaactacggctacactagaaggacagtatttggtatctgcgctctgctgaagccagttaccttcggaaaaagagttggtagctcttgatccggcaaacaaaccaccgctggtagcggtggtttttttgtttgcaagcagcagattacgcgcagaaaaaaaggatctcaagaagatcctttgatcttttctacggggtctgacgctcagtggaacgaaaactcacgttaagggattttggtcatgagattatcaaaaaggatcttcacctagatccttttaaattaaaaatgaagttttaaatcaatctaaagtatatatgagtaaacttggtctgacagttaccaatgcttaatcagtgaggcacctatctcagcgatctgtctatttcgttcatccatagttgcctgactccccgtcgtgtagataactacgatacgggagggcttaccatctggccccagtgctgcaatgataccgcgagacccacgctcaccggctccagatttatcagcaataaaccagccagccggaagggccgagcgcagaagtggtcctgcaactttatccgcctccatccagtctattaattgttgccgggaagctagagtaagtagttcgccagttaatagtttgcgcaacgttgttgccattgctacaggcatcgtggtgtcacgctcgtcgtttggtatggcttcattcagctccggttcccaacgatcaaggcgagttacatgatcccccatgttgtgcaaaaaagcggttagctccttcggtcctccgatcgttgtcagaagtaagttggccgcagtgttatcactcatggttatggcagcactgcataattctcttactgtcatgccatccgtaagatgcttttctgtgactggtgagtactcaaccaagtcattctgagaatagtgtatgcggcgaccgagttgctcttgcccggcgtcaatacgggataataccgcgccacatagcagaactttaaaagtgctcatcattggaaaacgttcttcggggcgaaaactctcaaggatcttaccgctgttgagatccagttcgatgtaacccactcgtgcacccaactgatcttcagcatcttttactttcaccagcgtttctgggtgagcaaaaacaggaaggcaaaatgccgcaaaaaagggaataagggcgacacggaaatgttgaatactcatactcttcctttttcaatattattgaagcatttatcagggttattgtctcatgagcggatacatatttgaatgtatttagaaaaataaacaaataggggttccgcgcacatttccccgaaaagtgccac

SEQ ID NO:56

tttn(N可以是任何核苷酸残基,例如A、G、C或T中的任一者)

SEQ ID NO:57

VP64-dCas9-VP64蛋白

RADALDDFDLDMLGSDALDDFDLDMLGSDALDDFDLDMLGSDALDDFDLDMVNPKKKRKVGRGMDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDAIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGDSRADPKKKRKVASRADALDDFDLDMLGSDALDDFDLDMLGSDALDDFDLDMLGSDALDDFDLDMLI

SEQ ID NO:58

VP64-dCas9-VP64 DNA

cgggctgacgcattggacgattttgatctggatatgctgggaagtgacgccctcgatgattttgaccttgacatgcttggttcggatgcccttgatgactttgacctcgacatgctcggcagtgacgcccttgatgatttcgacctggacatggttaaccccaagaagaagaggaaggtgggccgcggaatggacaagaagtactccattgggctcgccatcggcacaaacagcgtcggctgggccgtcattacggacgagtacaaggtgccgagcaaaaaattcaaagttctgggcaataccgatcgccacagcataaagaagaacctcattggcgccctcctgttcgactccggggaaaccgccgaagccacgcggctcaaaagaacagcacggcgcagatatacccgcagaaagaatcggatctgctacctgcaggagatctttagtaatgagatggctaaggtggatgactctttcttccataggctggaggagtcctttttggtggaggaggataaaaagcacgagcgccacccaatctttggcaatatcgtggacgaggtggcgtaccatgaaaagtacccaaccatatatcatctgaggaagaagcttgtagacagtactgataaggctgacttgcggttgatctatctcgcgctggcgcatatgatcaaatttcggggacacttcctcatcgagggggacctgaacccagacaacagcgatgtcgacaaactctttatccaactggttcagacttacaatcagcttttcgaagagaacccgatcaacgcatccggagttgacgccaaagcaatcctgagcgctaggctgtccaaatcccggcggctcgaaaacctcatcgcacagctccctggggagaagaagaacggcctgtttggtaatcttatcgccctgtcactcgggctgacccccaactttaaatctaacttcgacctggccgaagatgccaagcttcaactgagcaaagacacctacgatgatgatctcgacaatctgctggcccagatcggcgaccagtacgcagacctttttttggcggcaaagaacctgtcagacgccattctgctgagtgatattctgcgagtgaacacggagatcaccaaagctccgctgagcgctagtatgatcaagcgctatgatgagcaccaccaagacttgactttgctgaaggcccttgtcagacagcaactgcctgagaagtacaaggaaattttcttcgatcagtctaaaaatggctacgccggatacattgacggcggagcaagccaggaggaattttacaaatttattaagcccatcttggaaaaaatggacggcaccgaggagctgctggtaaagcttaacagagaagatctgttgcgcaaacagcgcactttcgacaatggaagcatcccccaccagattcacctgggcgaactgcacgctatcctcaggcggcaagaggatttctacccctttttgaaagataacagggaaaagattgagaaaatcctcacatttcggataccctactatgtaggccccctcgcccggggaaattccagattcgcgtggatgactcgcaaatcagaagagaccatcactccctggaacttcgaggaagtcgtggataagggggcctctgcccagtccttcatcgaaaggatgactaactttgataaaaatctgcctaacgaaaaggtgcttcctaaacactctctgctgtacgagtacttcacagtttataacgagctcaccaaggtcaaatacgtcacagaagggatgagaaagccagcattcctgtctggagagcagaagaaagctatcgtggacctcctcttcaagacgaaccggaaagttaccgtgaaacagctcaaagaagactatttcaaaaagattgaatgtttcgactctgttgaaatcagcggagtggaggatcgcttcaacgcatccctgggaacgtatcacgatctcctgaaaatcattaaagacaaggacttcctggacaatgaggagaacgaggacattcttgaggacattgtcctcacccttacgttgtttgaagatagggagatgattgaagaacgcttgaaaacttacgctcatctcttcgacgacaaagtcatgaaacagctcaagaggcgccgatatacaggatgggggcggctgtcaagaaaactgatcaatgggatccgagacaagcagagtggaaagacaatcctggattttcttaagtccgatggatttgccaaccggaacttcatgcagttgatccatgatgactctctcacctttaaggaggacatccagaaagcacaagtttctggccagggggacagtcttcacgagcacatcgctaatcttgcaggtagcccagctatcaaaaagggaatactgcagaccgttaaggtcgtggatgaactcgtcaaagtaatgggaaggcataagcccgagaatatcgttatcgagatggcccgagagaaccaaactacccagaagggacagaagaacagtagggaaaggatgaagaggattgaagagggtataaaagaactggggtcccaaatccttaaggaacacccagttgaaaacacccagcttcagaatgagaagctctacctgtactacctgcagaacggcagggacatgtacgtggatcaggaactggacatcaatcggctctccgactacgacgtggatgccatcgtgccccagtcttttctcaaagatgattctattgataataaagtgttgacaagatccgataaaaatagagggaagagtgataacgtcccctcagaagaagttgtcaagaaaatgaaaaattattggcggcagctgctgaacgccaaactgatcacacaacggaagttcgataatctgactaaggctgaacgaggtggcctgtctgagttggataaagccggcttcatcaaaaggcagcttgttgagacacgccagatcaccaagcacgtggcccaaattctcgattcacgcatgaacaccaagtacgatgaaaatgacaaactgattcgagaggtgaaagttattactctgaagtctaagctggtctcagatttcagaaaggactttcagttttataaggtgagagagatcaacaattaccaccatgcgcatgatgcctacctgaatgcagtggtaggcactgcacttatcaaaaaatatcccaagcttgaatctgaatttgtttacggagactataaagtgtacgatgttaggaaaatgatcgcaaagtctgagcaggaaataggcaaggccaccgctaagtacttcttttacagcaatattatgaattttttcaagaccgagattacactggccaatggagagattcggaagcgaccacttatcgaaacaaacggagaaacaggagaaatcgtgtgggacaagggtagggatttcgcgacagtccggaaggtcctgtccatgccgcaggtgaacatcgttaaaaagaccgaagtacagaccggaggcttctccaaggaaagtatcctcccgaaaaggaacagcgacaagctgatcgcacgcaaaaaagattgggaccccaagaaatacggcggattcgattctcctacagtcgcttacagtgtactggttgtggccaaagtggagaaagggaagtctaaaaaactcaaaagcgtcaaggaactgctgggcatcacaatcatggagcgatcaagcttcgaaaaaaaccccatcgactttctcgaggcgaaaggatataaagaggtcaaaaaagacctcatcattaagcttcccaagtactctctctttgagcttgaaaacggccggaaacgaatgctcgctagtgcgggcgagctgcagaaaggtaacgagctggcactgccctctaaatacgttaatttcttgtatctggccagccactatgaaaagctcaaagggtctcccgaagataatgagcagaagcagctgttcgtggaacaacacaaacactaccttgatgagatcatcgagcaaataagcgaattctccaaaagagtgatcctcgccgacgctaacctcgataaggtgctttctgcttacaataagcacagggataagcccatcagggagcaggcagaaaacattatccacttgtttactctgaccaacttgggcgcgcctgcagccttcaagtacttcgacaccaccatagacagaaagcggtacacctctacaaaggaggtcctggacgccacactgattcatcagtcaattacggggctctatgaaacaagaatcgacctctctcagctcggtggagacagcagggctgaccccaagaagaagaggaaggtggctagccgcgccgacgcgctggacgatttcgatctcgacatgctgggttctgatgccctcgatgactttgacctggatatgttgggaagcgacgcattggatgactttgatctggacatgctcggctccgatgctctggacgatttcgatctcgatatgttaatc

SEQ ID NO:59

人类p300(具有L553M突变)蛋白

MAENVVEPGPPSAKRPKLSSPALSASASDGTDFGSLFDLEHDLPDELINSTELGLTNGGDINQLQTSLGMVQDAASKHKQLSELLRSGSSPNLNMGVGGPGQVMASQAQQSSPGLGLINSMVKSPMTQAGLTSPNMGMGTSGPNQGPTQSTGMMNSPVNQPAMGMNTGMNAGMNPGMLAAGNGQGIMPNQVMNGSIGAGRGRQNMQYPNPGMGSAGNLLTEPLQQGSPQMGGQTGLRGPQPLKMGMMNNPNPYGSPYTQNPGQQIGASGLGLQIQTKTVLSNNLSPFAMDKKAVPGGGMPNMGQQPAPQVQQPGLVTPVAQGMGSGAHTADPEKRKLIQQQLVLLLHAHKCQRREQANGEVRQCNLPHCRTMKNVLNHMTHCQSGKSCQVAHCASSRQIISHWKNCTRHDCPVCLPLKNAGDKRNQQPILTGAPVGLGNPSSLGVGQQSAPNLSTVSQIDPSSIERAYAALGLPYQVNQMPTQPQVQAKNQQNQQPGQSPQGMRPMSNMSASPMGVNGGVGVQTPSLLSDSMLHSAINSQNPMMSENASVPSMGPMPTAAQPSTTGIRKQWHEDITQDLRNHLVHKLVQAIFPTPDPAALKDRRMENLVAYARKVEGDMYESANNRAEYYHLLAEKIYKIQKELEEKRRTRLQKQNMLPNAAGMVPVSMNPGPNMGQPQPGMTSNGPLPDPSMIRGSVPNQMMPRITPQSGLNQFGQMSMAQPPIVPRQTPPLQHHGQLAQPGALNPPMGYGPRMQQPSNQGQFLPQTQFPSQGMNVTNIPLAPSSGQAPVSQAQMSSSSCPVNSPIMPPGSQGSHIHCPQLPQPALHQNSPSPVPSRTPTPHHTPPSIGAQQPPATTIPAPVPTPPAMPPGPQSQALHPPPRQTPTPPTTQLPQQVQPSLPAAPSADQPQQQPRSQQSTAASVPTPTAPLLPPQPATPLSQPAVSIEGQVSNPPSTSSTEVNSQAIAEKQPSQEVKMEAKMEVDQPEPADTQPEDISESKVEDCKMESTETEERSTELKTEIKEEEDQPSTSATQSSPAPGQSKKKIFKPEELRQALMPTLEALYRQDPESLPFRQPVDPQLLGIPDYFDIVKSPMDLSTIKRKLDTGQYQEPWQYVDDIWLMFNNAWLYNRKTSRVYKYCSKLSEVFEQEIDPVMQSLGYCCGRKLEFSPQTLCCYGKQLCTIPRDATYYSYQNRYHFCEKCFNEIQGESVSLGDDPSQPQTTINKEQFSKRKNDTLDPELFVECTECGRKMHQICVLHHEIIWPAGFVCDGCLKKSARTRKENKFSAKRLPSTRLGTFLENRVNDFLRRQNHPESGEVTVRVVHASDKTVEVKPGMKARFVDSGEMAESFPYRTKALFAFEEIDGVDLCFFGMHVQEYGSDCPPPNQRRVYISYLDSVHFFRPKCLRTAVYHEILIGYLEYVKKLGYTTGHIWACPPSEGDDYIFHCHPPDQKIPKPKRLQEWYKKMLDKAVSERIVHDYKDIFKQATEDRLTSAKELPYFEGDFWPNVLEESIKELEQEEEERKREENTSNESTDVTKGDSKNAKKKNNKKTSKNKSSLSRGNKKKPGMPNVSNDLSQKLYATMEKHKEVFFVIRLIAGPAANSLPPIVDPDPLIPCDLMDGRDAFLTLARDKHLEFSSLRRAQWSTMCMLVELHTQSQDRFVYTCNECKHHVETRWHCTVCEDYDLCITCYNTKNHDHKMEKLGLGLDDESNNQQAAATQSPGDSRRLSIQRCIQSLVHACQCRNANCSLPSCQKMKRVVQHTKGCKRKTNGGCPICKQLIALCCYHAKHCQENKCPVPFCLNIKQKLRQQQLQHRLQQAQMLRRRMASMQRTGVVGQQQGLPSPTPATPTTPTGQQPTTPQTPQPTSQPQPTPPNSMPPYLPRTQAAGPVSQGKAAGQVTPPTPPQTAQPPLPGPPPAAVEMAMQIQRAAETQRQMAHVQIFQRPIQHQMPPMTPMAPMGMNPPPMTRGPSGHLEPGMGPTGMQQQPPWSQGGLPQPQQLQSGMPRPAMMSVAQHGQPLNMAPQPGLGQVGISPLKPGTVSQQALQNLLRTLRSPSSPLQQQQVLSILHANPQLLAAFIKQRAAKYANSNPQPIPGQPGMPQGQPGLQPPTMPGQQGVHSNPAMQNMNPMQAGVQRAGLPQQQPQQQLQPPMGGMSPQAQQMNMNHNTMPSQFRDILRRQQMMQQQQQQGAGPGIGPGMANHNQFQQPQGVGYPPQQQQRMQHHMQQMQQGNMGQIGQLPQALGAEAGASLQAYQQRLLQQQMGSPVQPNPMSPQQHMLPNQAQSPHLQGQQIPNSLSNQVRSPQPVPSPRPQSQPPHSSPSPRMQPQPSPHHVSPQTSSPHPGLVAAQANPMEQGHFASPDQNSMLSQLASNPGMANLHGASATDLGLSTDNSDLNSNLSQSTLDIH

SEQ ID NO:60

人类p300核心效应物蛋白(SEQ ID NO:59的aa 1048-1664)

IFKPEELRQALMPTLEALYRQDPESLPFRQPVDPQLLGIPDYFDIVKSPMDLSTIKRKLDTGQYQEPWQYVDDIWLMFNNAWLYNRKTSRVYKYCSKLSEVFEQEIDPVMQSLGYCCGRKLEFSPQTLCCYGKQLCTIPRDATYYSYQNRYHFCEKCFNEIQGESVSLGDDPSQPQTTINKEQFSKRKNDTLDPELFVECTECGRKMHQICVLHHEIIWPAGFVCDGCLKKSARTRKENKFSAKRLPSTRLGTFLENRVNDFLRRQNHPESGEVTVRVVHASDKTVEVKPGMKARFVDSGEMAESFPYRTKALFAFEEIDGVDLCFFGMHVQEYGSDCPPPNQRRVYISYLDSVHFFRPKCLRTAVYHEILIGYLEYVKKLGYTTGHIWACPPSEGDDYIFHCHPPDQKIPKPKRLQEWYKKMLDKAVSERIVHDYKDIFKQATEDRLTSAKELPYFEGDFWPNVLEESIKELEQEEEERKREENTSNESTDVTKGDSKNAKKKNNKKTSKNKSSLSRGNKKKPGMPNVSNDLSQKLYATMEKHKEVFFVIRLIAGPAANSLPPIVDPDPLIPCDLMDGRDAFLTLARDKHLEFSSLRRAQWSTMCMLVELHTQSQD

SEQ ID NO:85

gRNA支架的多核苷酸序列

gttttagagctagaaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcttttttt

去获取专利,查看全文>
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号