首页> 中国专利> 通过靶向肌营养相关蛋白基因来治疗肌营养不良的方法

通过靶向肌营养相关蛋白基因来治疗肌营养不良的方法

页面导航

摘要
著录项
说明书
相似文献

摘要

预期可用于治疗或预防杜氏肌营养不良或贝克肌营养不良的多核苷酸，所述多核苷酸包含以下碱基序列：(a)编码核酸酶缺陷型CRISPR效应蛋白和转录激活子的融合蛋白的碱基序列，和(b)编码向导RNA的碱基序列，所述向导RNA靶向人肌营养相关蛋白基因的表达调节区中SEQ ID NO:104、105、135、141、153、167或172所示区域中长度为18至24个核苷酸的连续区域。

著录项

公开/公告号CN113271982A

专利类型发明专利
公开/公告日2021-08-17

原文格式PDF
申请/专利权人安斯泰来制药株式会社;摩大力斯医疗株式会社;
展开▼

申请/专利号CN201980075173.0
发明设计人吉见英治;吉冈克郎;山形哲也;秦元宝;伊恩·罗伯特·汤普生;尼德西·康纳;
展开▼

申请日2019-11-15
分类号A61K48/00(20060101);C07K14/47(20060101);C12N9/22(20060101);C12N15/113(20060101);C12N15/86(20060101);
代理机构11219 中原信达知识产权代理有限责任公司;
代理人金海霞;刘慧
地址日本东京都
入库时间 2023-06-19 12:14:58

说明书

相关申请的交叉引用

本申请要求2018年11月16日提交的美国临时专利申请第62/768,474号、2019年6月13日提交的美国临时专利申请第62/861,039号以及2019年11月7日提交的美国临时专利申请第62/931,925号的优先权，所述申请各自的内容通过引用全部并入本文。

技术领域

本发明涉及通过靶向人肌营养相关蛋白(Utrophin，UTRN)基因来治疗肌营养不良的方法等。更特别地，本发明涉及通过使用靶向人UTRN基因的特定序列的向导RNA以及转录激活子和CRISPR效应蛋白的融合蛋白激活人UTRN基因的表达来治疗或预防肌营养不良的方法和药剂等。

背景技术

肌营养不良是与进行性肌萎缩和肌无力相关的遗传性疾病的总称。在肌营养不良中，由X染色体上的肌营养不良蛋白基因突变引起的肌营养不良包括杜氏肌营养不良(DUCHENNE muscular dystrophy，DMD)及其轻度型、贝克肌营养不良(BECKER musculardystrophy，BMD)。

DMD是最常见的遗传性进行性肌肉疾病，每3,500名新出生的男性中就有1名患上DMD。其临床症状包括从约2至5岁开始的肌无力，此后肌无力的进一步发展，到约10岁前的步行不能，以及在二十多岁时因心力衰竭或呼吸衰竭而死亡(参见WO 2009/044383，通过引用全部并入本文)。

已知DMD是由肌营养不良蛋白基因的突变引起的。肌营养不良蛋白基因存在于X染色体上，是一个由约220万个DNA碱基组成的巨大基因。它从DNA转录成mRNA前体，通过剪接进一步去除内含子，并产生了由79个外显子组成的mRNA(约14kb)。该mRNA被翻译成3685个氨基酸以产生肌营养不良蛋白。肌营养不良蛋白参与维持肌肉细胞的膜稳定性。在DMD患者中，由于在肌营养不良蛋白基因中发生突变，因此肌营养不良蛋白几乎不表达并且不能维持肌肉细胞的结构，从而导致肌无力。

BMD也是由肌营养不良蛋白基因突变引起的；但是，与DMD相比，其症状通常较轻。DMD和BMD的临床症状之间的差异是基于DMD中功能性的肌营养不良蛋白几乎不表达，而BMD中却产生了不完整但功能性的肌营养不良蛋白。

即使到现在，还没有有效的药物作为针对肌营养不良的病因治疗，只是进行了诸如施用类固醇的对症治疗。已经提出了多种治疗策略来治疗DMD和BMD，且作为策略之一的基因治疗方法已经引起关注。基因治疗的目的是通过向具有突变的肌肉细胞补充正常肌营养不良蛋白基因来实现正常肌营养不良蛋白的表达。然而，全长的肌营养不良蛋白cDNA相对较大，长度为约14kb；因此，对于某些载体，例如腺相关病毒(AAV)载体，可以被封包的DNA的尺寸限制可能是一个问题。作为这个问题的一种解决方案，已经提出了使用具有最小功能域的截短型肌营养不良蛋白基因(小型/微型肌营养不良蛋白基因)的方法(参见Sakamoto M.等人，《生物化学与生物物理学研究通讯(Biochem Biophys Res Commun)》，2002年5月17日；293(4):1265-72，通过引用全部并入本文)。考虑到向缺乏肌营养不良蛋白的DMD患者中引入肌营养不良蛋白可能会引起免疫反应，因此还报道了使用肌营养相关蛋白(在本说明书中有时也称为“UTRN”等)来降低这种免疫反应的手段(参见Gilbert R.等人，《人基因治疗(Hum Gene Ther)》，1999年5月20日；10(8)：1299-310，通过引用全部并入本文)。肌营养相关蛋白是一种与肌营养不良蛋白高度同源的细胞骨架蛋白，存在于正常和DMD肌肉中，但含量很低。与肌营养不良蛋白一样，肌营养相关蛋白cDNA非常大(超过10kb)。已知肌营养相关蛋白能够补偿肌营养不良蛋白的肌肉细胞膜稳定功能(参见Gilbert R.等人，《人基因治疗》，1999年5月20日；10(8)：1299-310和Liao H.等人，《细胞(Cell)》，2017年12月14日；171(7)：1495-507，通过引用全部并入本文)。

作为靶向肌营养相关蛋白的基因治疗，例如，WO2015/018503公开了一项涉及用于在骨骼或心肌组织中表达基因的重组腺相关病毒(AAV)载体的发明，所述载体包含肌肉特异性启动子和编码融合蛋白的基因，其中所述融合蛋白包含：

a)转录激活元件和

b)DNA结合元件，

其中所述融合蛋白当在所述骨骼或心肌组织中表达时能够增加肌营养相关蛋白的表达(参见WO2015/018503，通过引用全部并入本文)。在本发明中，锌指蛋白用作DNA结合元件。

另一方面，近年来已经开发出一种使用核酸酶活性失活的Cas9(dCas9)和转录激活结构域或转录抑制结构域的组合的系统，其中通过使用向导RNA而不切割靶基因的DNA序列将所述蛋白质靶向靶基因来控制靶基因的表达(WO2013/176772，通过引用全部并入本文)。预期其可应用于临床(参见Dominguez A.等人，《自然评论-分子细胞生物学(Nat RevMol Cell Biol)》，2016年1月；17(1)：5-15，通过引用全部并入本文)。但是，存在一个问题，即编码dCas9、向导RNA和共转录激活子的复合物的序列超出了最常见的病毒载体(例如AAV)的容量，最常见的病毒载体代表了最有希望的体内基因递送方法(参见Liao H.等人，《细胞》，2017年12月14日；171(7)：1495-507，通过引用全部并入本文)。

2017年，报道了(a)通过向引入有Cas9基因的DMD模型小鼠(mdx小鼠)施用携带靶向小鼠UTRN并抑制Cas9的DNA切割能力的向导RNA(dgUtrn)和转录激活结构域的AAV，UTRN的表达水平增加，抓取力也得到了提高，以及(b)通过向mdx小鼠共同注射携带Cas9的AAV和携带上述dgUtrn和转录激活结构域的AAV，抓取力得到了提高(参见Liao H.等人，《细胞》，2017年12月14日；171(7)：1495-507，通过引用全部并入本文)。

发明内容

因此，本发明的一个目的是提供一种治疗肌营养不良(特别是DMD和BMD)的新方法。

这一目的以及其它目的，在以下详细描述中将变得显而易见，这些目的已经通过本发明人的以下发现而实现，即，可以通过使用靶向人UTRN基因的特定序列的向导RNA以及转录激活子和核酸酶缺陷型CRISPR效应蛋白的融合蛋白来强烈激活人UTRN基因(基因ID：7402)的表达。另外，本发明人发现，可以通过携带编码所述融合蛋白的碱基序列和编码所述向导RNA的碱基序列的单个AAV载体，使用小型核酸酶缺陷型CRISPR效应蛋白和小型转录激活子来强烈激活人UTRN基因的表达。

因此，本发明提供：

(1)一种多核苷酸，所述多核苷酸包含以下碱基序列：

(a)编码核酸酶缺陷型CRISPR效应蛋白和转录激活子的融合蛋白的碱基序列，和

(b)编码向导RNA的碱基序列，所述向导RNA靶向人肌营养相关蛋白基因的表达调节区中SEQ ID NO:104、105、135、141、153、167或172所示区域中长度为18至24个核苷酸的连续区域。

(2)根据(1)所述的多核苷酸，其中所述编码向导RNA的碱基序列包含SEQ ID NO:45、46、58、59、60、135、141、153、155、156、157、159、167或172所示的碱基序列，或SEQ IDNO:45、46、58、59、60、135、141、153、155、156、157、159、167或172所示但其中缺失、替换、插入和/或添加了1至3个碱基的碱基序列。

(3)根据(1)或(2)所述的多核苷酸，所述多核苷酸包含至少两种不同的编码所述向导RNA的碱基序列。

(4)根据(1)至(3)中任一项所述的多核苷酸，其中所述转录激活子是包含RTA的转录激活结构域和VP64的肽。

(5)根据(4)所述的多核苷酸，其中所述转录激活子包含SEQ ID NO:117所示的氨基酸序列，或与SEQ ID NO:117所示的氨基酸序列具有至少90％同一性的氨基酸序列。

(6)根据(1)至(5)中任一项所述的多核苷酸，其中所述核酸酶缺陷型CRISPR效应蛋白是dCas9。

(7)根据(6)所述的多核苷酸，其中所述dCas9来源于金黄色葡萄球菌(Staphylococcus aureus)。

(8)根据(1)至(7)中任一项所述的多核苷酸，所述多核苷酸进一步包含用于所述编码向导RNA的碱基序列的启动子序列和/或用于所述编码核酸酶缺陷型CRISPR效应蛋白和转录激活子的融合蛋白的碱基序列的启动子序列。

(9)根据(8)所述的多核苷酸，其中所述用于编码向导RNA的碱基序列的启动子序列选自U6启动子、SNR6启动子、SNR52启动子、SCR1启动子、RPR1启动子、U3启动子和H1启动子。

(10)根据(8)或(9)所述的多核苷酸，其中所述用于编码核酸酶缺陷型CRISPR效应蛋白和转录激活子的融合蛋白的碱基序列的启动子序列选自EFS启动子、EF-1α启动子、CMV启动子、CK8启动子、MHC启动子、Des启动子、CAG启动子和MYOD启动子。

(11)根据(8)至(10)中任一项所述的多核苷酸，

其中所述编码向导RNA的碱基序列包含SEQ ID NO:45、46或59所示的碱基序列，或SEQ ID NO:45、46或59所示但其中缺失、替换、插入和/或添加了1至3个碱基的碱基序列，

所述转录激活子包含SEQ ID NO:117所示的氨基酸序列，或与SEQ ID NO:117所示的氨基酸序列具有至少90％同一性的氨基酸序列，

所述核酸酶缺陷型CRISPR效应蛋白是来源于金黄色葡萄球菌的dCas9，

所述用于编码向导RNA的碱基序列的启动子序列是U6启动子，且

所述用于编码核酸酶缺陷型CRISPR效应蛋白和转录激活子的融合蛋白的碱基序列的启动子序列是CK8启动子。

(12)根据(11)所述的多核苷酸，

其中所述编码向导RNA的碱基序列包含SEQ ID NO:59所示的碱基序列，或SEQ IDNO:59所示但其中缺失、替换、插入和/或添加了1至3个碱基的碱基序列。

(13)一种载体，所述载体包含根据(1)至(12)中任一项所述的多核苷酸。

(14)根据(13)所述的载体，其中所述载体是质粒载体或病毒载体。

(15)根据(14)所述的载体，其中所述病毒载体选自腺相关病毒(AAV)载体、腺病毒载体和慢病毒载体。

(16)根据(15)所述的载体，其中所述AAV载体选自AAV1、AAV2、AAV6、AAV7、AAV8、AAV9、AAV

(17)根据(16)所述的载体，其中所述AAV载体是AAV9。

(18)一种药物组合物，所述药物组合物包含根据(1)至(12)中任一项所述的多核苷酸或根据(13)至(17)中任一项所述的载体。

(19)根据(18)所述的药物组合物，所述药物组合物用于治疗或预防杜氏肌营养不良或贝克肌营养不良。

(20)一种治疗或预防杜氏肌营养不良或贝克肌营养不良的方法，所述方法包括向有此需要的对象施用根据(1)至(12)中任一项所述的多核苷酸或根据(13)至(17)中任一项所述的载体。

(21)根据(1)至(12)中任一项所述的多核苷酸或根据(13)至(17)中任一项所述的载体用于治疗或预防杜氏肌营养不良或贝克肌营养不良的用途。

(22)根据(1)至(12)中任一项所述的多核苷酸或根据(13)至(17)中任一项所述的载体在制备用于治疗或预防杜氏肌营养不良或贝克肌营养不良的药物组合物中的用途。

(23)一种核糖核蛋白，所述核糖核蛋白包含以下：

(c)核酸酶缺陷型CRISPR效应蛋白和转录激活子的融合蛋白，和

(d)靶向人肌营养相关蛋白基因的表达调节区中SEQ ID NO:104、105、135、141、153、167或172所示区域中长度为18至24个核苷酸的连续区域的向导RNA。

(24)根据(23)所述的核糖核蛋白，其中所述向导RNA包含SEQ ID NO:194、195、196、197、198、199、200、201、202、203、204、205、206或207所示的碱基序列，或SEQ ID NO:194、195、196、197、198、199、200、201、202、203、204、205、206或207所示但其中缺失、替换、插入和/或添加了1至3个碱基的碱基序列。

(25)根据(23)或(24)所述的核糖核蛋白，其中所述转录激活子是包含RTA的转录激活结构域和VP64的肽。

(26)根据(25)所述的核糖核蛋白，其中所述转录激活子包含SEQ ID NO:117所示的氨基酸序列，或与SEQ ID NO:117所示的氨基酸序列具有至少90％同一性的氨基酸序列。

(27)根据(23)至(26)中任一项所述的核糖核蛋白，其中所述核酸酶缺陷型CRISPR效应蛋白是dCas9。

(28)根据(27)所述的核糖核蛋白，其中所述dCas9来源于金黄色葡萄球菌。

(29)根据(23)至(28)中任一项所述的核糖核蛋白，

其中所述向导RNA包含SEQ ID NO:194、195或197所示的碱基序列，或SEQ ID NO:194、195或197所示但其中缺失、替换、插入和/或添加了1至3个碱基的碱基序列，

其中所述转录激活子包含SEQ ID NO:117所示的氨基酸序列，或与SEQ ID NO:117所示的氨基酸序列具有至少90％同一性的氨基酸序列，且

其中所述核酸酶缺陷型CRISPR效应蛋白是来源于金黄色葡萄球菌的dCas9。

(30)根据(29)所述的核糖核蛋白，其中所述向导RNA包含SEQ ID NO:197所示的碱基序列或SEQ ID NO:197所示但其中缺失、替换、插入和/或添加了1至3个碱基的碱基序列。

(31)一种组合物或试剂盒，所述组合物或试剂盒包含以下用于激活人肌营养相关蛋白基因的表达：

(e)核酸酶缺陷型CRISPR效应蛋白和转录激活子的融合蛋白，或编码所述融合蛋白的多核苷酸，和

(f)靶向人肌营养相关蛋白基因的表达调节区中SEQ ID NO:104、105、135、141、153、167或172所示区域中长度为18至24个核苷酸的连续区域的向导RNA，或编码所述向导RNA的多核苷酸。

(32)根据(31)所述的组合物或试剂盒，其中所述向导RNA包含SEQ ID NO:194、195、196、197、198、199、200、201、202、203、204、205、206或207所示的碱基序列，或SEQ IDNO:194、195、196、197、198、199、200、201、202、203、204、205、206或207所示但其中缺失、替换、插入和/或添加了1至3个碱基的碱基序列。

(33)根据(31)或(32)所述的组合物或试剂盒，包含至少两种不同的向导RNA。

(34)根据(31)至(33)中任一项所述的组合物或试剂盒，其中所述转录激活子是包含RTA的转录激活结构域和VP64的肽。

(35)根据(34)所述的组合物或试剂盒，其中所述转录激活子包含SEQ ID NO:117所示的氨基酸序列，或与SEQ ID NO:117所示的氨基酸序列具有至少90％同一性的氨基酸序列。

(36)根据(31)至(35)中任一项所述的组合物或试剂盒，其中所述核酸酶缺陷型CRISPR效应蛋白是dCas9。

(37)根据(36)所述的组合物或试剂盒，其中所述dCas9来源于金黄色葡萄球菌。

(38)根据(31)至(37)中任一项所述的组合物或试剂盒，

其中所述组合物或试剂盒包含编码所述融合蛋白的多核苷酸和编码所述向导RNA的多核苷酸，且

其中所述编码融合蛋白的多核苷酸进一步包含用于所述融合蛋白的启动子序列，且/或所述编码向导RNA的多核苷酸进一步包含用于所述向导RNA的启动子序列。

(39)根据(38)所述的组合物或试剂盒，其中所述用于向导RNA的启动子序列选自U6启动子、SNR6启动子、SNR52启动子、SCR1启动子、RPR1启动子、U3启动子和H1启动子。

(40)根据(38)或(39)所述的组合物或试剂盒，其中所述用于融合蛋白的启动子序列选自EFS启动子、EF-1α启动子、CMV启动子、CK8启动子、MHC启动子、Des启动子、CAG启动子和MYOD启动子。

(41)根据(38)至(40)中任一项所述的组合物或试剂盒，其中所述向导RNA包含SEQID NO:194、195或197所示的碱基序列，或SEQ ID NO:194、195或197所示但其中缺失、替换、插入和/或添加了1至3个碱基的碱基序列，

其中所述转录激活子包含SEQ ID NO:117所示的氨基酸序列，或与SEQ ID NO:117所示的氨基酸序列具有至少90％同一性的氨基酸序列，

其中所述核酸酶缺陷型CRISPR效应蛋白是来源于金黄色葡萄球菌的dCas9，

其中所述用于向导RNA的启动子序列是U6启动子，且

其中所述用于融合蛋白的启动子序列是CK8启动子。

(42)根据(41)所述的组合物或试剂盒，其中所述向导RNA包含SEQ ID NO:197所示的碱基序列，或SEQ ID NO:197所示但其中缺失、替换、插入和/或添加了1至3个碱基的碱基序列。

(43)一种治疗或预防DUCCHENNE肌营养不良或贝克肌营养不良的方法，所述方法包括施用以下(e)和(f)：

(e)核酸酶缺陷型CRISPR效应蛋白和转录激活子的融合蛋白，或编码所述融合蛋白的多核苷酸，和

(44)根据(43)所述的方法，其中所述向导RNA包含SEQ ID NO:194、195、196、197、198、199、200、201、202、203、204、205、206或207所示的碱基序列，或SEQ ID NO:194、195、196、197、198、199、200、201、202、203、204、205、206或207所示但其中缺失、替换、插入和/或添加了1至3个碱基的碱基序列，或编码所述向导RNA的多核苷酸。

(45)根据(43)或(44)所述的方法，包含至少两种不同的向导RNA。

(46)根据(43)至(45)中任一项所述的方法，其中所述转录激活子是包含RTA的转录激活结构域和VP64的肽。

(47)根据(46)所述的方法，其中所述转录激活子包含SEQ ID NO:117所示的氨基酸序列，或与SEQ ID NO:117所示的氨基酸序列具有至少90％同一性的氨基酸序列。

(48)根据(43)至(47)中任一项所述的方法，其中所述核酸酶缺陷型CRISPR效应蛋白是dCas9。

(49)根据(48)所述的方法，其中所述dCas9来源于金黄色葡萄球菌。

(50)根据(43)至(49)中任一项所述的方法，

其中所述方法包括施用编码所述融合蛋白的多核苷酸和编码所述向导RNA的多核苷酸，且

(51)根据(50)所述的方法，其中所述用于向导RNA的启动子序列选自U6启动子、SNR6启动子、SNR52启动子、SCR1启动子、RPR1启动子、U3启动子和H1启动子。

(52)根据(50)或(51)所述的方法，其中所述用于融合蛋白的启动子序列选自EFS启动子、EF-1α启动子、CMV启动子、CK8启动子、MHC启动子、Des启动子、CAG启动子和MYOD启动子。

(53)根据(50)至(52)中任一项所述的方法，其中所述向导RNA包含SEQ ID NO:194、195或197所示的碱基序列，或SEQ ID NO:194、195或197所示但其中缺失、替换、插入和/或添加了1至3个碱基的碱基序列，

其中所述转录激活子包含SEQ ID NO:117所示的氨基酸序列，或与SEQ ID NO:117所示的氨基酸序列具有至少90％同一性的氨基酸序列，

其中所述核酸酶缺陷型CRISPR效应蛋白是来源于金黄色葡萄球菌的dCas9，

其中所述用于向导RNA的启动子序列是U6启动子，且

其中所述用于融合蛋白的启动子序列是CK8启动子。

(54)根据(53)所述的方法，其中所述向导RNA包含SEQ ID NO:197所示的碱基序列，或SEQ ID NO:197所示但其中缺失、替换、插入和/或添加了1至3个碱基的碱基序列。

(55)以下(e)及(f)在制备用于治疗或预防杜氏肌营养不良或贝克肌营养不良的药物组合物中的用途：

(e)核酸酶缺陷型CRISPR效应蛋白和转录激活子的融合蛋白，或编码所述融合蛋白的多核苷酸，和

(56)根据(55)所述的用途，其中所述向导RNA包含SEQ ID NO:194、195、196、197、198、199、200、201、202、203、204、205、206或207所示的碱基序列，或SEQ ID NO:194、195、196、197、198、199、200、201、202、203、204、205、206或207所示但其中缺失、替换、插入和/或添加了1至3个碱基的碱基序列。

(57)根据(55)或(56)所述的用途，包含至少两种不同的向导RNA。

(58)根据(55)至(57)中任一项所述的用途，其中所述转录激活子是包含RTA的转录激活结构域和VP64的肽。

(59)根据(58)所述的用途，其中所述转录激活子包含SEQ ID NO:117所示的氨基酸序列，或与SEQ ID NO:117所示的氨基酸序列具有至少90％同一性的氨基酸序列。

(60)根据(55)至(59)中任一项所述的用途，其中所述核酸酶缺陷型CRISPR效应蛋白是dCas9。

(61)根据(60)所述的用途，其中所述dCas9来源于金黄色葡萄球菌。

(62)根据(55)至(61)中任一项所述的用途，

其中所述用途包括编码所述融合蛋白的多核苷酸的用途以及编码所述向导RNA的多核苷酸的用途，且

(63)根据(62)所述的用途，其中所述用于向导RNA的启动子序列选自U6启动子、SNR6启动子、SNR52启动子、SCR1启动子、RPR1启动子、U3启动子和H1启动子。

(64)根据(62)或(63)所述的用途，其中所述用于融合蛋白的启动子序列选自EFS启动子、EF-1α启动子、CMV启动子、CK8启动子、MHC启动子、Des启动子、CAG启动子和MYOD启动子。

(65)根据(62)至(64)中任一项所述的用途，其中所述向导RNA包含SEQ ID NO:194、195或197所示的碱基序列，或SEQ ID NO:194、195或197所示但其中缺失、替换、插入和/或添加了1至3个碱基的碱基序列，

其中所述转录激活子包含SEQ ID NO:117所示的氨基酸序列，或与SEQ ID NO:117所示的氨基酸序列具有至少90％同一性的氨基酸序列，

其中所述核酸酶缺陷型CRISPR效应蛋白是来源于金黄色葡萄球菌的dCas9，

其中所述用于向导RNA的启动子序列是U6启动子，且

其中所述用于融合蛋白的启动子序列是CK8启动子。

(66)根据(65)所述的用途，其中所述向导RNA包含SEQ ID NO:197所示的碱基序列，或SEQ ID NO:197所示但其中缺失、替换、插入和/或添加了1至3个碱基的碱基序列。

发明效果

根据本发明，可以激活人肌营养相关蛋白基因的表达，因此，预期本发明能够治疗DMD和BMD。

附图说明

当结合附图考虑以下详细描述时，将容易更完整地理解本发明及其许多附带优点，因为通过以下详细描述将使本发明得到更好的理解，其中：

在图1中，上图示出了人UTRN基因中启动子A的区域，中图示出了启动子B的区域，且示出了相应区域中确定的24种靶向序列的位置(向导编号sgED3-1至sgED3-24(SEQ IDNO:129至152))。在图1中，下图示出了HEK293FT细胞中通过使用包含由SEQ ID NO:129至152所示的靶向序列编码的crRNA的sgRNA和3种不同的dSaCas9-转录激活子融合蛋白(dSaCas9-VP64(SEQ ID NO:188)、dSaCas9-VPH(SEQ ID NO:189)、dSaCas9-VPR(SEQ IDNO:190))的组合对人UTRN基因表达的激活(N＝3，误差条表示标准偏差)。当分别使用特异性结合包含向导编号sgED3-6和sgED3-7(SEQ ID NO:134和135)的区域(区域A)和包含向导编号sgED3-13(SEQ ID NO:141)的另一个区域(区域B)的sgRNA时，与使用对照sgRNA的情况相比，人UTRN基因的表达被强烈激活。在3种dSaCas9-转录激活子融合蛋白中，使用dSaCas9-VPR融合蛋白时的激活效果最强。

在图2中，上图示出了在人UTRN基因的启动子A的区域中确定的靶向序列(向导编号sgED3-1至sgED3-20和sgED3-25至sgED3-48(SEQ ID NO:129至148和153至176))的位置。在图2中，下图示出了HEK293FT细胞中通过使用包含由靶向序列向导编号sgED3-6、sgED3-13、sgED3-25至sgED3-48(SEQ ID NO:134、141、153至176)编码的crRNA的sgRNA和dSaCas9-VPR的组合对人UTRN基因表达的激活(N＝3，误差条表示标准偏差)。当分别使用特异性结合包含靶向序列向导编号sgED3-6、sgED3-13、sgED3-25至sgED3-32、sgED3-39、sgED3-40、sgED3-44(SEQ ID NO:134、141、153至160、167、168和172)的区域的sgRNA时，与使用对照sgRNA的情况相比，人UTRN基因表达被激活了不少于两倍。

图3示出了通过使用质粒载体对各sgRNA的功能的验证结果(N＝1)。制备表达包含由靶向序列向导编号sgED3-6、sgED3-13、sgED3-25、sgED3-27、sgED3-30、sgED3-31、sgED3-39、sgED3-40或sgED3-44(SEQ ID NO:134、141、153、155、158、159、167、168或172)编码的crRNA的sgRNA的pAAV-EFS-dSaCas9[-25]-miniVR-U6-sgRNA AIO质粒，并将所述质粒转染到HEK293FT细胞中，并验证其功能。与对照sgRNA相比，当使用包含由靶向序列向导编号sgED3-6、sgED3-13、sgED3-25、sgED3-27、sgED3-30、sgED3-31、sgED3-39、sgED3-40或sgED3-44(SEQ ID NO:134、141、153、155、158、159、167、168或172)编码的crRNA的sgRNA时，观察到人UTRN基因表达的激活。

图4示出了通过使用AAV载体对各sgRNA的功能的验证结果(N＝1)。使用表达包含由靶向序列向导编号sgED3-6、sgED3-30或sgED3-31(SEQ ID NO:134、158或159))编码的crRNA的sgRNA的pAAV-EFS-dSaCas9[-25]-miniVR-U6-sgRNA AIO质粒产生AAV2，将其转导至HEK293FT细胞中。与对照sgRNA相比，在包含由靶向序列向导编号sgED3-6、sgED3-30或sgED3-31(SEQ ID NO:134、158或159)编码的crRNA的所有sgRNA中，都观察到了人UTRN基因的激活。

图5示出了pAAV-EFS-dSaCas9[-25]-miniVR-U6-sgRNA AIO质粒的构建体。

在图6中，图A示出了人骨骼肌细胞中基因组的H3K4me3和H3K27Ac图谱，以及人UTRN基因的推定的增强子区域E1、E2和E3以及推定的启动子区域P1和P2。图B至F示出了各向导编号所示的靶向序列(SEQ ID NO:4至103所示的序列)的位置。

图7示出了HSMM细胞中通过使用包含由各向导编号所示的靶向序列(SEQ ID NO:4至103所示的序列)编码的crRNA的srRNA和dSaCas9-miniVR对人UTRN基因表达的激活的评估结果(N＝2)。

在图8中，上图示出了5种靶向序列向导编号145、146、205、208、210(SEQ ID NO:45、46、58、59和60)各自与食蟹猴(Macaca fascicularis)的同源性以及所定位的区域。下图示出了5种靶向序列的组合，它们与食蟹猴的同源性和所定位的区域。

图9示出了在5种不同的HSMM细胞中通过使用包含由靶向序列向导编号145、146、205、208、210(SEQ ID NO:45、46、58、59和60)编码的crRNA的sgRNA(分别或其组合)和dSaCas9-miniVR，对人UTRN基因表达的激活(N＝2)。

图10示出了在pED260、pED261或pED263质粒骨架中包含由靶向序列向导编号145、146或208编码的crRNA的sgRNA上调了UTRN。相对mRNA表达是分别从瞬时表达pED260、pED261或pED263骨架中向导编号145、146或208的HEK293FT细胞确定的。数据表示为3次重复实验的平均值+标准偏差(N＝3，误差条表示标准偏差)。

在图11中，左图示出了施加了各AAV9样品和标记的SDS-PAGE的泳道布局，右图示出了SDS-PAGE的图像。泳道11旁的值表示分子量(kDa)。从各AAV样品中检测到三种衣壳蛋白(VP1、VP2和VP3，分别为87kDa、72kDa和62kDa)。这些结果表明，克隆到质粒(pED261-145、pED261-146、pED261-208、pED263-145、pED263-146和pED263-208)中的目标基因可以封包到AAV9中。

图12示出了在HSMM细胞中通过使用3种AAV9(AAV9-ED261-145、AAV9-ED261-208和AAV9-ED263-208)对人UTRN基因表达的激活(N＝3-4，对于AAV组；N＝8，对于非AAV对照。误差条表示标准误差)。这些AAV9激活了人UTRN基因的表达。

图13示出了靶向性向导相对于非靶向性向导标准化的RNA测序结果，绘制为log 2倍数变化对比标准化计数的平均值的图(图A：向导编号145对比NTg1；图B：向导编号146对比NTg1；图C：向导编号208对比NTg1)。

具体实施方式

下面详细说明本发明的实施方式。

1.多核苷酸

本发明提供了一种包含以下碱基序列的多核苷酸(下文中有时称为“本发明的多核苷酸”)：

(a)编码核酸酶缺陷型CRISPR效应蛋白和转录激活子的融合蛋白的碱基序列，和

(b)编码向导RNA的碱基序列，所述向导RNA靶向人肌营养相关蛋白基因的表达调节区中SEQ ID NO:104、105、135、141、153、167或172所示区域中长度为18至24个核苷酸的连续区域(即18至24个连续核苷酸)。

将本发明的多核苷酸引入到所需细胞中并转录以产生核酸酶缺陷型CRISPR效应蛋白和转录激活子的融合蛋白，以及靶向人UTRN基因的表达调节区的特定区域的向导RNA。这些融合蛋白和向导RNA形成复合物(下文中，所述复合物有时称为“核糖核蛋白；RNP”)并协同作用于上述特定区域，从而激活人UTRN基因的转录。

(1)定义

在本说明书中，“人肌营养相关蛋白(UTRN)基因的表达调节区”是指其中RNP结合到所述区域可以激活人UTRN基因的表达的任何区域。即，人UTRN基因的表达调节区可以存在于人UTRN基因的任何区域，诸如启动子区、增强子区、内含子和外显子等，只要RNP结合激活人UTRN基因的表达即可。在本说明书中，当表达调节区由特定序列示出时，表达调节区在概念上包含有义链序列和反义链序列。

在本发明中，核酸酶缺陷型CRISPR效应蛋白和转录激活子的融合蛋白被向导RNA募集到人UTRN基因的表达调节区中的特定区域中。在本说明书中，“靶向......的向导RNA”是指“将融合蛋白募集到......中的向导RNA”。

在本说明书中，“向导RNA(也称为“gRNA”)”是包含基因组特异性CRISPR-RNA(称为“crRNA”)的RNA。crRNA是与靶向序列(下文描述)的互补序列结合的RNA。当Cpf1用作CRISPR效应蛋白时，“向导RNA”是指包含由crRNA和与其5'末端连接的特异性序列组成的RNA的RNA(例如，在FnCpf 1的情况下，SEQ ID NO:106所示的RNA序列)。当Cas9用作CRISPR效应蛋白时，“向导RNA”是指嵌合体RNA(称为“单个向导RNA(sgRNA)”)，包含crRNA和与其3'末端连接的反式激活crRNA(称为“tracrRNA”)(例如，参见Zhang F.等人，《人类分子遗传学(Hum MolGenet)》，2014年9月15日；23(R1)：R40-6和Zetsche B.等人，《细胞》，2015年10月22日；163(3)：759-71，通过引用全部并入本文)。

在本说明书中，将与在人UTRN基因的表达调节区中与crRNA结合的序列互补的序列称为“靶向序列”。即，在本说明书中，“靶向序列”是存在于人UTRN基因的表达调节区中且与PAM(前间隔子相邻基序)相邻的DNA序列。当Cpf1用作CRISPR效应蛋白时，PAM与靶向序列的5'侧相邻。当Cas9用作CRISPR效应蛋白时，PAM与靶向序列的3'侧相邻。靶向序列可以存在于人UTRN基因的表达调节区的有义链序列侧或反义链序列侧(参见，例如，上述Zhang F.等人，《人类分子遗传学》，2014年9月15日；23(R1)：R40-6和Zetsche B.等人，《细胞》，2015年10月22日；163(3)：759-71，通过引用全部并入本文)。

(2)核酸酶缺陷型CRISPR效应蛋白

在本发明中，使用核酸酶缺陷型CRISPR效应蛋白，将与其融合的转录激活子募集到人UTRN基因的表达调节区中。用于本发明的核酸酶缺陷型CRISPR效应蛋白(下文中简称为“CRISPR效应蛋白”)没有特别限制，只要它与gRNA形成复合物并被募集到人UTRN基因的表达调节区中即可。例如，可以包括核酸酶缺陷型Cas9(下文中有时也称为“dCas9”)或核酸酶缺陷型Cpf1(下文中有时也称为“dCpf1”)。

上述dCas9的实例包括但不限于以下各者的核酸酶缺陷型变体：酿脓链球菌(Streptococcus pyogenes)来源的Cas9(SpCas9；PAM序列：NGG(N为A、G、T或C，以下相同))、嗜热链球菌(Streptococcus thermophilus)来源的Cas9(StCas9；PAM序列：NNAGAAW(W为A或T，以下相同))、脑膜炎奈瑟氏球菌(Neisseria meningitidis)来源的Cas9(NmCas9；PAM序列：NNNNGATT)，或金黄色葡萄球菌(Staphylococcus aureus)来源的Cas9(SaCas9；PAM序列：NNGRRT(R为A或G，以下相同)等(例如，参见Nishimasu等人，《细胞》，2014年2月27日；156(5)：935-49，Esvelt KM等人，《自然方法学(Nat Methods)》，2013年11月；10(11)：1116-21，Zhang Y.《分子细胞(Mol Cell)》，2015年10月15日；60(2)：242-55，以及Friedland AE等人，《基因组生物学(Genome Biol)》，2015年11月24日；16：257，通过引用全部并入本文)。例如，在SpCas9的情况下，可以使用其中第10位Asp残基被转化为Ala残基并且第840位His残基被转化为Ala残基的双突变体(有时称为“dSpCas9”)(参见，例如，上述Nishimasu等人，《细胞》，2014)。或者，在SaCas9的情况下，可以使用其中第10位Asp残基被转化为Ala残基并且第580位Asn残基被转化为Ala残基的双突变体(SEQ ID NO:107)，或者其中第10位Asp残基被转化为Ala残基并且第557位His残基被转化为Ala残基的双突变体(SEQ ID NO:108)(下文中，这些双突变体中的任何一个有时称为“dSaCas9”)(参见，例如Friedland AE等人，《基因组生物学》，2015，通过引用全部并入本文)。

另外，在本发明的一个实施方式中，作为dCas9，也可以使用通过修饰上述dCas9的氨基酸序列的一部分而得到的变体，所述变体与gRNA形成复合体并被募集到人UTRN基因的表达调节区中。此类变体的实例包括具有部分缺失的氨基酸序列的截短型变体。在本发明的一个实施方式中，作为dCas9，可以使用在PCT/JP2019/022795和PCT/JP2019/041751中公开的变体，通过引用全部并入本文。具体地，也可以使用通过从其中第10位Asp残基被转化为Ala残基且第580位Asn残基被转化为Ala残基的dSaCas9双突变体中缺失第721位至第745位氨基酸而获得的dSaCas9(SEQ ID NO:109)，或其中缺失的部分被肽连接子替换的dSaCas9(例如，SEQ ID NO:111所示者，其中缺失的部分被GGSGGS连接子(SEQ ID NO:110)替换，和SEQ ID NO:214所示者，其中缺失的部分被SGGGS连接子(SEQ ID NO:213)替换，等)(下文中，这些双突变体中的任何一个有时称为“dSaCas9[-25]”)，或通过从作为上述dSaCas9双突变体中缺失第482位至第648位氨基酸而获得的dSaCas9(SEQ ID NO:112)，或其中缺失的部分被肽连接子替换的dSaCas9(SEQ ID NO:113所示者，其中缺失的部分被GGSGGS连接子替换)。

上述dCpf1的实例包括但不限于以下各者的核酸酶缺陷型变体：来源于新凶手弗朗西丝氏菌(Francisella novicida)的Cpf1(FnCpf1；PAM序列：NTT)、来源于氨基球菌属(Acidaminococcus sp.)的Cpf1(AsCpf1；PAM序列：NTTT)，或来源于毛螺科菌(Lachnospiraceae bacterium)的Cpf1(LbCpf1；PAM序列：NTTT)等(参见，例如，Zetsche B.等人，《细胞》，2015年10月22日；163(3)：759-71，Yamano T等人，《细胞》，2016年5月5日；165(4)：949-62，和Yamano T等人，《分子细胞》，2017年8月17日；67(4)：633-45，通过引用全部并入本文)。例如，在FnCpf1的情况下，可以使用其中第917位Asp残基转化为Ala残基且第1006位Glu残基转化为Ala残基的双突变体(例如，参见上述Zetsche B等人，《细胞》，2015，通过引用全部并入本文)。在本发明的一个实施方式中，作为dCpf1，也可以使用通过修饰上述dCpf1的氨基酸序列的一部分而获得的变体，所述变体与gRNA形成复合物并被募集到人UTRN基因的表达调节区中。

在本发明的一个实施方式中，dCas9用作核酸酶缺陷型CRISPR效应蛋白。在一个实施方式中，dCas9是dSaCas9，且在特定的实施方式中，dSaCas9是dSaCas9[-25]。

包含编码CRISPR效应蛋白的碱基序列的多核苷酸可以通过例如以下步骤克隆：基于其cDNA序列信息，合成覆盖编码所述蛋白质的所需部分的区域的寡DNA引物，并通过PCR方法使用从产生所述蛋白质的细胞制备的总RNA或mRNA级分作为模板扩增所述多核苷酸。另外，包含编码核酸酶缺陷型CRISPR效应蛋白的碱基序列的多核苷酸可以通过以已知的定点诱变方法将突变引入到编码克隆的CRISPR效应蛋白的核苷酸序列中以将在对DNA切割活性重要的位置处的氨基酸残基(例如，可以包括但不限于：在SaCas9的情况下，第10位Asp残基、第557位His残基和第580位Asn残基；在FnCpf1的情况下，第917位Asp残基和第1006位Glu残基等)转化成其它氨基酸而获得。

或者，包含编码核酸酶缺陷型CRISPR效应蛋白的碱基序列的多核苷酸可以通过化学合成或化学合成与PCR方法或Gibson组装方法的组合，基于其cDNA序列信息而获得，且还可以进一步构建为经过密码子优化以产生适合在人体内表达的密码子的碱基序列。

(3)转录激活子

在本发明中，人UTRN基因表达通过与核酸酶缺陷型CRISPR效应蛋白融合的转录激活子的作用而被激活。在本说明书中，“转录激活子”是指能够激活人UTRN基因的基因转录的蛋白质或保留其功能的肽片段。用于本发明的转录激活子没有特别限制，只要其可以激活人UTRN基因的表达即可。例如，其包括VP64、VPH、VPR、miniVR和microVR，其具有转录激活能力的变体等。VP64是由SEQ ID NO:114所示的50个氨基酸组成的肽。VPH是VP64、p65和HSF1的融合蛋白，具体地，是由SEQ ID NO:115所示的376个氨基酸组成的肽。VPR是VP64、p65和爱泼斯坦-巴尔病毒(Epstein-Barr virus)的复制和转录激活子(RTA)的融合蛋白，例如，由SEQ ID NO:116所示的523个氨基酸组成的肽、由SEQ ID NO:216所示的519个氨基酸组成的肽等。VP64、VPH和VPR是已知的并且在例如以下文献中详细公开：Chavez A.等人，《自然方法学》，2016年7月；13(7)：563-7和Chavez A.等人，《自然方法学》，2015年4月；12(4)：326-8，通过引用全部并入本文。在本发明的一个实施方式中，作为转录激活子，可以使用包含RTA的转录激活结构域和VP64的肽。RTA的转录激活结构域是已知的并且在例如以下文献中公开：《病毒学杂志(J Virol)》，1992年9月；66(9)：5500-8，通过引用全部并入本文。作为这种肽的序列，miniVR是由SEQ ID NO:117所示的167个氨基酸组成的肽，microVR是由SEQ ID NO:118所示的140个氨基酸组成的肽。SEQ ID NO:117所示的氨基酸序列由如下氨基酸序列组成，其中RTA的较短的转录激活结构域，即RTA的第493位至第605位氨基酸残基，和VP64以G-S-G-S连接子(SEQ ID NO:209)连接。SEQ ID NO:118所示的氨基酸序列由如下氨基酸序列组成，其中RTA的更短的转录激活结构域，即RTA的第520位至第605位氨基酸残基，和VP64以G-S-G-S连接子连接。miniVR和microVR的详情在PCT/JP2019/030972中进行了描述，通过引用全部并入本文。任何上述转录激活子都可以进行任何修饰和/或改变，只要其保持其转录激活能力即可。例如，作为本发明中的转录激活子，还可以使用(i)包含SEQID NO:117所示的氨基酸序列的肽，(ii)包含SEQ ID NO:117所示但其中缺失、替换、插入和/或添加了1个或几个(例如2、3、4、5或更多个)氨基酸的氨基酸序列的肽，(iii)包含与SEQ ID NO:117所示的氨基酸序列具有不小于90％(例如90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或以上)同一性的氨基酸序列的肽，(iv)由SEQ ID NO:117所示但其中缺失、替换、插入和/或添加了1个或几个(例如2、3、4、5或更多个)氨基酸的氨基酸序列组成的肽，或(v)由与SEQ ID NO:117所示的氨基酸序列具有不小于90％(例如90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或以上)同一性的氨基酸序列组成的肽，只要其保持其转录激活能力即可。例如，作为本发明中的转录激活子，还可以使用(i)包含SEQ ID NO:118所示的氨基酸序列的肽，(ii)包含SEQ ID NO:118所示但其中缺失、替换、插入和/或添加了1个或几个(例如2、3、4、5或更多个)氨基酸的氨基酸序列的肽，(iii)由与SEQ ID NO:118中所示的氨基酸序列具有不小于90％(例如90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或以上)同一性的氨基酸序列组成的肽，(iv)由SEQ ID NO:118所示但其中缺失、替换、插入和/或添加了1个或几个(例如2、3、4、5或更多个)氨基酸的氨基酸序列组成的肽，或(v)由与SEQ ID NO:118所示的氨基酸序列具有不小于90％(例如90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或以上)同一性的氨基酸序列组成的肽，只要其保持其转录激活能力即可。

包含编码转录激活子的碱基序列的多核苷酸可以通过化学合成或化学合成与PCR方法或Gibson组装方法的组合来构建。此外，包含编码转录激活子的碱基序列的多核苷酸还可以被构建为密码子优化的DNA序列，成为适合于在人体内表达的密码子。

包含编码转录激活子和核酸酶缺陷型CRISPR效应蛋白的融合蛋白的碱基序列的多核苷酸可以通过将编码核酸酶缺陷型CRISPR效应蛋白的碱基序列与编码转录激活子的碱基序列直接或在添加编码连接子、NLS(核定位信号)、标签和/或其它的碱基序列后连接来制备。在本发明中，转录激活子可以与CRISPR效应蛋白的N-末端或C-末端融合。作为连接子，可以使用氨基酸数为约2至50的连接子，其具体实例包括但不限于其中甘氨酸(G)和丝氨酸(S)交替连接的G-S-G-S连接子，及类似物。

(4)向导RNA

在本发明中，核酸酶缺陷型CRISPR效应蛋白和转录激活子的融合蛋白可以被向导RNA募集到人UTRN基因的表达调节区。如上述“(1)定义”中所述，向导RNA包含crRNA，且所述crRNA与靶向序列的互补序列结合。crRNA可能不与靶向序列的互补序列完全互补，只要向导RNA可以将融合蛋白募集到靶区域即可，且可以包含靶向序列中缺失、替换、插入和/或添加了至少1至3个碱基的碱基序列。

当dCas9用作核酸酶缺陷型CRISPR效应蛋白时，例如，可以使用已发布的gRNA设计网站(CRISPR Design Tool、CRISPR direct等)确定靶向序列。具体而言，从靶基因(即人UTRN基因)的序列中，列出了长度为约20个核苷酸的候选靶向序列，其中PAM(例如，在SaCas9的情况下，NNGRRT)与其3'侧相邻，且可以将这些候选靶向序列中在人基因组中具有少量脱靶位点的序列用作靶向序列。靶向序列的碱基长度为18至24个核苷酸，优选为20至23个核苷酸，更优选为21至23个核苷酸。作为预测脱靶位点数目的初步筛选，许多生物信息学工具是已知的且可公开获得，可用于预测脱靶效应最低的靶向序列。其实例包括诸如Benchling(https://benchling.com)和COSMID(具有错配、插入和缺失的CRISPR脱靶位点)(可在互联网https://crispr.bme.gatech.edu上找到)的生物信息学工具。使用这些，可以总结出与gRNA靶向的碱基序列的相似性。当要使用的gRNA设计软件不具有搜索靶基因组的脱靶位点的功能时，例如，可以通过对靶基因组进行关于候选靶向序列的3'侧的8至12个核苷酸(具有靶向核苷酸序列高识别能力的种子序列)的Blast搜索来搜索脱靶位点。

在本发明的一个实施方式中，在存在于人6号染色体(Chr 6)的GRCh38.p12位置上的区域中，以下五个区域可能是人UTRN基因的表达调节区。组蛋白修饰图谱强力表明这些区域为表达调节区。因此，在本发明的一个实施方式中，在存在于人6号染色体(Chr 6)的GRCh38.p12位置上的以下五个区域中的至少一个区域中，靶向序列的长度可以为18至24个核苷酸，优选为20至23个核苷酸，更优选为21至23个核苷酸：

(1)144,215,500-144,217,000，

(2)144,248,500-144,249,800，

(3)144,264,000-144,267,000，

(4)144,283,900-144,288,300，

(5)144,292,500-144,295,500。

在本发明的一个实施方式中，在存在于上述区域(3)中的SEQ ID NO:104所示的区域中或存在于上述区域(4)中的SEQ ID NO:105、135、141、153、167或172所示的区域中，靶向序列的长度可以是连续的18至24个核苷酸，优选为20至23个核苷酸，更优选为21至23个核苷酸。

在本发明的另一个实施方式中，靶向序列可以是SEQ ID NO:45、46、58、59、60、135、141、153、155、156、157、159、167或172所示的碱基序列。SEQ ID NO:45和46所示的碱基序列是包含在上述SEQ ID NO:104所示区域中的靶向序列，且SEQ ID NO:58、59、60、155、156、157和159所示的碱基序列是包含在上述SEQ ID NO:105所示区域中的靶向序列。

在本发明的一个实施方式中，编码crRNA的碱基序列可以是与靶向序列相同的碱基序列。例如，当将SEQ ID NO:4所示的靶向序列(AGAAAAGCGGCCCCTAGGGGC)作为编码crRNA的碱基序列引入细胞时，从所述序列转录的crRNA是AGAAAAGCGGCCCCUAGGGGC(SEQ ID NO:119)，并与GCCCCTAGGGGCCGCTTTTCT(SEQ ID NO:120)结合，后者是与SEQ ID NO:4所示的碱基序列互补的序列，且存在于人UTRN基因的表达调节区中。在另一个实施方式中，可以使用靶向序列中缺失、替换、插入和/或添加了至少1至3个碱基的碱基序列作为编码crRNA的碱基序列，只要向导RNA可以募集融合蛋白至靶区域即可。因此，在本发明的一个实施方式中，作为编码crRNA的碱基序列，可以使用SEQ ID NO:45、46、58、59、60、135、141、153、155、156、157、159、167或172所示的碱基序列，或SEQ ID NO:45、46、58、59、60、135、141、153、155、156、157、159、167或172所示但其中缺失、替换、插入和/或添加了1至3个碱基的碱基序列。

在本发明的一个实施方式中，SEQ ID NO:45、46、58、59、60，135、141、153、155、156、157、159、167或172所示的碱基序列可以用作编码crRNA的碱基序列以分别产生包含SEQ ID NO:194、195、196、197、198、199、200、201、202、203、204、205、206或207所示的crRNA的gRNA。在本发明的另一个实施方式中，gRNA可以包含SEQ ID NO:194、195、196、197、198、199、200、201、202、203、204、205、206或207所示的碱基序列，或SEQ ID NO:194、195、196、197、198、199、200、201、202、203、204、205、206或207所示但其中缺失、替换、插入和/或添加了1至3个碱基的碱基序列。

当dCpf1用作核酸酶缺陷型CRISPR效应蛋白时，可以将编码gRNA的碱基序列设计为编码在5'末端连接有特定RNA的crRNA的DNA序列。本领域普通技术人员可以根据要使用的dCpf1适当地选择所述与crRNA的5'末端连接的RNA和编码所述RNA的DNA序列。例如，当使用dFnCpf1时，其中SEQ ID NO:121，即AATT

当dCas9用作CRISPR效应蛋白时，可以将编码gRNA的碱基序列设计为其中编码已知tracrRNA的DNA序列连接到编码crRNA的DNA序列的3'末端的DNA序列。本领域普通技术人员可以根据要使用的dCas9适当地选择这样的tracrRNA和编码所述tracrRNA的DNA序列。例如，当使用dSaCas9时，SEQ ID NO:122所示的碱基序列用作编码tracrRNA的DNA序列。编码tracrRNA的DNA序列可以是编码通常用于各种Cas9蛋白的tracrRNA的碱基序列，其中缺失、替换、插入和/或添加了至少1至6个碱基，只要转录后gRNA可以将融合蛋白募集到表达调节区即可。

包含以此方式设计的编码gRNA的碱基序列的多核苷酸可以使用已知的DNA合成方法化学合成。

在本发明的另一个实施方式中，本发明的多核苷酸可以包含至少两种不同的编码gRNA的碱基序列。例如，多核苷酸可以包含至少两种不同的编码向导RNA的碱基序列，其中所述至少两种不同的碱基序列选自包含SEQ ID NO:45、46、58、59、60、135、141、153、155、156、157、159、167或172所示序列的碱基序列。在本发明的一个实施方式中，多核苷酸可以包含至少两种不同的编码向导RNA的碱基序列，其中所述至少两种不同的碱基序列选自包含SEQ ID NO:45、46或59所示序列的碱基序列。

(5)启动子序列

在本发明的一个实施方式中，启动子序列可以可操作地连接至编码核酸酶缺陷型CRISPR效应蛋白和转录激活子的融合蛋白的碱基序列和/或编码gRNA的碱基序列各自的上游。可能连接的启动子没有特别限制，只要它在靶细胞中显示出启动子活性即可。可能连接至编码融合蛋白的碱基序列上游的启动子序列的实例包括但不限于EFS启动子、EF-1α启动子、CMV(巨细胞病毒)启动子、CK8启动子、MHC启动子、MLC启动子、Des启动子、cTnC启动子、MYOD启动子、hTERT启动子、SRα启动子、SV40启动子、LTR启动子、CAG启动子、RSV(劳斯氏肉瘤病毒)启动子等。可能连接至编码gRNA的碱基序列上游的启动子序列的实例包括但不限于为pol III启动子的U6启动子、SNR6启动子、SNR52启动子、SCR1启动子、RPR1启动子、U3启动子、H1启动子和tRNA启动子等。在本发明的一个实施方式中，当多核苷酸包含两种以上编码向导RNA的碱基序列时，单个启动子序列可以可操作地连接至所述两种以上碱基序列的上游。在另一个实施方式中，启动子序列可以可操作地连接至两种以上碱基序列各自的上游，其中可操作地连接至各碱基序列的启动子序列可以相同或不同。

在本发明的一个实施方式中，可以使用肌肉特异性启动子作为连接至编码上述融合蛋白的碱基序列上游的启动子序列。肌肉特异性启动子的实例包括但不限于CK8启动子、CK6启动子、CK1启动子、CK7启动子、CK9启动子、心肌肌钙蛋白C启动子、α肌动蛋白启动子、肌球蛋白重链激酶(MHCK)启动子、肌球蛋白轻链2A启动子、肌营养不良蛋白启动子、肌肉肌酸激酶启动子、dMCK启动子、tMCK启动子、enh348 MCK启动子、合成C5-12(Syn)启动子、Myf5启动子、MLC1/3f启动子、MYOD启动子、Myog启动子、Pax7启动子、Des启动子等(关于肌肉特异性启动子的详情，参见，例如，US2011/0212529A、McCarthy JJ等人，《骨骼肌(SkeletalMuscle)》，2012年5月；2(1)：8，Wang B.等人，《基因治疗(Gene Ther)》(2008年11月；15(22)：1489-99，通过引用全部并入本文)。

在本发明的一个实施方式中，U6启动子可以用作编码gRNA的碱基序列的启动子序列，CK8启动子可以用作编码融合蛋白的碱基序列的启动子序列。具体地，对于U6启动子，可以使用以下碱基序列：(i)SEQ ID NO:128所示的碱基序列，(ii)SEQ ID NO:128所示但其中缺失、替换、插入和/或添加了1个或几个(例如2、3、4、5或更多个)碱基的碱基序列，在靶细胞中具有启动子活性，或(iii)与SEQ ID NO:128所示的碱基序列具有不小于90％(例如90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或以上)同一性的碱基序列，在靶细胞中显示出启动子活性。对于CK8启动子，可以使用以下碱基序列：(i)SEQ ID NO:191所示的碱基序列，(ii)SEQ ID NO:191所示但其中缺失、替换、插入和/或添加了1个或几个(例如2、3、4、5或更多个)碱基的碱基序列，在靶细胞中具有启动子活性，或(iii)与SEQ ID NO:191所示的碱基序列具有不小于90％(例如90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或以上)同一性的碱基序列，在靶细胞中显示出启动子活性。

(6)其它碱基序列

此外，本发明的多核苷酸除了上述提及的那些以外，可以进一步包含例如多腺苷酸化(polyA)信号、Kozak共有序列等已知序列，以达成提高由编码核酸酶缺陷型CRISPR效应蛋白和转录激活子的融合蛋白的碱基序列的转录产生的mRNA的翻译效率的目的。例如，本发明中的多腺苷酸化信号可以包括hGH polyA、bGH polyA、2x sNRP-1 polyA(参见US7557197B2，通过引用全部并入本文)等。另外，本发明的多核苷酸可以包含编码连接子序列的碱基序列、编码NLS的碱基序列和/或编码标签的碱基序列。

(7)本发明的示例性实施方式

在本发明的一个实施方式中，提供了一种多核苷酸，所述多核苷酸包含：

编码核酸酶缺陷型CRISPR效应蛋白和转录激活子的融合蛋白的碱基序列，

用于所述编码核酸酶缺陷型CRISPR效应蛋白和转录激活子的融合蛋白的碱基序列的启动子序列，

一种或两种编码向导RNA的碱基序列，其中所述一种或两种碱基序列选自包含SEQID NO:45、46或59所示序列的碱基序列，或包含SEQ ID NO:45、46或59所示但其中缺失、替换、插入和/或添加了1至3个碱基的序列的碱基序列，以及

用于所述编码向导RNA的碱基序列的U6启动子，

其中所述核酸酶缺陷型CRISPR效应蛋白是dSaCas9或dSaCas9[-25]，

其中所述转录激活子选自VP64、VPH、VPR、miniVR和microVR，且

其中所述用于编码融合蛋白的碱基序列的启动子序列选自EF-1α启动子、EFS启动子和CK8启动子。

所述多核苷酸可以进一步包含hGH polyA、bGH polyA或2xsNRP-1 polyA。

在本发明的一个实施方式中，提供了一种多核苷酸，所述多核苷酸包含：

编码核酸酶缺陷型CRISPR效应蛋白和转录激活子的融合蛋白的碱基序列，

用于所述编码核酸酶缺陷型CRISPR效应蛋白和转录激活子的融合蛋白的碱基序列的CK8启动子，

用于所述编码向导RNA的碱基序列的U6启动子，

其中所述核酸酶缺陷型CRISPR效应蛋白是dSaCas9或dSaCas9[-25]，且

其中所述转录激活子是miniVR或microVR。

所述多核苷酸可以进一步包含bGH polyA或2x sNRP-1 polyA。

在本发明的一个实施方式中，提供了一种多核苷酸，所述多核苷酸包含：

编码核酸酶缺陷型CRISPR效应蛋白和转录激活子的融合蛋白的碱基序列，

用于所述编码核酸酶缺陷型CRISPR效应蛋白和转录激活子的融合蛋白的碱基序列的CK8启动子，

用于所述编码向导RNA的碱基序列的U6启动子，

其中所述核酸酶缺陷型CRISPR效应蛋白是dSaCas9，且

其中所述转录激活子是miniVR。

所述多核苷酸可以进一步包含bGH polyA或2x sNRP-1 polyA。

在本发明的一个实施方式中，提供了一种多核苷酸，所述多核苷酸包含：

编码核酸酶缺陷型CRISPR效应蛋白和转录激活子的融合蛋白的碱基序列，

用于所述编码核酸酶缺陷型CRISPR效应蛋白和转录激活子的融合蛋白的碱基序列的CK8启动子，

用于所述编码向导RNA的碱基序列的U6启动子，

其中所述核酸酶缺陷型CRISPR效应蛋白是dSaCas9，且

其中所述转录激活子是microVR。

所述多核苷酸可以进一步包含bGH polyA或2x sNRP-1 polyA。

在本发明的一个实施方式中，提供了一种多核苷酸，所述多核苷酸包含：

编码核酸酶缺陷型CRISPR效应蛋白和转录激活子的融合蛋白的碱基序列，

用于所述编码核酸酶缺陷型CRISPR效应蛋白和转录激活子的融合蛋白的碱基序列的CK8启动子，

编码向导RNA的碱基序列，包含SEQ ID NO:59所示的碱基序列，或SEQ ID NO:59所示但其中缺失、替换、插入和/或添加了1至3个碱基的碱基序列，以及

用于所述编码向导RNA的碱基序列的U6启动子，

其中所述核酸酶缺陷型CRISPR效应蛋白是dSaCas9，且

其中所述转录激活子是miniVR。

所述多核苷酸可以进一步包含2x sNRP-1 polyA。

在本发明的一个实施方式中，提供了一种多核苷酸，所述多核苷酸包含：

编码核酸酶缺陷型CRISPR效应蛋白和转录激活子的融合蛋白的碱基序列，

用于所述编码核酸酶缺陷型CRISPR效应蛋白和转录激活子的融合蛋白的碱基序列的CK8启动子，

编码向导RNA的碱基序列，包含SEQ ID NO:59所示的碱基序列，或SEQ ID NO:59所示但其中缺失、替换、插入和/或添加了1至3个碱基的碱基序列，以及

用于所述编码向导RNA的碱基序列的U6启动子，

其中所述核酸酶缺陷型CRISPR效应蛋白是dSaCas9，且

其中所述转录激活子是microVR。

所述多核苷酸可以进一步包含2x sNRP-1 polyA。

在本发明的多核苷酸的一个实施方式中，多核苷酸从5'末端开始依次包含(i)编码核酸酶缺陷型CRISPR效应蛋白和转录激活子的融合蛋白的碱基序列和(ii)编码gRNA的碱基序列。在另一个实施方式中，多核苷酸从5'末端开始依次包含(ii)编码gRNA的碱基序列和(i)编码核酸酶缺陷型CRISPR效应蛋白与转录激活子的融合蛋白的碱基序列。

2.载体

本发明提供了一种包含本发明的多核苷酸的载体(下文中有时称为“本发明的载体”)。本发明的载体可以是质粒载体或病毒载体。

当本发明的载体是质粒载体时，所使用的质粒载体没有特别限制，且可以是任何质粒载体，诸如克隆质粒载体和表达质粒载体。通过用已知方法将本发明的多核苷酸插入质粒载体中来制备质粒载体。

当本发明的载体是病毒载体时，使用的病毒载体没有特别限制，其实例包括但不限于腺病毒载体、腺相关病毒(AAV)载体、慢病毒载体、逆转录病毒载体、仙台病毒载体等。在本说明书中，“病毒载体”还包括其衍生物。考虑到在基因治疗中的用途，优选使用AAV载体，原因在于它能够长时间表达转基因，且它衍生自非致病性病毒并具有高安全性。

可以通过已知方法制备包含本发明的多核苷酸的病毒载体。简而言之，制备插入有本发明的多核苷酸的用于病毒表达的质粒载体，将所述载体转染到合适的宿主细胞中以允许瞬时产生包含本发明的多核苷酸的病毒载体，并收集病毒载体。

在本发明的一个实施方式中，当使用AAV载体时，AAV载体的血清型没有特别限制，只要可以激活靶标中人UTRN基因的表达即可，且可以使用AAV1、AAV2、AAV3、AAV4、AAV5、AAV6、AAV7、AAV8、AAV9、AAVrh.10等中的任何一个(对于AAV的各种血清型，参见，例如，WO2005/033321和EP2341068(A1)，通过引用全部并入本文)。AAV变体的实例包括但不限于具有修饰的衣壳的新血清型(例如，WO 2012/057363，通过引用全部并入本文)等。例如，在本发明的一个实施方式中，可以使用具有修饰的衣壳以提高对肌肉细胞的感染性的新血清型，诸如AAV

当制备AAV载体时，可以使用诸如以下的已知方法：(1)使用质粒的方法，(2)使用杆状病毒的方法，(3)使用单纯疱疹病毒的方法，(4)使用腺病毒的方法，或(5)使用酵母的方法(例如，《应用微生物学与生物技术(Appl Microbiol Biotechnol)》，2018；102(3)：1045-1054等，通过引用全部并入本文)。例如，当通过使用质粒的方法制备AAV载体时，首先，制备在野生型AAV基因组序列的两个末端包含反向的末端重复序列(ITR)并插入有本发明的多核苷酸代替编码Rep蛋白和衣壳蛋白的DNA的载体质粒。另一方面，将编码形成病毒粒子所必需的Rep蛋白和衣壳蛋白的DNA插入其它质粒中。此外，将包含负责AAV增殖所必需的腺病毒的辅助作用的基因(E1A、E1B、E2A、VA和E4orf6)的质粒制备为腺病毒辅助质粒。将这三种质粒共转染到宿主细胞中使得在细胞中产生重组AAV(即，AAV载体)。作为宿主细胞，优选使用能够提供负责上述辅助作用的基因的一部分基因产物(蛋白质)的细胞(例如293细胞等)。当使用这种细胞时，不必在上述腺病毒辅助质粒中携带编码可以从宿主细胞提供的蛋白质的基因。产生的AAV载体存在于细胞核中。因此，通过以下步骤来制备所需的AAV载体：用冻融破坏宿主细胞，收集病毒，然后通过使用氯化铯的密度梯度超速离心法，柱法等对病毒级分进行分离和纯化。

AAV载体在安全性、基因转导效率等方面具有很大的优势，且用于基因治疗。然而，已知可以封包在AAV载体中的多核苷酸的大小是有限制的。例如，在本发明的一个实施方式中，包括包含编码dSaCas9和miniVR或microVR的融合蛋白的碱基序列、编码靶向人UTRN的表达调节区的gRNA的碱基序列以及作为启动子序列的EFS启动子序列或CK8启动子序列和U6启动子序列，以及ITR部分在内的多核苷酸的碱基长度的全长为约4.85kb，且它们可以被封包在单个AAV载体中。

3.药物组合物

本发明还提供了一种包含本发明的多核苷酸或本发明的载体的药物组合物(下文中有时称为“本发明的药物组合物”)。本发明的药物组合物可以用于治疗或预防DMD或BMD。

本发明的药物组合物包含本发明的多核苷酸或本发明的载体作为活性成分，且可以制备成包含这种活性成分(即，本发明的多核苷酸或本发明的载体)和通常药学上可接受的载剂的制剂。

本发明的药物组合物经肠胃外施用，且可以局部或全身施用。本发明的药物组合物可以通过但不限于例如静脉内施用、动脉内施用、皮下施用、腹膜内施用或肌肉内施用来施用。

本发明的药物组合物向对象施用的剂量没有特别限制，只要它是用于治疗和/或预防的有效量即可。可以根据活性成分、剂型、对象的年龄和体重、施用方案、施用方法等适当地优化。

在本发明的一个实施方式中，本发明的药物组合物不仅可以施用于患有DMD或BMD的对象，而且还可以预防性地施用于基于遗传背景分析等将来可能发展为DMD或BMD的对象。本说明书中的术语“治疗”除了治愈疾病以外，还包括疾病缓解。另外，术语“预防”除了预防疾病发作以外，还可以包括延迟疾病发作。本发明的药物组合物也可以称为“本发明的药剂”等。

4.治疗或预防DMD或BMD的方法

本发明还提供一种用于治疗或预防DMD或BMD的方法，所述方法包括向有此需要的对象施用本发明的多核苷酸或本发明的载体(下文中有时称为“本发明的方法”)。另外，本发明包括用于治疗或预防DMD或BMD的本发明的多核苷酸或本发明的载体。此外，本发明包括本发明的多核苷酸或本发明的载体在制备用于治疗或预防DMD或BMD的药物组合物中的用途。

本发明的方法可以通过向患有DMD或BMD的对象施用上述本发明的药物组合物来实践，且剂量、施用途径、对象等与上述相同。

症状的测量可以在使用本发明的方法开始治疗之前以及在治疗之后的任何时间进行，以确定对象对治疗的反应。

本发明的方法可以改善对象的骨骼肌和/或心肌的功能。要改善功能的肌肉没有特别限制，且可以列举任何肌肉和肌肉群。

5.核糖核蛋白

本发明提供了一种核糖核酸蛋白，所述核糖核酸蛋白包含以下(下文中有时称为“本发明的RNP”)：

(c)核酸酶缺陷型CRISPR效应蛋白和转录激活子的融合蛋白，和

(d)靶向人肌营养相关蛋白基因的表达调节区中SEQ ID NO:104、105、135、141、153、167或172所示区域中长度为18至24个核苷酸的连续区域的向导RNA。

作为包含在本发明的RNP中的核酸酶缺陷型CRISPR效应蛋白、转录激活子和向导RNA，可以使用在上述“1.多核苷酸”部分中详细说明的核酸酶缺陷型CRISPR效应蛋白、转录激活子和向导RNA。包含在本发明的RNP中的核酸酶缺陷型CRISPR效应蛋白和转录激活子的融合蛋白可以通过例如将编码所述融合蛋白的多核苷酸引入到细胞、细菌或其它生物中以允许表达而产生，或由体外翻译系统通过使用所述多核苷酸而产生。另外，包含在本发明的RNP中的向导RNA可以通过例如化学合成或体外转录系统通过使用编码向导RNA的多核苷酸而产生。将由此制备的融合蛋白和向导RNA混合以制备本发明的RNP。必要时，可以混合其它物质，诸如金粒子。为了将本发明的RNP直接递送至靶细胞、组织等，可以通过已知方法将RNP封装在脂质纳米粒子(LNP)中。可以通过已知方法将本发明的RNP引入至靶细胞、组织等中。对于封装在LNP中和引入方法，可以参考例如，Lee K.等人，《自然-生物医学工程(NatBiomed Eng)》，2017；1：889-901，WO 2016/153012，通过引用全部并入本文，等等。

在本发明的一个实施方式中，本发明的RNP中所包含的向导RNA靶向存在于人6号染色体(Chr 6)的GRCh38.p12位置上的以下五个区域中至少一个区域中连续的18至24个核苷酸长度，优选20至23个核苷酸长度，更优选21至23个核苷酸长度：

(1)144,215,500-144,217,000，

(2)144,248,500-144,249,800，

(3)144,264,000-144,267,000，

(4)144,283,900-144,288,300，

(5)144,292,500-144,295,500。

在一个实施方式中，向导RNA靶向SEQ ID NO:104、105、135、141、153、167或172所示的DNA序列中连续的18至24个核苷酸长度，优选20至23个核苷酸长度，更优选为21至23个核苷酸长度的碱基序列。在一个实施方式中，向导RNA靶向包含SEQ ID NO:45、46、58、59、60、135、141、153、155、156、157、159、167或172所示的全部或一部分序列的区域。在本发明的一个实施方式中，可以使用包含SEQ ID NO:194、195、196、197、197、198、199、200、201、202、203、204、205、206或207所示的crRNA的向导RNA，或SEQ ID NO:194、195、196、197、198、199、200、201、202、203、204、205、206或207所示但其中分别缺失、替换、插入和/或添加了1至3个碱基的碱基序列。

6.其它

本发明还提供了一种组合物或试剂盒，所述组合物或试剂盒包含以下用于激活人肌营养相关蛋白基因的表达：

(e)核酸酶缺陷型CRISPR效应蛋白和转录激活子的融合蛋白，或编码所述融合蛋白的多核苷酸，和

本发明还提供了一种治疗或预防杜氏肌营养不良或贝克肌营养不良的方法，所述方法包括施用以下(e)和(f)：

(e)核酸酶缺陷型CRISPR效应蛋白和转录激活子的融合蛋白，或编码所述融合蛋白的多核苷酸，和

本发明还提供以下(e)和(f)在制备用于治疗或预防杜氏肌营养不良或贝克肌营养不良的药物组合物中的用途：

(e)核酸酶缺陷型CRISPR效应蛋白和转录激活子的融合蛋白，或编码所述融合蛋白的多核苷酸，和

作为本发明中的核酸酶缺陷型CRISPR效应蛋白、转录激活子、向导RNA以及编码它们的多核苷酸和携带它们的载体，可以使用在上述“1.多核苷酸”、“2.载体”和“5.核糖核蛋白”部分中详细说明的那些。上述(e)和(f)的剂量、施用途径、对象、制剂等与在“3.DMD或BMD的治疗或预防剂”中所述的相同。

在以下示例性实施方式的描述过程中，本发明的其它特征将变得显而易见，所述示例性实施方式是为了说明本发明而给出的，而并不旨在限制本发明。

实施例

这些实施例描述了在人UTRN基因的指定的表达调节区中，使用dCas9与转录激活子的融合蛋白来增强基因表达，从而使得人UTRN基因表达被选择性激活。基因表达修饰的目的是增强野生型人UTRN基因产物的表达，补充了缺陷型肌营养不良蛋白基因产物的功能。实施例还描述了赋予人UTRN基因的选择性激活而对其它基因的表达影响最小的特异性基因组区域的定义。如本文所述和所示，本发明增强人UTRN基因表达的方法代表了一种新的治疗或预防策略，用于改善由缺陷型肌营养不良蛋白引起的缺陷型肌肉功能。

实施例1.使用HEK293FT细胞筛选针对人肌营养相关蛋白基因的gRNA

在这个实施例中，我们举例说明了使用本文所述的方法通过靶向UTRN基因的指定的表达调节区来实现UTRN基因的激活。所述方法通过设计合适的sgRNA序列，利用Cas9和sgRNA的复合物的性质，以将其募集到基因组的所需基因座。所述方法还利用SaCas9蛋白的核酸酶缺陷形式(D10A和N580A突变体(SEQ ID NO:107)或D10A和H557A突变体(SEQ ID NO:108)；dSaCas9)来保持基因组序列完整，但将各种转录/表观遗传功能性结构域或基序拴系至dSaCas9，以实现对sgRNA序列所靶向的预期基因座的所需修饰，如Gilbert LA等人，《细胞》，2013年7月；154(2)：442-51，以及Gilbert LA等人，《细胞》，2014年10月；159(3)：647-61所述，通过引用全部并入本文。

在这个实施例中，我们说明了本文所述的方法可以用于激活野生型UTRN的表达。sgRNA被设计成靶向UTRN基因的表达调节区，赋予选择性和有效的基因激活。图1示出了人UTRN基因座和两个预测的转录起始位点(TSS)(上图和中图)。UTRN基因的TSS通过查询FANTOM5人promoterome数据库来鉴定(

(1)实验方法

sgRNA序列的选择

查看UTRN基因启动子区域周围的序列(启动子A，约4.4kb(Chr6：GRCh38/hg38；144,283,900-144,288,300)和启动子B，约2.6kb(Chr6：GRCh38/hg38；144,342,683-144,345,311))，以寻找dSaCas9和sgRNA复合体会结合的潜在识别序列。查看所述区域以寻找具有序列NNGRRT的原间隔子相邻基序(PAM)。鉴定了与PAM相邻的靶向序列。靶向序列(与靶DNA杂交的一部分gRNA)的长度被设为21个核苷酸。根据Benchench软件(

测试了表1中列出的24种靶向序列(向导编号sgED3-1至sgED3-24(SEQ ID NO:129至152))对UTRN基因表达的调节功能(下文中，表1中列出的靶向序列有时称为“sgED3系列”。

UTRN基因中靶向序列的位置也在图1中示出(上图和中图)。

将选择的24种靶向序列和对照非靶向性靶向序列(SEQ ID NO:177)分别与编码tracr RNA的DNA序列(SEQ ID NO:122)融合以形成sgRNA序列，并将其克隆到来自Genecopoeia的pCRISPR-LvSG03载体(#pCRISPR-LvSG03)中。所获得的载体在本说明书中表示为pCRISPR-LvSG03 sgRNA表达载体。sgRNA的表达受U6启动子驱动，所述载体在SV40启动子下表达mCherry-IRES-嘌呤霉素基因，从而有助于追踪和选择sgRNA表达细胞。

效应分子的克隆

核酸酶缺陷型SaCas9蛋白(D10A和N580A，或D10A和H557A；dSaCas9)充当以直接融合蛋白形式拴系功能性结构域/基序的主要骨架。dSaCas9连接了两个核定位信号(NLS)在其N末端(SEQ ID NO:178所示的氨基酸序列，SEQ ID NO:179所示的DNA序列)和C末端(SEQID NO：180所示的氨基酸序列，SEQ ID NO:181所示的DNA序列)，以使效应分子能够有效定位至细胞核。

在一个实施例中，将编码具有D10A和N580A突变的dSaCas9的DNA序列在其C末端与编码合成氨基酸转录激活部分VP64、VPH或VPR的DNA序列融合(参见Chavez A等人，《自然方法学》，2016年7月；13(7)：563-67和Chavez A等人，《自然方法学》，2015年4月；12(4)：326-8，通过引用全部并入本文)(SEQ ID NO:182、183或184)。所获得的融合蛋白在本说明书中分别表示为dSaCas9-VP64、dSaCas9-VPH或dSaCas9-VPR融合蛋白。

融合蛋白被募集到UTRN基因的表达调节区，从而发挥其转录激活作用。结果，增强了UTRN基因的表达。

在一个实施例中，将编码缺少氨基酸721-745的dSaCas9蛋白(dSaCas9[-25]，(SEQID NO:214))的DNA序列在其C端与编码合成氨基酸转录激活子miniVR的DNA序列融合(参见PCT/JP2019/030972，通过引用全部并入本文)(SEQ ID NO:185)。所获得的融合蛋白在本说明书中表示为dSaCas9[-25]-miniVR融合蛋白(SEQ ID NO:186)。

为了表达dSaCas9-VP64、dSaCas9-VPH、dSaCas9-VPR和dSaCas9[-25]-miniVR融合蛋白，将编码所述融合蛋白的DNA片段克隆到来自Genecopoeia的CP-LvC9NU-09慢病毒表达载体(目录号CP-LvC9NU-09)中。用融合蛋白编码序列替换原始载体中的Cas9编码序列，从而产生包含编码dSaCas9-VP64、dSaCas9-VPH、dSaCas9-VPR或dSaCas9[-25]-miniVR四种融合蛋白之一的DNA片段的CP-LvC9NU-09慢病毒表达载体。在本说明书中，所得载体分别表示为CP-LvdSaCas9-VP64-09、CP-LvdSaCas9-VPH-09、CP-LvdSaCas9-VPR-09或CP-LvdSaCas9[-25]-miniVR-09质粒。所述载体使用EF1a启动子表达效应分子，并使用SV40启动子表达eGFP-IRES-新霉素基因。

为了在腺相关病毒载体中表达，将编码dSaCas9[-25]-miniVR融合蛋白的DNA片段、U6启动子和sgRNA克隆到来自Takara的pAAV-CMV载体(#6234)中。将CMV启动子替换为EFS启动子(SEQ ID NO:187)。从原始载体中除去β-珠蛋白内含子，并将hGH poly-A替换为牛GH polyA(bGH polyA)。所获得的载体从其5'末端到其3'末端依次包含ITR、EFS启动子、dCas9、miniVR、bGH polyA、U6启动子、sgRNA和ITR(图5)，在本说明书中表示为pAAV-EFS-dSaCas9[-25]-miniVR-U6-sgRNA AIO质粒。

细胞培养和转染

转染前24小时，将HEK293FT细胞(Thermo Fisher#R70007)以每孔75,000个细胞的密度接种到24孔板(CORNING#351147)中，并在补充有10％FBS和2mM新鲜L-谷氨酰胺、1mM丙酮酸钠和非必需氨基酸的DMEM培养基(Thermo Fisher#11140050)中培养。为了在慢病毒表达载体中表达，根据制造商的说明，细胞用500ng CP-LvdSaCas9-VP64-09、CP-LvdSaCas9-VPH-09、CP-LvdSaCas9-VPR-09或CP-LvdSaCas9[-25]-miniVR-09质粒和500ng pCRISPR-LvSG03 sgRNA表达载体，使用1.5μl Lipofectamine 2000(Life Technologies#11668019)转染。用嘌呤霉素(1μg/ml)选择转染的细胞。为了在腺相关病毒载体中表达，根据制造商的说明，细胞用500ng pAAV-EFS-dSaCas9[-25]-miniVR-U6-sgRNA AIO质粒，使用1.5μlLipofectamine 2000(Life Technologies#11668019)转染。不用嘌呤霉素选择转染的细胞。

为了进行基因表达分析，将转染的细胞在37℃下5％CO

基因表达分析

为了进行Taqman分析，使用TaqMan

Taqman探针产品ID：

UTRN：HS01125994_m1(FAM)

HPRT：Hs99999909_m1(FAM，VIC)

Taqman QPCR条件：

步骤1：95℃，10分钟

步骤2：95℃，15秒

步骤3：60℃，30秒

重复步骤2和3：40次

腺相关病毒(AAV)的产生

腺相关病毒血清型2(AAV2)粒子是使用在150mm培养皿(Corning)中以每个培养皿9,000,000个细胞的密度接种，并在补充有10％FBS、2mM新鲜L-谷氨酰胺、1mM丙酮酸钠和非必需氨基酸的DMEM培养基(Thermo Fisher#11140050)中培养的AAVpro 293T细胞(Takara#632273)生成的。细胞用14.85μg pRC2-mi342和pHelper载体(Takara#6234)和含有81μlTransIT-VirusGen(Mirus Bio#MIR6703)的14.85μg pAAV-EFS-dsaCas9[-25]-miniVR-U6-sgRNA AIO质粒转染。72小时后，根据制造商在AAV2无辅助系统方案(Takara#6230)中的说明，以每个150mm培养皿550μl收获细胞并提取AAV2粗品。

用AAV2转导细胞

为了转导HEK293FT细胞(Thermo Fisher#R70007)，将每孔75,000个细胞接种到24孔板(CORNING#351147)中，并在补充有10％FBS和2mM新鲜L-谷氨酰胺、1mM丙酮酸钠和非必需氨基酸的DMEM培养基(Thermo Fisher#11140050)中孵育16小时。将培养基替换为1000μl新鲜培养基，包含10μl或1μl(分别为1:100或1:1000稀释)的AAV2粗品。在随后的72h孵育后，将细胞裂解，并根据制造商的说明(Qiagen#74192)提取总RNA(RNeasy Plus 96试剂盒)，并如Taqman在“基因表达分析”中所述确定肌营养相关蛋白的过表达。

表1.用于筛选UTRN基因的表达调节区的靶向序列

表1-1.

表1-2.

表1-3.

在表1中，“位置”表示当使用SaCas9时，链中存在靶向序列的核苷酸的切割位置。

在表1的“链”项中，1表示有义链，-1表示反义链。

(2)结果

图1示出了与对照sgRNA相比，三种不同的dSaCas9-激活子融合蛋白(dSaCas9-VP64、dSaCas9-VPH和dSaCas9-VPR)对UTRN基因表达的激活。对照sgRNA包含ACGGAGGCUAAGCGUCGCAAG(SEQ ID NO:215)和tracrRNA序列，且被设计为它在人基因组中的任何序列上均没有靶标。包含分别由向导编号sgED3-6、sgED3-7或sgED3-13(SEQ ID NO:134、135或141)编码的crRNA的sgRNA通过募集dSaCas9-激活子融合蛋白到UTRN基因的表达调节区来激活UTRN基因的表达。dSaCas9-VPR融合蛋白的激活作用最强。

根据以上结果，由向导编号sgED3-6至sgED3-7(SEQ ID NO 134至135)(表1)覆盖的对应于Chr6：GRCh38/hg38；144,285,000-144,286,000(图1)的约1.0kb区域(区域A)以及位于向导编号sgED3-13(SEQ ID NO 141)周围的对应于Chr6：GRCh38/hg38；144,287,000-144,287,300的约0.3kb区域(区域B)赋予了UTRN基因表达的有效激活。与向导编号sgED3-6、sgED3-7和sgED3-13(SEQ ID NO:134、135和141)编码的crRNA相比，启动子B赋予的UTRN基因的激活相对较弱。

在图2中，进一步用另外的24种sgRNA(表1，向导编号sgED3-25至sgED3-48(SEQ IDNo：153至176))和dSaCas9-VPR筛选跨越区域A和B的对应于Chr6：GRCh38/hg38；144,284,750-144,287,300的区域，以发现更有效的UTRN基因激活。包含分别由向导编号sgED3-6、sgED3-13、sgED3-25至sgED3-32、sgED3-39、sgED3-40和sgED3-44(SEQ ID NO:134、141、153至160、167、168和172)编码的crRNA的sgRNA激活的UTRN基因表达是上述对照sgRNA的两倍以上。

在图3中，对于一些包含分别由向导编号sgED3-6、sgED3-13、sgED3-25、sgED3-27、sgED3-30、sgED3-31、sgED3-39、sgED3-40和sgED3-44(SEQ ID NO:134、141、153、155、158、159、167、168和172)编码的crRNA的有效sgRNA，分别制备pAAV-EFS-dSaCas9[-25]-miniVR-U6-sgRNA AIO质粒，然后转染到HEK293FT细胞中以验证功能。与上述对照sgRNA相比，观察到不同sgRNA对UTRN基因不同程度的诱导。

在图4中，制得携带EFS-dSaCas9[-25]-miniVR-U6-sgRNA的AAV2，并转导HEK293FT细胞。作为sgRNA，使用包含分别由向导编号sgED3-6、sgED3-30或sgED3-31(SEQ ID NO:134、158或159)编码的crRNA的sgRNA。对于所有三种sgRNA，与上述对照sgRNA相比，观察到了UTRN基因诱导。

实施例2.使用HSMM细胞筛选针对人肌营养相关蛋白基因的gRNA

(1)实验方法

UTRN靶向序列的选择

根据人骨骼肌细胞中基因组的H3K4me3和H3K27Ac图谱，查看人UTRN基因推定的增强子(称为E)和启动子(称为P)区域周围大约13.2kb的序列，以寻找可以被与gRNA复合的核酸酶缺陷型SaCas9(D10A和N580A突变体；dSaCas9[SEQ ID NO:123(蛋白质)])靶向的序列，在本文中定义为靶向序列。所靶向的基因组区域相对于UTRN基因的位置如图6所示，其坐标如下所示：

1.Chr6：GRCh38.p12；144215500-144217000->约1.5kb(称为P2)

2.Chr6：GRCh38.p12；144248500-144249800->约1.3kb(称为E1)

3.Chr6：GRCh38.p12；144264000-144267000->约3.0kb(称为E2)

4.Chr6：GRCh38.p12；144283900-144288300->约4.4kb(称为P1)

5.Chr6：GRCh38.p12；144292500-144295500->约3.0kb(称为E3)

靶向序列是由与具有序列NNGRRT的原间隔子相邻基序(PAM)相邻的21个核苷酸的片段指定(5'-21nt靶向序列-NNGRRT-3')，并经过过滤以包括大部分完美匹配食蟹猴(Macaca fascicularis)基因组的相应区域(靶向序列和PAM序列)的序列(在表3中列为“TRUE”)。

慢病毒转移质粒(pED176)的构建

pLentiCRISPR v2是从Genscript(https://www.genscript.com)购得，并进行了以下修饰：SpCas9 gRNA骨架序列替换为SaCas9 gRNA骨架序列(SEQ ID NO:124)；SpCas9替换为与密码子优化的VP64-迷你型miniRTA(也称为迷你型miniVR)[SEQ ID NO:125(DNA)和126(蛋白质)]融合的dSaCas9。迷你型miniVR转录激活结构域可以通过激活转录来激活基因表达。迷你型miniVR拴系在dSaCas9(D10A和N580A突变体)的C末端，下文中称为dSaCas9-迷你型miniVR(SEQ ID NO:192(DNA)和193(蛋白质))，并由在包含各靶向序列编码的crRNA的gRNA指导下靶向人UTRN基因的推定的增强子或启动子区域(图6)。所产生的骨架质粒被命名为pED176。

gRNA克隆

将三种对照非靶向性靶向序列(表3，SEQ ID NO:1至3)和100种靶向序列(表3，SEQID NO:4至103)克隆到pED176中。正向和反向寡核苷酸是由Integrated DNA Technologies按以下格式合成：正向：5'CACC(G)-20至21个碱基对的靶向序列-3'，以及反向：5'AAAC-20至21个碱基对的反向补体靶向序列-(C)-3'，其中如果靶标不以G开头，则添加括号中的碱基。将寡核苷酸以100μM再悬浮于Tris-EDTA缓冲液(pH 8.0)中。在NE Buffer 3.1(NewEngland Biolabs(NEB)#B7203S)中，在10μl反应物中混合1μl各互补寡核苷酸。将反应物加热至95℃，并在热循环仪中冷却至25℃，由此使寡核苷酸退火成具有与克隆至pED176相容的粘性突出末端。将退火的寡核苷酸与已用BsmBI消化并经凝胶纯化的慢病毒转移质粒pED176组合，并根据制造商的方案用T4 DNA连接酶(NEB#M0202S)连接。根据制造商的方案，将2μl的连接反应物转化到10μl的NEB稳定感受态细胞(NEB#C3040I)中。所得的构建体通过U6启动子(SEQ ID NO:128)驱动包含3'末端与tracrRNA(guuuuaguacucuggaaacagaaucuacuaaaacaaggcaaaaugccguguuuaucucgucaacuuguuggcgagauuuuuu(SEQ ID NO:127))融合的由各个靶向序列编码的crRNA的sgRNA的表达，所述tracrRNA由添加有U6聚合酶TTTTTT末端信号的SaCas9 gRNA骨架序列编码。

慢病毒的产生

将HEK293TA细胞(Genecopoeia#LT008)以0.75×10

HSMM细胞的转导

如表2所示，来自5位年龄在0-35岁之间的不同人供体的原代骨骼肌成肌细胞(HSMM)获自Lonza Inc。

表2.

细胞在来自Lonza的原代骨骼肌细胞生长培养基[SkGM

1个红盖小瓶的GA-1000，0.50mL

1个绿盖小瓶的hEGF，0.50mL

1个天然盖小瓶的地塞米松，0.50mL

1瓶FBS，50.00mL

1瓶L-谷氨酰胺，10.00mL

根据制造商的说明，将CC-3244的成分添加到500ml培养基(#CC-3246)中。

为了进行转导，将细胞以0.125-0.33×10

以相同方式进行两种病毒的共转导实验，病毒总量与单一病毒转导相等。

基因表达分析

为了进行基因表达分析，根据高容量cDNA逆转录试剂盒(Applied Biosystems；Thermo Fisher#4368813)方案，以10μl的体积从约0.05至0.8μg的总RNA产生cDNA。将cDNA稀释10倍，并使用Taqman快速高级预混物(Thermo Fisher#4444557)，根据制造商的方案进行分析。Taqman探针(UTRN：测定Id Hs01125994_m1 FAM；HPRT：测定Id Hs99999909_m1VIC_PL)从Life Technologies获得。按照Taqman快速高级预混物方案的指导，由QuantStudio 5实时PCR系统对基于Taqman探针的实时PCR反应进行处理和分析。

数据分析

对于各样品和三个对照，通过将UTRN探针的3个技术重复样品的平均Ct值减去HPRT探针的3个技术重复样品的平均Ct值(平均Ct UTRN-平均Ct HPRT)来计算ΔCt值。使用式2

(2)结果

RNP对UTRN基因表达的激活

产生慢病毒，其将针对各靶向序列的dSaCas9-miniVR和sgRNA的表达盒递送给来自5个不同供体的原代HSMM细胞(表2)。由于细胞的生长速度，大多数测定是对来自供体#3的HSMM细胞(表2)进行的。针对嘌呤霉素抗性对转导细胞进行选择，且使用Taqman测定法对UTRN表达进行定量(表3)。将各样品的表达值相对于用对照sgRNA(表3；SEQ ID NO:1至3)转导的细胞中的UTRN表达的平均值标准化。对供体#3的重复样品测量平均表达水平(表3；和图7)。

表3.用于筛选UTRN基因的表达调节区的靶向序列。

表3-1.

表3-2.

表3-3.

表3-4.

在表3中，“坐标”表示当使用SaCas9时对于所有示出的gRNA可能的SaCas9切割位点。

如图7所示，所测试的100种靶向序列当中，5种靶向序列示出了在供体HSMM#3细胞中对UTRN mRNA表达的一致上调(向导编号145、146、205、208和210(SEQ ID NO:45、46、58、59和60))。这些序列中有2种，即145号(SEQ ID NO:45)、146号(SEQ ID NO:46)聚集在增强子E2区域，而其余3种，即205号(SEQ ID NO:58)、208号(SEQ ID NO:59)和210号(SEQ IDNO:60)聚集在启动子P1区域。向导编号205、208和210分别与实施例1中的sgED3-6、sgED3-30和sgED3-32相同。

在这5种靶向序列中，145号、146号和208号这3种序列与食蟹猴基因组的相应区域100％匹配。另一方面，这些序列中的2种，即205号和210号与食蟹猴基因组的相应区域不匹配(图8)。

当单独测试时，这5种靶向序列一致地示出了在5个不同供体HSMM中UTRN mRNA表达上调约2至4倍(图9)。在启动子区中的向导编号205、208或210和增强子区中的向导编号145或146的组合(图8中示意性示出)中，2种组合，即向导编号205和145(205+145)以及向导编号208和145(208+145)，使得在5种不同的HSMM供体中UTRN表达上调约3至7倍(图9)。

实施例3.AAV顺式质粒的生成和评估

(1)实验方法

AAV AIO顺式质粒的构建

如表4中所示，所有测试的质粒骨架pED260(SEQ ID NO:210)、pED261(SEQ ID NO:211)和pED263(SEQ ID NO:212)含有相同的全长dSaCas9、CK8启动子和U6启动子的碱基序列，替换pAAV-CMV载体(Takara#6234)的ITR之间的序列。其区别在于激活子部分、polyA序列，即pED260、pED261包含miniVR，而pED263包含microVR作为激活子部分，且pED260具有bGH polyA，而pED261、pED263具有2个SNRP-1 polyA序列(SEQ ID NO:208)。

表4.

*ITR之间的核苷酸长度(含ITR核苷酸)

将包含由靶向序列向导编号145、146或208编码的crRNA的sgRNA的各寡核苷酸克隆到这些骨架中的各者中，以创建用于测试的多合一(AIO)质粒。产生的各AIO质粒表示为pAAV-CK8-dSaCas9-miniVR-bGH polyA-U6-sgRNA#145(pED260-145)、pAAV-CK8-dSaCas9-miniVR-bGH polyA-U6-sgRNA#146(pED260-146)、pAAV-CK8-dSaCas9-miniVR-bGHpolyA-U6-sgRNA#208(pED260-208)、pAAV-CK8-dSaCas9-miniVR-2×sNRP-1 polyA-U6-sgRNA#145(pED261-145)、pAAV-CK8-dSaCas9-miniVR-2×sNRP-1polyA-U6-sgRNA#146(pED261-146)、pAAV-CK8-dSaCas9-miniVR-2×sNRP-1 polyA-U6-sgRNA#208(pED261-208)、pAAV-CK8-dSaCas9-microVR-2×sNRP-1polyA-U6-sgRNA#145(pED263-145)、pAAV-CK8-dSaCas9-microVR-2×sNRP-1 polyA-U6-sgRNA#146(pED263-146)或pAAV-CK8-dSaCas9-microVR-2×sNRP-1polyA-U6-sgRNA#208(pED263-208)，如表4所示。

已知与人基因组的任何部分都不同源的两个不同序列被用作阴性对照，并被称为非靶向性向导(NTg1(SEQ ID NO:1)和NTg2(SEQ IDNO:2))。NTg1或NTg2的各寡核苷酸也被克隆到各自的骨架中，并用作对照质粒。

HEK293FT细胞的转染

将HEK293FT细胞(Thermo Fisher#R70007)以5×10

转染后48小时，按照制造商的指导，收获细胞并用RNeasy 96试剂盒(Qiagen#74182)提取RNA。

基因表达分析

为了进行基因表达分析，根据高容量cDNA逆转录试剂盒(Applied Biosystems；Thermo Fisher#4368813)方案，以10μl的体积从约0.5μg的总RNA产生cDNA。将cDNA稀释10倍，并使用Taqman快速高级预混物(Thermo Fisher#4444557)，根据制造商的方案进行分析。Taqman探针(UTRN：测定Id Hs01125994_m1 FAM；HPRT：测定Id Hs99999909_m1 VIC_PL)从Thermo Fisher获得。按照Taqman快速高级预混物方案的指导，用QuantStudio 5实时PCR系统对基于Taqman探针的实时PCR反应进行处理和分析。

数据分析

对于含有NTg1或NTg2的质粒，结果的平均值示出为CtrlX2。

对于各样品，通过将非靶向性向导对照的3个技术重复样品的平均Ct值减去各样品的3个技术重复样品的平均Ct值，计算出各探针的ΔCt值。

ΔCt UTRN＝平均对照Ct UTRN-平均样本Ct UTRN。

ΔCt HPRT＝平均对照Ct HPRT-平均样本Ct HPRT。

然后通过将各样品的UTRN的Ct值减去HPRT的Ct值来计算Δ(ΔCt)值。

Δ(ΔCt)＝ΔCt UTRN-ΔCt HPRT。

使用式2

(2)结果

存在包含由靶向序列向导编号145(SEQ ID NO:45)或146(SEQ ID NO:46)或208(SEQ ID NO:59)编码的crRNA的sgRNA时，所有3个受测骨架(pED260、261和263)能够上调HEK293FT细胞中的UTRN(图10)。

实施例4.携带dSaCas9、转录激活子和sgRNA的重组AAV9的产生

(1)实验方法

腺相关病毒(AAV)的产生

使用293T细胞(ATCC CRL-3216)产生腺相关病毒血清型9(AAV9)粒子，所述细胞以每个T225烧瓶(Corning)0.96×10

AAV的验证

在用NuPAGE样品还原剂、抗氧化剂和缓冲液(Thermo Fisher#NP0009、#NP0005、#NP0007)制备AAV样品后，使用NuPAGE 4至12％Bis-Tris蛋白凝胶1.0mm×12孔(ThermoFisher#NP0322BOX)通过SDS-PAGE检查AAV衣壳蛋白。各AAV的施加量为1.0×10

(2)结果

在T225烧瓶中产生的AAV9的滴度值计算如下。

表5.

在SDS-PAGE中，从各AAV样品中检测到3种衣壳蛋白(VP1、VP2和VP3，分别为87kDa、72kDa和62kDa)(图11)。这些结果表明，克隆到AAV AIO质粒中的包括dSaCas9和转录激活子在内的目标基因可以被封包到AAV9中。

实施例5.携带dSaCas9、转录激活子和sgRNA的重组AAV9对肌营养相关蛋白的上调的体外药理评估

(1)实验方法

AAV9产生

使用293T细胞(ATCC#CRL-3216)产生腺相关病毒血清型9(AAV9)粒子，所述细胞以4.77×10

细胞培养和AAV感染

将人骨骼肌成肌细胞(HSMM，Lonza#CC-2580，批号18TL211617)以每孔100,000个细胞的密度接种到覆盖有胶原蛋白I的24孔板(IWAKI#4820-010)中，并在补充有500U/mL青霉素/链霉素(Thermo Fisher#15070063)的SkGM

基因表达分析

对于Taqman qPCR，使用SuperScript

(2)结果

通过将AAV9-ED261-145、AAV9-ED261-208或AAV9-ED263-208施加至HSMM细胞中，发现了肌营养相关蛋白mRNA上调，这表明携带dSaCas9、miniVR或microVR和包含向导编号145或208的sgRNA的转基因的AAV9对人肌肉细胞中的肌营养相关蛋白上调具有药理作用(图12)。

实施例6：使用RNA测序分析的脱靶分析

(1)实验方法

慢病毒的产生

将HEK293TA细胞(Genecopoeia#LT008)以0.75×10

HSMM细胞的转导和RNA样品制备

从Lonza Inc.获得年龄为0岁的人供体的原代骨骼肌成肌细胞(HSMM)(批号542368)。将细胞在来自Lonza的原代骨骼肌细胞生长培养基[SkGM

脱靶分析

由GeneWiz，LLC进行Illumina测序，其中RNA文库是使用NEBNext Ultra RNA文库制备试剂盒(Ipswich,MA,USA,NEB#E7530L)根据制造商的方案制备。测序文库聚集在Illumina HiSeq流动槽的三个泳道上，并使用2×150配对末端配置进行测序。将产生的原始序列数据(.bcl文件)转换为fastq文件，并使用Illumina的bcl2fastq2.17软件进行多路分解，其中索引序列识别允许一个不匹配项。使用STAR比对器将fastq文件与人基因组装体GRCh38.p12比对。使用DESeq2进行差异分析，并使用定制R脚本通过plotly(https://plot.ly)生成图。

(2)结果

相对于非靶向性向导1(NTg1)标准化各向导的mRNA水平的全基因组倍数变化。每个点代表一个基因。X轴示出了基因的平均表达水平。Y轴示出了相对于NTg1样品，基因表达的log-2倍数变化。水平Log2＝0以上的基因表示实验样品(例如，向导编号145)中的基因表达高于NTg1样品，水平Log2＝0以下的基因表明实验样品中的基因表达低于NTg1样品。示出了在实验样品中比在NTg1样品中高度上调或下调的基因的基因ID。不同的gRNA诱导了不同的基因表达变化(图13A：向导编号145，13B：向导编号146，13C：向导编号208)。向导编号208似乎触发了较少的其它基因表达变化，同时示出了出良好的UTRN基因上调。

实施例7.对肌营养相关蛋白上调的药理作用的体内评估

(1)实验方法

动物和免疫抑制方案

在本研究中使用AAV9血清反应阴性的食蟹猴(雄性)。驯化一周后，向所述食蟹猴口服施用0.75mg/kg/天的泼尼松龙磷酸钠(Abcam#ab142456)。AAV施用前14天开始给药，一直持续到处死。

AAV9治疗和肌肉组织取样

向食蟹猴经由头静脉静脉内施用1.0或6.0×10

肌肉组织样品的基因和蛋白质表达分析

对于Taqman qPCR，使用RNeasy纤维组织Mini试剂盒(Qiagen#74704)从肌肉样品中提取总RNA，并使用Superscript

对于蛋白质表达分析，用含有蛋白酶和磷酸酶抑制剂混合物(Thermo Fisher#78441)的RIPA缓冲液(Millipore#20-188)制备全肌肉裂解物，并应用于SDS-PAGE和Western印迹法。使用针对肌营养相关蛋白的第一抗体(SantaCruz#SC-33700)和辣根过氧化物酶标记的第二抗体(Cell Signaling#7076)检测肌营养相关蛋白蛋白。

工业适用性

根据本发明，可以激活UTRN基因在人细胞中的表达。因此，本发明预期对治疗和/或预防DMD和BMD极其有用。

若在本文中指定一个数值限制或范围，则包括端点。此外，数值限制或范围内的所有值和子范围被明确包括在内，如同明确地写出一般。

如本文中所使用，词“一个”和“一种”等有“一个(种)或多个(种)”的意思。

显然，本发明的许多修改和变化根据上述教导是可能的。因此，应理解，在所附权利要求的范围内，本发明可以以不同于本文中具体描述的其它方式实施。

上述所有专利和其它参考文献通过引入全部并入本文，如同详细描述一般。

序列表

<110> 安斯泰来制药株式会社（Astellas Pharma Inc. ）

摩大力斯医疗株式会社（Modalis Therapeutics Corporation）

<120> 通过靶向肌营养相关蛋白基因来治疗肌营养不良的方法

<130> 092955

<150> US62/768,474

<151> 2018-11-16

<150> US62/861,039

<151> 2019-06-13

<150> US62/931,925

<151> 2019-11-07

<160> 216

<170> PatentIn version 3.5

<210> 1

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 对照非靶向性靶向序列

<400> 1

acggaggcta agcgtcgcaa 20

<210> 2

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 对照非靶向性靶向序列

<400> 2

cgcttccgcg gcccgttcaa 20

<210> 3

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 对照非靶向性靶向序列

<400> 3

gtaggcgcgc cgctctctac 20

<210> 4

<211> 21

<212> DNA

<213> 智人（Homo sapiens）

<400> 4

agaaaagcgg cccctagggg c 21

<210> 5

<211> 21

<212> DNA

<213> 智人（Homo sapiens）

<400> 5

caaacacaca ccagcaaact t 21

<210> 6

<211> 21

<212> DNA

<213> 智人（Homo sapiens）

<400> 6

tgaaagcgca actggagggc c 21

<210> 7

<211> 21

<212> DNA

<213> 智人（Homo sapiens）

<400> 7

acccacgcgg acatatgtcc a 21

<210> 8

<211> 21

<212> DNA

<213> 智人（Homo sapiens）

<400> 8

atccaatgga catatgtccg c 21

<210> 9

<211> 21

<212> DNA

<213> 智人（Homo sapiens）

<400> 9

gagggggagg gctgtgacct g 21

<210> 10

<211> 21

<212> DNA

<213> 智人（Homo sapiens）

<400> 10

atttggtggt cagggagcaa g 21

<210> 11

<211> 21

<212> DNA

<213> 智人（Homo sapiens）

<400> 11

aatgaaacca aagacagctt c 21

<210> 12

<211> 21

<212> DNA

<213> 智人（Homo sapiens）

<400> 12

ccaaaatcct ttaatgaatc a 21

<210> 13

<211> 21

<212> DNA

<213> 智人（Homo sapiens）

<400> 13

tacagattcc atgattcatt a 21

<210> 14

<211> 21

<212> DNA

<213> 智人（Homo sapiens）

<400> 14

ggaacaaacc aaaatccttt a 21

<210> 15

<211> 21

<212> DNA

<213> 智人（Homo sapiens）

<400> 15

atctgtttgt ggggaaatct t 21

<210> 16

<211> 21

<212> DNA

<213> 智人（Homo sapiens）

<400> 16

caaacagatt tcagtatttt c 21

<210> 17

<211> 21

<212> DNA

<213> 智人（Homo sapiens）

<400> 17

gtggtgattt atgttactgg t 21

<210> 18

<211> 21

<212> DNA

<213> 智人（Homo sapiens）

<400> 18

tgagtctttc aagttccttt c 21

<210> 19

<211> 21

<212> DNA

<213> 智人（Homo sapiens）

<400> 19

agatcatttt tggcttcaaa c 21

<210> 20

<211> 21

<212> DNA

<213> 智人（Homo sapiens）

<400> 20

tggcttcaaa ctagaatgtc c 21

<210> 21

<211> 21

<212> DNA

<213> 智人（Homo sapiens）

<400> 21

gatctatcta tagacaccaa a 21

<210> 22

<211> 21

<212> DNA

<213> 智人（Homo sapiens）

<400> 22

tgcttcttcc aggcttgagt g 21

<210> 23

<211> 21

<212> DNA

<213> 智人（Homo sapiens）

<400> 23

accgctttgc ttcttccagg c 21

<210> 24

<211> 21

<212> DNA

<213> 智人（Homo sapiens）

<400> 24

aagcctggaa gaagcaaagc g 21

<210> 25

<211> 21

<212> DNA

<213> 智人（Homo sapiens）

<400> 25

cttctgaatc agaattccta a 21

<210> 26

<211> 21

<212> DNA

<213> 智人（Homo sapiens）

<400> 26

tggttccaag ctagtacttc a 21

<210> 27

<211> 21

<212> DNA

<213> 智人（Homo sapiens）

<400> 27

atgttcacaa aataaattta a 21

<210> 28

<211> 21

<212> DNA

<213> 智人（Homo sapiens）

<400> 28

cctttatggt caccttctct g 21

<210> 29

<211> 21

<212> DNA

<213> 智人（Homo sapiens）

<400> 29

ccttctctgc tgagtaaaaa t 21

<210> 30

<211> 21

<212> DNA

<213> 智人（Homo sapiens）

<400> 30

aaggtggcca aaaaagaacc c 21

<210> 31

<211> 21

<212> DNA

<213> 智人（Homo sapiens）

<400> 31

aaggaagaga gaggcaagaa a 21

<210> 32

<211> 21

<212> DNA

<213> 智人（Homo sapiens）

<400> 32

taaagaattc tagcactgga a 21

<210> 33

<211> 21

<212> DNA

<213> 智人（Homo sapiens）

<400> 33

aaatgtgtca tgtgttggtt a 21

<210> 34

<211> 21

<212> DNA

<213> 智人（Homo sapiens）

<400> 34

aaaaatgaaa attgcaactt c 21

<210> 35

<211> 21

<212> DNA

<213> 智人（Homo sapiens）

<400> 35

attgcaactt ctagaattta a 21

<210> 36

<211> 21

<212> DNA

<213> 智人（Homo sapiens）

<400> 36

cagctggagt gggccacgta a 21

<210> 37

<211> 21

<212> DNA

<213> 智人（Homo sapiens）

<400> 37

atttttgcat atttctttgg t 21

<210> 38

<211> 21

<212> DNA

<213> 智人（Homo sapiens）

<400> 38

agtgacctgc tgatttctct a 21

<210> 39

<211> 21

<212> DNA

<213> 智人（Homo sapiens）

<400> 39

ctttccccat tgttcaggac t 21

<210> 40

<211> 21

<212> DNA

<213> 智人（Homo sapiens）

<400> 40

ttggttgata aatttgtata t 21

<210> 41

<211> 21

<212> DNA

<213> 智人（Homo sapiens）

<400> 41

tctctagttc attttttagc t 21

<210> 42

<211> 21

<212> DNA

<213> 智人（Homo sapiens）

<400> 42

tccttcaact tcaagacaac a 21

<210> 43

<211> 21

<212> DNA

<213> 智人（Homo sapiens）

<400> 43

gctcctcctg ctggatgggg g 21

<210> 44

<211> 21

<212> DNA

<213> 智人（Homo sapiens）

<400> 44

ctctatttcc agctcctcct g 21

<210> 45

<211> 21

<212> DNA

<213> 智人（Homo sapiens）

<400> 45

gtacagttag tgctactagg a 21

<210> 46

<211> 21

<212> DNA

<213> 智人（Homo sapiens）

<400> 46

gctactagga caggatgctg g 21

<210> 47

<211> 21

<212> DNA

<213> 智人（Homo sapiens）

<400> 47

ccccagctgt gcctctgttt t 21

<210> 48

<211> 21

<212> DNA

<213> 智人（Homo sapiens）

<400> 48

ttcccaaaac agaggcacag c 21

<210> 49

<211> 21

<212> DNA

<213> 智人（Homo sapiens）

<400> 49

gttttgaaac tggtagcagc t 21

<210> 50

<211> 21

<212> DNA

<213> 智人（Homo sapiens）

<400> 50

aaactgatgc ttgttaaatg a 21

<210> 51

<211> 21

<212> DNA

<213> 智人（Homo sapiens）

<400> 51

cttgttaaat gaatgaatga a 21

<210> 52

<211> 21

<212> DNA

<213> 智人（Homo sapiens）

<400> 52

aatccaaagg attaacttga a 21

<210> 53

<211> 21

<212> DNA

<213> 智人（Homo sapiens）

<400> 53

tacccatttc aagttaatcc t 21

<210> 54

<211> 21

<212> DNA

<213> 智人（Homo sapiens）

<400> 54

tgccccctcc ctggagcact t 21

<210> 55

<211> 21

<212> DNA

<213> 智人（Homo sapiens）

<400> 55

agcaacgtca gcaaactgag a 21

<210> 56

<211> 21

<212> DNA

<213> 智人（Homo sapiens）

<400> 56

acgtcagcaa actgagatgg g 21

<210> 57

<211> 21

<212> DNA

<213> 智人（Homo sapiens）

<400> 57

gaaccgtgcg tgccgggagc c 21

<210> 58

<211> 21

<212> DNA

<213> 智人（Homo sapiens）

<400> 58

ggggtccgct ctccagatga g 21

<210> 59

<211> 21

<212> DNA

<213> 智人（Homo sapiens）

<400> 59

ggagggtggg gcgcaggacc g 21

<210> 60

<211> 21

<212> DNA

<213> 智人（Homo sapiens）

<400> 60

cctctctcgc gcacaaagtt g 21

<210> 61

<211> 21

<212> DNA

<213> 智人（Homo sapiens）

<400> 61

tctggctcca gaagccgatt g 21

<210> 62

<211> 21

<212> DNA

<213> 智人（Homo sapiens）

<400> 62

acaagtaagg ggcgttttca g 21

<210> 63

<211> 21

<212> DNA

<213> 智人（Homo sapiens）

<400> 63

gagctggcca agggctcctc t 21

<210> 64

<211> 21

<212> DNA

<213> 智人（Homo sapiens）

<400> 64

tagaggagcc cttggccagc t 21

<210> 65

<211> 21

<212> DNA

<213> 智人（Homo sapiens）

<400> 65

ccaagtccca gagtcgaaga t 21

<210> 66

<211> 21

<212> DNA

<213> 智人（Homo sapiens）

<400> 66

gtccacagga gagggtgggc a 21

<210> 67

<211> 21

<212> DNA

<213> 智人（Homo sapiens）

<400> 67

ctctgggtgg ttgctgctcc c 21

<210> 68

<211> 21

<212> DNA

<213> 智人（Homo sapiens）

<400> 68

tcagttgcag caagagatcc c 21

<210> 69

<211> 21

<212> DNA

<213> 智人（Homo sapiens）

<400> 69

attttaggta aacacccaaa g 21

<210> 70

<211> 21

<212> DNA

<213> 智人（Homo sapiens）

<400> 70

taggtgagaa actgagaatc a 21

<210> 71

<211> 21

<212> DNA

<213> 智人（Homo sapiens）

<400> 71

cagaaggcta ggtgagaaac t 21

<210> 72

<211> 21

<212> DNA

<213> 智人（Homo sapiens）

<400> 72

gccattaatg gccagaggaa t 21

<210> 73

<211> 21

<212> DNA

<213> 智人（Homo sapiens）

<400> 73

agatacagca gaaaaggtga t 21

<210> 74

<211> 21

<212> DNA

<213> 智人（Homo sapiens）

<400> 74

aatttgaaaa atcaccttga g 21

<210> 75

<211> 21

<212> DNA

<213> 智人（Homo sapiens）

<400> 75

cagttgattc atctgtacag c 21

<210> 76

<211> 21

<212> DNA

<213> 智人（Homo sapiens）

<400> 76

tttttgactc tggctgtaca g 21

<210> 77

<211> 21

<212> DNA

<213> 智人（Homo sapiens）

<400> 77

gctgtacaga tgaatcaact g 21

<210> 78

<211> 21

<212> DNA

<213> 智人（Homo sapiens）

<400> 78

atctcccctt tgagtttgtc t 21

<210> 79

<211> 21

<212> DNA

<213> 智人（Homo sapiens）

<400> 79

ctgttcaaaa atatctcccc t 21

<210> 80

<211> 21

<212> DNA

<213> 智人（Homo sapiens）

<400> 80

aaaattacac agaactccac c 21

<210> 81

<211> 21

<212> DNA

<213> 智人（Homo sapiens）

<400> 81

ttttttgtct ttaaagtgac a 21

<210> 82

<211> 21

<212> DNA

<213> 智人（Homo sapiens）

<400> 82

tcttgtttta aaatatgctt t 21

<210> 83

<211> 21

<212> DNA

<213> 智人（Homo sapiens）

<400> 83

ctctgttata tttacatatg t 21

<210> 84

<211> 21

<212> DNA

<213> 智人（Homo sapiens）

<400> 84

tataaatatc aaaggtctta c 21

<210> 85

<211> 21

<212> DNA

<213> 智人（Homo sapiens）

<400> 85

cctagggaaa aactctagaa a 21

<210> 86

<211> 21

<212> DNA

<213> 智人（Homo sapiens）

<400> 86

acaccatgaa aatctaatat t 21

<210> 87

<211> 21

<212> DNA

<213> 智人（Homo sapiens）

<400> 87

agatgtgcta gagtaaagaa a 21

<210> 88

<211> 21

<212> DNA

<213> 智人（Homo sapiens）

<400> 88

gtatgatctg ttcagatgtg c 21

<210> 89

<211> 21

<212> DNA

<213> 智人（Homo sapiens）

<400> 89

tttaaagatt atcaaattgc t 21

<210> 90

<211> 21

<212> DNA

<213> 智人（Homo sapiens）

<400> 90

atatgaatca cattcttttg g 21

<210> 91

<211> 21

<212> DNA

<213> 智人（Homo sapiens）

<400> 91

tgcaaaagcc agtagataaa t 21

<210> 92

<211> 21

<212> DNA

<213> 智人（Homo sapiens）

<400> 92

agccagtaga taaatttgga t 21

<210> 93

<211> 21

<212> DNA

<213> 智人（Homo sapiens）

<400> 93

ttttagttta gattaagtca t 21

<210> 94

<211> 21

<212> DNA

<213> 智人（Homo sapiens）

<400> 94

aagaaacctg gaagagcaga t 21

<210> 95

<211> 21

<212> DNA

<213> 智人（Homo sapiens）

<400> 95

ggtttctttt ttggggggaa a 21

<210> 96

<211> 21

<212> DNA

<213> 智人（Homo sapiens）

<400> 96

tatggttgta gtatacttgc c 21

<210> 97

<211> 21

<212> DNA

<213> 智人（Homo sapiens）

<400> 97

tgtagtatac ttgccttggg t 21

<210> 98

<211> 21

<212> DNA

<213> 智人（Homo sapiens）

<400> 98

gtatacttgc cttgggtttg g 21

<210> 99

<211> 21

<212> DNA

<213> 智人（Homo sapiens）

<400> 99

acatgaaata ataaaatggt t 21

<210> 100

<211> 21

<212> DNA

<213> 智人（Homo sapiens）

<400> 100

attattgaat gaaatagcag t 21

<210> 101

<211> 21

<212> DNA

<213> 智人（Homo sapiens）

<400> 101

acaacactga cagcaacaga a 21

<210> 102

<211> 21

<212> DNA

<213> 智人（Homo sapiens）

<400> 102

agtgtgtcag ctggctccat g 21

<210> 103

<211> 21

<212> DNA

<213> 智人（Homo sapiens）

<400> 103

catgtggagt tcttgacagt t 21

<210> 104

<211> 32

<212> DNA

<213> 智人（Homo sapiens）

<400> 104

gtacagttag tgctactagg acaggatgct gg 32

<210> 105

<211> 494

<212> DNA

<213> 智人（Homo sapiens）

<400> 105

gagcgcgcgc cccaggccag ccaagcgccg agccgggctg ctgcgggctg ggagggcgcg 60

cagggccggc gctgattgac ggggcgcgca gtcaggtgac ttggggcgcc aagttcccga 120

cgcggtggcc gcggtgaccg ccgaggcccg gcagacgctg acccgggaac gtagtggggc 180

tgatcttccg gaacaaagtt gctgggccgg cggcggcggg gcgagagcgc cgagggggag 240

ccggagcgct gcagaggcgc gggccggagg gctggcgctg atctgcaccc ttctcatctg 300

gagagcggac ccctggctgc ccggaggcga gccccttccc ggggggtggg ggcggcaacg 360

cgcgacccag cggtcctgcg ccccaccctc cctcctccgc ctccagcgct cggctccaac 420

aaaggggcag gcccgcagcg gggaggagga ggaggagccg ccgaaggagc gagcctctct 480

cgcgcacaaa gttg 494

<210> 106

<211> 19

<212> RNA

<213> 新凶手弗朗西丝氏菌（Francisella novicid）

<220>

<221> misc_feature

<222> (1)..(19)

<223> crRNA的5'-柄

<400> 106

aauuucuacu guuguagau 19

<210> 107

<211> 1053

<212> PRT

<213> 金黄色葡萄球菌（Staphylococcus aureus）

<220>

<221> 变体

<222> (10)..(10)

<223> Asp残基转化成Ala残基

<220>

<221> 变体

<222> (580)..(580)

<223> Asn残基转化成Ala残基

<400> 107

Met Lys Arg Asn Tyr Ile Leu Gly Leu Ala Ile Gly Ile Thr Ser Val

1 5 10 15

Gly Tyr Gly Ile Ile Asp Tyr Glu Thr Arg Asp Val Ile Asp Ala Gly

20 25 30

Val Arg Leu Phe Lys Glu Ala Asn Val Glu Asn Asn Glu Gly Arg Arg

35 40 45

Ser Lys Arg Gly Ala Arg Arg Leu Lys Arg Arg Arg Arg His Arg Ile

50 55 60

Gln Arg Val Lys Lys Leu Leu Phe Asp Tyr Asn Leu Leu Thr Asp His

65 70 75 80

Ser Glu Leu Ser Gly Ile Asn Pro Tyr Glu Ala Arg Val Lys Gly Leu

85 90 95

Ser Gln Lys Leu Ser Glu Glu Glu Phe Ser Ala Ala Leu Leu His Leu

100 105 110

Ala Lys Arg Arg Gly Val His Asn Val Asn Glu Val Glu Glu Asp Thr

115 120 125

Gly Asn Glu Leu Ser Thr Lys Glu Gln Ile Ser Arg Asn Ser Lys Ala

130 135 140

Leu Glu Glu Lys Tyr Val Ala Glu Leu Gln Leu Glu Arg Leu Lys Lys

145 150 155 160

Asp Gly Glu Val Arg Gly Ser Ile Asn Arg Phe Lys Thr Ser Asp Tyr

165 170 175

Val Lys Glu Ala Lys Gln Leu Leu Lys Val Gln Lys Ala Tyr His Gln

180 185 190

Leu Asp Gln Ser Phe Ile Asp Thr Tyr Ile Asp Leu Leu Glu Thr Arg

195 200 205

Arg Thr Tyr Tyr Glu Gly Pro Gly Glu Gly Ser Pro Phe Gly Trp Lys

210 215 220

Asp Ile Lys Glu Trp Tyr Glu Met Leu Met Gly His Cys Thr Tyr Phe

225 230 235 240

Pro Glu Glu Leu Arg Ser Val Lys Tyr Ala Tyr Asn Ala Asp Leu Tyr

245 250 255

Asn Ala Leu Asn Asp Leu Asn Asn Leu Val Ile Thr Arg Asp Glu Asn

260 265 270

Glu Lys Leu Glu Tyr Tyr Glu Lys Phe Gln Ile Ile Glu Asn Val Phe

275 280 285

Lys Gln Lys Lys Lys Pro Thr Leu Lys Gln Ile Ala Lys Glu Ile Leu

290 295 300

Val Asn Glu Glu Asp Ile Lys Gly Tyr Arg Val Thr Ser Thr Gly Lys

305 310 315 320

Pro Glu Phe Thr Asn Leu Lys Val Tyr His Asp Ile Lys Asp Ile Thr

325 330 335

Ala Arg Lys Glu Ile Ile Glu Asn Ala Glu Leu Leu Asp Gln Ile Ala

340 345 350

Lys Ile Leu Thr Ile Tyr Gln Ser Ser Glu Asp Ile Gln Glu Glu Leu

355 360 365

Thr Asn Leu Asn Ser Glu Leu Thr Gln Glu Glu Ile Glu Gln Ile Ser

370 375 380

Asn Leu Lys Gly Tyr Thr Gly Thr His Asn Leu Ser Leu Lys Ala Ile

385 390 395 400

Asn Leu Ile Leu Asp Glu Leu Trp His Thr Asn Asp Asn Gln Ile Ala

405 410 415

Ile Phe Asn Arg Leu Lys Leu Val Pro Lys Lys Val Asp Leu Ser Gln

420 425 430

Gln Lys Glu Ile Pro Thr Thr Leu Val Asp Asp Phe Ile Leu Ser Pro

435 440 445

Val Val Lys Arg Ser Phe Ile Gln Ser Ile Lys Val Ile Asn Ala Ile

450 455 460

Ile Lys Lys Tyr Gly Leu Pro Asn Asp Ile Ile Ile Glu Leu Ala Arg

465 470 475 480

Glu Lys Asn Ser Lys Asp Ala Gln Lys Met Ile Asn Glu Met Gln Lys

485 490 495

Arg Asn Arg Gln Thr Asn Glu Arg Ile Glu Glu Ile Ile Arg Thr Thr

500 505 510

Gly Lys Glu Asn Ala Lys Tyr Leu Ile Glu Lys Ile Lys Leu His Asp

515 520 525

Met Gln Glu Gly Lys Cys Leu Tyr Ser Leu Glu Ala Ile Pro Leu Glu

530 535 540

Asp Leu Leu Asn Asn Pro Phe Asn Tyr Glu Val Asp His Ile Ile Pro

545 550 555 560

Arg Ser Val Ser Phe Asp Asn Ser Phe Asn Asn Lys Val Leu Val Lys

565 570 575

Gln Glu Glu Ala Ser Lys Lys Gly Asn Arg Thr Pro Phe Gln Tyr Leu

580 585 590

Ser Ser Ser Asp Ser Lys Ile Ser Tyr Glu Thr Phe Lys Lys His Ile

595 600 605

Leu Asn Leu Ala Lys Gly Lys Gly Arg Ile Ser Lys Thr Lys Lys Glu

610 615 620

Tyr Leu Leu Glu Glu Arg Asp Ile Asn Arg Phe Ser Val Gln Lys Asp

625 630 635 640

Phe Ile Asn Arg Asn Leu Val Asp Thr Arg Tyr Ala Thr Arg Gly Leu

645 650 655

Met Asn Leu Leu Arg Ser Tyr Phe Arg Val Asn Asn Leu Asp Val Lys

660 665 670

Val Lys Ser Ile Asn Gly Gly Phe Thr Ser Phe Leu Arg Arg Lys Trp

675 680 685

Lys Phe Lys Lys Glu Arg Asn Lys Gly Tyr Lys His His Ala Glu Asp

690 695 700

Ala Leu Ile Ile Ala Asn Ala Asp Phe Ile Phe Lys Glu Trp Lys Lys

705 710 715 720

Leu Asp Lys Ala Lys Lys Val Met Glu Asn Gln Met Phe Glu Glu Lys

725 730 735

Gln Ala Glu Ser Met Pro Glu Ile Glu Thr Glu Gln Glu Tyr Lys Glu

740 745 750

Ile Phe Ile Thr Pro His Gln Ile Lys His Ile Lys Asp Phe Lys Asp

755 760 765

Tyr Lys Tyr Ser His Arg Val Asp Lys Lys Pro Asn Arg Glu Leu Ile

770 775 780

Asn Asp Thr Leu Tyr Ser Thr Arg Lys Asp Asp Lys Gly Asn Thr Leu

785 790 795 800

Ile Val Asn Asn Leu Asn Gly Leu Tyr Asp Lys Asp Asn Asp Lys Leu

805 810 815

Lys Lys Leu Ile Asn Lys Ser Pro Glu Lys Leu Leu Met Tyr His His

820 825 830

Asp Pro Gln Thr Tyr Gln Lys Leu Lys Leu Ile Met Glu Gln Tyr Gly

835 840 845

Asp Glu Lys Asn Pro Leu Tyr Lys Tyr Tyr Glu Glu Thr Gly Asn Tyr

850 855 860

Leu Thr Lys Tyr Ser Lys Lys Asp Asn Gly Pro Val Ile Lys Lys Ile

865 870 875 880

Lys Tyr Tyr Gly Asn Lys Leu Asn Ala His Leu Asp Ile Thr Asp Asp

885 890 895

Tyr Pro Asn Ser Arg Asn Lys Val Val Lys Leu Ser Leu Lys Pro Tyr

900 905 910

Arg Phe Asp Val Tyr Leu Asp Asn Gly Val Tyr Lys Phe Val Thr Val

915 920 925

Lys Asn Leu Asp Val Ile Lys Lys Glu Asn Tyr Tyr Glu Val Asn Ser

930 935 940

Lys Cys Tyr Glu Glu Ala Lys Lys Leu Lys Lys Ile Ser Asn Gln Ala

945 950 955 960

Glu Phe Ile Ala Ser Phe Tyr Asn Asn Asp Leu Ile Lys Ile Asn Gly

965 970 975

Glu Leu Tyr Arg Val Ile Gly Val Asn Asn Asp Leu Leu Asn Arg Ile

980 985 990

Glu Val Asn Met Ile Asp Ile Thr Tyr Arg Glu Tyr Leu Glu Asn Met

995 1000 1005

Asn Asp Lys Arg Pro Pro Arg Ile Ile Lys Thr Ile Ala Ser Lys

1010 1015 1020

Thr Gln Ser Ile Lys Lys Tyr Ser Thr Asp Ile Leu Gly Asn Leu

1025 1030 1035

Tyr Glu Val Lys Ser Lys Lys His Pro Gln Ile Ile Lys Lys Gly

1040 1045 1050

<210> 108

<211> 1053

<212> PRT

<213> 金黄色葡萄球菌（Staphylococcus aureus）

<220>

<221> 变体

<222> (10)..(10)

<223> Asp残基转化成Ala残基

<220>

<221> 变体

<222> (557)..(557)

<223> His残基转化成Ala残基

<400> 108

Met Lys Arg Asn Tyr Ile Leu Gly Leu Ala Ile Gly Ile Thr Ser Val

1 5 10 15

Gly Tyr Gly Ile Ile Asp Tyr Glu Thr Arg Asp Val Ile Asp Ala Gly

20 25 30

Val Arg Leu Phe Lys Glu Ala Asn Val Glu Asn Asn Glu Gly Arg Arg

35 40 45

Ser Lys Arg Gly Ala Arg Arg Leu Lys Arg Arg Arg Arg His Arg Ile

50 55 60

Gln Arg Val Lys Lys Leu Leu Phe Asp Tyr Asn Leu Leu Thr Asp His

65 70 75 80

Ser Glu Leu Ser Gly Ile Asn Pro Tyr Glu Ala Arg Val Lys Gly Leu

85 90 95

Ser Gln Lys Leu Ser Glu Glu Glu Phe Ser Ala Ala Leu Leu His Leu

100 105 110

Ala Lys Arg Arg Gly Val His Asn Val Asn Glu Val Glu Glu Asp Thr

115 120 125

Gly Asn Glu Leu Ser Thr Lys Glu Gln Ile Ser Arg Asn Ser Lys Ala

130 135 140

Leu Glu Glu Lys Tyr Val Ala Glu Leu Gln Leu Glu Arg Leu Lys Lys

145 150 155 160

Asp Gly Glu Val Arg Gly Ser Ile Asn Arg Phe Lys Thr Ser Asp Tyr

165 170 175

Val Lys Glu Ala Lys Gln Leu Leu Lys Val Gln Lys Ala Tyr His Gln

180 185 190

Leu Asp Gln Ser Phe Ile Asp Thr Tyr Ile Asp Leu Leu Glu Thr Arg

195 200 205

Arg Thr Tyr Tyr Glu Gly Pro Gly Glu Gly Ser Pro Phe Gly Trp Lys

210 215 220

Asp Ile Lys Glu Trp Tyr Glu Met Leu Met Gly His Cys Thr Tyr Phe

225 230 235 240

Pro Glu Glu Leu Arg Ser Val Lys Tyr Ala Tyr Asn Ala Asp Leu Tyr

245 250 255

Asn Ala Leu Asn Asp Leu Asn Asn Leu Val Ile Thr Arg Asp Glu Asn

260 265 270

Glu Lys Leu Glu Tyr Tyr Glu Lys Phe Gln Ile Ile Glu Asn Val Phe

275 280 285

Lys Gln Lys Lys Lys Pro Thr Leu Lys Gln Ile Ala Lys Glu Ile Leu

290 295 300

Val Asn Glu Glu Asp Ile Lys Gly Tyr Arg Val Thr Ser Thr Gly Lys

305 310 315 320

Pro Glu Phe Thr Asn Leu Lys Val Tyr His Asp Ile Lys Asp Ile Thr

325 330 335

Ala Arg Lys Glu Ile Ile Glu Asn Ala Glu Leu Leu Asp Gln Ile Ala

340 345 350

Lys Ile Leu Thr Ile Tyr Gln Ser Ser Glu Asp Ile Gln Glu Glu Leu

355 360 365

Thr Asn Leu Asn Ser Glu Leu Thr Gln Glu Glu Ile Glu Gln Ile Ser

370 375 380

Asn Leu Lys Gly Tyr Thr Gly Thr His Asn Leu Ser Leu Lys Ala Ile

385 390 395 400

Asn Leu Ile Leu Asp Glu Leu Trp His Thr Asn Asp Asn Gln Ile Ala

405 410 415

Ile Phe Asn Arg Leu Lys Leu Val Pro Lys Lys Val Asp Leu Ser Gln

420 425 430

Gln Lys Glu Ile Pro Thr Thr Leu Val Asp Asp Phe Ile Leu Ser Pro

435 440 445

Val Val Lys Arg Ser Phe Ile Gln Ser Ile Lys Val Ile Asn Ala Ile

450 455 460

Ile Lys Lys Tyr Gly Leu Pro Asn Asp Ile Ile Ile Glu Leu Ala Arg

465 470 475 480

Glu Lys Asn Ser Lys Asp Ala Gln Lys Met Ile Asn Glu Met Gln Lys

485 490 495

Arg Asn Arg Gln Thr Asn Glu Arg Ile Glu Glu Ile Ile Arg Thr Thr

500 505 510

Gly Lys Glu Asn Ala Lys Tyr Leu Ile Glu Lys Ile Lys Leu His Asp

515 520 525

Met Gln Glu Gly Lys Cys Leu Tyr Ser Leu Glu Ala Ile Pro Leu Glu

530 535 540

Asp Leu Leu Asn Asn Pro Phe Asn Tyr Glu Val Asp Ala Ile Ile Pro

545 550 555 560

Arg Ser Val Ser Phe Asp Asn Ser Phe Asn Asn Lys Val Leu Val Lys

565 570 575

Gln Glu Glu Asn Ser Lys Lys Gly Asn Arg Thr Pro Phe Gln Tyr Leu

580 585 590

Ser Ser Ser Asp Ser Lys Ile Ser Tyr Glu Thr Phe Lys Lys His Ile

595 600 605

Leu Asn Leu Ala Lys Gly Lys Gly Arg Ile Ser Lys Thr Lys Lys Glu

610 615 620

Tyr Leu Leu Glu Glu Arg Asp Ile Asn Arg Phe Ser Val Gln Lys Asp

625 630 635 640

Phe Ile Asn Arg Asn Leu Val Asp Thr Arg Tyr Ala Thr Arg Gly Leu

645 650 655

Met Asn Leu Leu Arg Ser Tyr Phe Arg Val Asn Asn Leu Asp Val Lys

660 665 670

Val Lys Ser Ile Asn Gly Gly Phe Thr Ser Phe Leu Arg Arg Lys Trp

675 680 685

Lys Phe Lys Lys Glu Arg Asn Lys Gly Tyr Lys His His Ala Glu Asp

690 695 700

Ala Leu Ile Ile Ala Asn Ala Asp Phe Ile Phe Lys Glu Trp Lys Lys

705 710 715 720

Leu Asp Lys Ala Lys Lys Val Met Glu Asn Gln Met Phe Glu Glu Lys

725 730 735

Gln Ala Glu Ser Met Pro Glu Ile Glu Thr Glu Gln Glu Tyr Lys Glu

740 745 750

Ile Phe Ile Thr Pro His Gln Ile Lys His Ile Lys Asp Phe Lys Asp

755 760 765

Tyr Lys Tyr Ser His Arg Val Asp Lys Lys Pro Asn Arg Glu Leu Ile

770 775 780

Asn Asp Thr Leu Tyr Ser Thr Arg Lys Asp Asp Lys Gly Asn Thr Leu

785 790 795 800

Ile Val Asn Asn Leu Asn Gly Leu Tyr Asp Lys Asp Asn Asp Lys Leu

805 810 815

Lys Lys Leu Ile Asn Lys Ser Pro Glu Lys Leu Leu Met Tyr His His

820 825 830

Asp Pro Gln Thr Tyr Gln Lys Leu Lys Leu Ile Met Glu Gln Tyr Gly

835 840 845

Asp Glu Lys Asn Pro Leu Tyr Lys Tyr Tyr Glu Glu Thr Gly Asn Tyr

850 855 860

Leu Thr Lys Tyr Ser Lys Lys Asp Asn Gly Pro Val Ile Lys Lys Ile

865 870 875 880

Lys Tyr Tyr Gly Asn Lys Leu Asn Ala His Leu Asp Ile Thr Asp Asp

885 890 895

Tyr Pro Asn Ser Arg Asn Lys Val Val Lys Leu Ser Leu Lys Pro Tyr

900 905 910

Arg Phe Asp Val Tyr Leu Asp Asn Gly Val Tyr Lys Phe Val Thr Val

915 920 925

Lys Asn Leu Asp Val Ile Lys Lys Glu Asn Tyr Tyr Glu Val Asn Ser

930 935 940

Lys Cys Tyr Glu Glu Ala Lys Lys Leu Lys Lys Ile Ser Asn Gln Ala

945 950 955 960

Glu Phe Ile Ala Ser Phe Tyr Asn Asn Asp Leu Ile Lys Ile Asn Gly

965 970 975

Glu Leu Tyr Arg Val Ile Gly Val Asn Asn Asp Leu Leu Asn Arg Ile

980 985 990

Glu Val Asn Met Ile Asp Ile Thr Tyr Arg Glu Tyr Leu Glu Asn Met

995 1000 1005

Asn Asp Lys Arg Pro Pro Arg Ile Ile Lys Thr Ile Ala Ser Lys

1010 1015 1020

Thr Gln Ser Ile Lys Lys Tyr Ser Thr Asp Ile Leu Gly Asn Leu

1025 1030 1035

Tyr Glu Val Lys Ser Lys Lys His Pro Gln Ile Ile Lys Lys Gly

1040 1045 1050

<210> 109

<211> 1028

<212> PRT

<213> 人工序列

<220>

<223> 氨基酸残基(dSaCas9的第721位至第745位氨基酸残基)缺失突变体

<220>

<221> 变体

<222> (10)..(10)

<223> Asp残基转化成Ala残基

<220>

<221> 变体

<222> (580)..(580)

<223> Asn残基转化成Ala残基

<400> 109

Met Lys Arg Asn Tyr Ile Leu Gly Leu Ala Ile Gly Ile Thr Ser Val

1 5 10 15

Gly Tyr Gly Ile Ile Asp Tyr Glu Thr Arg Asp Val Ile Asp Ala Gly

20 25 30

Val Arg Leu Phe Lys Glu Ala Asn Val Glu Asn Asn Glu Gly Arg Arg

35 40 45

Ser Lys Arg Gly Ala Arg Arg Leu Lys Arg Arg Arg Arg His Arg Ile

50 55 60

Gln Arg Val Lys Lys Leu Leu Phe Asp Tyr Asn Leu Leu Thr Asp His

65 70 75 80

Ser Glu Leu Ser Gly Ile Asn Pro Tyr Glu Ala Arg Val Lys Gly Leu

85 90 95

Ser Gln Lys Leu Ser Glu Glu Glu Phe Ser Ala Ala Leu Leu His Leu

100 105 110

Ala Lys Arg Arg Gly Val His Asn Val Asn Glu Val Glu Glu Asp Thr

115 120 125

Gly Asn Glu Leu Ser Thr Lys Glu Gln Ile Ser Arg Asn Ser Lys Ala

130 135 140

Leu Glu Glu Lys Tyr Val Ala Glu Leu Gln Leu Glu Arg Leu Lys Lys

145 150 155 160

Asp Gly Glu Val Arg Gly Ser Ile Asn Arg Phe Lys Thr Ser Asp Tyr

165 170 175

Val Lys Glu Ala Lys Gln Leu Leu Lys Val Gln Lys Ala Tyr His Gln

180 185 190

Leu Asp Gln Ser Phe Ile Asp Thr Tyr Ile Asp Leu Leu Glu Thr Arg

195 200 205

Arg Thr Tyr Tyr Glu Gly Pro Gly Glu Gly Ser Pro Phe Gly Trp Lys

210 215 220

Asp Ile Lys Glu Trp Tyr Glu Met Leu Met Gly His Cys Thr Tyr Phe

225 230 235 240

Pro Glu Glu Leu Arg Ser Val Lys Tyr Ala Tyr Asn Ala Asp Leu Tyr

245 250 255

Asn Ala Leu Asn Asp Leu Asn Asn Leu Val Ile Thr Arg Asp Glu Asn

260 265 270

Glu Lys Leu Glu Tyr Tyr Glu Lys Phe Gln Ile Ile Glu Asn Val Phe

275 280 285

Lys Gln Lys Lys Lys Pro Thr Leu Lys Gln Ile Ala Lys Glu Ile Leu

290 295 300

Val Asn Glu Glu Asp Ile Lys Gly Tyr Arg Val Thr Ser Thr Gly Lys

305 310 315 320

Pro Glu Phe Thr Asn Leu Lys Val Tyr His Asp Ile Lys Asp Ile Thr

325 330 335

Ala Arg Lys Glu Ile Ile Glu Asn Ala Glu Leu Leu Asp Gln Ile Ala

340 345 350

Lys Ile Leu Thr Ile Tyr Gln Ser Ser Glu Asp Ile Gln Glu Glu Leu

355 360 365

Thr Asn Leu Asn Ser Glu Leu Thr Gln Glu Glu Ile Glu Gln Ile Ser

370 375 380

Asn Leu Lys Gly Tyr Thr Gly Thr His Asn Leu Ser Leu Lys Ala Ile

385 390 395 400

Asn Leu Ile Leu Asp Glu Leu Trp His Thr Asn Asp Asn Gln Ile Ala

405 410 415

Ile Phe Asn Arg Leu Lys Leu Val Pro Lys Lys Val Asp Leu Ser Gln

420 425 430

Gln Lys Glu Ile Pro Thr Thr Leu Val Asp Asp Phe Ile Leu Ser Pro

435 440 445

Val Val Lys Arg Ser Phe Ile Gln Ser Ile Lys Val Ile Asn Ala Ile

450 455 460

Ile Lys Lys Tyr Gly Leu Pro Asn Asp Ile Ile Ile Glu Leu Ala Arg

465 470 475 480

Glu Lys Asn Ser Lys Asp Ala Gln Lys Met Ile Asn Glu Met Gln Lys

485 490 495

Arg Asn Arg Gln Thr Asn Glu Arg Ile Glu Glu Ile Ile Arg Thr Thr

500 505 510

Gly Lys Glu Asn Ala Lys Tyr Leu Ile Glu Lys Ile Lys Leu His Asp

515 520 525

Met Gln Glu Gly Lys Cys Leu Tyr Ser Leu Glu Ala Ile Pro Leu Glu

530 535 540

Asp Leu Leu Asn Asn Pro Phe Asn Tyr Glu Val Asp His Ile Ile Pro

545 550 555 560

Arg Ser Val Ser Phe Asp Asn Ser Phe Asn Asn Lys Val Leu Val Lys

565 570 575

Gln Glu Glu Ala Ser Lys Lys Gly Asn Arg Thr Pro Phe Gln Tyr Leu

580 585 590

Ser Ser Ser Asp Ser Lys Ile Ser Tyr Glu Thr Phe Lys Lys His Ile

595 600 605

Leu Asn Leu Ala Lys Gly Lys Gly Arg Ile Ser Lys Thr Lys Lys Glu

610 615 620

Tyr Leu Leu Glu Glu Arg Asp Ile Asn Arg Phe Ser Val Gln Lys Asp

625 630 635 640

Phe Ile Asn Arg Asn Leu Val Asp Thr Arg Tyr Ala Thr Arg Gly Leu

645 650 655

Met Asn Leu Leu Arg Ser Tyr Phe Arg Val Asn Asn Leu Asp Val Lys

660 665 670

Val Lys Ser Ile Asn Gly Gly Phe Thr Ser Phe Leu Arg Arg Lys Trp

675 680 685

Lys Phe Lys Lys Glu Arg Asn Lys Gly Tyr Lys His His Ala Glu Asp

690 695 700

Ala Leu Ile Ile Ala Asn Ala Asp Phe Ile Phe Lys Glu Trp Lys Lys

705 710 715 720

Thr Glu Gln Glu Tyr Lys Glu Ile Phe Ile Thr Pro His Gln Ile Lys

725 730 735

His Ile Lys Asp Phe Lys Asp Tyr Lys Tyr Ser His Arg Val Asp Lys

740 745 750

Lys Pro Asn Arg Glu Leu Ile Asn Asp Thr Leu Tyr Ser Thr Arg Lys

755 760 765

Asp Asp Lys Gly Asn Thr Leu Ile Val Asn Asn Leu Asn Gly Leu Tyr

770 775 780

Asp Lys Asp Asn Asp Lys Leu Lys Lys Leu Ile Asn Lys Ser Pro Glu

785 790 795 800

Lys Leu Leu Met Tyr His His Asp Pro Gln Thr Tyr Gln Lys Leu Lys

805 810 815

Leu Ile Met Glu Gln Tyr Gly Asp Glu Lys Asn Pro Leu Tyr Lys Tyr

820 825 830

Tyr Glu Glu Thr Gly Asn Tyr Leu Thr Lys Tyr Ser Lys Lys Asp Asn

835 840 845

Gly Pro Val Ile Lys Lys Ile Lys Tyr Tyr Gly Asn Lys Leu Asn Ala

850 855 860

His Leu Asp Ile Thr Asp Asp Tyr Pro Asn Ser Arg Asn Lys Val Val

865 870 875 880

Lys Leu Ser Leu Lys Pro Tyr Arg Phe Asp Val Tyr Leu Asp Asn Gly

885 890 895

Val Tyr Lys Phe Val Thr Val Lys Asn Leu Asp Val Ile Lys Lys Glu

900 905 910

Asn Tyr Tyr Glu Val Asn Ser Lys Cys Tyr Glu Glu Ala Lys Lys Leu

915 920 925

Lys Lys Ile Ser Asn Gln Ala Glu Phe Ile Ala Ser Phe Tyr Asn Asn

930 935 940

Asp Leu Ile Lys Ile Asn Gly Glu Leu Tyr Arg Val Ile Gly Val Asn

945 950 955 960

Asn Asp Leu Leu Asn Arg Ile Glu Val Asn Met Ile Asp Ile Thr Tyr

965 970 975

Arg Glu Tyr Leu Glu Asn Met Asn Asp Lys Arg Pro Pro Arg Ile Ile

980 985 990

Lys Thr Ile Ala Ser Lys Thr Gln Ser Ile Lys Lys Tyr Ser Thr Asp

995 1000 1005

Ile Leu Gly Asn Leu Tyr Glu Val Lys Ser Lys Lys His Pro Gln

1010 1015 1020

Ile Ile Lys Lys Gly

1025

<210> 110

<211> 6

<212> PRT

<213> 人工序列

<220>

<223> GGSGGS连接子

<400> 110

Gly Gly Ser Gly Gly Ser

1 5

<210> 111

<211> 1034

<212> PRT

<213> 人工序列

<220>

<223> 具有GGSGGS连接子的氨基酸残基(dSaCas9的第721位至第745位氨基酸残基)缺失突变体

<220>

<221> 变体

<222> (10)..(10)

<223> Asp残基转化成Ala残基

<220>

<221> 变体

<222> (580)..(580)

<223> Asn残基转化成Ala残基

<220>

<221> MISC_FEATURE

<222> (721)..(726)

<223> GGSGGS连接子

<400> 111

Met Lys Arg Asn Tyr Ile Leu Gly Leu Ala Ile Gly Ile Thr Ser Val

1 5 10 15

Gly Tyr Gly Ile Ile Asp Tyr Glu Thr Arg Asp Val Ile Asp Ala Gly

20 25 30

Val Arg Leu Phe Lys Glu Ala Asn Val Glu Asn Asn Glu Gly Arg Arg

35 40 45

Ser Lys Arg Gly Ala Arg Arg Leu Lys Arg Arg Arg Arg His Arg Ile

50 55 60

Gln Arg Val Lys Lys Leu Leu Phe Asp Tyr Asn Leu Leu Thr Asp His

65 70 75 80

Ser Glu Leu Ser Gly Ile Asn Pro Tyr Glu Ala Arg Val Lys Gly Leu

85 90 95

Ser Gln Lys Leu Ser Glu Glu Glu Phe Ser Ala Ala Leu Leu His Leu

100 105 110

Ala Lys Arg Arg Gly Val His Asn Val Asn Glu Val Glu Glu Asp Thr

115 120 125

Gly Asn Glu Leu Ser Thr Lys Glu Gln Ile Ser Arg Asn Ser Lys Ala

130 135 140

Leu Glu Glu Lys Tyr Val Ala Glu Leu Gln Leu Glu Arg Leu Lys Lys

145 150 155 160

Asp Gly Glu Val Arg Gly Ser Ile Asn Arg Phe Lys Thr Ser Asp Tyr

165 170 175

Val Lys Glu Ala Lys Gln Leu Leu Lys Val Gln Lys Ala Tyr His Gln

180 185 190

Leu Asp Gln Ser Phe Ile Asp Thr Tyr Ile Asp Leu Leu Glu Thr Arg

195 200 205

Arg Thr Tyr Tyr Glu Gly Pro Gly Glu Gly Ser Pro Phe Gly Trp Lys

210 215 220

Asp Ile Lys Glu Trp Tyr Glu Met Leu Met Gly His Cys Thr Tyr Phe

225 230 235 240

Pro Glu Glu Leu Arg Ser Val Lys Tyr Ala Tyr Asn Ala Asp Leu Tyr

245 250 255

Asn Ala Leu Asn Asp Leu Asn Asn Leu Val Ile Thr Arg Asp Glu Asn

260 265 270

Glu Lys Leu Glu Tyr Tyr Glu Lys Phe Gln Ile Ile Glu Asn Val Phe

275 280 285

Lys Gln Lys Lys Lys Pro Thr Leu Lys Gln Ile Ala Lys Glu Ile Leu

290 295 300

Val Asn Glu Glu Asp Ile Lys Gly Tyr Arg Val Thr Ser Thr Gly Lys

305 310 315 320

Pro Glu Phe Thr Asn Leu Lys Val Tyr His Asp Ile Lys Asp Ile Thr

325 330 335

Ala Arg Lys Glu Ile Ile Glu Asn Ala Glu Leu Leu Asp Gln Ile Ala

340 345 350

Lys Ile Leu Thr Ile Tyr Gln Ser Ser Glu Asp Ile Gln Glu Glu Leu

355 360 365

Thr Asn Leu Asn Ser Glu Leu Thr Gln Glu Glu Ile Glu Gln Ile Ser

370 375 380

Asn Leu Lys Gly Tyr Thr Gly Thr His Asn Leu Ser Leu Lys Ala Ile

385 390 395 400

Asn Leu Ile Leu Asp Glu Leu Trp His Thr Asn Asp Asn Gln Ile Ala

405 410 415

Ile Phe Asn Arg Leu Lys Leu Val Pro Lys Lys Val Asp Leu Ser Gln

420 425 430

Gln Lys Glu Ile Pro Thr Thr Leu Val Asp Asp Phe Ile Leu Ser Pro

435 440 445

Val Val Lys Arg Ser Phe Ile Gln Ser Ile Lys Val Ile Asn Ala Ile

450 455 460

Ile Lys Lys Tyr Gly Leu Pro Asn Asp Ile Ile Ile Glu Leu Ala Arg

465 470 475 480

Glu Lys Asn Ser Lys Asp Ala Gln Lys Met Ile Asn Glu Met Gln Lys

485 490 495

Arg Asn Arg Gln Thr Asn Glu Arg Ile Glu Glu Ile Ile Arg Thr Thr

500 505 510

Gly Lys Glu Asn Ala Lys Tyr Leu Ile Glu Lys Ile Lys Leu His Asp

515 520 525

Met Gln Glu Gly Lys Cys Leu Tyr Ser Leu Glu Ala Ile Pro Leu Glu

530 535 540

Asp Leu Leu Asn Asn Pro Phe Asn Tyr Glu Val Asp His Ile Ile Pro

545 550 555 560

Arg Ser Val Ser Phe Asp Asn Ser Phe Asn Asn Lys Val Leu Val Lys

565 570 575

Gln Glu Glu Ala Ser Lys Lys Gly Asn Arg Thr Pro Phe Gln Tyr Leu

580 585 590

Ser Ser Ser Asp Ser Lys Ile Ser Tyr Glu Thr Phe Lys Lys His Ile

595 600 605

Leu Asn Leu Ala Lys Gly Lys Gly Arg Ile Ser Lys Thr Lys Lys Glu

610 615 620

Tyr Leu Leu Glu Glu Arg Asp Ile Asn Arg Phe Ser Val Gln Lys Asp

625 630 635 640

Phe Ile Asn Arg Asn Leu Val Asp Thr Arg Tyr Ala Thr Arg Gly Leu

645 650 655

Met Asn Leu Leu Arg Ser Tyr Phe Arg Val Asn Asn Leu Asp Val Lys

660 665 670

Val Lys Ser Ile Asn Gly Gly Phe Thr Ser Phe Leu Arg Arg Lys Trp

675 680 685

Lys Phe Lys Lys Glu Arg Asn Lys Gly Tyr Lys His His Ala Glu Asp

690 695 700

Ala Leu Ile Ile Ala Asn Ala Asp Phe Ile Phe Lys Glu Trp Lys Lys

705 710 715 720

Gly Gly Ser Gly Gly Ser Thr Glu Gln Glu Tyr Lys Glu Ile Phe Ile

725 730 735

Thr Pro His Gln Ile Lys His Ile Lys Asp Phe Lys Asp Tyr Lys Tyr

740 745 750

Ser His Arg Val Asp Lys Lys Pro Asn Arg Glu Leu Ile Asn Asp Thr

755 760 765

Leu Tyr Ser Thr Arg Lys Asp Asp Lys Gly Asn Thr Leu Ile Val Asn

770 775 780

Asn Leu Asn Gly Leu Tyr Asp Lys Asp Asn Asp Lys Leu Lys Lys Leu

785 790 795 800

Ile Asn Lys Ser Pro Glu Lys Leu Leu Met Tyr His His Asp Pro Gln

805 810 815

Thr Tyr Gln Lys Leu Lys Leu Ile Met Glu Gln Tyr Gly Asp Glu Lys

820 825 830

Asn Pro Leu Tyr Lys Tyr Tyr Glu Glu Thr Gly Asn Tyr Leu Thr Lys

835 840 845

Tyr Ser Lys Lys Asp Asn Gly Pro Val Ile Lys Lys Ile Lys Tyr Tyr

850 855 860

Gly Asn Lys Leu Asn Ala His Leu Asp Ile Thr Asp Asp Tyr Pro Asn

865 870 875 880

Ser Arg Asn Lys Val Val Lys Leu Ser Leu Lys Pro Tyr Arg Phe Asp

885 890 895

Val Tyr Leu Asp Asn Gly Val Tyr Lys Phe Val Thr Val Lys Asn Leu

900 905 910

Asp Val Ile Lys Lys Glu Asn Tyr Tyr Glu Val Asn Ser Lys Cys Tyr

915 920 925

Glu Glu Ala Lys Lys Leu Lys Lys Ile Ser Asn Gln Ala Glu Phe Ile

930 935 940

Ala Ser Phe Tyr Asn Asn Asp Leu Ile Lys Ile Asn Gly Glu Leu Tyr

945 950 955 960

Arg Val Ile Gly Val Asn Asn Asp Leu Leu Asn Arg Ile Glu Val Asn

965 970 975

Met Ile Asp Ile Thr Tyr Arg Glu Tyr Leu Glu Asn Met Asn Asp Lys

980 985 990

Arg Pro Pro Arg Ile Ile Lys Thr Ile Ala Ser Lys Thr Gln Ser Ile

995 1000 1005

Lys Lys Tyr Ser Thr Asp Ile Leu Gly Asn Leu Tyr Glu Val Lys

1010 1015 1020

Ser Lys Lys His Pro Gln Ile Ile Lys Lys Gly

1025 1030

<210> 112

<211> 886

<212> PRT

<213> 人工序列

<220>

<223> 氨基酸残基(dSaCas9的第482位至第648位氨基酸残基)缺失突变体

<220>

<221> 变体

<222> (10)..(10)

<223> Asp残基转化成Ala残基

<400> 112

Met Lys Arg Asn Tyr Ile Leu Gly Leu Ala Ile Gly Ile Thr Ser Val

1 5 10 15

Gly Tyr Gly Ile Ile Asp Tyr Glu Thr Arg Asp Val Ile Asp Ala Gly

20 25 30

Val Arg Leu Phe Lys Glu Ala Asn Val Glu Asn Asn Glu Gly Arg Arg

35 40 45

Ser Lys Arg Gly Ala Arg Arg Leu Lys Arg Arg Arg Arg His Arg Ile

50 55 60

Gln Arg Val Lys Lys Leu Leu Phe Asp Tyr Asn Leu Leu Thr Asp His

65 70 75 80

Ser Glu Leu Ser Gly Ile Asn Pro Tyr Glu Ala Arg Val Lys Gly Leu

85 90 95

Ser Gln Lys Leu Ser Glu Glu Glu Phe Ser Ala Ala Leu Leu His Leu

100 105 110

Ala Lys Arg Arg Gly Val His Asn Val Asn Glu Val Glu Glu Asp Thr

115 120 125

Gly Asn Glu Leu Ser Thr Lys Glu Gln Ile Ser Arg Asn Ser Lys Ala

130 135 140

Leu Glu Glu Lys Tyr Val Ala Glu Leu Gln Leu Glu Arg Leu Lys Lys

145 150 155 160

Asp Gly Glu Val Arg Gly Ser Ile Asn Arg Phe Lys Thr Ser Asp Tyr

165 170 175

Val Lys Glu Ala Lys Gln Leu Leu Lys Val Gln Lys Ala Tyr His Gln

180 185 190

Leu Asp Gln Ser Phe Ile Asp Thr Tyr Ile Asp Leu Leu Glu Thr Arg

195 200 205

Arg Thr Tyr Tyr Glu Gly Pro Gly Glu Gly Ser Pro Phe Gly Trp Lys

210 215 220

Asp Ile Lys Glu Trp Tyr Glu Met Leu Met Gly His Cys Thr Tyr Phe

225 230 235 240

Pro Glu Glu Leu Arg Ser Val Lys Tyr Ala Tyr Asn Ala Asp Leu Tyr

245 250 255

Asn Ala Leu Asn Asp Leu Asn Asn Leu Val Ile Thr Arg Asp Glu Asn

260 265 270

Glu Lys Leu Glu Tyr Tyr Glu Lys Phe Gln Ile Ile Glu Asn Val Phe

275 280 285

Lys Gln Lys Lys Lys Pro Thr Leu Lys Gln Ile Ala Lys Glu Ile Leu

290 295 300

Val Asn Glu Glu Asp Ile Lys Gly Tyr Arg Val Thr Ser Thr Gly Lys

305 310 315 320

Pro Glu Phe Thr Asn Leu Lys Val Tyr His Asp Ile Lys Asp Ile Thr

325 330 335

Ala Arg Lys Glu Ile Ile Glu Asn Ala Glu Leu Leu Asp Gln Ile Ala

340 345 350

Lys Ile Leu Thr Ile Tyr Gln Ser Ser Glu Asp Ile Gln Glu Glu Leu

355 360 365

Thr Asn Leu Asn Ser Glu Leu Thr Gln Glu Glu Ile Glu Gln Ile Ser

370 375 380

Asn Leu Lys Gly Tyr Thr Gly Thr His Asn Leu Ser Leu Lys Ala Ile

385 390 395 400

Asn Leu Ile Leu Asp Glu Leu Trp His Thr Asn Asp Asn Gln Ile Ala

405 410 415

Ile Phe Asn Arg Leu Lys Leu Val Pro Lys Lys Val Asp Leu Ser Gln

420 425 430

Gln Lys Glu Ile Pro Thr Thr Leu Val Asp Asp Phe Ile Leu Ser Pro

435 440 445

Val Val Lys Arg Ser Phe Ile Gln Ser Ile Lys Val Ile Asn Ala Ile

450 455 460

Ile Lys Lys Tyr Gly Leu Pro Asn Asp Ile Ile Ile Glu Leu Ala Arg

465 470 475 480

Glu Thr Arg Tyr Ala Thr Arg Gly Leu Met Asn Leu Leu Arg Ser Tyr

485 490 495

Phe Arg Val Asn Asn Leu Asp Val Lys Val Lys Ser Ile Asn Gly Gly

500 505 510

Phe Thr Ser Phe Leu Arg Arg Lys Trp Lys Phe Lys Lys Glu Arg Asn

515 520 525

Lys Gly Tyr Lys His His Ala Glu Asp Ala Leu Ile Ile Ala Asn Ala

530 535 540

Asp Phe Ile Phe Lys Glu Trp Lys Lys Leu Asp Lys Ala Lys Lys Val

545 550 555 560

Met Glu Asn Gln Met Phe Glu Glu Lys Gln Ala Glu Ser Met Pro Glu

565 570 575

Ile Glu Thr Glu Gln Glu Tyr Lys Glu Ile Phe Ile Thr Pro His Gln

580 585 590

Ile Lys His Ile Lys Asp Phe Lys Asp Tyr Lys Tyr Ser His Arg Val

595 600 605

Asp Lys Lys Pro Asn Arg Glu Leu Ile Asn Asp Thr Leu Tyr Ser Thr

610 615 620

Arg Lys Asp Asp Lys Gly Asn Thr Leu Ile Val Asn Asn Leu Asn Gly

625 630 635 640

Leu Tyr Asp Lys Asp Asn Asp Lys Leu Lys Lys Leu Ile Asn Lys Ser

645 650 655

Pro Glu Lys Leu Leu Met Tyr His His Asp Pro Gln Thr Tyr Gln Lys

660 665 670

Leu Lys Leu Ile Met Glu Gln Tyr Gly Asp Glu Lys Asn Pro Leu Tyr

675 680 685

Lys Tyr Tyr Glu Glu Thr Gly Asn Tyr Leu Thr Lys Tyr Ser Lys Lys

690 695 700

Asp Asn Gly Pro Val Ile Lys Lys Ile Lys Tyr Tyr Gly Asn Lys Leu

705 710 715 720

Asn Ala His Leu Asp Ile Thr Asp Asp Tyr Pro Asn Ser Arg Asn Lys

725 730 735

Val Val Lys Leu Ser Leu Lys Pro Tyr Arg Phe Asp Val Tyr Leu Asp

740 745 750

Asn Gly Val Tyr Lys Phe Val Thr Val Lys Asn Leu Asp Val Ile Lys

755 760 765

Lys Glu Asn Tyr Tyr Glu Val Asn Ser Lys Cys Tyr Glu Glu Ala Lys

770 775 780

Lys Leu Lys Lys Ile Ser Asn Gln Ala Glu Phe Ile Ala Ser Phe Tyr

785 790 795 800

Asn Asn Asp Leu Ile Lys Ile Asn Gly Glu Leu Tyr Arg Val Ile Gly

805 810 815

Val Asn Asn Asp Leu Leu Asn Arg Ile Glu Val Asn Met Ile Asp Ile

820 825 830

Thr Tyr Arg Glu Tyr Leu Glu Asn Met Asn Asp Lys Arg Pro Pro Arg

835 840 845

Ile Ile Lys Thr Ile Ala Ser Lys Thr Gln Ser Ile Lys Lys Tyr Ser

850 855 860

Thr Asp Ile Leu Gly Asn Leu Tyr Glu Val Lys Ser Lys Lys His Pro

865 870 875 880

Gln Ile Ile Lys Lys Gly

885

<210> 113

<211> 892

<212> PRT

<213> 人工序列

<220>

<223> 具有GGSGGS连接子的氨基酸残基(dSaCas9的第482位至第648位氨基酸残基)缺失突变体

<220>

<221> 变体

<222> (10)..(10)

<223> Asp残基转化成Ala残基

<220>

<221> MISC_FEATURE

<222> (482)..(487)

<223> GGSGGS连接子

<400> 113

Met Lys Arg Asn Tyr Ile Leu Gly Leu Ala Ile Gly Ile Thr Ser Val

1 5 10 15

Gly Tyr Gly Ile Ile Asp Tyr Glu Thr Arg Asp Val Ile Asp Ala Gly

20 25 30

Val Arg Leu Phe Lys Glu Ala Asn Val Glu Asn Asn Glu Gly Arg Arg

35 40 45

Ser Lys Arg Gly Ala Arg Arg Leu Lys Arg Arg Arg Arg His Arg Ile

50 55 60

Gln Arg Val Lys Lys Leu Leu Phe Asp Tyr Asn Leu Leu Thr Asp His

65 70 75 80

Ser Glu Leu Ser Gly Ile Asn Pro Tyr Glu Ala Arg Val Lys Gly Leu

85 90 95

Ser Gln Lys Leu Ser Glu Glu Glu Phe Ser Ala Ala Leu Leu His Leu

100 105 110

Ala Lys Arg Arg Gly Val His Asn Val Asn Glu Val Glu Glu Asp Thr

115 120 125

Gly Asn Glu Leu Ser Thr Lys Glu Gln Ile Ser Arg Asn Ser Lys Ala

130 135 140

Leu Glu Glu Lys Tyr Val Ala Glu Leu Gln Leu Glu Arg Leu Lys Lys

145 150 155 160

Asp Gly Glu Val Arg Gly Ser Ile Asn Arg Phe Lys Thr Ser Asp Tyr

165 170 175

Val Lys Glu Ala Lys Gln Leu Leu Lys Val Gln Lys Ala Tyr His Gln

180 185 190

Leu Asp Gln Ser Phe Ile Asp Thr Tyr Ile Asp Leu Leu Glu Thr Arg

195 200 205

Arg Thr Tyr Tyr Glu Gly Pro Gly Glu Gly Ser Pro Phe Gly Trp Lys

210 215 220

Asp Ile Lys Glu Trp Tyr Glu Met Leu Met Gly His Cys Thr Tyr Phe

225 230 235 240

Pro Glu Glu Leu Arg Ser Val Lys Tyr Ala Tyr Asn Ala Asp Leu Tyr

245 250 255

Asn Ala Leu Asn Asp Leu Asn Asn Leu Val Ile Thr Arg Asp Glu Asn

260 265 270

Glu Lys Leu Glu Tyr Tyr Glu Lys Phe Gln Ile Ile Glu Asn Val Phe

275 280 285

Lys Gln Lys Lys Lys Pro Thr Leu Lys Gln Ile Ala Lys Glu Ile Leu

290 295 300

Val Asn Glu Glu Asp Ile Lys Gly Tyr Arg Val Thr Ser Thr Gly Lys

305 310 315 320

Pro Glu Phe Thr Asn Leu Lys Val Tyr His Asp Ile Lys Asp Ile Thr

325 330 335

Ala Arg Lys Glu Ile Ile Glu Asn Ala Glu Leu Leu Asp Gln Ile Ala

340 345 350

Lys Ile Leu Thr Ile Tyr Gln Ser Ser Glu Asp Ile Gln Glu Glu Leu

355 360 365

Thr Asn Leu Asn Ser Glu Leu Thr Gln Glu Glu Ile Glu Gln Ile Ser

370 375 380

Asn Leu Lys Gly Tyr Thr Gly Thr His Asn Leu Ser Leu Lys Ala Ile

385 390 395 400

Asn Leu Ile Leu Asp Glu Leu Trp His Thr Asn Asp Asn Gln Ile Ala

405 410 415

Ile Phe Asn Arg Leu Lys Leu Val Pro Lys Lys Val Asp Leu Ser Gln

420 425 430

Gln Lys Glu Ile Pro Thr Thr Leu Val Asp Asp Phe Ile Leu Ser Pro

435 440 445

Val Val Lys Arg Ser Phe Ile Gln Ser Ile Lys Val Ile Asn Ala Ile

450 455 460

Ile Lys Lys Tyr Gly Leu Pro Asn Asp Ile Ile Ile Glu Leu Ala Arg

465 470 475 480

Glu Gly Gly Ser Gly Gly Ser Thr Arg Tyr Ala Thr Arg Gly Leu Met

485 490 495

Asn Leu Leu Arg Ser Tyr Phe Arg Val Asn Asn Leu Asp Val Lys Val

500 505 510

Lys Ser Ile Asn Gly Gly Phe Thr Ser Phe Leu Arg Arg Lys Trp Lys

515 520 525

Phe Lys Lys Glu Arg Asn Lys Gly Tyr Lys His His Ala Glu Asp Ala

530 535 540

Leu Ile Ile Ala Asn Ala Asp Phe Ile Phe Lys Glu Trp Lys Lys Leu

545 550 555 560

Asp Lys Ala Lys Lys Val Met Glu Asn Gln Met Phe Glu Glu Lys Gln

565 570 575

Ala Glu Ser Met Pro Glu Ile Glu Thr Glu Gln Glu Tyr Lys Glu Ile

580 585 590

Phe Ile Thr Pro His Gln Ile Lys His Ile Lys Asp Phe Lys Asp Tyr

595 600 605

Lys Tyr Ser His Arg Val Asp Lys Lys Pro Asn Arg Glu Leu Ile Asn

610 615 620

Asp Thr Leu Tyr Ser Thr Arg Lys Asp Asp Lys Gly Asn Thr Leu Ile

625 630 635 640

Val Asn Asn Leu Asn Gly Leu Tyr Asp Lys Asp Asn Asp Lys Leu Lys

645 650 655

Lys Leu Ile Asn Lys Ser Pro Glu Lys Leu Leu Met Tyr His His Asp

660 665 670

Pro Gln Thr Tyr Gln Lys Leu Lys Leu Ile Met Glu Gln Tyr Gly Asp

675 680 685

Glu Lys Asn Pro Leu Tyr Lys Tyr Tyr Glu Glu Thr Gly Asn Tyr Leu

690 695 700

Thr Lys Tyr Ser Lys Lys Asp Asn Gly Pro Val Ile Lys Lys Ile Lys

705 710 715 720

Tyr Tyr Gly Asn Lys Leu Asn Ala His Leu Asp Ile Thr Asp Asp Tyr

725 730 735

Pro Asn Ser Arg Asn Lys Val Val Lys Leu Ser Leu Lys Pro Tyr Arg

740 745 750

Phe Asp Val Tyr Leu Asp Asn Gly Val Tyr Lys Phe Val Thr Val Lys

755 760 765

Asn Leu Asp Val Ile Lys Lys Glu Asn Tyr Tyr Glu Val Asn Ser Lys

770 775 780

Cys Tyr Glu Glu Ala Lys Lys Leu Lys Lys Ile Ser Asn Gln Ala Glu

785 790 795 800

Phe Ile Ala Ser Phe Tyr Asn Asn Asp Leu Ile Lys Ile Asn Gly Glu

805 810 815

Leu Tyr Arg Val Ile Gly Val Asn Asn Asp Leu Leu Asn Arg Ile Glu

820 825 830

Val Asn Met Ile Asp Ile Thr Tyr Arg Glu Tyr Leu Glu Asn Met Asn

835 840 845

Asp Lys Arg Pro Pro Arg Ile Ile Lys Thr Ile Ala Ser Lys Thr Gln

850 855 860

Ser Ile Lys Lys Tyr Ser Thr Asp Ile Leu Gly Asn Leu Tyr Glu Val

865 870 875 880

Lys Ser Lys Lys His Pro Gln Ile Ile Lys Lys Gly

885 890

<210> 114

<211> 50

<212> PRT

<213> 人工序列

<220>

<223> VP64

<400> 114

Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Gly Ser Asp Ala Leu

1 5 10 15

Asp Asp Phe Asp Leu Asp Met Leu Gly Ser Asp Ala Leu Asp Asp Phe

20 25 30

Asp Leu Asp Met Leu Gly Ser Asp Ala Leu Asp Asp Phe Asp Leu Asp

35 40 45

Met Leu

<210> 115

<211> 376

<212> PRT

<213> 人工序列

<220>

<223> VPH

<400> 115

Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Gly Ser Asp Ala Leu

1 5 10 15

Asp Asp Phe Asp Leu Asp Met Leu Gly Ser Asp Ala Leu Asp Asp Phe

20 25 30

Asp Leu Asp Met Leu Gly Ser Asp Ala Leu Asp Asp Phe Asp Leu Asp

35 40 45

Met Leu Ser Ser Gly Ser Pro Lys Lys Lys Arg Lys Val Gly Ser Pro

50 55 60

Ser Gly Gln Ile Ser Asn Gln Ala Leu Ala Leu Ala Pro Ser Ser Ala

65 70 75 80

Pro Val Leu Ala Gln Thr Met Val Pro Ser Ser Ala Met Val Pro Leu

85 90 95

Ala Gln Pro Pro Ala Pro Ala Pro Val Leu Thr Pro Gly Pro Pro Gln

100 105 110

Ser Leu Ser Ala Pro Val Pro Lys Ser Thr Gln Ala Gly Glu Gly Thr

115 120 125

Leu Ser Glu Ala Leu Leu His Leu Gln Phe Asp Ala Asp Glu Asp Leu

130 135 140

Gly Ala Leu Leu Gly Asn Ser Thr Asp Pro Gly Val Phe Thr Asp Leu

145 150 155 160

Ala Ser Val Asp Asn Ser Glu Phe Gln Gln Leu Leu Asn Gln Gly Val

165 170 175

Ser Met Ser His Ser Thr Ala Glu Pro Met Leu Met Glu Tyr Pro Glu

180 185 190

Ala Ile Thr Arg Leu Val Thr Gly Ser Gln Arg Pro Pro Asp Pro Ala

195 200 205

Pro Thr Pro Leu Gly Thr Ser Gly Leu Pro Asn Gly Leu Ser Gly Asp

210 215 220

Glu Asp Phe Ser Ser Ile Ala Asp Met Asp Phe Ser Ala Leu Leu Ser

225 230 235 240

Gln Ile Ser Ser Ser Gly Gln Gly Gly Gly Gly Ser Gly Phe Ser Val

245 250 255

Asp Thr Ser Ala Leu Leu Asp Leu Phe Ser Pro Ser Val Thr Val Pro

260 265 270

Asp Met Ser Leu Pro Asp Leu Asp Ser Ser Leu Ala Ser Ile Gln Glu

275 280 285

Leu Leu Ser Pro Gln Glu Pro Pro Arg Pro Pro Glu Ala Glu Asn Ser

290 295 300

Ser Pro Asp Ser Gly Lys Gln Leu Val His Tyr Thr Ala Gln Pro Leu

305 310 315 320

Phe Leu Leu Asp Pro Gly Ser Val Asp Thr Gly Ser Asn Asp Leu Pro

325 330 335

Val Leu Phe Glu Leu Gly Glu Gly Ser Tyr Phe Ser Glu Gly Asp Gly

340 345 350

Phe Ala Glu Asp Pro Thr Ile Ser Leu Leu Thr Gly Ser Glu Pro Pro

355 360 365

Lys Ala Lys Asp Pro Thr Val Ser

370 375

<210> 116

<211> 523

<212> PRT

<213> 人工序列

<220>

<223> VPR

<400> 116

Glu Ala Ser Gly Ser Gly Arg Ala Asp Ala Leu Asp Asp Phe Asp Leu

1 5 10 15

Asp Met Leu Gly Ser Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu

20 25 30

Gly Ser Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Gly Ser Asp

35 40 45

Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Ile Asn Ser Arg Ser Ser

50 55 60

Gly Ser Ser Gln Tyr Leu Pro Asp Thr Asp Asp Arg His Arg Ile Glu

65 70 75 80

Glu Lys Arg Lys Arg Thr Tyr Glu Thr Phe Lys Ser Ile Met Lys Lys

85 90 95

Ser Pro Phe Ser Gly Pro Thr Asp Pro Arg Pro Pro Pro Arg Arg Ile

100 105 110

Ala Val Pro Ser Arg Ser Ser Ala Ser Val Pro Lys Pro Ala Pro Gln

115 120 125

Pro Tyr Pro Phe Thr Ser Ser Leu Ser Thr Ile Asn Tyr Asp Glu Phe

130 135 140

Pro Thr Met Val Phe Pro Ser Gly Gln Ile Ser Gln Ala Ser Ala Leu

145 150 155 160

Ala Pro Ala Pro Pro Gln Val Leu Pro Gln Ala Pro Ala Pro Ala Pro

165 170 175

Ala Pro Ala Met Val Ser Ala Leu Ala Gln Ala Pro Ala Pro Val Pro

180 185 190

Val Leu Ala Pro Gly Pro Pro Gln Ala Val Ala Pro Pro Ala Pro Lys

195 200 205

Pro Thr Gln Ala Gly Glu Gly Thr Leu Ser Glu Ala Leu Leu Gln Leu

210 215 220

Gln Phe Asp Asp Glu Asp Leu Gly Ala Leu Leu Gly Asn Ser Thr Asp

225 230 235 240

Pro Ala Val Phe Thr Asp Leu Ala Ser Val Asp Asn Ser Glu Phe Gln

245 250 255

Gln Leu Leu Asn Gln Gly Ile Pro Val Ala Pro His Thr Thr Glu Pro

260 265 270

Met Leu Met Glu Tyr Pro Glu Ala Ile Thr Arg Leu Val Thr Gly Ala

275 280 285

Gln Arg Pro Pro Asp Pro Ala Pro Ala Pro Leu Gly Ala Pro Gly Leu

290 295 300

Pro Asn Gly Leu Leu Ser Gly Asp Glu Asp Phe Ser Ser Ile Ala Asp

305 310 315 320

Met Asp Phe Ser Ala Leu Leu Gly Ser Gly Ser Gly Ser Arg Asp Ser

325 330 335

Arg Glu Gly Met Phe Leu Pro Lys Pro Glu Ala Gly Ser Ala Ile Ser

340 345 350

Asp Val Phe Glu Gly Arg Glu Val Cys Gln Pro Lys Arg Ile Arg Pro

355 360 365

Phe His Pro Pro Gly Ser Pro Trp Ala Asn Arg Pro Leu Pro Ala Ser

370 375 380

Leu Ala Pro Thr Pro Thr Gly Pro Val His Glu Pro Val Gly Ser Leu

385 390 395 400

Thr Pro Ala Pro Val Pro Gln Pro Leu Asp Pro Ala Pro Ala Val Thr

405 410 415

Pro Glu Ala Ser His Leu Leu Glu Asp Pro Asp Glu Glu Thr Ser Gln

420 425 430

Ala Val Lys Ala Leu Arg Glu Met Ala Asp Thr Val Ile Pro Gln Lys

435 440 445

Glu Glu Ala Ala Ile Cys Gly Gln Met Asp Leu Ser His Pro Pro Pro

450 455 460

Arg Gly His Leu Asp Glu Leu Thr Thr Thr Leu Glu Ser Met Thr Glu

465 470 475 480

Asp Leu Asn Leu Asp Ser Pro Leu Thr Pro Glu Leu Asn Glu Ile Leu

485 490 495

Asp Thr Phe Leu Asn Asp Glu Cys Leu Leu His Ala Met His Ile Ser

500 505 510

Thr Gly Leu Ser Ile Phe Asp Thr Ser Leu Phe

515 520

<210> 117

<211> 167

<212> PRT

<213> 人工序列

<220>

<223> miniVR

<400> 117

Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Gly Ser Asp Ala Leu

1 5 10 15

Asp Asp Phe Asp Leu Asp Met Leu Gly Ser Asp Ala Leu Asp Asp Phe

20 25 30

Asp Leu Asp Met Leu Gly Ser Asp Ala Leu Asp Asp Phe Asp Leu Asp

35 40 45

Met Leu Gly Ser Gly Ser Pro Ala Pro Ala Val Thr Pro Glu Ala Ser

50 55 60

His Leu Leu Glu Asp Pro Asp Glu Glu Thr Ser Gln Ala Val Lys Ala

65 70 75 80

Leu Arg Glu Met Ala Asp Thr Val Ile Pro Gln Lys Glu Glu Ala Ala

85 90 95

Ile Cys Gly Gln Met Asp Leu Ser His Pro Pro Pro Arg Gly His Leu

100 105 110

Asp Glu Leu Thr Thr Thr Leu Glu Ser Met Thr Glu Asp Leu Asn Leu

115 120 125

Asp Ser Pro Leu Thr Pro Glu Leu Asn Glu Ile Leu Asp Thr Phe Leu

130 135 140

Asn Asp Glu Cys Leu Leu His Ala Met His Ile Ser Thr Gly Leu Ser

145 150 155 160

Ile Phe Asp Thr Ser Leu Phe

165

<210> 118

<211> 140

<212> PRT

<213> 人工序列

<220>

<223> microVR

<400> 118

Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Gly Ser Asp Ala Leu

1 5 10 15

Asp Asp Phe Asp Leu Asp Met Leu Gly Ser Asp Ala Leu Asp Asp Phe

20 25 30

Asp Leu Asp Met Leu Gly Ser Asp Ala Leu Asp Asp Phe Asp Leu Asp

35 40 45

Met Leu Gly Ser Gly Ser Arg Glu Met Ala Asp Thr Val Ile Pro Gln

50 55 60

Lys Glu Glu Ala Ala Ile Cys Gly Gln Met Asp Leu Ser His Pro Pro

65 70 75 80

Pro Arg Gly His Leu Asp Glu Leu Thr Thr Thr Leu Glu Ser Met Thr

85 90 95

Glu Asp Leu Asn Leu Asp Ser Pro Leu Thr Pro Glu Leu Asn Glu Ile

100 105 110

Leu Asp Thr Phe Leu Asn Asp Glu Cys Leu Leu His Ala Met His Ile

115 120 125

Ser Thr Gly Leu Ser Ile Phe Asp Thr Ser Leu Phe

130 135 140

<210> 119

<211> 21

<212> RNA

<213> 智人（Homo sapiens）

<220>

<221> misc_feature

<222> (1)..(21)

<223> 对应于靶序列(SEQ ID NO:4)的crRNA

<400> 119

agaaaagcgg ccccuagggg c 21

<210> 120

<211> 21

<212> DNA

<213> 智人（Homo sapiens）

<220>

<221> misc_feature

<222> (1)..(21)

<223> 与靶序列(SEQ ID NO:4)互补的序列

<400> 120

gcccctaggg gccgcttttc t 21

<210> 121

<211> 19

<212> DNA

<213> 新凶手弗朗西丝氏菌（Francisella novicid）

<220>

<221> misc_feature

<222> (1)..(19)

<223> crRNA的5'-柄

<400> 121

aatttctact gttgtagat 19

<210> 122

<211> 83

<212> DNA

<213> 金黄色葡萄球菌（Staphylococcus aureus）

<220>

<221> misc_feature

<222> (1)..(83)

<223> 编码tracrRNA的序列

<400> 122

gttttagtac tctggaaaca gaatctacta aaacaaggca aaatgccgtg tttatctcgt 60

caacttgttg gcgagatttt ttt 83

<210> 123

<211> 1053

<212> PRT

<213> 金黄色葡萄球菌（Staphylococcus aureus）

<220>

<221> 变体

<222> (10)..(10)

<223> Asp残基转化成Ala残基

<220>

<221> 变体

<222> (580)..(580)

<223> Asn残基转化成Ala残基

<400> 123

Met Lys Arg Asn Tyr Ile Leu Gly Leu Ala Ile Gly Ile Thr Ser Val

1 5 10 15

Gly Tyr Gly Ile Ile Asp Tyr Glu Thr Arg Asp Val Ile Asp Ala Gly

20 25 30

Val Arg Leu Phe Lys Glu Ala Asn Val Glu Asn Asn Glu Gly Arg Arg

35 40 45

Ser Lys Arg Gly Ala Arg Arg Leu Lys Arg Arg Arg Arg His Arg Ile

50 55 60

Gln Arg Val Lys Lys Leu Leu Phe Asp Tyr Asn Leu Leu Thr Asp His

65 70 75 80

Ser Glu Leu Ser Gly Ile Asn Pro Tyr Glu Ala Arg Val Lys Gly Leu

85 90 95

Ser Gln Lys Leu Ser Glu Glu Glu Phe Ser Ala Ala Leu Leu His Leu

100 105 110

Ala Lys Arg Arg Gly Val His Asn Val Asn Glu Val Glu Glu Asp Thr

115 120 125

Gly Asn Glu Leu Ser Thr Lys Glu Gln Ile Ser Arg Asn Ser Lys Ala

130 135 140

Leu Glu Glu Lys Tyr Val Ala Glu Leu Gln Leu Glu Arg Leu Lys Lys

145 150 155 160

Asp Gly Glu Val Arg Gly Ser Ile Asn Arg Phe Lys Thr Ser Asp Tyr

165 170 175

Val Lys Glu Ala Lys Gln Leu Leu Lys Val Gln Lys Ala Tyr His Gln

180 185 190

Leu Asp Gln Ser Phe Ile Asp Thr Tyr Ile Asp Leu Leu Glu Thr Arg

195 200 205

Arg Thr Tyr Tyr Glu Gly Pro Gly Glu Gly Ser Pro Phe Gly Trp Lys

210 215 220

Asp Ile Lys Glu Trp Tyr Glu Met Leu Met Gly His Cys Thr Tyr Phe

225 230 235 240

Pro Glu Glu Leu Arg Ser Val Lys Tyr Ala Tyr Asn Ala Asp Leu Tyr

245 250 255

Asn Ala Leu Asn Asp Leu Asn Asn Leu Val Ile Thr Arg Asp Glu Asn

260 265 270

Glu Lys Leu Glu Tyr Tyr Glu Lys Phe Gln Ile Ile Glu Asn Val Phe

275 280 285

Lys Gln Lys Lys Lys Pro Thr Leu Lys Gln Ile Ala Lys Glu Ile Leu

290 295 300

Val Asn Glu Glu Asp Ile Lys Gly Tyr Arg Val Thr Ser Thr Gly Lys

305 310 315 320

Pro Glu Phe Thr Asn Leu Lys Val Tyr His Asp Ile Lys Asp Ile Thr

325 330 335

Ala Arg Lys Glu Ile Ile Glu Asn Ala Glu Leu Leu Asp Gln Ile Ala

340 345 350

Lys Ile Leu Thr Ile Tyr Gln Ser Ser Glu Asp Ile Gln Glu Glu Leu

355 360 365

Thr Asn Leu Asn Ser Glu Leu Thr Gln Glu Glu Ile Glu Gln Ile Ser

370 375 380

Asn Leu Lys Gly Tyr Thr Gly Thr His Asn Leu Ser Leu Lys Ala Ile

385 390 395 400

Asn Leu Ile Leu Asp Glu Leu Trp His Thr Asn Asp Asn Gln Ile Ala

405 410 415

Ile Phe Asn Arg Leu Lys Leu Val Pro Lys Lys Val Asp Leu Ser Gln

420 425 430

Gln Lys Glu Ile Pro Thr Thr Leu Val Asp Asp Phe Ile Leu Ser Pro

435 440 445

Val Val Lys Arg Ser Phe Ile Gln Ser Ile Lys Val Ile Asn Ala Ile

450 455 460

Ile Lys Lys Tyr Gly Leu Pro Asn Asp Ile Ile Ile Glu Leu Ala Arg

465 470 475 480

Glu Lys Asn Ser Lys Asp Ala Gln Lys Met Ile Asn Glu Met Gln Lys

485 490 495

Arg Asn Arg Gln Thr Asn Glu Arg Ile Glu Glu Ile Ile Arg Thr Thr

500 505 510

Gly Lys Glu Asn Ala Lys Tyr Leu Ile Glu Lys Ile Lys Leu His Asp

515 520 525

Met Gln Glu Gly Lys Cys Leu Tyr Ser Leu Glu Ala Ile Pro Leu Glu

530 535 540

Asp Leu Leu Asn Asn Pro Phe Asn Tyr Glu Val Asp His Ile Ile Pro

545 550 555 560

Arg Ser Val Ser Phe Asp Asn Ser Phe Asn Asn Lys Val Leu Val Lys

565 570 575

Gln Glu Glu Ala Ser Lys Lys Gly Asn Arg Thr Pro Phe Gln Tyr Leu

580 585 590

Ser Ser Ser Asp Ser Lys Ile Ser Tyr Glu Thr Phe Lys Lys His Ile

595 600 605

Leu Asn Leu Ala Lys Gly Lys Gly Arg Ile Ser Lys Thr Lys Lys Glu

610 615 620

Tyr Leu Leu Glu Glu Arg Asp Ile Asn Arg Phe Ser Val Gln Lys Asp

625 630 635 640

Phe Ile Asn Arg Asn Leu Val Asp Thr Arg Tyr Ala Thr Arg Gly Leu

645 650 655

Met Asn Leu Leu Arg Ser Tyr Phe Arg Val Asn Asn Leu Asp Val Lys

660 665 670

Val Lys Ser Ile Asn Gly Gly Phe Thr Ser Phe Leu Arg Arg Lys Trp

675 680 685

Lys Phe Lys Lys Glu Arg Asn Lys Gly Tyr Lys His His Ala Glu Asp

690 695 700

Ala Leu Ile Ile Ala Asn Ala Asp Phe Ile Phe Lys Glu Trp Lys Lys

705 710 715 720

Leu Asp Lys Ala Lys Lys Val Met Glu Asn Gln Met Phe Glu Glu Lys

725 730 735

Gln Ala Glu Ser Met Pro Glu Ile Glu Thr Glu Gln Glu Tyr Lys Glu

740 745 750

Ile Phe Ile Thr Pro His Gln Ile Lys His Ile Lys Asp Phe Lys Asp

755 760 765

Tyr Lys Tyr Ser His Arg Val Asp Lys Lys Pro Asn Arg Glu Leu Ile

770 775 780

Asn Asp Thr Leu Tyr Ser Thr Arg Lys Asp Asp Lys Gly Asn Thr Leu

785 790 795 800

Ile Val Asn Asn Leu Asn Gly Leu Tyr Asp Lys Asp Asn Asp Lys Leu

805 810 815

Lys Lys Leu Ile Asn Lys Ser Pro Glu Lys Leu Leu Met Tyr His His

820 825 830

Asp Pro Gln Thr Tyr Gln Lys Leu Lys Leu Ile Met Glu Gln Tyr Gly

835 840 845

Asp Glu Lys Asn Pro Leu Tyr Lys Tyr Tyr Glu Glu Thr Gly Asn Tyr

850 855 860

Leu Thr Lys Tyr Ser Lys Lys Asp Asn Gly Pro Val Ile Lys Lys Ile

865 870 875 880

Lys Tyr Tyr Gly Asn Lys Leu Asn Ala His Leu Asp Ile Thr Asp Asp

885 890 895

Tyr Pro Asn Ser Arg Asn Lys Val Val Lys Leu Ser Leu Lys Pro Tyr

900 905 910

Arg Phe Asp Val Tyr Leu Asp Asn Gly Val Tyr Lys Phe Val Thr Val

915 920 925

Lys Asn Leu Asp Val Ile Lys Lys Glu Asn Tyr Tyr Glu Val Asn Ser

930 935 940

Lys Cys Tyr Glu Glu Ala Lys Lys Leu Lys Lys Ile Ser Asn Gln Ala

945 950 955 960

Glu Phe Ile Ala Ser Phe Tyr Asn Asn Asp Leu Ile Lys Ile Asn Gly

965 970 975

Glu Leu Tyr Arg Val Ile Gly Val Asn Asn Asp Leu Leu Asn Arg Ile

980 985 990

Glu Val Asn Met Ile Asp Ile Thr Tyr Arg Glu Tyr Leu Glu Asn Met

995 1000 1005

Asn Asp Lys Arg Pro Pro Arg Ile Ile Lys Thr Ile Ala Ser Lys

1010 1015 1020

Thr Gln Ser Ile Lys Lys Tyr Ser Thr Asp Ile Leu Gly Asn Leu

1025 1030 1035

Tyr Glu Val Lys Ser Lys Lys His Pro Gln Ile Ile Lys Lys Gly

1040 1045 1050

<210> 124

<211> 76

<212> DNA

<213> 金黄色葡萄球菌（Staphylococcus aureus）

<220>

<221> misc_feature

<222> (1)..(76)

<223> SaCas9 gRNA骨架序列

<400> 124

gttttagtac tctggaaaca gaatctacta aaacaaggca aaatgccgtg tttatctcgt 60

caacttgttg gcgaga 76

<210> 125

<211> 501

<212> DNA

<213> 人工序列

<220>

<223> miniVR DNA

<400> 125

gatgcactcg atgattttga cctcgatatg cttgggagtg atgcgctcga tgacttcgat 60

ttggatatgc ttggatctga tgccctcgac gatttcgacc ttgatatgct cgggtcagac 120

gctttggatg actttgacct tgacatgctg gggagcggct cccccgcacc ggcagttaca 180

ccggaggcca gtcacttgct cgaagatcct gacgaggaaa ccagccaggc cgtaaaggcg 240

ttgcgggaga tggctgacac agtaataccc caaaaagagg aggctgcgat ttgtgggcag 300

atggatttgt cccaccctcc accgagaggt catcttgacg aattgacaac gacgctcgaa 360

tccatgaccg aggacctgaa cctcgatagc ccgctcaccc ccgagttgaa tgagatcctg 420

gatacatttc ttaatgatga gtgtttgctt cacgcaatgc atatttctac gggtcttagt 480

attttcgaca cgagcctgtt t 501

<210> 126

<211> 167

<212> PRT

<213> 人工序列

<220>

<223> miniVR蛋白

<400> 126

Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Gly Ser Asp Ala Leu

1 5 10 15

Asp Asp Phe Asp Leu Asp Met Leu Gly Ser Asp Ala Leu Asp Asp Phe

20 25 30

Asp Leu Asp Met Leu Gly Ser Asp Ala Leu Asp Asp Phe Asp Leu Asp

35 40 45

Met Leu Gly Ser Gly Ser Pro Ala Pro Ala Val Thr Pro Glu Ala Ser

50 55 60

His Leu Leu Glu Asp Pro Asp Glu Glu Thr Ser Gln Ala Val Lys Ala

65 70 75 80

Leu Arg Glu Met Ala Asp Thr Val Ile Pro Gln Lys Glu Glu Ala Ala

85 90 95

Ile Cys Gly Gln Met Asp Leu Ser His Pro Pro Pro Arg Gly His Leu

100 105 110

Asp Glu Leu Thr Thr Thr Leu Glu Ser Met Thr Glu Asp Leu Asn Leu

115 120 125

Asp Ser Pro Leu Thr Pro Glu Leu Asn Glu Ile Leu Asp Thr Phe Leu

130 135 140

Asn Asp Glu Cys Leu Leu His Ala Met His Ile Ser Thr Gly Leu Ser

145 150 155 160

Ile Phe Asp Thr Ser Leu Phe

165

<210> 127

<211> 82

<212> RNA

<213> 金黄色葡萄球菌（Staphylococcus aureus）

<220>

<221> misc_feature

<222> (1)..(82)

<223> tracrRNA

<400> 127

guuuuaguac ucuggaaaca gaaucuacua aaacaaggca aaaugccgug uuuaucucgu 60

caacuuguug gcgagauuuu uu 82

<210> 128

<211> 241

<212> DNA

<213> 人工序列

<220>

<223> U6启动子

<400> 128

gagggcctat ttcccatgat tccttcatat ttgcatatac gatacaaggc tgttagagag 60

ataattagaa ttaatttgac tgtaaacaca aagatattag tacaaaatac gtgacgtaga 120

aagtaataat ttcttgggta gtttgcagtt ttaaaattat gttttaaaat ggactatcat 180

atgcttaccg taacttgaaa gtatttcgat ttcttggctt tatatatctt gtggaaagga 240

c 241

<210> 129

<211> 21

<212> DNA

<213> 智人（Homo sapiens）

<400> 129

cttgttaaat gaatgaatga a 21

<210> 130

<211> 21

<212> DNA

<213> 智人（Homo sapiens）

<400> 130

tgtcctagaa accttacaag g 21

<210> 131

<211> 21

<212> DNA

<213> 智人（Homo sapiens）

<400> 131

ggtttattgc tggcttaata t 21

<210> 132

<211> 21

<212> DNA

<213> 智人（Homo sapiens）

<400> 132

acgtcagcaa actgagatgg g 21

<210> 133

<211> 21

<212> DNA

<213> 智人（Homo sapiens）

<400> 133

ttttcggata atctgaataa g 21

<210> 134

<211> 21

<212> DNA

<213> 智人（Homo sapiens）

<400> 134

ggggtccgct ctccagatga g 21

<210> 135

<211> 21

<212> DNA

<213> 智人（Homo sapiens）

<400> 135

ggctcctcta ggagtttgac a 21

<210> 136

<211> 21

<212> DNA

<213> 智人（Homo sapiens）

<400> 136

taatgtgact acagcccccg a 21

<210> 137

<211> 21

<212> DNA

<213> 智人（Homo sapiens）

<400> 137

ccaagtccca gagtcgaaga t 21

<210> 138

<211> 21

<212> DNA

<213> 智人（Homo sapiens）

<400> 138

tcagttgcag caagagatcc c 21

<210> 139

<211> 21

<212> DNA

<213> 智人（Homo sapiens）

<400> 139

cctcctcctc gaaaaacgca c 21

<210> 140

<211> 21

<212> DNA

<213> 智人（Homo sapiens）

<400> 140

gggagggtcg gctcagacct a 21

<210> 141

<211> 21

<212> DNA

<213> 智人（Homo sapiens）

<400> 141

gggtagttct gcggtgacgg a 21

<210> 142

<211> 21

<212> DNA

<213> 智人（Homo sapiens）

<400> 142

attttaggta aacacccaaa g 21

<210> 143

<211> 21

<212> DNA

<213> 智人（Homo sapiens）

<400> 143

gaaacacagt aaaagaaaac g 21

<210> 144

<211> 21

<212> DNA

<213> 智人（Homo sapiens）

<400> 144

taagatttta ggaattatac a 21

<210> 145

<211> 21

<212> DNA

<213> 智人（Homo sapiens）

<400> 145

agcgttctga agggagagtt a 21

<210> 146

<211> 21

<212> DNA

<213> 智人（Homo sapiens）

<400> 146

cagaaggcta ggtgagaaac t 21

<210> 147

<211> 21

<212> DNA

<213> 智人（Homo sapiens）

<400> 147

aatttgagta cacttaaggc a 21

<210> 148

<211> 21

<212> DNA

<213> 智人（Homo sapiens）

<400> 148

agatacagca gaaaaggtga t 21

<210> 149

<211> 21

<212> DNA

<213> 智人（Homo sapiens）

<400> 149

gacacatgca gaagtgacag c 21

<210> 150

<211> 21

<212> DNA

<213> 智人（Homo sapiens）

<400> 150

agcagccttc gaactgcaca c 21

<210> 151

<211> 21

<212> DNA

<213> 智人（Homo sapiens）

<400> 151

tctagatggc agtaaacagc a 21

<210> 152

<211> 21

<212> DNA

<213> 智人（Homo sapiens）

<400> 152

ggctgctcca atcattttgg t 21

<210> 153

<211> 21

<212> DNA

<213> 智人（Homo sapiens）

<400> 153

gagtccggag accgaaccag a 21

<210> 154

<211> 21

<212> DNA

<213> 智人（Homo sapiens）

<400> 154

gaaccgtgcg tgccgggagc c 21

<210> 155

<211> 21

<212> DNA

<213> 智人（Homo sapiens）

<400> 155

gctggcctgg ggcgcgcgct c 21

<210> 156

<211> 21

<212> DNA

<213> 智人（Homo sapiens）

<400> 156

aagatcagcc ccactacgtt c 21

<210> 157

<211> 21

<212> DNA

<213> 智人（Homo sapiens）

<400> 157

ccggaggcga gccccttccc g 21

<210> 158

<211> 21

<212> DNA

<213> 智人（Homo sapiens）

<400> 158

ggagggtggg gcgcaggacc g 21

<210> 159

<211> 21

<212> DNA

<213> 智人（Homo sapiens）

<400> 159

gagcgctgga ggcggaggag g 21

<210> 160

<211> 21

<212> DNA

<213> 智人（Homo sapiens）

<400> 160

cctctctcgc gcacaaagtt g 21

<210> 161

<211> 21

<212> DNA

<213> 智人（Homo sapiens）

<400> 161

gggagcggcg ccccccttct t 21

<210> 162

<211> 21

<212> DNA

<213> 智人（Homo sapiens）

<400> 162

caccaacttt gccaaacgct a 21

<210> 163

<211> 21

<212> DNA

<213> 智人（Homo sapiens）

<400> 163

ggagtaaccg cgggggtgtg t 21

<210> 164

<211> 21

<212> DNA

<213> 智人（Homo sapiens）

<400> 164

gaatggggcg ggggccggga g 21

<210> 165

<211> 21

<212> DNA

<213> 智人（Homo sapiens）

<400> 165

tctttctgtg gttcttccgc c 21

<210> 166

<211> 21

<212> DNA

<213> 智人（Homo sapiens）

<400> 166

tttggatcgt tcacaactag t 21

<210> 167

<211> 21

<212> DNA

<213> 智人（Homo sapiens）

<400> 167

agaggggacg tggcctctta g 21

<210> 168

<211> 21

<212> DNA

<213> 智人（Homo sapiens）

<400> 168

gtccacagga gagggtgggc a 21

<210> 169

<211> 21

<212> DNA

<213> 智人（Homo sapiens）

<400> 169

gctcccaagg gtggggctcc g 21

<210> 170

<211> 21

<212> DNA

<213> 智人（Homo sapiens）

<400> 170

tttcagatgg caggttgttc a 21

<210> 171

<211> 21

<212> DNA

<213> 智人（Homo sapiens）

<400> 171

ctttcccagc cttcaggtca g 21

<210> 172

<211> 21

<212> DNA

<213> 智人（Homo sapiens）

<400> 172

gcgcgcggag ctcgggggag g 21

<210> 173

<211> 21

<212> DNA

<213> 智人（Homo sapiens）

<400> 173

tgaggccggt gcaacttaca a 21

<210> 174

<211> 21

<212> DNA

<213> 智人（Homo sapiens）

<400> 174

tgggcgtggg agacgcagcc t 21

<210> 175

<211> 21

<212> DNA

<213> 智人（Homo sapiens）

<400> 175

aggtggagga atgcgaagct t 21

<210> 176

<211> 21

<212> DNA

<213> 智人（Homo sapiens）

<400> 176

agacaactct ttaactctcc t 21

<210> 177

<211> 21

<212> DNA

<213> 人工序列

<220>

<223> 编码对照sgRNA的crRNA的序列

<400> 177

acggaggcta agcgtcgcaa g 21

<210> 178

<211> 16

<212> PRT

<213> 人工序列

<220>

<223> 核定位信号

<400> 178

Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala Ala

1 5 10 15

<210> 179

<211> 48

<212> DNA

<213> 人工序列

<220>

<223> 编码SEQ ID NO 178的NLS的DNA序列

<400> 179

gccccaaaga agaagcggaa ggtcggtatc cacggagtcc cagcagcc 48

<210> 180

<211> 16

<212> PRT

<213> 人工序列

<220>

<223> 核定位信号

<400> 180

Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys

1 5 10 15

<210> 181

<211> 48

<212> DNA

<213> 人工序列

<220>

<223> 编码SEQ ID NO 180的NLS的DNA序列

<400> 181

aaaaggccgg cggccacgaa aaaggccggc caggcaaaaa agaaaaag 48

<210> 182

<211> 3414

<212> DNA

<213> 人工序列

<220>

<223> 编码dSaCas9(D10A, N580A)-VP64的DNA序列

<400> 182

atggccccaa agaagaagcg gaaggtcggt atccacggag tcccagcagc caagcggaac 60

tacatcctgg gcctggccat cggcatcacc agcgtgggct acggcatcat cgactacgag 120

acacgggacg tgatcgatgc cggcgtgcgg ctgttcaaag aggccaacgt ggaaaacaac 180

gagggcaggc ggagcaagag aggcgccaga aggctgaagc ggcggaggcg gcatagaatc 240

cagagagtga agaagctgct gttcgactac aacctgctga ccgaccacag cgagctgagc 300

ggcatcaacc cctacgaggc cagagtgaag ggcctgagcc agaagctgag cgaggaagag 360

ttctctgccg ccctgctgca cctggccaag agaagaggcg tgcacaacgt gaacgaggtg 420

gaagaggaca ccggcaacga gctgtccacc aaagagcaga tcagccggaa cagcaaggcc 480

ctggaagaga aatacgtggc cgaactgcag ctggaacggc tgaagaaaga cggcgaagtg 540

cggggcagca tcaacagatt caagaccagc gactacgtga aagaagccaa acagctgctg 600

aaggtgcaga aggcctacca ccagctggac cagagcttca tcgacaccta catcgacctg 660

ctggaaaccc ggcggaccta ctatgaggga cctggcgagg gcagcccctt cggctggaag 720

gacatcaaag aatggtacga gatgctgatg ggccactgca cctacttccc cgaggaactg 780

cggagcgtga agtacgccta caacgccgac ctgtacaacg ccctgaacga cctgaacaat 840

ctcgtgatca ccagggacga gaacgagaag ctggaatatt acgagaagtt ccagatcatc 900

gagaacgtgt tcaagcagaa gaagaagccc accctgaagc agatcgccaa agaaatcctc 960

gtgaacgaag aggatattaa gggctacaga gtgaccagca ccggcaagcc cgagttcacc 1020

aacctgaagg tgtaccacga catcaaggac attaccgccc ggaaagagat tattgagaac 1080

gccgagctgc tggatcagat tgccaagatc ctgaccatct accagagcag cgaggacatc 1140

caggaagaac tgaccaatct gaactccgag ctgacccagg aagagatcga gcagatctct 1200

aatctgaagg gctataccgg cacccacaac ctgagcctga aggccatcaa cctgatcctg 1260

gacgagctgt ggcacaccaa cgacaaccag atcgctatct tcaaccggct gaagctggtg 1320

cccaagaagg tggacctgtc ccagcagaaa gagatcccca ccaccctggt ggacgacttc 1380

atcctgagcc ccgtcgtgaa gagaagcttc atccagagca tcaaagtgat caacgccatc 1440

atcaagaagt acggcctgcc caacgacatc attatcgagc tggcccgcga gaagaactcc 1500

aaggacgccc agaaaatgat caacgagatg cagaagcgga accggcagac caacgagcgg 1560

atcgaggaaa tcatccggac caccggcaaa gagaacgcca agtacctgat cgagaagatc 1620

aagctgcacg acatgcagga aggcaagtgc ctgtacagcc tggaagccat ccctctggaa 1680

gatctgctga acaacccctt caactatgag gtggaccaca tcatccccag aagcgtgtcc 1740

ttcgacaaca gcttcaacaa caaggtgctc gtgaagcagg aagaagccag caagaagggc 1800

aaccggaccc cattccagta cctgagcagc agcgacagca agatcagcta cgaaaccttc 1860

aagaagcaca tcctgaatct ggccaagggc aagggcagaa tcagcaagac caagaaagag 1920

tatctgctgg aagaacggga catcaacagg ttctccgtgc agaaagactt catcaaccgg 1980

aacctggtgg ataccagata cgccaccaga ggcctgatga acctgctgcg gagctacttc 2040

agagtgaaca acctggacgt gaaagtgaag tccatcaatg gcggcttcac cagctttctg 2100

cggcggaagt ggaagtttaa gaaagagcgg aacaaggggt acaagcacca cgccgaggac 2160

gccctgatca ttgccaacgc cgatttcatc ttcaaagagt ggaagaaact ggacaaggcc 2220

aaaaaagtga tggaaaacca gatgttcgag gaaaagcagg ccgagagcat gcccgagatc 2280

gaaaccgagc aggagtacaa agagatcttc atcacccccc accagatcaa gcacattaag 2340

gacttcaagg actacaagta cagccaccgg gtggacaaga agcctaatag agagctgatt 2400

aacgacaccc tgtactccac ccggaaggac gacaagggca acaccctgat cgtgaacaat 2460

ctgaacggcc tgtacgacaa ggacaatgac aagctgaaaa agctgatcaa caagagcccc 2520

gaaaagctgc tgatgtacca ccacgacccc cagacctacc agaaactgaa gctgattatg 2580

gaacagtacg gcgacgagaa gaatcccctg tacaagtact acgaggaaac cgggaactac 2640

ctgaccaagt actccaaaaa ggacaacggc cccgtgatca agaagattaa gtattacggc 2700

aacaaactga acgcccatct ggacatcacc gacgactacc ccaacagcag aaacaaggtc 2760

gtgaagctgt ccctgaagcc ctacagattc gacgtgtacc tggacaatgg cgtgtacaag 2820

ttcgtgaccg tgaagaatct ggatgtgatc aaaaaagaaa actactacga agtgaatagc 2880

aagtgctatg aggaagctaa gaagctgaag aagatcagca accaggccga gtttatcgcc 2940

tccttctaca acaacgatct gatcaagatc aacggcgagc tgtatagagt gatcggcgtg 3000

aacaacgacc tgctgaaccg gatcgaagtg aacatgatcg acatcaccta ccgcgagtac 3060

ctggaaaaca tgaacgacaa gaggcccccc aggatcatta agacaatcgc ctccaagacc 3120

cagagcatta agaagtacag cacagacatt ctgggcaacc tgtatgaagt gaaatctaag 3180

aagcaccctc agatcatcaa aaagggcaaa aggccggcgg ccacgaaaaa ggccggccag 3240

gcaaaaaaga aaaagtctag agatgcttta gacgattttg acttagatat gcttggttca 3300

gacgcgttag acgacttcga cctagacatg ttaggctcag atgcattgga cgacttcgat 3360

ttagatatgt tgggctccga tgccctagat gactttgatt tggatatgct ataa 3414

<210> 183

<211> 4392

<212> DNA

<213> 人工序列

<220>

<223> 编码dSaCas9(D10A, N580A)-VPH的DNA序列

<400> 183