首页> 中国专利> 一种用于丝状真菌Crispr-Cas系统的Cas9编码基因及其应用

一种用于丝状真菌Crispr-Cas系统的Cas9编码基因及其应用

摘要

本发明提供了用于丝状真菌Crispr-Cas系统的Cas9编码基因及其应用。具体地,本发明涉及一种适合于丝状真菌异源表达Cas9编码基因的密码子优化方案以及含有所述编码基因的表达载体和宿主细胞。本发明还涉及利用密码子优化Cas9基因构建CRISPR/Cas的基因组编辑方法。本发明的密码子优化方案,能有效的提高Cas9基因在丝状真菌的表达量,能成功的应用于CRISPR/Cas的基因组编辑方法,给丝状真菌的分子改造带来极大的便利。

著录项

  • 公开/公告号CN105695485A

    专利类型发明专利

  • 公开/公告日2016-06-22

    原文格式PDF

  • 申请/专利权人 中国科学院上海生命科学研究院;

    申请/专利号CN201410606474.0

  • 发明设计人 周志华;邹根;刘睿;陈玲;江艳萍;

    申请日2014-11-27

  • 分类号C12N15/31(20060101);C12N15/80(20060101);C12N1/15(20060101);C12R1/885(20060101);C12R1/66(20060101);C12R1/645(20060101);

  • 代理机构31266 上海一平知识产权代理有限公司;

  • 代理人崔佳佳;马莉华

  • 地址 200031 上海市徐汇区岳阳路319号

  • 入库时间 2023-12-18 15:32:47

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2020-05-19

    专利权的转移 IPC(主分类):C12N15/31 登记生效日:20200430 变更前: 变更后: 申请日:20141127

    专利申请权、专利权的转移

  • 2020-02-21

    授权

    授权

  • 2016-07-20

    实质审查的生效 IPC(主分类):C12N15/31 申请日:20141127

    实质审查的生效

  • 2016-06-22

    公开

    公开

说明书

技术领域

本发明属于生物技术领域,涉及一种Cas9编码基因密码子优化方案,及其在丝状真菌Cripr-Cas基因组编辑系统中的应用。

背景技术

基因组编辑技术是进行功能基因组研究的一类重要工具,它们可以让研究人员能够在多种物种中实现精确的修饰,有着核苷酸水平的精确度,精准而高效。锌指核酸酶技术(ZFNs)、类转录激活因子核酸酶技术(TALENs)以及CRISPR/Cas技术是近年来发展起来的3种主流基因组编辑技术。

上述3种基因组编辑技术的原理都是通过在生物基因组特定位点制造DNA断裂损伤,从而激活机体自身的DNA损伤修复机制,在此过程中引发各种变异。ZFNs是最早发展的通用基因组编辑技术,可用以实施定点敲除和定点敲入变异,但ZFNs技术的发展受限于构建难度大、成本高等缺点。TALENs技术在ZFNs基础上发展而来,较ZFNs技术而言,TALENs技术具备构建灵活度高、成本低等优势.不同于ZFNs与TALENs技术,CRISPR/Cas技术具有独特的DNA靶向机制,,这种机制使其非常适合进行多位点编辑。

目前,CRISPR/Cas系统已在多种物种中测试成功,例如小鼠、斑马鱼、果蝇、线虫和家蚕。但是本领域中仍然缺乏适用于丝状真菌的Crispr-Cas系统。

发明内容

本发明的目的在于提供一种用于丝状真菌Crispr-Cas系统的Cas9编码基因及其应用。

本发明提供了包括密码子优化的Cas9基因的表达载体和宿主细胞,以及利用密码子优化的Cas9基因构建CRISPR/Cas基因组编辑的方法。

在本发明的第一方面,提供了一种分离的多核苷酸,所述多核苷酸选自下组:

(a)序列如SEQIDNO.:1的第4-4116位所示的多核苷酸;

(b)核苷酸序列与(a)中多核苷酸的同源性≥95%(较佳地≥98%)并且编码Cas9蛋白的多核苷酸;

(c)与(a)-(b)任一所述的多核苷酸互补的多核苷酸。

在另一优选例中,所述多核苷酸的序列如SEQIDNO.:1所示。

在另一优选例中,所述的互补为完全互补。

本发明的第二方面,提供了一种表达载体,它含有本发明第一方面所述的多核苷酸。

在另一优选例中,所述表达载体为组成型表达载体或诱导型表达载体。

在另一优选例中,所述组成型表达载体中的组成型启动子选自下组:Ppdc、Ppki、Ptef1和Pgpda等启动子。

在另一优选例中,所述诱导型表达载体中的诱导型启动子选自下组:Pcbh1、Pcbh2、Peg1和Pxyn2等启动子。

在另一优选例中,所述表达载体具有选自下组的质粒骨架:pDHt/sk质粒、pMD-18T、pXBthg、pAN52等。

本发明的第三方面,提供了一种遗传工程化的宿主细胞,它含有本发明第二方面所述的表达载体,或其基因组中整合有本发明第一方面所述的多核苷酸。

在另一优选例中,所述宿主细胞为真菌细胞,较佳地为丝状真菌细胞。

在另一优选例中,所述丝状真菌包括但不限于:里氏木霉(Trichodermareesei)、曲霉菌(Aspergillussp.)、脉孢霉(Neurosporasp.)等。

在另一优选例中,所述宿主细胞的基因组中插入有编码异源蛋白的多核苷酸序列。

在另一优选例中,所述异源蛋白的多核苷酸序列通过CRISPR/Cas系统插入所述宿主细胞的基因组中。

本发明的第四方面,提供了一种基于CRISPR/CAS技术的真菌系统,所述的系统包括

(i)真菌细胞,所述真菌细胞表达外源的Cas9蛋白;和

(ii)用于CRISPR/CAS系统(CRISPR/Cas技术)的gRNA;或用于产生所述gRNA的表达载体。

在另一优选例中,所述的Cas9蛋白包括:Streptococcuspyogenes的Cas9。

在另一优选例中,所述的真菌细胞为丝状真菌细胞。

在另一优选例中,所述的真菌细胞中,编码所述Cas9蛋白的核苷酸序列如SEQIDNO.:1所示(或者与SEQIDNO.:1所示序列的同源性≥95%,较佳地≥98%)。

本发明的第五方面,提供了一种基因组编辑方法,所述方法包括步骤:利用CRISPR/Cas系统(CRISPR/Cas技术)对本发明第三方面所述的宿主细胞进行基因组编辑。

在另一优选例中,所述基因组编辑包括但不限于:基因突变、基因敲除、基因插入、大片段敲除或者多拷贝表达。

在另一优选例中,所述基因组编辑方法包括步骤:

(a)培养本发明第三方面所述的宿主细胞;

(b)利用CRISPR/Cas系统,在所述宿主细胞中的待编辑的基因组位点进行基因组编辑,从而形成基因组发生编辑的宿主细胞;

(c)利用筛选标记,从培养物中分离出所述的基因组发生编辑的宿主细胞。

在另一优选例中,所述步骤(b)中,包括以下具体步骤:

(b1)收获(a)中宿主细胞所产的分生孢子,制备原生质体;

(b2)设定需要发生编辑的目标基因,其中保守的间隔相邻基序(PAM)为寡核苷酸NGG;

(b3)融合gRNA序列和靶标核苷酸序列,并转录成RNA;

(b4)利用原生质体转化方法导入到宿主细胞(原生质体)中。

在另一优选例中,所述目标基因中编辑序列长度为15-30bp,优选为20bp。

在另一优选例中,在步骤(c)中,利用筛选标记,从培养物中分离出基因组发生突变的宿主细胞、基因组上插入了异源基因的宿主细胞、或基因组上敲除了目的基因的宿主细胞。

在另一优选例中,所述基因组编辑的方法中,基因突变的步骤包括:

(a)培养本发明第三方面所述的宿主细胞;

(b)利用CRISPR/Cas系统,设定需要突变的基因组位点;

(c)利用筛选标记从培养物中分离出基因组发生突变的宿主细胞。

在另一优选例中,所述基因组编辑的方法中,基因插入的步骤包括:

(a)培养本发明第三方面所述的宿主细胞;

(b)利用CRISPR/Cas系统,设定异源基因插入的基因组位点;

(c)利用筛选标记从培养物中分离出基因组上插入了异源基因的宿主细胞。

在另一优选例中,所述基因组编辑的方法中,基因敲除的步骤包括:

(a)培养本发明第三方面所述的宿主细胞;

(b)利用CRISPR/Cas系统,设定敲除基因所在的基因组位点;

(c)利用筛选标记从培养物中分离出基因组上敲除了目的基因的宿主细胞。

应理解,在本发明范围内中,本发明的上述各技术特征和在下文(如实施例)中具体描述的各技术特征之间都可以互相组合,从而构成新的或优选的技术方案。限于篇幅,在此不再一一累述。

附图说明

图1为验证Cas9在里氏木霉Rut-C30中的表达情况的SDS-PAGE和WesternBlot图。图1A为SDS-PAGE验证提取胞内总蛋白图,图1B为对应的WesternBlot检测。其中泳道M1和M2为蛋白Marker(分子量从上到下依次为97.2,66.4,44.3,29.0,20.1,14.3kDa),泳道1为含有EGFP的一个已知蛋白,作为阳性对照,泳道2是C30-pe转化子培养48h后抽提的胞内蛋白,泳道3,4是C30-ce转化子培养24h和48h后抽提的胞内蛋白样品。泳道5,6,7,8和图1A的SDS-PAGE图谱样品一一对应。Cas9-EGFP融合蛋白大小约为190kDa,从图中可以看出C30-pe和C30-ce转化子中都成功表达了Cas9-EGFP融合蛋白。

图2是gRNA体外转录验证。图中泳道M为DS-2000DNAMarker电泳结果(片段从上到下依次为2000bp、1000bp、750bp、500bp、250bp、100bp)泳道1-5为稀释后gRNA体外转录产物,其中1号泳道上样量为1μl,2号泳道为2μl,以此类推,直到5号泳道上样量为5μl。

图3是gRNA原生质体转化子ura5测序验证靶标是否发生突变(基于诱导型启动子)。其中Tura5是野生型,共送19个样品测序,编号为1-19,其中6,18,19号转化子靶标处未发生突变,靶标序列为5'GGCGAGGGCGGCAACATCGT3',其中PAM序列小写并加粗。

图4是gRNA原生质体转化子ura5测序验证靶标是否发生突变(基于组成型启动子)。其中Tura5是野生型,共送17个样品测序,编号为1-17,其中1-14号转化子靶标处发生突变,靶标序列为5'GGCGAGGGCGGCAACATCGT3',其中PAM序列小写并加粗。

具体实施方式

本发明人通过广泛而深入的研究,通过对Cas9蛋白编码序列的一系列优化,并经筛选,在多个修饰序列中获得了一个特别适合在丝状真菌中表达的优化序列(SEQIDNO:1)。该优化序列不仅选用了丝状真菌的优选密码子,还消除了一些不利于表达的二级结构,因此有助于在丝状真菌中高效、稳定地表达Cas9蛋白。在此基础上完成了本发明。

CRISPR/Cas系统

该系统为目前发现存在于大多数细菌与所有的古菌中的一种后天免疫系统,以消灭外来的质体或者噬菌体,并在自身基因组中留下外来基因片段作为“记忆”。全名为常间回文重复序列丛集/常间回文重复序列丛集关联蛋白系统(clusteredregularlyinterspacedshortpalindromicrepeats/CRISPR-associatedproteins)。

目前已发现三种不同类型的CRISPR/Cas系统,存在于大约40%和90%已测序的细菌和古菌中。其中第二型的组成较为简单,以Cas9蛋白以及向导RNA(gRNA)为核心的组成,由于其对DNA干扰(DNAi)的特性,目前被积极地应用于遗传工程中,作为基因体剪辑工具,与锌指核酸酶(ZFN)及类转录活化因子核酸酶(TALEN)同样利用非同源性末端接合(NHEJ)的机制,于基因体中产生去氧核糖核酸的双股断裂以利剪辑。二型CRISPR/Cas并经由遗传工程的改造应用于哺乳类细胞及斑马鱼的基因体剪辑。其设计简单以及操作容易的特性为最大的优点。未来将可应用在各种不同的模式生物当中。

称为CRISPR的基因组重复丛集,即原核生物拟核DNA链中的丛生重复序列,在1987关于E.coli的一份研究报告中被首次描述。2000年,相似的重复序列在其它真细菌和古细菌中被发现并被命名为短间隔重复序列(ShortRegularlySpacedRepeats,SRSR)。2002年SRSR被重命名为CRISPR。其中一部分基因编码的蛋白为核酸酶和解旋酶。。这些关联蛋白(CAS,CRISPR-associatedproteins)与CRISPR组成了CRISPR/CAS系统。

CRISPR/Cas技术

本发明所称的“CRISPR/Cas技术”、“CRISPR/Cas基因组编辑”、“CRISPR/Cas基因组编辑技术”、“CRISPR/Cas基因组编辑方法”均指利用CRISPR/Cas系统的原理对目的基因进行改造的基因组编辑技术。

Cas9蛋白

CRISPR/Cas的核心就是Cas9蛋白以及向导RNA(gRNA)。在不同物种中能够利用CRISPR/Cas系统进行基因组编辑的核心技术,首要一步即在该物种中异源表达有DNA剪切酶活性的Cas9蛋白,第二步则是获得gRNA和靶点同源序列将Cas9引导至靶点进行DNA剪切。其中第二步中,具体的操作方法是本领域技术人员所熟知的。

来源于Streptococcuspyogenes的Cas9蛋白是一种多结构域多功能的Cas蛋白,其N端具有类RuvC核酸酶的结构域,其中部具有HNH核酸酶结构域。Cas9蛋白与gRNA结合能够实现在特异位点处切割DNA,来源于Streptococcuspyogenes的CRISPR/Cas系统识别序列为23bp,并能靶向20bp,其识别位点最末3位NGG序列被称作PAM(protospaceradjacentmotif)序列,其对于DNA切割非常重要。目前大多数真核生物(包括家蚕、拟南芥、酵母、线虫等)的CRISPR/Cas系统最初均源自Streptococcuspyogenes,Cas9蛋白则均是经过人源化改造。而这一系统目前在丝状真菌中还未有报道。

在本发明一个优选地实施方式中,提供了一种酿脓链球菌(Streptococcuspyogenes)的Cas9编码基因密码子优化方案,及其在丝状真菌Cripr-Cas基因组编辑系统中的应用。

较佳地,本发明所提供的Cas9来源于Streptococcuspyogenes,经过密码子偏爱性优化之后具有SEQIDNo.1所示的序列。

为了便于密码子优化的Cas9基因在宿主中表达,还可在构建表达载体时,将优化的Cas9基因构建在强组成型启动子(如:pdc启动子(Lietal.MicrobialCellFactories2012,11:84),但不限于此),和强诱导型启动子(如:cbh1启动子(Zouetal.MicrobialCellFactories2012,11:21),但不限于此)的下游。

上述密码子优化的Cas9编码基因,可具有下述核苷酸序列之一:

1)SEQIDNo:1的5’端第1-4137位核苷酸序列;

2)SEQIDNo:1的核苷酸序列;

3)核苷酸序列与SEQIDNO.:1所示序列的同源性≥95%(较佳地≥98%)的多核苷酸序列;

4)在高严谨条件下可与SEQIDNo:1限定的序列及其同源性95%以上的序列杂交的核苷酸序列。

上述高严谨条件可为在0.1×SSPE(或0.1×SSC),0.1%SDS的溶液中,在65℃下杂交并洗膜。

在本发明一个优选地实施方式中,所述密码子优化的Cas9编码基因序列如下所示:

ATGGACAAGAAGTACAGCATTGGCCTGGACATTGGCACGAACTCGGTCGGCTGGGCCGTCATCACGGACGAGTACAAGGTCCCCTCCAAGAAGTTTAAGGTCCTGGGCAACACCGACCGCCACTCCATCAAGAAGAACCTCATTGGCGCCCTGCTCTTCGACTCCGGCGAGACCGCCGAGGCCACCCGCCTCAAGCGCACCGCCCGCCGCCGATACACGCGCCGCAAGAACCGCATCTGCTACCTGCAGGAGATTTTCTCCAACGAGATGGCCAAGGTCGACGACTCCTTCTTTCACCGCCTGGAGGAGTCGTTCCTCGTCGAGGAAGACAAGAAGCACGAGCGCCACCCCATCTTTGGCAACATTGTCGACGAGGTCGCCTACCACGAGAAGTACCCCACGATCTACCACCTGCGCAAGAAGCTCGTCGACTCCACCGACAAGGCCGACCTCCGCCTGATCTACCTCGCCCTGGCCCACATGATTAAGTTCCGCGGCCACTTTCTGATCGAGGGCGACCTCAACCCCGACAACAGCGACGTCGACAAGCTGTTCATCCAGCTCGTCCAGACCTACAACCAGCTCTTTGAGGAGAACCCCATTAACGCCTCCGGCGTCGACGCCAAGGCCATCCTCTCGGCCCGCCTCTCCAAGAGCCGCCGACTCGAGAACCTGATCGCCCAGCTGCCCGGCGAGAAGAAGAACGGCCTGTTCGGCAACCTCATCGCCCTCTCCCTGGGCCTCACCCCCAACTTCAAGTCGAACTTTGACCTCGCCGAGGACGCCAAGCTGCAGCTCTCCAAGGACACCTACGACGACGACCTGGACAACCTCCTGGCCCAGATCGGCGACCAGTACGCCGACCTGTTCCTCGCCGCCAAGAACCTGTCCGACGCCATCCTCCTGTCGGACATTCTCCGCGTCAACACCGAGATTACGAAGGCCCCTCTCTCCGCCTCGATGATCAAGCGCTACGACGAGCACCACCAGGACCTGACCCTGCTCAAGGCCCTGGTCCGCCAGCAGCTCCCCGAGAAGTACAAGGAGATCTTCTTTGACCAGAGCAAGAACGGCTACGCCGGCTACATCGACGGCGGCGCTAGCCAAGAGGAGTTCTACAAGTTTATCAAGCCCATTCTGGAGAAGATGGACGGCACGGAGGAGCTCCTGGTCAAGCTCAACCGCGAGGACCTCCTGCGCAAGCAGCGCACCTTCGACAACGGCAGCATCCCCCACCAGATTCACCTCGGCGAGCTGCACGCCATCCTCCGCCGACAAGAGGACTTCTACCCCTTTCTCAAGGACAACCGCGAGAAGATCGAGAAGATTCTGACGTTCCGCATCCCCTACTACGTCGGCCCCCTGGCCCGCGGCAACAGCCGCTTTGCCTGGATGACCCGCAAGTCCGAGGAGACCATCACGCCCTGGAACTTCGAGGAAGTCGTCGACAAGGGCGCCTCGGCCCAGTCCTTCATCGAGCGCATGACCAACTTTGACAAGAACCTGCCCAACGAGAAGGTCCTCCCCAAGCACTCGCTCCTGTACGAGTACTTCACCGTCTACAACGAGCTCACGAAGGTCAAGTACGTCACCGAGGGCATGCGCAAGCCCGCCTTCCTGTCGGGCGAGCAGAAGAAGGCCATCGTCGACCTCCTGTTTAAGACCAACCGCAAGGTCACGGTCAAGCAGCTCAAGGAAGACTACTTCAAGAAGATTGAGTGCTTTGACAGCGTCGAGATCTCCGGCGTCGAGGACCGCTTTAACGCCTCCCTGGGCACCTACCACGACCTCCTGAAGATCATTAAGGACAAGGACTTCCTGGACAACGAGGAGAACGAGGACATCCTCGAGGACATTGTCCTGACCCTCACGCTGTTTGAGGACCGCGAGATGATCGAGGAGCGCCTGAAGACGTACGCCCACCTCTTCGACGACAAGGTCATGAAGCAGCTCAAGCGCCGCCGATACACCGGCTGGGGCCGCCTGAGCCGCAAGCTCATCAACGGCATTCGCGACAAGCAGTCGGGCAAGACGATCCTCGACTTCCTGAAGAGCGACGGCTTCGCCAACCGCAACTTTATGCAGCTGATTCACGACGACTCCCTCACCTTCAAGGAAGACATCCAGAAGGCCCAGGTCTCCGGCCAGGGCGACTCCCTGCACGAGCACATCGCCAACCTCGCCGGCAGCCCCGCCATCAAGAAGGGCATTCTGCAGACCGTCAAGGTCGTCGACGAGCTCGTCAAGGTCATGGGCCGCCACAAGCCCGAGAACATCGTCATTGAGATGGCCCGCGAGAACCAGACCACGCAGAAGGGCCAGAAGAACAGCCGCGAGCGCATGAAGCGCATCGAGGAAGGCATCAAGGAGCTGGGCTCCCAGATCCTCAAGGAGCACCCCGTCGAGAACACCCAGCTGCAGAACGAGAAGCTCTACCTGTACTACCTCCAGAACGGCCGCGACATGTACGTCGACCAGGAGCTGGACATTAACCGCCTCTCGGACTACGACGTCGACCACATCGTCCCCCAGAGCTTCCTGAAGGACGACTCCATCGACAACAAGGTCCTCACCCGCAGCGACAAGAACCGCGGCAAGAGCGACAACGTCCCCTCCGAGGAAGTCGTCAAGAAGATGAAGAACTACTGGCGCCAGCTCCTGAACGCCAAGCTGATCACGCAGCGCAAGTTTGACAACCTCACCAAGGCCGAGCGAGGCGGCCTCTCGGAGCTGGACAAGGCCGGCTTCATCAAGCGCCAGCTGGTCGAGACCCGCCAGATCACGAAGCACGTCGCCCAGATTCTCGACTCGCGCATGAACACGAAGTACGACGAGAACGACAAGCTGATCCGCGAGGTCAAGGTCATTACCCTGAAGTCGAAGCTCGTCAGCGACTTCCGCAAGGACTTCCAGTTTTACAAGGTCCGCGAGATCAACAACTACCACCACGCCCACGACGCCTACCTCAACGCCGTCGTCGGCACCGCCCTGATCAAGAAGTACCCCAAGCTCGAGTCCGAGTTCGTCTACGGCGACTACAAGGTCTACGACGTCCGCAAGATGATCGCCAAGTCCGAGCAGGAGATTGGCAAGGCCACCGCCAAGTACTTCTTTTACTCGAACATCATGAACTTCTTTAAGACCGAGATCACCCTCGCCAACGGCGAGATCCGCAAGCGCCCCCTCATTGAGACCAACGGCGAGACCGGCGAGATCGTCTGGGACAAGGGCCGCGACTTCGCCACCGTCCGCAAGGTCCTCAGCATGCCCCAGGTCAACATCGTCAAGAAGACCGAGGTCCAGACGGGCGGCTTCTCGAAGGAGAGCATTCTGCCCAAGCGCAACTCCGACAAGCTCATCGCCCGCAAGAAGGACTGGGACCCCAAGAAGTACGGTGGCTTCGACTCCCCCACCGTCGCCTACTCGGTCCTGGTCGTCGCCAAGGTCGAGAAGGGCAAGTCGAAGAAGCTCAAGAGCGTCAAGGAGCTCCTGGGCATCACCATTATGGAGCGCAGCTCCTTCGAGAAGAACCCCATCGACTTTCTCGAGGCCAAGGGCTACAAGGAAGTCAAGAAGGACCTGATCATTAAGCTCCCCAAGTACTCCCTCTTCGAGCTGGAGAACGGCCGCAAGCGCATGCTCGCCTCCGCCGGCGAGCTCCAGAAGGGCAACGAGCTCGCCCTGCCCAGCAAGTACGTCAACTTCCTCTACCTGGCCAGCCACTACGAGAAGCTCAAGGGCTCCCCCGAGGACAACGAGCAGAAGCAGCTGTTTGTCGAGCAGCACAAGCACTACCTCGACGAGATCATTGAGCAGATTTCCGAGTTCTCGAAGCGCGTCATCCTGGCCGACGCCAACCTGGACAAGGTCCTCAGCGCCTACAACAAGCACCGCGACAAGCCCATCCGCGAGCAGGCCGAGAACATCATTCACCTCTTCACCCTGACCAACCTCGGCGCCCCCGCCGCCTTCAAGTACTTTGACACCACGATCGACCGCAAGCGCTACACCTCGACGAAGGAAGTCCTGGACGCCACCCTCATCCACCAGAGCATTACCGGCCTCTACGAGACGCGCATCGACCTCAGCCAGCTCGGCGGCGACTCCCGCGCCGACCCCAAGAAGAAGCGCAAGGTCTAA(SEQIDNO.:1)。

其中,SEQIDNo.1由4140个脱氧核苷酸组成,自SEQIDNo.1的5’端的第1-4140位的核苷酸为木聚糖酶的开放阅读框(OpenReadingFrame,ORF),自SEQIDNo.1的5’端的第1-3位核苷酸为木聚糖酶基因的起始密码子ATG,自SEQIDNo.1的5’端的第4138至4140位核苷酸为木聚糖酶基因的终止密码子TAA,自SEQIDNo.1的5’端的第4至4116为Cas9蛋白编码序列,其中SEQIDNo.1的5’端的第10至3147位为RuvC-likenucleasedomain,其中SEQIDNo.1的5’端的第2461至2616位为HNH-nucleasedomain,自SEQIDNo.1的5’端的第4117至4137位核苷酸所编码的是SV40NLS入核信号。

本发明通过密码子优化的Cas9基因,利用组成型启动子或诱导型启动子构建能够在丝状真菌异源表达的载体,通过农杆菌介导T-DNA转化方法,能够整合到丝状真菌基因组,并能够成功表达。利用获得的转化子能够成功构建丝状真菌的CRISPR/Cas基因组编辑方法。实验证明,利用该基因组编辑方法具有操作简单,打靶精确度、成功率高等特点,目前丝状真菌还尚未有此类方法的报道。具有及其重要的科学研究应用和工业应用前景。

本发明人经过对已经成功构建CRISPR/Cas基因组编辑方法的家蚕、酵母、拟南芥中的Cas9进行克隆,并在丝状真菌里氏木霉的产纤维素酶工业菌株Rut-C30及其出发菌株Qm6a中进行异源表达,发现无论是胞外和胞内均无法检测到Cas9蛋白。将该Cas9基因和增强型绿色荧光蛋白基因eGFP融合后在相同的菌株中异源表达,亦无法在胞内和胞外检测到Cas9蛋白和eGFP蛋白,通过eGFP的抗体杂交,也无法检测到信号,说明在目前已经构建的CRISPR/Cas基因组编辑方法的物种中的Cas9编码基因并不能用于丝状真菌之中。经过如SEQIDNo.1序列所示的密码子优化序列,用相同的方法进行载体构建,无论用组成型启动子和诱导型启动子均能够在丝状真菌里氏木霉中获得成功表达,这是在丝状真菌中构建CRISPR/Cas基因组编辑方法最根本的一步。由于目前丝状真菌中缺乏TALEN等基因组编辑方法,因此通过密码子优化Cas9来构建CRISPR/Cas系统具有十分重大的应用价值。

丝状真菌不仅是传统发酵工业中抗生素、酶制剂和有机酸的主要生产者,在医疗、食品、饲料、能源等领域有着重要应用,而且也是代谢工程育种中异源蛋白表达的重要细胞工厂。丝状真菌的遗传修饰和代谢工程研究是现代工业生物技术领域最具活力的研究方向之一。特别是与细菌和酵母相比,丝状真菌在细胞生长、营养需求、环境适应性、翻译后修饰、蛋白分泌能力和生物安全性等方面具有显著的优势。但是其分子遗传操作一直落后于其他物种。到目前为止还没有发展出一种廉价而经济的基因组编辑方法。这和丝状真菌各个领域的应用价值是不符的。特别是后基因组时代的来临,因此对丝状真菌进行基因组编辑方法的研究对真菌工业菌株的改造是极为重要的,是今后丝状真菌在合成生物学领域作为底盘细胞、成为生产各种产品的细胞工厂所必须解决的问题,是一个关乎国计民生的各个的领域的重大问题。以里商业纤维素酶的主要生产微生物里氏木霉为例,该工业菌株无论作为纤维素酶细胞工厂还是作为异源表达系统的底盘细胞,很多机制到目前还是不明确的,虽然基因组已经公布,但是用传统的方法对基因组进行基因逐个研究是相当费时费力的。发展出简易而快捷,精确而高效的基因组编辑方法对菌株的改造显得尤为重要。另一方面构建异源蛋白表达的底盘细胞,纤维素酶存在显得多余,因此进行逐个对纤维素酶基因进行敲除对于研究人员来说是非常繁琐的工作。而作为纤维素酶工业菌株,里氏木霉目前酶系还是有瓶颈,如何一步敲入多个异源基因也是研究者想要的方法。以上种种均说明建立在本发明密码子优化的Cas9基因之上的丝状真菌CRISPR/Cas系统是很重要的。

本发明的密码子优化的Cas9基因所编码的Cas9蛋白是来源于Streptococcuspyogenes的Cas9蛋白是一种多结构域多功能的Cas蛋白,其N端具有类RuvC核酸酶的结构域,其中部具有HNH核酸酶结构域。天然CRISPR/Cas系统是将转录的CRISPR序列加工成crRNA与tracrRNA,并通过与Cas蛋白结合形成复合体,将crRNA与tracrRNA融合而成的sgRNA同样能够有效指导Cas蛋白切割DNA。Cas9蛋白与sgRNA结合能够实现在特异位点处切割DNA,这是目前存在的最简单的CRISPR/Cas系统。不同于ZFN与TALEN技术系统,CRISPR/Cas系统是由crRNA或者sgRNA来确定靶向的特异性。相对于ZFarray或TALEarray的构建而言,sgRNA的构建在难度、时间以及成本方面都有无与伦比的巨大优势。同时,由于Cas9蛋白与不同的sgRNA结合就可以针对不同的位点进行编辑,因此对于多位点编辑而言,CRISPR/Cas系统的优势更加重要和明显。

如本文所用,术语“本发明的基因”、“优化的Cas9”、“密码子优化的Cas9”、“优化的Cas9基因”、“密码子优化的Cas9基因”指具有序列SEQIDNO:1或其变异形式或衍生物的多核苷酸,能够编码Streptococcuspyogenes的Cas9蛋白。

如本文所用,术语“丝状真菌CRISPR/Cas系统”、“里氏木霉CRISPR/Cas系统”、“丝状真菌CRISPR/Cas基因组编辑方法”、“里氏木霉CRISPR/Cas基因组编辑方法”指以基因组上整合有SEQIDNO:1或其变异形式或衍生物的多核苷酸的丝状真菌菌株为基础的,能够对其基因组进行(单位点和多位点)定点突变、定点敲除或定点敲入基因的一套基因组编辑方法。

本发明的多核苷酸可以是DNA形式或RNA形式。DNA形式包括cDNA、基因组DNA或人工合成的DNA。DNA可以是单链的或是双链的。DNA可以是编码链或非编码链。SEQIDNO:1的多核苷酸包括:只编码部分成熟多肽的编码序列;成熟多肽的编码序列和各种附加编码序列;成熟多肽的编码序列(和任选的附加编码序列)以及非编码序列。术语“编码多肽的多核苷酸”可以是包括编码此多肽的多核苷酸,也可以是还包括附加编码和/或非编码序列的多核苷酸。

本发明还涉及上述多核苷酸的变异体,其编码与本发明有相同的氨基酸序列的多肽或多肽的片段、类似物和衍生物。此多核苷酸的变异体可以是天然发生的等位变异体或非天然发生的变异体。这些核苷酸变异体包括取代变异体、缺失变异体和插入变异体。如本领域所知的,等位变异体是一个多核苷酸的替换形式,它可能是一个或多个核苷酸的取代、缺失或插入,但不会从实质上改变其编码的多肽的功能。

本发明还涉及与上述的序列杂交且两个序列之间具有至少90%,较佳地至少95%,更佳地至少98%相同性的多核苷酸。本发明特别涉及在严格条件(或严谨条件)下与本发明所述多核苷酸可杂交的多核苷酸。在本发明中,“严格条件”是指:(1)在较低离子强度和较高温度下的杂交和洗脱,如0.2×SSC,0.1%SDS,60℃;或(2)杂交时加有变性剂,如50%(v/v)甲酰胺,0.1%小牛血清/0.1%Ficoll,42℃等;或(3)仅在两条序列之间的相同性至少在90%以上,更好是95%以上时才发生杂交。并且,可杂交的多核苷酸编码的多肽与SEQIDNO:1所编码的成熟多肽有相同的生物学功能和活性。

本发明还涉及与上述的序列杂交的核酸片段。如本文所用,“核酸片段”的长度至少含15个核苷酸,较好是至少30个核苷酸,更好是至少50个核苷酸,最好是至少100个核苷酸以上。核酸片段可用于核酸的扩增技术(如PCR)以确定和/或分离的密码子优化的Cas9基因。

本发明中的多核苷酸优选以分离的形式提供,更佳地被纯化至均质。

本发明的密码子优化的Cas9基因的多核苷酸全长序列或其片段通常可以用PCR扩增法、重组法或人工合成的方法获得。对于PCR扩增法,可根据本发明所公开的有关核苷酸序列,尤其是开放阅读框序列来设计引物,并用市售的cDNA库或按本领域技术人员已知的常规方法所制备的cDNA库作为模板,扩增而得有关序列。当序列较长时,常常需要进行两次或多次PCR扩增,然后再将各次扩增出的片段按正确次序拼接在一起。

一旦获得了有关的序列,就可以用重组法来大批量地获得有关序列。这通常是将其克隆入载体,再转入细胞,然后通过常规方法从增殖后的宿主细胞中分离得到有关序列。此外,还可用人工合成的方法来合成有关序列,尤其是片段长度较短时。通常,通过先合成多个小片段,然后再进行连接可获得序列很长的片段。

目前,已经可以完全通过化学合成来得到编码本发明蛋白(或其片段,或其衍生物)的DNA序列。然后可将该DNA序列引入本领域中已知的各种现有的DNA分子(或如载体)和细胞中。此外,还可通过化学合成将突变引入本发明蛋白序列中。

应用PCR技术扩增DNA/RNA的方法被优选用于获得本发明的基因。特别是很难从文库中得到全长的cDNA时,可优选使用RACE法(RACE-cDNA末端快速扩增法),用于PCR的引物可根据本文所公开的本发明的序列信息适当地选择,并可用常规方法合成。可用常规方法如通过凝胶电泳分离和纯化扩增的DNA/RNA片段。

本发明也涉及包含本发明的多核苷酸的载体,以及用本发明的载体构建基因工程产生的宿主细胞。

通过常规的重组DNA技术,可利用本发明的多聚核苷酸序列可用来表达或生产重组的Cas9蛋白,进一步构建CRISPR/Cas基因组编辑方法。一般来说有以下步骤:

(1).用本发明的密码子优化的Cas9基因的多核苷酸(或变异体),或用含有该多核苷酸的重组表达载体转化或转导合适的宿主细胞;

(2).在合适的培养基中培养的宿主细胞;

(3).从培养基分离重组细胞。

(4).将分离的重组细胞扩大培养

(5).向扩大培养的重组细胞转化人工合成的带有靶向核苷酸的gRNA;也可以用启动子和终止子连同gRNA及靶向序列一起构建表达框和载体转化重组细胞;该步骤可以存在多种方式,实现基因的定点突变、定点敲除、定点敲入。

(6).从培养基分离用合适的方法分离阳性突变(敲除/敲入)细胞

本发明中,密码子优化的Cas9基因的多核苷酸序列可插入到重组表达载体中。术语“重组表达载体”指本领域熟知的细菌质粒、噬菌体、酵母质粒、植物细胞病毒、哺乳动物细胞病毒如腺病毒、逆转录病毒或其他载体。只要能在宿主体内复制和稳定,任何质粒和载体都可以用。表达载体的一个重要特征是通常含有复制起点、启动子、标记基因和翻译控制元件。

本领域的技术人员熟知的方法能用于构建密码子优化的Cas9基因DNA序列和合适的转录/翻译控制信号的表达载体。这些方法包括体外重组DNA技术、DNA合成技术、体内重组技术等。所述的DNA序列可有效连接到表达载体中的适当启动子上,以指导mRNA合成。这些启动子的代表性例子有:大肠杆菌的lac或trp启动子;λ噬菌体PL启动子;真核启动子包括CMV立即早期启动子、HSV胸苷激酶启动子、早期和晚期SV40启动子、反转录病毒的LTRs和其他一些已知的可控制基因在原核或真核细胞或其病毒中表达的启动子。表达载体还包括翻译起始用的核糖体结合位点和转录终止子。

此外,表达载体优选地包含一个或多个选择性标记基因,以提供用于选择转化的宿主细胞的表型性状,如真核细胞培养用的二氢叶酸还原酶、新霉素抗性以及绿色荧光蛋白(GFP),或用于大肠杆菌的四环素或氨苄青霉素抗性。包含上述的适当DNA序列以及适当启动子或者控制序列的载体,可以用于转化适当的宿主细胞,以使其能够表达蛋白质。

宿主细胞可以是原核细胞,如细菌细胞;或是低等真核细胞,如酵母细胞;或是高等真核细胞,如哺乳动物细胞。代表性例子有:大肠杆菌,链霉菌属;鼠伤寒沙门氏菌的细菌细胞;真菌细胞如酵母;植物细胞;果蝇S2或Sf9的昆虫细胞;CHO、COS、293细胞、或Bowes黑素瘤细胞的动物细胞等。

本发明的多核苷酸在高等真核细胞中表达时,如果在载体中插入增强子序列时将会使转录得到增强。增强子是DNA的顺式作用因子,通常大约有到300个碱基对,作用于启动子以增强基因的转录。可举的例子包括在复制起始点晚期一侧的100到270个碱基对的SV40增强子、在复制起始点晚期一侧的多瘤增强子以及腺病毒增强子等。

本领域一般技术人员都清楚如何选择适当的载体、启动子、增强子和宿主细胞。

用重组DNA转化宿主细胞可用本领域技术人员熟知的常规技术进行。当宿主为原核生物如大肠杆菌时,能吸收DNA的感受态细胞可在指数生长期后收获,用CaCl2法处理,所用的步骤在本领域众所周知。另一种方法是使用MgCl2。如果需要,转化也可用电穿孔的方法进行。当宿主是真核生物,可选用如下的DNA转染方法:磷酸钙共沉淀法,常规机械方法如显微注射、电穿孔、脂质体包装等。

在本发明的一个实例中,提供了一种分离的多核苷酸,它具有SEQIDNO:1所示序列。本发明的多核苷酸是综合丝状真菌密码子偏爱性经过人工设计并人工合成的多核苷酸,并通过PCR分离出的。其序列如SEQIDNO:1所示,它包含的多核苷酸序列全长为4140个碱基,编码全长为1380个氨基酸的Cas9蛋白(含SV40NLS入核信号)。所述的优化的Cas9基因在里氏木霉的工业菌株Rut-C30和出发菌株Qm6a重组子中良好表达。更佳地,在里氏木霉工业菌株Rut-C30宿主中用诱导型启动子pcbh1能够在乳糖诱导下更高效的表达。更进一步地,为了验证和观察优化的Cas9基因在里氏木霉的表达可以将其和eGFP等标签融合表达。

实验证明本发明的优化的Cas9基因无论在里氏木霉Rut-C30和Qm6a菌株中均能表达,用组成型和诱导型启动子也均能表达。更佳地在Rut-C30菌株中用诱导型启动子pcbh1在乳糖的诱导下表达。获得的重组菌可用于丝状真菌CRISPR/Cas基因组编辑方法的构建,因而具有巨大的应用前景。

本发明的主要优点在于:

(1)首次提出了一种能够在丝状真菌中表达、并且能够用于CRISPR/Cas基因组编辑的Cas9基因序列。

(2)首次在丝状真菌中构建了能够用于CRISPR/Cas基因组编辑的宿主细胞。

(3)采用本发明的Cas9基因序列,构建用于CRISPR/Cas基因组编辑的丝状真菌,在CRISPR/Cas基因组编辑中成功率高,靶标精确,效果稳定。

(4)本发明的密码子优化方案,能有效的提高Cas9基因在丝状真菌的表达量,能成功的应用于CRISPR/Cas的基因组编辑方法,给丝状真菌的分子改造带来极大的便利。

(5)本发明的密码子优化方案,能利用诱导型启动子和组成型启动子均能很好的丝状真菌中表达,可以以此设计条件性基因组编辑方案,进行深入的科学研究。

(6)本发明的密码子优化方案,可以在里氏木霉的野生菌株和工业菌株中表达,构建CRISPR/Cas的基因组编辑方法后,可以进一步了解工业菌株的分子遗传机制。

(7)本发明的密码子优化方案,可以在丝状真菌中构建基于CRISPR/Cas的高效、精准的同源重组系统。

下面结合具体实施例,进一步详陈本发明。应理解,这些实施例仅用于说明本发明而不用于限制本发明的范围。下列实施例中未注明详细条件的实验方法,通常按照常规条件如Sambrook等人,分子克隆:实验室手册(NewYork:ColdSpringHarborLaboratoryPress,1989)中所述的条件,或按照制造厂商所建议的条件。除非另外说明,否则百分比和份数按重量计算。本发明实施例中所用的实验材料如无特殊说明均可从市售渠道获得。

除非另行定义,文中所使用的所有专业与科学用语与本领域熟练人员所熟悉的意义相同。此外,任何与所记载内容相似或均等的方法及材料皆可应用于本发明中。文中所述的较佳实施方法与材料仅作示范之用。

实施例1、Cas9基因的密码子优化和基因的分离

通过对Streptococcuspyogenes的Cas9编码基因的密码子进行分析,结合酵母等宿主中密码子优化方案,将Cas9编码基因作如SeqIDNo.1的优化(含SV40NLS入核信号)。基因合成由金斯瑞公司(南京,中国)完成。通过引物Cas9F(ATGGACAAGAAGTACAGCATTGG)(SeqIDNo.2)和Cas9R(TTAGACCTTGCGCTTCTTCTTGGG)(SeqIDNo.3)可以通过PCR分离获得该密码子。

实施例2、密码子优化的Cas9基因表达载体的构建及转化

以pDHt/sk载体(含有Kan和hyg筛选标记,购自Sigma公司)为骨架,构建密码子优化的Cas9基因表达载体。同时用组成型启动子和诱导型启动子两种方案,为了方便检测Cas9的表达情况,还构建了Cas9和eGFP融合基因的表达载体,共计四个表达载体用于丝状真菌的转化。

(1)构建诱导型启动子表达载体。

首先利用正向引物:5’ACGACGGCCAGTGCCAAGCTTTTTCCCTGATTCAGCGTACC3’(SEQIDNO:4)和反向引物:5’TTGACTATTGGGTTTCTGTGCCTC3’(SEQIDNO:5)扩增获得Pcbh1作为优化的Cas9基因表达的启动子。优化的Cas9引物利用正向引物:5’AGCGCAGCTACAGCACAATCATGGACAAGAAGTACAGCAT3’(SEQIDNO:6)和反向引物:5’TTAGACCTTGCGCTTCTTCTTGGGGTCGGCGCGGGAGTCG3’(SEQIDNO:7)扩增。融合基因Cas9-eGFP用先用5’AGCGCAGCTACAGCACAATCATGGACAAGAAGTACAGCAT3’(SEQIDNO:6)和GTCGGCGCGGGAGTCGCCGC(SEQIDNO:7)获得融合用的Cas9序列,再用GCGGCGACTCCCGCGCCGACGTACCGGTCGCCACCATGGTG(SEQIDNO:8)和TTACACCTTCCTCTTCTTCTTGGGCTTGTACAGCTCGTCCATG(SEQIDNO:9)扩增eGFP,之后用5’AGCGCAGCTACAGCACAATCATGGACAAGAAGTACAGCAT(SEQIDNO:6)进行基因融合获得融合片段Cas9-eGFP。终止子采用Tpdc,用引物AGAAGAAGCGCAAGGTCTAACCCGGCATGAAGTCTGACCG(SEQIDNO:10)和TAATTGCGCGGATCCTCTAGATGGACGCCTCGATGTCTTCC(SEQIDNO.:12)来获得用于构建仅为表达Cas9的终止子,用引物AGAAGAAGAGGAAGGTGTAACCCGGCATGAAGTCTGACCG(SEQIDNO:11)和TAATTGCGCGGATCCTCTAGATGGACGCCTCGATGTCTTCC(SEQIDNO:12)来构建表达Cas9-eGFP片段。采用一步法克隆的方法构建载体,通过验证序列成功构建诱导型启动子pDHt/sk-pcbh1-Cas9-tpdc和pDHt/sk-pcbh1-Cas9-eGFP-tpdc。

(2)构建组成型启动子表达载体。

首先利用正向引物:5’ACGACGGCCAGTGCCAAGCTTAGGACTTCCAGGGCTACTTG3’(SEQIDNO:13)和反向引物:5’GATTGTGCTGTAGCTGCGCTGCTTTGATCGTTTTGAGGTGC3’(SEQIDNO:14)扩增获得Ppdc作为优化的Cas9基因表达的启动子。其余片段Cas9、Cas-eGFP、Tpdc的扩增方法同上。采用一步法克隆的方法构建载体,通过验证序列成功构建诱导型启动子pDHt/sk-ppdc-Cas9-tpdc和pDHt/sk-ppdc-Cas9-eGFP-tpdc。

重组有pDHt/sk-pcbh1-Cas9-tpdc和pDHt/sk-ppdc-Cas9-tpdc表达载体的丝状真菌转化子可以用来构建CRISPR/Cas基因组编辑方法。重组有pDHt/sk-pcbh1-Cas9-eGFP-tpdc和pDHt/sk-ppdc-Cas9-eGFP-tpdc的丝状真菌转化子则可以用来westernblots和荧光显微镜的方法来方便检测优化的Cas9基因的表达与否。

(3)丝状真菌里氏木霉的转化和筛选

将上述构建好的质粒转化入根癌农杆菌AGL1中,在根癌农杆菌的介导下转化入里氏木霉Rut-C30(购自ATCC,菌株编号:ATCC56765)或QM6a菌株(购自ATCC,菌株编号:ATCC13631)中,用潮霉素作为筛选压力,将长出的转化子接种于SDB培养液中,2天后抽提DNA为模板,通过载体上的启动子处设计正向引物5'TACGTCGGCCCCCTGGCC3'(SEQIDNO:15)和Cas9基因的反向引物为5'GAGGTTGTCAAACTTGCGCTGCG3'(SEQIDNO:16)PCR鉴定阳性转化子。Rut-C30获得的转化子用pDHt/sk-pcbh1-Cas9-tpdc、pDHt/sk-pcbh1-Cas9-eGFP-tpdc、pDHt/sk-ppdc-Cas9-tpdc和pDHt/sk-ppdc-Cas9-eGFP-tpdc获得的转化子分别命名为为C30-pc、C30-pe、C30-cc和C30-ce;而Qm6a获得的转化子则分别命名为6a-pc、6a-pe、6a-cc和6a-ce。

实施例3:里氏木霉异源表达Cas9-EGFP融合蛋白的验证。

(1)Ca9-EGFP在里氏木霉Rut-C30菌株中的表达

以里氏木霉Rut-C30菌株组成型和诱导型表达Cas9-EGFP融合蛋白,组成型表达Cas9-EGFP的阳性转化子C30-pe在SDB培养基(1%tryptone,1%Yeastextract,4%Glucose)中培养48h。诱导型表达Cas9-EGFP的阳性转化子C30-ce先在SDB培养基中培养48h,然后取1ml培养液转1接到10ml含诱导物(1%Avicel)的的无机盐培养液(0.5%(NH4)2SO4,1.5%KH2PO4,0.06%MgSO4·7H2O,0.06%CaCl2,0.0005%FeSO4·7H2O,0.00016%MnSO4·H2O,0.00014%ZnSO4·7H2O,0.0002%CoCl2,pH调至5.5)中,分别培养24h和48h。

(2)胞内总蛋白的提取

过滤收集菌丝,称取6~7.5mg菌丝抽提胞内蛋白。首先将菌丝用1mlLysisbuffer(0.185MNaOH,0.75%β-巯基乙醇)重悬,用Fastprep震荡器破碎细胞,冰上静置15min。接下来,加入150μl55%TCA,混合均匀后,冰上放置10min。离心(13200rpm,10min)弃去上清后,将沉淀用150μlHUbuffer(48%Urea,5%SDS,0.2MTris-Cl,pH6.5,5mMEDTA,0.01%Bromophenolblue,5%β-巯基乙醇,6%Tris-base)重悬,于65℃放置10min。

(3)胞内蛋白SDS-PAGE及Westernblot验证。

立即点样进行SDS-PAGE及Westernblot验证。Westernblot中所使用的一抗为兔源抗EGFP抗体,二抗为辣根过氧化物酶标记的羊抗兔抗体。验证结果如图1所示,A图为SDS-PAGE验证提取胞内总蛋白图,B图为对应的WesternBlot检测。其中泳道M1和M2为蛋白Marker(分子量从上到下依次为97.2,66.4,44.3,29.0,20.1,14.3kDa),泳道1为含有EGFP的一个已知蛋白,作为阳性对照,泳道2是C30-pe转化子培养48h后抽提的胞内蛋白,泳道3,4是C30-ce转化子培养24h和48h后抽提的胞内蛋白样品。泳道5,6,7,8和SDS-PAGE图谱样品一一对应。Cas9-EGFP融合蛋白大小约为190KD,从图中可以看出C30-pe和C30-ce转化子中都成功表达了Cas9-EGFP融合蛋白。

实施例4、基于C30-cc菌株构建CRISPR/Cas基因组编辑方法

(1)gRNA体外转录

使用人工合成gRNA的方法,并合成打靶同源片段序列(目标基因为ura5),使用正向引物:5'GGCGAGGGCGGCAACATCGT3'(SeqIDNo.17)和反向引物:5'ACACGACCTCCGACCACT3'(SeqIDNo.18)扩增获得目标片段,其中通过正向引物引入T7启动子(黑体标出序列)。PCR产物纯化回收后连接于pMD-18Tvector,转化大肠杆菌top10感受态,挑取转化子,使用正向引物M13F和反向引物:5'ACACGACCTCCGACCACT3'(SeqIDNo.18)验证转化子并送测序,命名该质粒为T7-Tura5-gRNA-18T。

以测序正确T7-Tura5-gRNA-18T质粒为模版,使用正向引物:5'TCGCGCGTTTCGGTGATGAC3'(SeqIDNo.19)和反向引物5'AAAAGCACCGACTCGGTGCC3'(SeqIDNo.20)扩增获得gRNA体外转录DNA模版(图2)。

获得的体外转录模版用苯酚:氯仿:异戊醇(25:24:1)抽提纯化,最后用Nucleasefreewater溶解DNA,即可用于gRNA的体外转录。gRNA的体外转录,具体方法参考试剂盒说明书。

(2)gRNA原生质体转化里氏木霉

将C30-cc孢子接种于PDA平板,28℃培养7d,使用0.85%NaCl+0.02%吐温80洗下孢子。用灭菌的镊子在PDA平板上盖一张玻璃纸,将其铺平,在玻璃纸上加入150ul左右的孢子悬液,用玻棒涂布均匀,做6个同样的处理,28度培养约14h。用裂解酶(Sigma#L1412lysingenzymes)裂解细胞壁,除去细胞壁碎片后即可获得原生质体悬液,与纯化gRNA片段混合后用PEG介导的原生质转化法转化,涂布于含有5-FOA的筛选平板,置28度培养,5天左右可观察到菌丝长出。待转化子长出后,抽提其基因组,以正向引物:5'GCGGCGTCCTCAAGTTTGGC3'(SeqIDNo.21)和反向引物:5'AAGAACACGGAGGATTACCG3'(SeqIDNo.22)PCR获得ura5片段后送测序,看靶标处是否发生突变。结果如图3所示,共送19个转化子样品测序,其中16个在靶标处发生突变,阳性率为16/19=84%。说明CRISPR/Cas系统在里氏木霉Rut-C30中正常工作。

实施例5、基于6a-pc菌株构建CRISPR/Cas基因组编辑方法

gRNA体外转录方法同上。将6a-pc孢子(物种同前)接种于PDA平板,28℃培养7d,使用0.85%NaCl+0.02%吐温80洗下孢子。用灭菌的镊子在PDA平板上盖一张玻璃纸,将其铺平,在玻璃纸上加入150ul左右的孢子悬液,用玻棒涂布均匀,做6个同样的处理,25℃培养约14h。用裂解酶(Sigma#L1412lysingenzymes)裂解细胞壁,除去细胞壁碎片后即可获得原生质体悬液,与纯化gRNA片段混合后用PEG介导的原生质转化法转化,涂布于含有5-FOA的筛选平板,置28℃培养,5天左右可观察到菌丝长出。待转化子长出后,抽提其基因组,以正向引物:5'GCGGCGTCCTCAAGTTTGGC3'(SeqIDNo.21)和反向引物:5'AAGAACACGGAGGATTACCG3'(SeqIDNo.22)PCR获得ura5片段后送测序,看靶标处是否发生突变。结果如图4所示,共送17个转化子样品测序,其中14个在靶标处发生突变,阳性率为14/17=82%。说明CRISPR/Cas系统在里氏木霉Qm6a中正常工作。

对比例1

在本对比例中,采用上述方法对已经成功构建CRISPR/Cas基因组编辑方法的家蚕、酵母、拟南芥中的Cas9基因序列进行克隆,并在丝状真菌里氏木霉的产纤维素酶工业菌株Rut-C30及其出发菌株Qm6a中进行异源表达,发现无论是胞外和胞内均无法检测到Cas9蛋白。将该Cas9基因和增强型绿色荧光蛋白基因eGFP融合后在相同的菌株中异源表达,亦无法在胞内和胞外检测到Cas9蛋白和eGFP蛋白,通过eGFP的抗体杂交,也无法检测到信号,说明在目前已经构建的CRISPR/Cas基因组编辑方法的物种中的Cas9编码基因并不能用于丝状真菌之中。

然后通对Streptococcuspyogenes的Cas9编码基因的密码子进行分析,采用本领域通常的方法,考量丝状真菌密码子偏爱的情况,将Cas9编码基因进行优化,除了SEQIDNO.1外,还获得了多组经优化密码子,其中代表性的5组分别如以及SEQIDNO.:23-27所示,将这6组密码子在丝状真菌里氏木霉的产纤维素酶工业菌株Rut-C30中进行表达,对成功表达的菌株,使用实施例4中的方法进行CRISPR/Cas基因组编辑验证。结果如下表所示:

表1对比例中优化密码子的实验情况

注:“-”表示无法表达;“+”表示可以少量表达;“++”表示表达量较高。

在本发明提及的所有文献都在本申请中引用作为参考,就如同每一篇文献被单独引用作为参考那样。此外应理解,在阅读了本发明的上述讲授内容之后,本领域技术人员可以对本发明作各种改动或修改,这些等价形式同样落于本申请所附权利要求书所限定的范围。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号