首页> 中国专利> MAD7-NLS融合蛋白、用于植物基因组定点编辑的核酸构建物及其应用

MAD7-NLS融合蛋白、用于植物基因组定点编辑的核酸构建物及其应用

摘要

本发明提供一种MAD7‑NLS融合蛋白,具有以下结构:B1‑C‑B2、B1‑C或C‑B2,其中,C为MAD7蛋白;B1和B2各自独立地为核定位信号序列(NLS)。本发明还提供了用于植物基因组定点编辑的核酸构建物,包含第一表达盒,第一表达盒包含依次连接的第一启动子、MAD7‑NLS融合蛋白的编码核苷酸序列和第一终止子。本发明还提供了该核酸构建体在植物基因编辑中的应用。本发明利用MAD7能够在预定的植物基因组位点简便而高效地进行单基因敲除、多基因敲除或者同源重组和外源片段的定向插入。

著录项

  • 公开/公告号CN113846075A

    专利类型发明专利

  • 公开/公告日2021-12-28

    原文格式PDF

  • 申请/专利权人 科稷达隆(北京)生物技术有限公司;

    申请/专利号CN202111427444.X

  • 申请日2021-11-29

  • 分类号C12N9/22(20060101);C12N15/82(20060101);A01H5/00(20180101);A01H5/12(20180101);A01H5/04(20180101);A01H5/06(20180101);A01H6/46(20180101);A01H6/54(20180101);A01H6/82(20180101);A01H6/20(20180101);

  • 代理机构11794 北京知汇林知识产权代理事务所(普通合伙);

  • 代理人杨华

  • 地址 102206 北京市昌平区科技园区生命园路27号1号楼D区三层

  • 入库时间 2023-06-19 13:27:45

说明书

技术领域

本发明涉及生物技术领域。具体涉及MAD7-NLS融合蛋白、用于植物基因组定点编辑的核酸构建物,以及基于新型核酸酶MAD7利用RNA引导的植物基因组的高效定点基因编辑方法。

背景技术

随着基因定向编辑工具如锌指蛋白核糖核酸酶(Zinc finger nulease, ZFN)、转录激活样效应因子核酸酶(Transcription activator-like effectors nulease,TALEN)和规律成簇间隔短回文重复序列(Clustered regularly interspaced shortpalindromic repeats,CRISPR)系统的推广应用,特别是CRISPR系统由于活性高,特异性好、操作简便、快速,近年来发展非常迅速,并且在大量物种上得到成功应用。目前应用最广的核酸酶为II型Cas9和Cpf1(Cas12a)。其中,Cas9识别3′G-rich 位点,而Cpf1(Cas12a)识别5′A-T rich位点。而相对Cas9来说,Cas12a蛋白兼具DNA剪切酶和RNA修剪酶的功能,不但能够靶向切割DNA双链,而且能把相应的非成熟型crRNA(pre-crRNA)加工剪切成成熟型crRNA(Fonfara et al.,2016),且不需要tracrRNA的参与;同时,Cas12a蛋白分子相对更小,特异性更强,相对Cas9对多靶点基因编辑具有更强的优势;另外,相对于Cas9剪切基因组形成的是平末端,Cas12a剪切基因组形成的粘性末端更有利于外源基因的定向插入。

MAD7隶属于II型V-A Cpf1-like家族,由Inscripta公司发现于真杆菌属并经优化改造,可供科研院所和商业研究免费使用。MAD7同AsCpf1蛋白同源性最高,同源度也仅为31%,PAM识别位点为YTTN,目前MAD7系统已在细菌、酵母、斑马鱼、小鼠和人体细胞中验证具有较高编辑活性,为推广其植物中应用范围,将其水稻密码子优化后研究其在植物中编辑效率。尽管近期MAD7系统亦已报道在水稻中的应用,但其突变效率49-65.6%。综上所述,为了满足植物基因工程的需要,丰富植物基因编辑的工具箱,有必要开发更高效的基因编辑系统具有较强优势。

发明内容

本发明的目的在于提供一套基于MAD7的CRISPR/MAD7植物基因组高效定点编辑系统,可以简单高效地在单双子叶植物实现单基因敲除、多基因敲除和同源重组或外源片段定点敲入。

本发明首先提供了一种MAD7-NLS融合蛋白,具有以下结构:

B1-C-B2、B1-C或C-B2;

其中,

C为MAD7蛋白;

B1和B2为各自独立的核定位信号序列(NLS)。

在根据本发明的一个实施方案中,所述核定位信号序列(NLS)选自:SV40、KRP2(Kiprelated protein gene NO .2)、MDM2、CDc25C、DPP9、MTA1、CBP80、AreA、M9、Rev、hTAP、MyRF、EBNA-6、TERT或Tfam中的一种或者任两种或多种的组合。

在根据本发明的一个实施方案中,所述MAD7-NLS融合蛋白的N端还包含信号肽和/或蛋白标签序列。

本发明的另一方面提供了一种用于植物基因组定点编辑的核酸构建物,包含第一表达盒,所述第一表达盒包含依次连接的第一启动子、如上述的MAD7-NLS融合蛋白的编码核苷酸序列和第一终止子;

优选地,所述第一启动子为Pol II类型的启动子优选为Ubi、Actin、CmYLCV、UBQ、35S、SPL,组织特异性启动子YAO、CDC45、rbcS和诱导型启动子XEV中的一种或任两种的组合。

在根据本发明的一个实施方案中,该核酸构建物还包含第二表达盒,所述的第二表达盒包含依次连接的第二启动子、若干串联的重复序列;

所述重复序列为成熟型直接重复序列(direct repeat,DR)和非成熟型直接重复序列中的一种或两种;优选地,第二启动子为Pol II类型或Pol III类型的启动子;更优选地,第二启动子选自OsU3、OsU6a、OsU6b、OsU6c、Actin、35S、Ubi、UBQ、SPL、CmYLCV、组织特异性启动子YAO、CDC45、rbcS或诱导型启动子XEV中的一种、两种或多种。

在根据本发明的一个实施方案中,所述第二表达盒还包含连接于重复序列末端的第二终止序列;

优选地,所述第二终止序列选自polyT、NOS、polyA或其组合。

在根据本发明的一个实施方案中,所述重复序列还包含目标位点引导序列sg;优选地,所述的sg序列的长度为17-35bp,优选为19-28bp,更优选为19-25bp;

优选地,所述重复序列重复数为2-50,优选为2-10,更优选为3-15,进一步优选为2、3、4、5、6、7、8、9、10、11或12。

尤其优选地,所述核酸构建物为选自SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6或SEQ ID NO:21中的一个或多个。

在根据本发明的一个实施方案中,所述核酸构建物为同时包含第一表达盒和第二表达盒的载体,或者,

由分别包含第一表达盒的第一载体与包含第二表达盒的第二载体组成的载体组合。

本发明还提供了一种用于植物体基因编辑的试剂盒,其特征在于,包括上述的核酸构建物;优选地,还包括携带供体DNA表达盒的辅助载体。

本发明的再一方面提供了一种用于植物基因编辑的方法,包括:

(i)将上述的核酸构建物和任选的供体核酸片段,导入到植物细胞、植物组织或植物体,并在所述植物细胞、植物组织或植物体中进行基因编辑;

(ii)对发生所述基因编辑的植物细胞、植物组织或植物体进行筛选和鉴定;

(iii)将步骤(ii)中经鉴定发生了所述基因编辑的植物细胞、植物组织或植物体进行再生或培养;

优选地,所述的基因编辑包括基因敲除、定点插入或基因置换中的一种、或者任选的两种或三种的组合;

优选地,所述的基因编辑为单位点或多位点的基因编辑;

优选地,所述导入是利用选自农杆菌转化法、基因枪法、显微注射法、电击法、超声波法或聚乙二醇 (PEG)介导法中的任一种方法实现的;

优选地,所述的植物选自禾本科植物、豆科植物、茄科或十字花科植物中的任一种;

更优选地,所述的植物选自拟南芥、小麦、大麦、燕麦、玉米、水稻、高粱、粟、大豆、花生、烟草或番茄中的任一种。

本发明的上述技术方案的有益效果如下:

本发明基于MAD7的CRISPR/MAD7植物基因组高效定点编辑系统,可以简单高效地在单双子叶植物实现单基因敲除、多基因敲除和同源重组或外源片段定点敲入,相对于传统的CRISPR/Cas9、CRISPR/Cpf1基因编辑系统,本发明提供的CRISPR/MAD7系统具有更高的特异性,同时对于靶位点的选择也更灵活。

附图说明

图1为根据本发明的MAD7之水稻crRNA表达盒的相关序列(SEQ ID NO.2)中的各元件结构组成示意图。

图2为根据本发明的MAD7之水稻多基因位点编辑sg-DR crRNA表达盒的相关序列(SEQ ID NO.3)中的各元件结构组成示意图。

图3为根据本发明的MAD7之水稻多基因位点编辑tRNA-sg-DR crRNA表达盒的相关序列(SEQ ID NO.4)中的各元件结构组成示意图。

图4为根据本发明的MAD7之水稻多基因位点编辑miniOsU3/U6-DR-sg crRNA表达盒的相关序列(SEQ ID NO.5)中的各元件结构组成示意图。

图5为根据本发明的MAD7之水稻多基因位点编辑HH-DR-sg-HDV crRNA表达盒的相关序列(SEQ ID NO.6)中的各元件结构组成示意图。

图6为根据本发明的MAD7之玉米crRNA表达盒的相关序列(SEQ ID NO.21)中的各元件结构组成示意图。

图7为水稻单位点敲除CRISPR-MAD7(ncNLS)表达载体构建示意图。

图8为水稻单位点敲除OsHD3A位点时NLS设计三种放置方式‘’’下表达载体构建示意图。

图9为包含DR-sg序列串的水稻多位点敲除CRISPR-MAD7表达载体构建示意图。

图10为tRNA串联DR-sg序列的水稻多位点敲除CRISPR-MAD7表达载体构建示意图。

图11 miniOsU3/ miniOsU6分别驱动DR-sg序列的CRISPR-MAD7表达载体构建示意图。

图12为Pol III类型启动子驱动、HH-HDV串联DR-sg序列的CRISPR-MAD7表达载体构建示意图。

图13为Pol II类型启动子驱动、HH-HDV串联DR-sg序列的CRISPR-MAD7表达载体构建示意图。

图14为玉米单位点敲除CRISPR-MAD7(ncNLS)表达载体构建示意图。

具体实施方式

为使本发明要解决的技术问题、技术方案和优点更加清楚,下面将结合附图及具体实施例进行详细描述。

本发明人经过广泛而深入的研究,构建了一种基于MAD7的高通用性、高特异性的CRISPR/MAD7植物基因组定点高效编辑系统,以及用于植物基因组定点编辑的核酸构建物、载体或载体组合,以及植物基因组定点编辑方法。具体地,基于本发明的方法,可以在预定的植物基因组位点,简便而高效地进行单基因敲除、多基因敲除或者同源重组和外源片段的定向插入。在此基础上,完成了本发明。

具体地,本发明CRISPR/MAD7编辑系统采用成熟型crRNA,由于成熟型crRNA更加短小,便于人工合成并且更加容易转化进入细胞,所以开发基于成熟型crRNA的CRISPR-MAD7系统会更具优势。在此基础上,还开发了将核定位信号序列(NLS)置于MAD7蛋白的N端、C端的技术方案。实验结果表明,采用上述技术方案成功完成了水稻的基因编辑,效率高达95%。

术语

除非另外定义,本文使用的所有技术和科学术语的意义与本发明所属领域普通技术人员通常所理解的相同。本文中述及的所有出版物和其他参考文献都通过引用纳入本文。

如本文所用,所述的“含有”、“具有”或“包括”包括了“包含”、“主要由…… 构成”、“基本上由……构成”、和“由……构成”。

如本文所用,术语“操作性相连”或“可操作地连于”指这样一种状况,即线性DNA序列的某些部分能够调节或控制同一线性DNA序列其它部分的活性。例如,如果启动子控制序列的转录,那么它就是可操作地连于编码序列。

基于MAD7的植物基因组高效定点编辑的核酸构建物和方法

本发明提供了一种用于植物基因组高效定点编辑的核酸构建物,所述的核酸构建物包括第一表达盒和任选的第二表达盒;

其中,所述的第一表达盒为MAD7-NLS融合蛋白表达盒,其中所述的MAD7-NLS融合蛋白具有式I结构:

P1-A-B1-C-B2-E1 (I)

式中,

P1为第一启动子;

A为无、信号肽、和/或蛋白标签序列;

B1为无或核定位信号序列NLS;

B2为无或核定位信号序列NLS;

附加条件是,B1和B2中至多一个为无;

C为MAD7蛋白;

E1为第一终止子;

所述的第二表达盒为crRNA表达盒,在所述的crRNA表达盒含有对应于成熟型crRNA或非成熟型pre-crRNA的编码序列。

在本发明中,上述的各元件可用常规方法(如PCR法、人工全合成)制备,然后用常规方法进行连接,从而形成本发明所述的核酸构建物。如需要,在连接反应之前,可以任选地进行酶切反应。

此外,本发明的所述核酸构建物可以是线性的,也可以是环状的。本发明的所述核酸构建物可以是单链的,也可以是双链的。本发明的所述核酸构建物可以是DNA,也可以是RNA,或DNA/RNA杂合。

如本文所用,nNLS是指核定位信号序列NLS位于MAD7蛋白编码序列的5'端,cNLS是指核定位信号序列NLS位于MAD7蛋白编码序列的3'端,ncNLS是指MAD7蛋白编码序列的5'端和3'端均可连接核定位信号序列NLS。

如本文所用,“外源基因”指作用是阶段性作用的外源DNA分子。可用于本申请的外源基因没有特别限制,包括转基因动物领域常用的各种外源基因。代表性例子包括(但并不限于):β-葡萄糖苷酸酶基因、红色荧光蛋白基因、绿色荧光蛋白基因、溶菌酶基因、鲑鱼降钙素基因、乳铁蛋白、或血清白蛋白基因等。

如本文所用,“筛选标记基因”指转基因过程中用来筛选转基因细胞或转基因动物的基因,可用于本申请的筛选标记基因没有特别限制,包括转基因领域常用的各种筛选标记基因,代表性例子包括(但并不限于):潮霉素抗性基因(Hyg)、卡那霉素抗性基因(NPTII)、新霉素、或嘌呤霉素抗性基因。

如本文所用,术语“表达盒”是指含有待表达基因以及表达所需元件的序列组件的一段多聚核苷酸序列。例如,在本发明中,术语“筛选标记表达盒”指含有编码筛选标记的序列以及表达所需元件的序列组件的多聚核苷酸序列。表达所需的组件包括启动子和聚腺苷酸化信号序列。此外,筛选标记表达盒还可以含有或不含有其他序列,包括(但并不限于):增强子、分泌信号肽序列等。

如本文所用,术语“植物启动子”指能够在植物细胞中启动核酸转录的核酸序列。该植物启动子可以是来源于植物、微生物(如细菌、病毒)或动物等,或者是人工合成或改造过的启动子。

如本文所用,术语“植物终止子”指能够在植物细胞中可使转录停止的终止子。该植物转录终止子可以是来源于植物、微生物(如细菌、病毒)或动物等,或者是人工合成或改造过的终止子。代表性的例子包括(但并不限于):Nos终止子。

如本文所用,术语“MAD7蛋白”指一种核酸酶。典型的MAD7蛋白包括(但并不限于):

ErCas12a (

如本文所用,术语“MAD7蛋白的编码序列”指编码具有切割活性的MAD7蛋白的核苷酸序列。在插入的多聚核苷酸序列被转录和翻译从而产生功能性MAD7蛋白的情况下,技术人员会认识到,因为密码子的简并性,有大量多聚核苷酸序列可以编码相同的多肽。另外,技术人员也会认识到不同物种对于密码子具有一定的偏好性,可能会根据在不同物种中表达的需要,会对MAD7蛋白的密码子进行优化,这些变异体都被术语“MAD7蛋白的编码序列”所具体涵盖。此外,术语特定地包括了全长的,与MAD7基因序列基本相同的序列,以及编码出保留MAD7蛋白功能的蛋白质的序列。

在本发明中,所述的C对应于MAD7蛋白的全长或融合蛋白,所述的第二表达盒具有式II结构crRNA表达盒:

P2-(R-S)q-T (II)

式中,

P2为第二启动子;

各R独立地为对应于成熟型或非成熟型直接重复序列 (direct repeat, DR)

各S独立地为无或目标位点引导序列sg;

q为≥1的正整数;

T为无或polyT或Nos或polyA序列。

本发明还提供了一种载体或载体组合,所述的载体或载体组合含有本发明所述的核酸构建物。

优选地,本发明所述的载体组合还包括携带供体DNA表达盒的辅助载体。

在本发明的核酸构建物和/或载体中,一些元件之间(尤其是各表达盒中的相应元件)是可操作连接的。例如当启动子与编码序列可操作连接时,指所述启动子能够启动所述编码序列的转录。

本发明还提供了含有上述载体或载体组合的试剂组合以及试剂盒,它们可用于本发明的植物基因编辑方法。

本发明还提供了一种对植物进行基因编辑的方法,包括步骤:

(i)将(a)本发明所述的载体或载体组合以及(b)任选的供体核酸片段,导入植物细胞、植物组织或植物(植株),从而在所述植物细胞、植物组织或植物中产生基因编辑;和

(ii)任选地,对发生所述基因编辑的植物细胞或植物进行检测、筛选或鉴定。

在本发明中,所述的基因编辑包括基因敲除、定点插入、基因置换、或其组合。

本发明的植物基因编辑方法,可用于改良各类植物,尤其是对农作物进行改良。

如本文所用,术语“植物”包括全植株、植物器官(如叶、茎、根等)、种子和植物细胞以及它们的子代。可用于本发明方法的植物的种类没有特别限制,一般包括任何可进行转化技术的高等植物类型,包括单子叶、双子叶植物和裸子植物。

本发明可以用于植物基因工程领域,例如植物基因功能研究和作物遗传改良。

下面结合具体实施例,进一步阐述本发明。应理解,这些实施例仅用于说明本发明,而不用于限制本发明的范围。下列实施例中未注明具体条件的实验方法,通常按照常规条件如Sambrook等人,分子克隆:实验室手册(New York:Cold Spring HarborLaboratoryPress,1989)中所述的条件,或按照制造厂商所建议的条件。本发明中所涉及的实验材料如无特殊说明均可从市售渠道获得。

材料

MAD7蛋白的编码序列为针对水稻进行密码子优化的编码序列,具体序列见SEQ IDNO.1。

序列二MAD7之水稻crRNA表达盒的相关序列(SEQ ID NO.2),该表达盒中的元件结构如图1所示,该序列前后下划线分别标示AvrII、AfeI酶切位点,为方便克隆至pCAMBIA表达载体而设置;黑色底纹标示MAD7对应的成熟型DR序列;方框内为sg位点,构建基因敲除载体时该序列人工合成互补双链,同OsU3启动子的 PCR产物通过Overlapping PCR法扩增全长;加粗字母为转录终止子序列;其余为OsU3启动子的序列。

序列三MAD7之水稻多基因位点编辑sg-DR crRNA表达盒的相关序列(SEQ IDNO.3),该表达盒中的元件结构如图2所示,其中,下划线标示BsaI酶切位点,为方便克隆至pCAMBIA表达载体而设置;黑色底纹标示MAD7对应的成熟型DR序列;方框内为四个靶向位点的sg序列,按5’到3’的顺序分别为OsDEP1-g6、OsBEL260-g1、OsRoc5-g1和OsHD3A;加粗字母为转录终止子序列;其余为OsU3启动子的序列。

序列四MAD7之水稻多基因位点编辑tRNA-sg-DR crRNA表达盒的相关序列(SEQ IDNO.4),该表达盒中的元件结构如图3所示,其中,前后下划线分别标示AvrII、BsaI酶切位点,为方便克隆至pCAMBIA表达载体而设置;黑色底纹标示MAD7对应的成熟型DR序列;方框内为四个靶向位点的sg序列,按5’到3’的顺序分别为OsDEP1-g6、OsBEL260-g1、OsRoc5-g1和OsHD3A;双下划线为tRNA序列;加粗字母为转录终止子序列;其余为OsU3启动子的序列。

序列五MAD7之水稻多基因位点编辑miniOsU3/U6-DR-sg crRNA表达盒的相关序列(SEQ ID NO.5),该表达盒中的元件结构如图4所示,其中,前后下划线分别标示AvrII、BsaI酶切位点,为方便克隆至pCAMBIA表达载体而设置;黑色底纹标示MAD7对应的成熟型DR序列;方框内为四个靶向位点的sg序列,按5’到3’的顺序分别为OsDEP1-g6、OsBEL260-g1、OsRoc5-g1和OsHD3A;加粗字母为转录终止子序列;其余为miniOsU3/U6启动子的序列。

序列六MAD7之水稻多基因位点编辑HH-DR-sg-HDV crRNA表达盒的相关序列(SEQID NO.6),该表达盒中的元件结构如图5所示,其中,下划线标示BsaI酶切位点,为方便克隆至pCAMBIA表达载体而设置;黑色底纹标示MAD7对应的成熟型DR序列;方框内为四个靶向位点的sg序列,按5’到3’的顺序分别为OsDEP1-g6、OsBEL260-g1、OsRoc5-g1和OsHD3A;加粗字母为转录终止子序列;双下划线和点分别为hammerhead (HH)、Hepatitis deltavirus(HDV)核酶序列。

其中,HH 核酸序列中的5’

序列二十一MAD7之玉米crRNA表达盒的相关序列(SEQ ID NO.21),该表达盒中的元件结构如图6所示,其中,前后下划线分别标示ApaI酶切位点,为方便克隆至pCAMBIA表达载体而设置;黑色底纹标示MAD7对应的成熟型DR序列;方框内为sg位点,构建基因敲除载体时该序列人工合成互补双链,同ZmU3启动子的 PCR产物通过Overlapping PCR法扩增全长;加粗字母为转录终止子序列;其余为ZmU3启动子的序列。

方法

1)构建CRISPR-MAD7表达载体用于单位点敲除

对MAD7进行水稻密码子优化,构建MAD7和crRNA两个表达盒并克隆到pCAMBIA表达载体上。以水稻为例,crRNA表达盒(SEQ ID NO:2)从5’-3’具有以下4个元件:OsU6或OsU3启动子、MAD7对应的成熟型直接重复序列(direct repeat ,DR)、sg序列、转录终止子序列(TTTTTTT)。MAD7表达盒从5’-3’具有以下元件:来源于玉米的Ubi启动子、NLS核定位信号序列(nNLS)、MAD7的编码序列、第二段NLS核定位信号序列(cNLS)、NOS转录终止子序列(图7)。本发明的另一设计是改变sg长度,或者在上述构造的基础上去掉MAD7编码序列5’端或3’端的NLS核定位信号序列,其它元件保留(图8),以探讨不同组合时MAD7在体内的切割活性。

2)构建CRISPR-MAD7载体用于多位点敲除

由于MAD7自身具有RNA酶活性,可以自我剪切加工转录的前体crRNA序列,推测如果一个crRNA表达盒串联多个DR-sg序列,转录后可由MAD7剪切分成单个的DR-sg序列,从而方便的实现多位点敲除。该设计需要构建多位点crRNA表达盒,以水稻为例,从5’-3’具有以下元件:OsU6或OsU3启动子、MAD7对应的crRNA序列(含DR序列)、对应靶标位点1的sg1序列、crRNA序列、对应靶标位点2的sg2序列、crRNA序列、对应靶标位点3的sg3序列、crRNA序列、对应靶标位点N的sgN序列、转录终止子序列(TTTTTTT)。本发明的另一设计是多个DR-sg分别由miniOsU3/U6启动子驱动,或将不同DR-sg序列用tRNA加工识别序列、或HH-HDV间隔连接,而MAD7表达盒与单位点敲除的构建一样。最后把上述crRNA和MAD7核酸酶两个表达盒克隆到pCAMBIA表达载体上(图9-13)。

3)利用CRISPR-MAD7进行同源重组或基于非同源末端连接(non-homologous endjoining、NHEJ)介导的外源片段定点插入。

较Cas9切割产生平末端相比, MAD7与Cpf1一样切割产生粘性末端,理论上也更适合进行外源片段的定向插入。利用CRISPR-MAD7在靶标位点附近制造一个DSB,同时利用基因枪轰击或DNA病毒复制的方式导入大量外源片段,即可高效地实现植物细胞的基因同源重组或定向插入。

实施例1利用CRISPR-MAD7 (ncNLS)系统对水稻内源基因进行单位点敲除

采用LbCpf1高效编辑OsHD3A启动子靶向位点 (LOCOs06g06320,编辑效率81.5%),分别通过AvrII、Afel酶切位点连接到pCAMBIA-CRISPR-MAD7表达载体上。构建好的载体转化到农杆菌EHA105,然后通过该菌株侵染水稻品种南粳46 (Oryza sativa ssp japonicacv. Nangeng46) 的愈伤组织,共培养3天后分别30℃和34℃恢复4天,所转化的愈伤组织转移到含有潮霉素的筛选培养基,培养28-30天后转移到含有潮霉素的分化培养基中再生植株,再生植株取样提取DNA,Taqman检测MAD7阳性单株,并对阳性单株靶标位点进行扩增测序。结果显示该系统能在水稻细胞内靶向切割产生突变并生成突变体植株,30℃和34℃恢复培养时,OsHD3A位点编辑效率分别为89.9%和94.9%,两个等位基因同时被编辑的频率(含homo)高达77.5%和78.1%,与LbCpf1的编辑效率相当,两个不同温度处理下的编辑效率间不存在显著差异(表1)。

表1 CRISPR/MAD7 (ncNLS)系统水稻内源基因单位点敲除的PAM-sg序列及T0代植株鉴定结果

注:括号内数字为无测序结果单株数;下划线表示PAM序列;WT代表野生型,He代表杂合突变体,Bi代表等位双突变体(包含Homo纯合突变体)。编辑效率(%)=突变株数/(MAD7

实施例2利用CRISPR-MAD7 (ncNLS)系统对水稻多个内源基因进行单位点敲除

为进一步验证CRISPR-MAD7 (ncNLS)系统在植物细胞内靶向切割的效率,选取5个文章报道的水稻中Cpf1的编辑位点(OsRLK-799-g1, LOC_Os02g07960; OsDEP1-g6, LOC_Os09g26999; OsALS-g7, LOC_Os02g30630; OsBEL260-g1, LOC_Os03g55260; OsRoc5-g1,LOC_Os02g45250),同时根据已知基因序列新设计CRISPR-MAD7靶向位点(OsDEP1-g7;OsPDS1-g3;LOC_Os03g08570; OsRoc5-g2和OsBEL260-g4),人工合成DR-sgRNA,overlapPCR扩增产物通过酶切位点连接到pCAMBIA-CRISPR-MAD7表达载体上。构建好的载体转化到农杆菌EHA105,然后通过该菌株侵染水稻品种南粳46的愈伤组织,共培养3天后30℃恢复培养4天,所转化的愈伤组织转移到含有潮霉素的筛选培养基,培养28-30天后转移到含有潮霉素的分化培养基中再生植株,再生植株取样提取DNA,Taqman检测MAD7阳性单株,并对阳性单株靶标位点进行扩增测序。结果显示该系统在水稻细胞内对多个内源基因的多个靶点高效切割,编辑效率高达59.6%-96.9%,两个等位基因同时被编辑的频率(含homo)高达34.8%-95.9%,利用根据本发明构建的核酸构建物或组合CRISPR-MAD7可在植物细胞内高效编辑(表2)。

表2 CRISPR/MAD7 (ncNLS)系统水稻多个内源基因单位点敲除的PAM-sg序列及T0代植株鉴定结果

注:括号内数字为无测序结果单株数;下划线表示PAM序列;WT野生型,He杂合突变体,Bi等位双突变体(包含Homo纯合突变体)。编辑效率(%)=突变株数/(MAD7

实施例3 CRISPR-MAD7系统不同NLS位置和数目对水稻内源基因单位点敲除

实施例1中CRISPR-MAD7系统PCR扩增产物分别通过BsrGI和AvrII酶切位点、或ApaI酶切位点连接到PCAMBIA-CRISPR-MAD7表达载体上,构建pCAMBIA-CRISPR-nNLS-MAD7(去掉MAD7 核酸编辑酶C端NLS核定位序列)、pCAMBIA-CRISPR-MAD7-cNLS(去掉MAD7 核酸编辑酶N端NLS核定位序列)系统。构建好的载体转化到农杆菌EHA105,然后通过该菌株侵染水稻品种南粳46的愈伤组织,共培养3天后30℃恢复培养4天,所转化的愈伤组织转移到含有潮霉素的筛选培养基,培养28-30天后转移到含有潮霉素的分化培养基中再生植株。再生植株取样提取DNA,Taqman检测MAD7阳性单株,并对阳性单株靶标位点进行扩增测序。结果显示CRISPR-MAD7 (ncNLS)、CRISPR-MAD7 (nNLS)和CRISPR-MAD7 (cNLS)系统在水稻细胞内编辑效率分别为89.9%、89.0%和78.7%,biallelic(含homo)频率分别为77.5%、85.4%和54.7%,去掉MAD7蛋白N端核定位信号载体在水稻细胞内编辑效率有轻微下降,双等位基因编辑的频率显著下降(表3)。

表3 CRISPR-MAD7系统不同NLS位置和数目对水稻内源基因单位点敲除PAM-sg序列及T0代植株鉴定结果

注:括号内数字为无测序结果单株数;下划线表示PAM序列;WT野生型,He杂合突变体,Bi等位双突变体(包含Homo纯合突变体)。编辑效率(%)=突变株数/(MAD7

实施例4 CRISPR-MAD7系统不同sg长度对水稻内源基因单位点敲除

同实施例1中sg序列,长度分别去掉2bp、4bp或增加2bp,通过AvrII、RsrII酶切位点连接到pCAMBIA-CRISPR-MAD7表达载体上。构建好的载体转化到农杆菌EHA105,然后通过该菌株侵染水稻品种南粳46的愈伤组织,共培养3天后30℃恢复培养4天,所转化的愈伤组织转移到含有潮霉素的筛选培养基,培养28-30天后转移到含有潮霉素的分化培养基中再生植株。再生植株取样提取DNA,Taqman检测MAD7阳性单株,并对阳性单株靶标位点进行扩增测序。结果显示随着sg长度从19bp、21bp、23bp增加到25bp,水稻细胞内编辑频率和biallelic(含homo)频率分别从95.7%、89.2%呈趋势递减到85.9%、56.5%,除25bp sg较其他长度的biallelic频率显著降低外,不同长度sg载体间编辑率和biallelic频率不存在显著差异(表4)。

表4 CRISPR-MAD7系统不同sg长度对水稻内源基因单位点敲除PAM-sg序列及T0代植株鉴定结果

注:括号内数字为无测序结果单株数;下划线表示PAM序列;WT野生型,He杂合突变体,Bi等位双突变体(包含Homo纯合突变体)。编辑效率(%)=突变株数/(MAD7

实施例5包含DR-sg序列串的CRISPR-MAD7载体用于水稻多位点敲除

因MAD7具有自主剪切、加工pre-crRNA的能力,本实施例选取实施例2中4个文章报道的Cpf1的编辑位点(OsDEP1-g6, OsBEL260-g1, OsRoc5-g1, OsHD3A-g22),通过MAD7的成熟DR序列间隔连接,并处于同一个OsU3启动子的控制(SEQ ID NO.3)。随后将该表达盒与MAD7表达盒连接并置于pCAMBIA的LB与RB序列内。构建好的载体转化到农杆菌EHA105,然后通过该菌株侵染水稻品种南粳46的愈伤组织,共培养3天后30℃恢复培养4天,所转化的愈伤组织转移到含有潮霉素的筛选培养基,培养28-30天后转移到含有潮霉素的分化培养基中再生植株。再生植株取样提取DNA,Taqman检测MAD7阳性单株,并对阳性单株靶标位点进行扩增测序。结果显示该系统4个基因突变频率分别为34.0%、80.9%、3.2%和3.2%,两个等位基因同时被编辑的效率分别为11.7%、59.6%、0%和0 %。该系统第一、第二个基因能高效率地在水稻细胞内进行基因编辑,因U3属于Pol III类型启动子,驱动长链的能力有限,该系统的第三、第四个基因编辑效率显著下降,且突变基因型全部为杂合;未发现两个等位基因同时被编辑的单株和多个基因同时被编辑的单株(表5)。

表5 CRISPR-MAD7(DR串联sgRNA)多基因编辑系统对水稻不同基因进行敲除PAM-sg序列及T0代植株鉴定结果

注:括号内数字为无测序结果单株数;下划线表示PAM序列;WT野生型,He杂合突变体,Bi等位双突变体(包含Homo纯合突变体)。编辑效率(%)=突变株数/(MAD7

实施例6利用tRNA串联DR-sg序列的CRISPR-MAD7载体用于水稻多位点敲除

将实施例5中DR-sg序列串通过內源tRNA加工系统中RNAase的识别位点间隔连接,并处于同一个OsU3启动子的控制(序列四SEQ ID NO.4)。随后将该表达盒与MAD7表达盒连接并置于pCAMBIA的LB与RB序列内。构建好的载体转化到农杆菌EHA105,然后通过该菌株侵染水稻品种南粳46的愈伤组织,共培养3天后30℃恢复培养4天,所转化的愈伤组织转移到含有潮霉素的筛选培养基,培养28-30天后转移到含有潮霉素的分化培养基中再生植株。再生植株取样提取DNA,Taqman检测MAD7阳性单株,并对阳性单株靶标位点进行扩增测序。结果显示该系统4个基因突变频率分别为49.4%、91.0%、71.9%和68.2%,两个等位基因同时被编辑的效率分别为14.6%、78.7%、58.4%和47.7 %,4个基因同时突变的频率占阳性单株的38.2%,该系统能高效地在水稻细胞内同时进行多基因编辑(表6)。

表6 CRISPR-MAD7(tRNA串联DR-sgRNA)多基因编辑系统对水稻不同基因进行敲除PAM-sg序列及T0代植株鉴定结果

注:括号内数字为无测序结果单株数;下划线表示PAM序列;WT野生型,He杂合突变体,Bi等位双突变体(包含Homo纯合突变体)。编辑效率(%)=突变株数/(MAD7

实施例7利用miniOsU3/ miniOsU6分别驱动DR-sg序列的CRISPR-MAD7载体用于水稻多位点敲除

将实施例5中DR-sg序列串利用miniOsU3/ miniOsU6分别驱动(SEQ ID NO.5)。随后将该表达盒与MAD7表达盒连接并置于pCAMBIA的LB与RB序列内。构建好的载体转化到农杆菌EHA105,然后通过该菌株侵染水稻品种南粳46的愈伤组织,共培养3天后30℃恢复培养4天,所转化的愈伤组织转移到含有潮霉素的筛选培养基,培养28-30天后转移到含有潮霉素的分化培养基中再生植株。再生植株取样提取DNA,Taqman检测MAD7阳性单株,并对阳性单株靶标位点进行扩增测序。结果显示该系统能高效率地在水稻细胞内同时进行多基因编辑,4个基因突变频率分别为44.4 %、94.4%、92.2%和90.0%,两个等位基因同时被编辑的效率分别为22.2%、93.3%、86.7%和87.8%,4个基因同时突变的频率占阳性单株的42.2%,该系统能高效地在水稻细胞内同时进行多基因编辑(表7)。

表7 CRISPR-MAD7(miniOsU3/miniOsU6分别驱动DR-sgRNA)多基因编辑系统对水稻不同基因进行敲除PAM-sg序列及T0代植株鉴定结果

注:括号内数字为无测序结果单株数;下划线表示PAM序列;WT野生型,He杂合突变体,Bi等位双突变体(包含Homo纯合突变体)。编辑效率(%)=突变株数/(MAD7

实施例8利用Pol II类型启动子驱动、HH-HDV串联DR-sg序列的CRISPR-MAD7载体用于水稻多位点敲除

在实施例5-7中,利用OsU3或miniOsU3/miniOsU6启动子驱动的DR-guide阵列能实现水稻4个基因位点的高效敲除,但U3/U6均属于Pol III类型启动子,驱动长链的能力有限,而且Pol III类型启动子不具备条件特异性或组织特异性激活能力,但是Pol II类似的启动子能有效克服上述缺陷。在该实施例中,构建Pol II类型的启动子玉米Ubiquitin驱动crRNA表达盒,利用两种具有RNA自剪切活性的核酶hammerhead ribozyme (HH)和Hepatitis deltavirus ribozyme (HDV)把转录后的DR-guide靶向序列分离出来(序列六SEQ ID NO.6),同时构建OsU3启动子驱动crRNA表达盒的对照,将上述两个crRNA表达盒分别与原有的MAD7表达盒克隆到pCAMBIA表达载体上。构建好的载体转化到农杆菌EHA105,然后通过该菌株侵染水稻品种南粳46的愈伤组织,共培养3天后30℃恢复培养4天,所转化的愈伤组织转移到含有潮霉素的筛选培养基,培养28-30天后转移到含有潮霉素的分化培养基中再生植株。再生植株取样提取DNA,Taqman检测MAD7阳性单株,并对阳性单株靶标位点进行扩增测序。结果显示OsU3-HH-HDV系统4个基因突变频率分别为7.6%、6.7%、0%和3.3%,且除第二个基因上检测到一个两个等位基因同时被编辑的突变单株外,其余各基因突变单株均为杂合(表8)。ZmUbi-HH-HDV系统4个基因突变频率分别为82.6%、92.1%、88.8%和93.3%,两个等位基因同时被编辑的效率分别为62.8%、84.3%、84.3%和92.1 %(表8),使用效果甚至超过了单位点敲除的编辑效率,且4个基因同时突变的频率占阳性单株的77.5%,该系统能非常高效率地在水稻细胞内同时进行多基因编辑(表8)。

表8 CRISPR-MAD7(HH-HDV串联DR-sgRNA)多基因编辑系统对水稻不同基因进行敲除PAM-sg序列及T0代植株鉴定结果

注:括号内数字为无测序结果单株数;下划线表示PAM序列;WT野生型,He杂合突变体,Bi等位双突变体(包含Homo纯合突变体)。编辑效率(%)=突变株数/(MAD7

实施例9利用CRISPR-MAD7 (ncNLS)系统对玉米内源基因进行单位点敲除

为进一步验证CRISPR-MAD7 (ncNLS)系统在植物细胞内靶向切割的效率,选取文章报道的玉米中Cpf1的编辑位点(glossy2,Zm00001d002353),人工合成DR-sgRNA,overlapPCR扩增产物通过ApaI酶切位点连接到pCAMBIA-CRISPR-MAD7表达载体上。构建好的载体转化到农杆菌LBA4404,然后通过该菌株侵染玉米品种B104的幼胚,共培养7天后28℃恢复培养两周,所转化的幼胚转移到含有甘露糖的筛选培养基,培养两周后转移到含有甘露糖的分化培养基中再生植株,再生植株取样提取DNA,Taqman检测MAD7阳性单株,并对阳性单株靶标位点进行扩增测序。结果显示该系统能在玉米细胞内靶向切割产生突变并生成突变体植株,编辑效率为6.5%;当MAD7成熟DR序列5′端增加一个碱基C时(图14),MAD7在玉米细胞内靶向切割产生突变的效率提高,编辑效率提高到13.7%,为MAD7在玉米中编辑应用提供了新的思路。

表9 CRISPR/MAD7 (ncNLS)系统玉米内源基因单位点敲除的PAM-sg序列及T0代植株鉴定结果

注:括号内为载体编号;下划线表示PAM序列;编辑效率(%)=突变株数/(MAD7

以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明所述原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

序列表

<110> 科稷达隆(北京)生物技术有限公司

<120> MAD7-NLS融合蛋白、用于植物基因组定点编辑的核酸构建物及其应用

<160> 21

<170> SIPOSequenceListing 1.0

<210> 1

<211> 3792

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 1

atgaacaatg gcaccaacaa tttccagaat ttcatcggca tctccagcct gcaaaagaca 60

ctcaggaacg ccctgatccc gacggagaca acacagcagt tcatcgtgaa gaatggcatc 120

atcaaggagg atgagctccg gggcgagaac cgccagatcc tgaaggacat catggacgat 180

tactaccggg gcttcatctc cgagacactg tcttcaatcg acgatatcga ctggacgagc 240

ctcttcgaga agatggagat ccagctgaag aatggcgata acaaggacac actcatcaag 300

gagcagacgg agtaccgcaa ggccatccat aagaagttcg cgaatgacga taggttcaag 360

aacatgttct cggcgaagct catctccgat atcctgccag agttcgtgat ccacaacaat 420

aactactcag cctcggagaa ggaggagaag acccaggtca tcaagctgtt ctcccggttc 480

gcgacatctt tcaaggacta cttcaagaat cgcgccaact gcttctctgc ggacgatatc 540

tcgtccagct cttgccatcg catcgtgaat gataacgccg agatcttctt ctcaaacgcg 600

ctcgtgtacc gcaggatcgt caagtccctg agcaatgacg atatcaacaa gatctcaggc 660

gatatgaagg actcactcaa ggagatgtcg ctggaggaga tctactcgta cgagaagtac 720

ggcgagttca tcacccagga gggcatcagc ttctacaacg acatctgcgg caaggtcaat 780

tctttcatga acctgtactg ccagaagaat aaggagaata agaacctcta caagctgcag 840

aagctccata agcagatcct ctgcatcgcc gatacaagct acgaggtgcc ttacaagttc 900

gagtccgacg aggaggtgta ccagagcgtc aatggcttcc tcgataacat ctcatcgaag 960

cacatcgtcg agaggctgcg gaagatcggc gataattaca acggctacaa cctcgacaag 1020

atctacatcg tgtccaagtt ctacgagtct gtctcacaga agacctacag ggattgggag 1080

acaatcaaca cagcgctcga gatccactac aataacatcc tgccgggcaa cggcaagagc 1140

aaggccgata aggtgaagaa ggcggtcaag aatgacctcc agaagtctat caccgagatc 1200

aatgagctcg tgtcaaacta caagctgtgc tcggacgata acatcaaggc cgagacatac 1260

atccacgaga tctcccatat cctcaataac ttcgaggcgc aggagctgaa gtacaatccg 1320

gagatccatc tcgtcgagtc cgagctgaag gccagcgagc tcaagaatgt gctggacgtc 1380

atcatgaacg cgttccactg gtgctccgtg ttcatgaccg aggagctcgt cgacaaggat 1440

aataacttct acgccgagct ggaggagatc tacgatgaga tctacccagt gatctcgctg 1500

tacaatctcg tgcgcaacta cgtcacccag aagccatact ccacaaagaa gatcaagctc 1560

aacttcggca tccctacact ggccgacggc tggtcgaagt ccaaggagta ctcgaataac 1620

gcgatcatcc tcatgaggga taatctgtac tacctcggca tcttcaatgc gaagaacaag 1680

ccagacaaga agatcatcga gggcaatacg tccgagaaca agggcgatta caagaagatg 1740

atctacaatc tcctgccggg cccaaacaag atgatcccga aggtgttcct gtccagcaag 1800

acaggcgtcg agacatacaa gccatccgcc tacatcctcg agggctacaa gcagaacaag 1860

cacatcaagt cttcaaagga cttcgatatc acgttctgcc atgatctcat cgactacttc 1920

aagaattgca tcgcgatcca ccctgagtgg aagaacttcg gcttcgattt ctcagacaca 1980

tcgacgtacg aggacatctc cggcttctac cgggaggtgg agctccaggg ctacaagatc 2040

gattggacct acatcagcga gaaggacatc gatctcctgc aggagaaggg ccagctctac 2100

ctgttccaga tctacaacaa ggatttttcc aagaagtcca cgggcaatga caacctgcat 2160

accatgtacc tgaagaatct cttcagcgag gagaacctca aggacatcgt cctcaagctg 2220

aacggcgagg ccgagatctt cttcaggaag tcgtccatca agaatccaat catccacaag 2280

aagggctcta tcctggtgaa caggacctac gaggcggagg agaaggacca gttcggcaac 2340

atccagatcg tccggaagaa tatccctgag aacatctacc aggagctcta caagtacttc 2400

aatgataagt ctgacaagga gctctcagat gaggccgcga agctgaagaa tgtggtcggc 2460

caccatgagg ccgcgacgaa catcgtgaag gattaccggt acacctacga caagtacttc 2520

ctccatatgc cgatcaccat caatttcaag gccaacaaga caggcttcat caacgaccgc 2580

atcctccagt acatcgcgaa ggagaaggat ctgcacgtca tcggcatcga ccgcggcgag 2640

aggaatctga tctacgtgtc tgtcatcgat acctgcggca acatcgtgga gcagaagtca 2700

ttcaatatcg tcaacggcta cgattaccag atcaagctca agcagcagga gggagcaagg 2760

cagattgcca ggaaggagtg gaaggagatc ggcaagatca aggagatcaa ggagggctac 2820

ctctctctcg tgatccatga gatctcaaag atggtcatca agtacaacgc catcatcgcg 2880

atggaggacc tgagctatgg cttcaagaag ggccggttca aggtggagcg ccaggtctac 2940

cagaagttcg agacaatgct catcaataag ctgaactacc tcgtgttcaa ggacatctca 3000

atcacggaga acggcggcct cctgaagggc taccagctca cctacatccc ggataagctg 3060

aagaatgtgg gccaccagtg cggctgcatc ttctacgtcc ctgccgcgta cacaagcaag 3120

atcgacccga cgaccggctt cgtgaacatc ttcaagttca aggatctgac ggtcgacgcc 3180

aagagggagt tcatcaagaa gttcgattcg atccggtacg actccgagaa gaacctcttc 3240

tgcttcacgt tcgattacaa taacttcatc acgcagaata ccgtgatgag caagagctct 3300

tggtctgtgt acacctacgg cgtccggatc aagcggcgct tcgtcaatgg ccgcttctct 3360

aacgagtcag ataccatcga catcacaaag gatatggaga agacgctgga gatgaccgac 3420

atcaactgga gggatggcca tgacctccgg caggatatca tcgactacga gatcgtgcag 3480

cacatcttcg agatcttccg cctcacagtc cagatgagga acagcctgtc tgagctcgag 3540

gaccgcgatt acgacaggct catctcacct gtgctgaatg agaataacat cttctacgat 3600

tccgcaaagg cgggcgacgc cctcccgaag gatgcggatg ccaacggcgc atactgcatt 3660

gccctgaagg gcctctacga gatcaagcag atcacggaga attggaagga ggatggcaag 3720

ttctcgcgcg acaagctgaa gatctccaat aaggattggt tcgacttcat ccagaacaag 3780

aggtacctct aa 3792

<210> 2

<211> 462

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 2

cctaggaagg aatctttaaa catacgaaca gatcacttaa agttcttctg aagcaactta 60

aagttatcag gcatgcatgg atcttggagg aatcagatgt gcagtcaggg accatagcac 120

aagacaggcg tcttctactg gtgctaccag caaatgctgg aagccgggaa cactgggtac 180

gttggaaacc acgtgtgatg tgaaggagta agataaactg taggagaaaa gcatttcgta 240

gtgggccatg aagcctttca ggacatgtat tgcagtatgg gccggcccat tacgcaattg 300

gacgacaaca aagactagta ttagtaccac ctcggctatc cacatagatc aaagctggtt 360

taaaagagtt gtgcagatga tccgtggcag tcaaaagacc tttttaattt ctactcttgt 420

agataggaca ggtactacgt gctgatgttt ttttgcagcg ct 462

<210> 3

<211> 669

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 3

ggtctcaagg aatctttaaa catacgaaca gatcacttaa agttcttctg aagcaactta 60

aagttatcag gcatgcatgg atcttggagg aatcagatgt gcagtcaggg accatagcac 120

aagacaggcg tcttctactg gtgctaccag caaatgctgg aagccgggaa cactgggtac 180

gttggaaacc acgtgtgatg tgaaggagta agataaactg taggagaaaa gcatttcgta 240

gtgggccatg aagcctttca ggacatgtat tgcagtatgg gccggcccat tacgcaattg 300

gacgacaaca aagactagta ttagtaccac ctcggctatc cacatagatc aaagctggtt 360

taaaagagtt gtgcagatga tccgtggcag tcaaaagacc tttttaattt ctactcttgt 420

agatcagaaa gagaaggagg cacagatgtc aaaagacctt tttaatttct actcttgtag 480

atgtgccgga acagagacta catcagtcaa aagacctttt taatttctac tcttgtagat 540

taagcagctg gctgagggtg catgtcaaaa gaccttttta atttctactc ttgtagatag 600

gacaggtact acgtgctgat ggtcaaaaga cctttttaat ttctactctt gtagattttt 660

tttggtctc 669

<210> 4

<211> 1054

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 4

cctaggaagg aatctttaaa catacgaaca gatcacttaa agttcttctg aagcaactta 60

aagttatcag gcatgcatgg atcttggagg aatcagatgt gcagtcaggg accatagcac 120

aagacaggcg tcttctactg gtgctaccag caaatgctgg aagccgggaa cactgggtac 180

gttggaaacc acgtgtgatg tgaaggagta agataaactg taggagaaaa gcatttcgta 240

gtgggccatg aagcctttca ggacatgtat tgcagtatgg gccggcccat tacgcaattg 300

gacgacaaca aagactagta ttagtaccac ctcggctatc cacatagatc aaagctggtt 360

taaaagagtt gtgcagatga tccgtggcaa acaaagcacc agtggtctag tggtagaata 420

gtaccctgcc acggtacaga cccgggttcg attcccggct ggtgcagtca aaagaccttt 480

ttaatttcta ctcttgtaga tcagaaagag aaggaggcac agataacaaa gcaccagtgg 540

tctagtggta gaatagtacc ctgccacggt acagacccgg gttcgattcc cggctggtgc 600

agtcaaaaga cctttttaat ttctactctt gtagatgtgc cggaacagag actacatcaa 660

acaaagcacc agtggtctag tggtagaata gtaccctgcc acggtacaga cccgggttcg 720

attcccggct ggtgcagtca aaagaccttt ttaatttcta ctcttgtaga ttaagcagct 780

ggctgagggt gcataacaaa gcaccagtgg tctagtggta gaatagtacc ctgccacggt 840

acagacccgg gttcgattcc cggctggtgc agtcaaaaga cctttttaat ttctactctt 900

gtagatagga caggtactac gtgctgatgg tcaaaagacc tttttaattt ctactcttgt 960

agataacaaa gcaccagtgg tctagtggta gaatagtacc ctgccacggt acagacccgg 1020

gttcgattcc cggctggtgc atttttttgg tctc 1054

<210> 5

<211> 1048

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 5

cctaggggcc caatcggcag caaaggagtg gcccatgaag cccatcagga catgtattgc 60

agtatgggcc ggcccattac gcaattggac gacaacaaag gctagtatta gtaccacctc 120

ggctatccac atagatcaaa gctggtttaa aagagttgtg cagatgatcc gtggcagtca 180

aaagaccttt ttaatttcta ctcttgtaga tcagaaagag aaggaggcac agattttttt 240

tggcccaatc ggcagcaaag gaggcccagg acggaatagg ggaaaaagtt ggcccgatag 300

gagggaaagg cccaggtgct tacgtgcgag gtaggcctgg gctctcagca cttcgattcg 360

ttggcaccgg ggtaggatgc aatagagagc aacgtttagt accacctcgc ttagctagag 420

caaactggac tgccttatat gcgcgggtgc tggcttggct gccggtcaaa agaccttttt 480

aatttctact cttgtagatg tgccggaaca gagactacat catttttttg gcccaatcgg 540

cagcaaagga ggcccacgag cgtgtactac ggcccgggat gccgctgggc gctgcggggg 600

ccgttggatg gggatcggtg ggtcgcggga gcgttgaggg gagacaggtt tagtaccacc 660

tcgcctaccg aacaatgaag aacccacctt ataaccccgc gcgctgccgc ttgtgttggt 720

caaaagacct ttttaatttc tactcttgta gattaagcag ctggctgagg gtgcattttt 780

tttggcccaa tcggcagcaa aggaggccca cttttctccg tggtgggccg atccagctag 840

aggtccggcc cacaagtggc ccttgccccg tgggacggtg ggattgcaga gcgcgtgggc 900

ggaaacaaca gtttagtacc acctcgctca cgcaacgacg cgaccacttg cttataagct 960

gctgcgctga ggctcaggtc aaaagacctt tttaatttct actcttgtag ataggacagg 1020

tactacgtgc tgatgttttt ttggtctc 1048

<210> 6

<211> 725

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 6

ggtctctttg acctgatgag tccgtgagga cgaaacgagt aagctcgtcg tcaaaagacc 60

tttttaattt ctactcttgt agatcagaaa gagaaggagg cacagatggc cggcatggtc 120

ccagcctcct cgctggcgcc ggctgggcaa catgcttcgg catggcgaat gggacgaata 180

cgacctttga cctgatgagt ccgtgaggac gaaacgagta agctcgtcgt caaaagacct 240

ttttaatttc tactcttgta gatgtgccgg aacagagact acatcaggcc ggcatggtcc 300

cagcctcctc gctggcgccg gctgggcaac atgcttcggc atggcgaatg ggacgaatac 360

gacctttgac ctgatgagtc cgtgaggacg aaacgagtaa gctcgtcgtc aaaagacctt 420

tttaatttct actcttgtag attaagcagc tggctgaggg tgcatggccg gcatggtccc 480

agcctcctcg ctggcgccgg ctgggcaaca tgcttcggca tggcgaatgg gacgaatacg 540

acctttgacc tgatgagtcc gtgaggacga aacgagtaag ctcgtcgtca aaagaccttt 600

ttaatttcta ctcttgtaga taggacaggt actacgtgct gatgggccgg catggtccca 660

gcctcctcgc tggcgccggc tgggcaacat gcttcggcat ggcgaatggg actttttttg 720

gtctc 725

<210> 7

<211> 27

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 7

tttaaggaca ggtactacgt gctgatg 27

<210> 8

<211> 27

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 8

tttggaagga cagttaggca gcctggg 27

<210> 9

<211> 27

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 9

tttccagaaa gagaaggagg cacagat 27

<210> 10

<211> 27

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 10

tttgccaaca tacagattat agattaa 27

<210> 11

<211> 27

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 11

tttggtgccg gaacagagac tacatca 27

<210> 12

<211> 27

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 12

tttgtaagca gctggctgag ggtgcat 27

<210> 13

<211> 27

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 13

tttaatgcat ccagaacgag aaacggg 27

<210> 14

<211> 27

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 14

tttcagtgtc actccgtcca acccatt 27

<210> 15

<211> 27

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 15

tttgctgtca ctgtagcaga ggacatg 27

<210> 16

<211> 27

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 16

tttggaatat aatgatgctt gagcctt 27

<210> 17

<211> 23

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 17

tttaaggaca ggtactacgt gct 23

<210> 18

<211> 25

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 18

tttaaggaca ggtactacgt gctga 25

<210> 19

<211> 29

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 19

tttaaggaca ggtactacgt gctgatgat 29

<210> 20

<211> 27

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 20

tttggtcaca gatcacaaac ttcaaat 27

<210> 21

<211> 841

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 21

gggcccgaat tccatctaag tatcttggta aagcatggat taatttggat gcccacttca 60

ggtctatgca gctccggtgc cttgtgattg tgagttgtga ccgatgctca tgctattctg 120

catttctgcg atgtatgtag ctagtagatc ttcaaaacta acaccgcatg ccatcatcat 180

ccactgcttg attttagtct caccgctggc caaaaatgtg atgatgccag aaacctcaac 240

taccttgaat caacacgggc ccaacagtgt gatgacgaca gaaacaaaaa aaaatgagcc 300

aatagttcag aaggaggcac tatgcagaaa ctacatttct gaaggtgact aaaaggtgag 360

cgtagagtgt aattactagt agtttagcca ccattaccca aatgctttcg agcttgtatt 420

aagatttcct aagctgagca tcatcactga tctgcaggcc accctcgctt cgctgccaag 480

atcaacagca accatgtggc ggcaacatcc agcattgcac atgggctaaa gattgagctt 540

tgtgcctcgt ctagggatca gctgaggtta tcagtctttc ctttttttca tccaggtgag 600

gcatcaagct actactgcct cgattggctg gacccgaagc ccacatgtag gataccagaa 660

tgggccgacc caggacgcag tatgttggcc agtcccaccg gttagtgcca tctcggttgc 720

tcacatgcgt agaagccagc ttaaaaattt agctttggtg actcacagca gtcaaaagac 780

ctttttaatt tctactcttg tagatgtcac agatcacaaa cttcaaattt tttttgggcc 840

c 841

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号