首页> 中国专利> 编码BalI限制-修饰系统酶的基因

编码BalI限制-修饰系统酶的基因

摘要

公开了一种分离的BalI限制酶基因和分离的BalI修饰酶基因。还公开了大量生产BAlI限制酶的方法,包括培养含所述基因的转化子,然后从培养液中收集BalI限制酶。

著录项

  • 公开/公告号CN1138100A

    专利类型发明专利

  • 公开/公告日1996-12-18

    原文格式PDF

  • 申请/专利权人 宝酒造株式会社;

    申请/专利号CN96105959.1

  • 发明设计人 H·上野;石野良纯;加藤郁之进;

    申请日1996-02-02

  • 分类号C12N15/52;C12N15/60;C12N15/63;C12N9/88;

  • 代理机构中国专利代理(香港)有限公司;

  • 代理人姜建成

  • 地址 日本京都府

  • 入库时间 2023-12-17 12:48:12

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2005-03-30

    专利权的终止未缴年费专利权终止

    专利权的终止未缴年费专利权终止

  • 2003-02-12

    授权

    授权

  • 1998-02-04

    实质审查请求的生效

    实质审查请求的生效

  • 1996-12-18

    公开

    公开

说明书

本发明涉及用作遗传工程试剂的限制酶和修饰酶。具体地说,本发明涉及编码BalI限制-修饰系统酶的基因,和用其制备BalI限制酶的遗传工程方法。

由微白短杆菌ATCC 15831(本文以下称Bal菌株)产生BalI限制和修饰酶系统,而且由具有DNA切割活性的BalI限制酶和保护DNA免于BalI限制酶切割的BalI修饰酶(也称甲基酶或甲基转移酶)组成。BalI限制酶属于典型的II型限制酶。该酶识别含有具一旋转双轴结构的6个碱基(5′TGGCCA-3′)的序列,并在识别序列的G和C之间切割以得到平末端(Gelinas et al.,Journal of MolecularBiology,114,433-440(1977))。另一方面,BalI修饰酶有从识别序列的5′侧,将一甲基导入第4位胞嘧啶碱基(C)的作用,因此,该酶可保护DNA免于BalI限制酶的切割。

在上述Gelinas等人的Journal of Molecular Biology中描述了制备BalI限制酶的方法。然而,由于只能从BalI菌株得到少量的BalI限制酶,所以很难生产大量的该酶。认为只要克隆BalI限制酶基因就可经遗传工程方法生产大量的BalI限制酶。在所述的情况下,就需要BalI限制酶基因和BalI修饰酶基因。

Wilson(Gene,74,281-289(1988)描述了作为克隆的不同修饰酶之一的BalI修饰酶基因。然而,有关BalI修饰酶基因的鉴定未经详细描述,例如定义克隆它的方法和被克隆基因的结构或序列。另外也没有BalI限制酶基因的报道。

本发明的首要目的是提供编码BalI限制-修饰系统酶的基因,和通过产生新的微生物,特别是E.coli而制备BalI限制酶的方法,在所述新微生物中导入了质粒,所述质粒含有编码BalI限制-修饰系统酶的基因,所述基因适宜工业化生产BalI限制酶。

参考附图从下列描述中,本发明的该目的以及其它目的和优点对于本领域专业人员来说是显而易见的。

图1表明各缺失突变和修饰酶活性之间的关系。

图2表明构建pBSR1的步骤。

图3表明BalI限制和修饰酶基因的结构。

在第一方面,本发明涉及分离的BalI限制酶和可与其杂交的基因。这些基因有相等的功能。

在第二方面,本发明涉及分离的BalI修饰酶基因和可与其杂交的基因。这些基因有相等的功能。

在第三个方面,本发明涉及含有第一方面之基因的载体。

在第四个方面,本发明涉及含有第二方面基因的载体。

在第五个方面,本发明涉及含有第一方面和第二方面基因的载体。

在第六个方面,本发明涉及用可生产BalI限制酶的第三方面载体和第四方面载体转化的转化子。

在第七个方面,本发明涉及用可生产BalI限制酶之第五方面的载体转化的转化子。

在第八个方面,本发明涉及制备BalI限制酶的方法,包括培养第六方面或第七方面之转化子,然后从培养液中收集BalI限制酶。

本发明人进行了深入细致地研究以致成功地克隆了含编码Bal菌株之BalI限制-修饰系统酶的基因的DNA片断。本发明人还发现在细胞中积累了很大量的BalI限制酶,通过培养微生物,特别是E.coli,从培养液中可以得到大量的酶,所述微生物携带含有限制和修饰酶基因的一个质粒或分别含这些基因的质粒。

本文所用的术语″BalI限制酶″从种属上指具有BalI限制酶活性的多肽。

本文所用的术语″BalI修饰酶″从种属上指具有BalI修饰酶活性的多肽。

编码BalI限制-修饰系统酶的基因含有编码切割DNA活性之BalI限制酶的基因和编码保护DNA免于被BalI限制酶切割之修饰酶的基因。术语″编码限制-修饰系统酶的基因″指含有限制和修饰酶基因,和其单个基因的基因。换句话说,该术语指限制和/或修饰酶基因。这些基因可以单独或以复合体的形式使用。若使用上述两个基因克隆的质粒时,可以将两个基因克隆在相同质粒中,或也可以将这些基因分别克隆在不同的质粒中。

在本发明中,为了克隆编码限制-修饰系统酶的基因,常常使用称为载体修饰法或甲基酶选择法的方法(Wilson,Gene,74,281-289(1988))。该方法是基于预期限制酶基因和修饰酶基因彼此靠近。即具有修饰酶活性的某些克隆应同时拥有同源的限制酶基因。

然而,该方法不能直接用于克隆编码BalI限制-修饰系统酶的基因。

即,从具有BalI修饰酶活性的克隆中检测不到BalI限制酶活性。原因在于,例如,认为BalI限制酶基因不在BalI修饰酶基因的附近,或者尽管BalI限制酶基因位于BalI修饰酶基因的附近,但不能克隆到全长的BalI限制酶基因,或者尽管克隆了全长基因,但它在宿主中并未表达。此时,这就是不可能期望此为候选克隆没有限制酶活性的原因。

Wilson在上述Gene中已报告了多步骤克隆,它是一种研制的甲基酶选择方法,然而当基因在宿主E.coli中不能表达时,即使克隆了全长也不能表达,则不能使用不经修饰该方法。

结果,当将含有该基因的DNA片段插入质粒载体时,发现在E.coli中未表达BalI限制酶基因。因此,本发明人通过确定完整BalI限制酶基因的核苷酸序列,然后改变起始区以便与表达载体相连而分别构建了表达系统。此外,还发现编码BalI限制-修饰系统酶基因的适当克隆取决于所用的E.coli菌株。

下面说明克隆和表达BalI限制和修饰系统酶基因的方法。

(1)从作为DNA供体的Bal菌株中提取染色体DNA。用Sau 3AI限制酶部分消化染色体DNA,然后与含有BalI识别序列的载体相连。

(2)用(1)中得到的质粒文体转化E.coli ER 1648,通过质粒提取法制备质粒文库DNA。

(3)用BalI限制酶体外消化步骤(2)中制备的质粒文库DNA,其中不消化含有被表达的BalI修饰酶基因的质粒。

(4)回收步骤(3)中制备的质粒文库,再转化E.coli ER 1648,其中优选只将未被消化的环形质粒导入宿主以便可以筛选只表达BalI修饰酶的转化子。

(5)通过体外方法测量步骤(4)中得到之转化子的BalI限制酶活性。

如果检测到BalI限制酶活性,则BalI限制酶基因存在于克隆中并被表达。因此不需要下列步骤(6)-(10)。然而根据本发明,检测不到BalI限制酶活性并需要下列步骤。

(6)按上述Gelinas的方法,从Bal菌株中尽可能纯地纯化BalI限制酶,而且从蛋白质的氨基末端确定氨基酸序列。另外,进行SDS-聚丙烯酰胺凝胶电泳(SDS-PAGE),从而得到有关分子量的资料。

(7)从含BalI修饰酶基因的步骤(5)克隆中制备各种缺失突变体,然而确定BalI修饰酶基因的位置。

(8)在步骤(7)中制备的适当缺失突变体的完整核苷酸序列。然后,搜索开放式阅读框架(ORFs)以从步骤(6)和(7)中得到的资料预测BalI限制酶基因和BalI修饰酶基因。

(9)修饰BalI限制酶基因(在E.coli中未表达的)以便被表达,然后与一表达载体相连以构建用于BalI限制酶基因的表达载体。

(10)用含有步骤(7)中制备的BalI修饰酶基因的载体和在步骤(9)中制备的含有BalI限制酶基因的载体转化E.coli ER 1648以得到可生产BalI限制酶的转化子。

(11)培养步骤(10)中得到的转化子,然后得到大量的BalI限制酶。

正如在步骤(1)中所用的载体,可以使用含有BalI识别序列和由BalI限制酶切割的序列的载体。本发明人将BalI接头(5′-TTGGCCAA-3′)插入pBR 322的EcoRV位点和NruI位点以构建新导入BalI识别序列的载体,然后使用它。本发明人称该载体为pBBB1。

导入新的BalI识别序列的原因在于已知由于dcm甲基酶的作用,切割原存在于pBR322上的BalI识别序列很难。

在步骤(2)描述的转化中,根据本发明人的实验发现:根据所用的E.coli菌株得不到稳定的转化子。即,只有用E.coli ER 1648时才能得到稳定的转化子。但用菌株HB101或菌株MC 1061就得不到稳定的转化子。

因此,在下列步骤中使用菌株ER 1648。

本发明人从含有BalI修饰酶基因的Bal菌株中筛选含约5.2kbDNA片段的质粒,所述基因得自步骤(3)-(4)中的转化子。该质粒称为pBB5。

在步骤(5)中,测量所得克隆的BalI限制酶活性。用下述的体外方法检测BalI限制酶活性。

即,培养待测克隆,将培养液制成匀浆,通过超速离心得到除去了碎片的上清液。分别以上清液为酶组分,λ噬菌体DNA为底物,于37℃进行酶促反应。用琼脂糖凝胶电泳可分析反应产物。本发明人研究了来自含pBB5的E.coli ER 1648中提取物中的BalI限制酶活性,没有检测到该活性。没有活性的原因有上述三种可能。然而此时,无法预测哪个原因是真正的。为了确定这一点,完成下述过程。

在步骤(6)中,通过将纯化的BalI限制酶转移到聚偏二氟乙烯(PVDF)膜上,然后用自动氨基酸测序仪可以确定BalI限制酶的N-末端氨基酸序列。在SEQ ID NO:5中列出了用该方法确定的BalI限制酶的N-末端氨基的序列。另外,根据SDS-PAGE的结果,BalI限制酶的分子量约为29,000。

图1中列出了在步骤(7)中制备的各缺失突变体和BalI修饰酶活性间的关系。从结果发现BalI修饰酶基因位于约3.2kb DNA片段上。将该DNA片段插入pBBB1中而制备的质粒称为pBSR1。图2列出了构建pBSR1的方法。

在步骤(8),确定了插入pBSR1中的3.2kb DNA片段的整个核苷酸序列。该序列示于SEQ ID NO:6。另外,研究ORF,在核苷酸437-1276有一个正常方向(ORF1)ORF,在核苷酸1279-2058有一个反方向ORF(ORF2)。ORF1的核苷酸序列和推测的氨基酸序列示于SEQ ID NO:4。在SEQ ID NO:3只列出了氨基酸序列。ORF2的核苷酸序列和推测的氨基酸序列示于SEQ ID NO:2。在SEQ ID NO:1只列出了氨基的序列。从步骤(7)中制备的各缺失突变体与BalI修饰酶活性之间的关系,可以得出结论:ORF1编码BalI修饰酶。这可以由E.coli具有BalI修饰酶活性而得到证实,在所述的E.coli中,导入了经PCR只扩增ORF1得到的DNA片段克隆的表达载体。由步骤(6)中得到的N-末端氨基酸序列与ORF2的相同,从而确定了ORF2编码BalI限制酶。另外,从SEQ ID NO:1的氨基酸序列得出的分子量是29,043,这与步骤(6)中得到的SDS-PAGE的结果很吻合。在图3中列出了编码BalI限制-修饰系统酶之克隆基因的结构。在图3中,M代表修饰酶基因,R代表限制酶基因,箭头代表ORFs的方向。

因此,鉴定了编码BalI限制-修饰系统酶之克隆基因的结构。发现尽管克隆了完整的BalI限制酶基因,它在E.coli中也不表达。

在步骤(9)中,本发明人改变了ORF2的起始密码子,从GTG变成ATG,而且通过将该基因连在E.coli中作用很强的lac启动子下游还构建了用于BalI限制酶基因的表达系统。首先PCR扩增ORF2。在此PCR扩增中,设计了引物序列以便起始密码子是ATG。然后将扩增的基因连接到pSTV28载体(由Takara ShuzO Co.生产的)Lac启动子的下游。该载体称为pSRB8。将通过把pSRB8和表达BalI修饰酶的pBSR1导入E.coli ER 1648而得到的转化子称为E.coli ER1648/pBSR1/pSRB 8,而已以保藏号FERM BP -5229保存于National Institute e of Bioscience and Human-Technology,Agency of Industrial Science andTechnology,Ministry of International Trade andIudustry。

在步骤(10)中,检测1g培养的E.coli ER 1648/pBSR1/pSRB 8细胞,BalI限制酶活性约70,000单位,是Bal菌株所生产酶的数量的约100倍。在从培养液中纯化BalI限制酶时,从培养液中收集细胞后,通过例如超声处理和超离心,可以提取该酶。然后,结合除去核酸、盐析、亲和层析、凝胶过滤、离子交换层析等可纯化所述的酶。由这些方法可得到大量的BalI限制酶。

尽管序列与上述基因序列稍有不同,但用上述得到的基因作探针,在严格条件下杂交以便可以得到编码相似酶活性的相似基因。这些基因也包括在本发明范围内。

所述的严格条件指下列杂交条件,其中于65℃在含6×SSC(将8.76g NaCl和4.41g柠檬酸钠溶于1升水中制备1×SSC),1%十二烷基硫酸钠,鲑精子DNA 100μg/ml,5×Denhardt′s(含0.1%小牛血清白蛋白,0.1%聚乙烯吡咯烷酮和0.1% Ficoll)的溶液中,使固定到尼龙膜上的DNA与探针杂交20个小时。

至于通过杂交得到编码BalI限制-修饰系统酶的相似基因的方法,例如下述的方法是典型的。

首先,将来自所选基因源的染色体DNA与质粒或噬菌体载体相连,然后将其导入宿主以便按常规方法得到一文库。在平皿中培养文库,将在平皿上生长的菌落或噬菌斑转移到尼龙膜上。然后通过变性将DNA固定到膜上。通过在含有探针(可以用编码基因例如示于SEQID NO:2或SEQ ID NO:4或其部分的探针)的溶液中温育膜而使膜上的DNA与预先例如用32P标记的探针之间形成杂种。例如,在严格条件下,固定DNA的膜与探针杂交。

杂交后,洗掉非特异性吸附,通过例如放射自显影鉴定与探针形成杂种的克隆。重复该操作直到形成杂种的克隆成为单个的。将编码目标蛋白质的基因插入上述得到的克隆中。

例如按如下确定所得基因的核苷酸序列。然后,确定该基因是否编码目的BalI限制和修饰系统酶。

在通过杂交得到克隆的情况,通过在试管中培养转化子,然后按常规方法提取质粒(转化子是E.coli)来确定核苷酸序列。用适当的限制酶消化质粒。取出插入片段,然后亚克隆到例如M13噬菌体载体中,接着用双脱氧法确定核苷酸序列。若重组体是噬菌体,则用基本相似的过程可确定核苷酸序列。

有关来自培养以确定核苷序列的这些基本实验参见例如,T.Maniatis等人,Molecular Cloning A Laboratory Manual,1982,Cold Spring Harbor Laboratory。

为了确定得到的基因是否编码目的BalI限制和修饰系统酶,可将上述确定的核苷酸序列与示于SEQ ID NO:2或SEQ ID NO:4的核苷酸序列与示于SEQ ID NO:1或SEQ ID NO:3的氨基酸序列比较。

如果基因不含有编码BalI限制和修饰系统酶的完整区域,通过合成以所得基因为基础的DNA引物,然后PCR扩增所缺的区域或者用所得基因的片段为探针进一步筛选DNA文库。可以得到完整的编码区。

为了通过遗传工程方法得到具有BalI限制或修饰酶活性的多肽,按常规方法,将所得BalI限制-修饰系统的基因与可在例如E.coli,枯草芽孢杆菌、放线菌、酵母、动物细胞,昆虫细胞和植物细胞中表达的表达载体相连,然后将连接的载体导入宿主细胞以得到转化子。通过培养该转化子可生产具有BalI限制或修饰系统酶活性的多肽。

根据所用的表达载体,有时多肽以不溶物质(包涵体)而积累。在这种情况下,通过收集不溶物质,接着用变性剂例如脲使其溶解,然后除去变性剂,可以回收多肽。可以经测量BalI限制酶活性或BalI修饰酶活性证实表达与否。用上述体外方法可以测量BalI限制酶活性,由转化子DNA的BalI识别序列不为BalI限制酶消化证实BalI修饰酶活性。

为了从转化子纯化有BalI限制或修饰酶活性的多肽,可以使用与上述相似的层析技术。若表达产物以不溶物质而积累,如上所述,例如,破碎细胞后回收沉淀,然后用变性剂如脲溶解沉淀可以溶解表达产物。在除去变性剂并再折叠后,用上述层析得到有目的活性的多肽。

在本发明中,通过用含可被表达的BalI限制酶基因和BalI修饰基因之载体转化宿主,可以得到生产BalI限制酶的转化子。通过培养转化子可以生产BalI限制酶。

通过例如制备经修饰以便在宿主中表达pBSR1上之BalI限制酶基因的载体,可得到所述载体。至于BalI限制酶基因不能在E.coli中表达的原因,例如认为适于在E.coli中转录的任何启动子序列并不存在于限制酶结构基因的上游,而且在E.coli中,翻译起始密码子是低效的GTG。因此,通过将适当的启动子序列用体外遗传工程方法插入BalI限制酶基因的上游或者将起始密码子GTG用体外定点诱变变成ATG而得到目的载体。

如图3所示,限制酶基因和修饰酶基因的转录和翻译方向是相反的,各基因的末端彼此相对,以致可能在表达过程中,两个基因相互干扰。因此,将两个基因的方向置于相同方向,很容易表达基因。为了完成所述的修饰,例如首先分别用PCR扩增含全长限制酶基因的区域和含全长修饰酶基因的区域。在该情况下,设计引物序列以便可以用适宜限制酶的适宜识别序列,将其导入扩增基因的末端。然后,用这些位点同向连接两个基因,再克隆到有适宜启动子如Lac启动子的表达载体中,可以得到目的载体。

可以按上述用这些载体转化宿主细胞,培养所得的转化子,并纯化表达的酶。

实施例

下列实施例会进一步详细说明本发明,但不限制其范围。实施例1从BalI菌株制备染色体DNA

于37℃在100ml L肉汤(10g/l胰蛋白胨,5g/l酵母提取物,5g/L NaCl)培养Bal菌株过夜,然后离心收集细胞。将细胞悬于10ml溶液A(25mM Tris-HCl(pH 8.0),50mM葡萄糖,10mM EDTA)中。加入1ml溶菌酶溶液(在溶液A中溶解,2mg/ml)并搅拌,然后将溶液于37℃放15分钟。将28ml溶液B(100mM NaCl,100mMTris-HCl,(pH8.0))加到溶液中,搅拌混合物。加入4ml 10% SDS溶液,搅拌混合物并于37℃放1小时。将1ml溶液C(10% SDS,8% Sarcosyl)加到溶液中,搅拌混合物并于60℃放15分钟。放置溶液后,加入等体积的酚∶氯仿(1∶1)混合物。将混合物缓慢搅拌10分钟,离心(5000xg,10分钟)分离水层和氯仿层。分离后,取出水层,然后将等体积异丙醇加入其中。搅拌混合物并于0℃放10分钟,离心(13,500xg,10分钟)沉淀DNA。用70%乙醇洗涤沉淀,溶于10ml TE溶液(10mM Tris-HCl,(pH8.0),1mM EDTA)并于4℃贮存。实施例2构建克隆载体

按下述构建其中在pBR332的EcoRV限制位点和NruI限制位点导入了BalI接头(5′-TTGGCCAA-3′)的载体。

首先,在缓冲液(10mM Tris-HCl(pH 7.5),7mM MgCl2,150mMNaCl,7mM 2-巯基乙醇,0.01%小牛血清白蛋白)中,于37℃用150单位EcoRV限制酶将25μg pBR 322消化1小时,然后经乙醇沉淀回收质粒DNA。将该DNA溶于100mM Tris-HCl(pH8.0)中。加入2.5单位碱性磷酸酶(由Takara Shuzo Co生产的),于55℃温育1小时。然后进行酚提取和乙醇沉淀以回收DNA。另一方面,用10单位T4多核苷酸激酶(由Takara Shuzo Co.生产的)使100pmol BalI接头的5′末端磷酸化,用乙醇沉淀回收磷酸化的接头DNA。于5℃在连接酶缓冲液(66mM Tris-HCl(pH7.6),6.6mM二硫苏糖醇(DTT),0.1mM ATP)中,用700单位T4DNA连接酶(由Takara Shuzo Co生产的)将50pmol磷酸化的BalI接头和由EcoRV酶解的1μg pBR 322 DNA连接16小时,然后于75℃加热5分钟,用20单位EcoRV消化。用由此得到的质粒DNA转化E.coli HB101,然后放在含100μg/ml氨苄青霉素的L肉汤琼脂上。分离于37℃生长的菌落,于37℃在2mlL肉汤中培养16小时,然后收集细胞。用碱性SDS方法从细胞中分离质粒。

即将0.2ml溶液I(50mM葡萄糖,10mM Tris-HCl(pH8.0),5mMEDTA)加到收集的细胞中,然后悬浮细胞。加入0.4ml溶液II(0.2NNaOH,1%SDS),使混合物于0℃保持5分钟。将0.3ml溶液III(5M乙酸钾(pH4.8))加到混合物中,然后将混合物于0℃15分钟。离心除去上清液。加入0.6ml异丙醇并于0℃保持10分钟后,离心收集DNA,然后用70%乙醇洗涤沉淀。将0.1ml 20μg/ml RN ase加到沉淀中,于37℃反应40分钟。加入0.03ml 1M MgCl2,使混合物于0℃保持10分钟。离心得到上清液并向其中加入0.06ml溶液IV(20%聚乙二醇#6000,2M NaCl)。搅拌混合物并于0℃保持60分钟。离心收集沉淀,然后溶于TE溶液中。将该DNA溶液与BalI限制酶反应,然后进行琼脂糖凝胶电泳以筛选含BalI接头的质粒。

然后用NruI限制酶消化其中在EcoRV位点插入了BalI接头的质粒,以便用与上述相似的方法在NruI位点导入BalI接头。因此,得到在pBR 322的EcoRV限制位点和Nru限制位点导入了BalI接头的载体。该载体称为pBBB1。实施例3制备文库

在缓冲液(50mM Tris-HCl,(pH 7.5),10mM MgCl2,1mM DTT,100mM NaCl)中,用1单位Sau 3AI限制酶部分消化实施例1中得到的25μg染色体DNA,经琼脂糖凝胶电泳以回收3-7kb DNA片段。将这些DNA片段与预先经BamHI酶解的pBBB1相连,然后用这些质粒转化E.coli ER 1648。用碱性SDS方法从由此得到的转化子中提取质粒以制备质粒文库。实施例4分离修饰酶基因

将实施例3中制备的3μg质粒文库与50单位BalI限制酶在缓冲液(20mM Tris-HCl pH8.5),7mM MgCl2,7mM 2-巯基乙醇,0.01%小牛备清白蛋白)中反应。在该反应中,BalI限制酶不酶切表达BalI修饰酶的质粒。反应后,经酚提取和乙醇沉淀回收DNA。然后将DNA溶于100mM Tris-HCl(pH 8.0)中。加入2.5单位碱性磷酸酶,于55℃反应1小时,然后进行酚提取和乙醇沉淀以便再回收DNA。用酶切或未被酶切的所得质粒转化E.coli ER 1648。在该转化中,只有未被酶切的环状质粒被优选地导入可在含氨苄青霉素的平皿上以转化子而被筛选的E.coli中。因此,出现约10,000个菌落,随机从中筛选十个菌落。然后,在含100μg/ml氨苄青霉素的2mlL肉汤中,于37℃将各菌落培养16小时,收集细胞。用碱性SDS方法提取质粒,然后用BalI限制酶处理。因此,三个质粒有BalI限制酶抗性。其中的2个质粒在其上本身没有BalI位点,只有剩下的一个表达BalI修饰酶基因。用该方法得到含BalI修饰酶基因的转化子。然而,该转化体没有BalI限制酶活性。实施例5分析修饰酶基因

在实施例4所得的表达BalI修饰酶的质粒含有一个约5.2kb来自Bal菌株的DNA片段。称该质粒为pBB5。为了确定BalI修饰酶基因的位置,制作所述DNA片段的限制图谱。用该图谱,制备含有其中缺失了各区域之DNA片段的质粒,测量由此表达的修饰酶活性。结果示于图1。即发现BalI修饰酶基因位于约3.2kb DNA片段上。从pBB5切出含该约3.2kb片段的EcoRV-SspI片段(3.7kb),然后与pBBB1相连以得到称为pBSR1的质粒。pBSR1的构建过程示于图2。实施例6确定BalI限制酶的N-末端氨基酸序列

按Gelinas的方法从Bal菌株中纯化Bal限制酶,并径SDS-PAGE,然后转移到PVDF膜上。完成考马斯亮兰染色,用10%乙酸-50%甲醇进行脱色。切下含BalI限制酶之相应的MW 29,000区,用氨基酸测序仪470A(由Applied Biosystems制造)经自动的Edman降解,确定该蛋白质的N-末端氨基的序列。氨基酸序列示于SEQ ID NO:5。实施例7分析编码BalI限制-修饰系统酶之基因的结构

用核酸外切酶III(由Takara Shuzo Co制造)和mung bean核酸酶(由Takara Shuzo Co制造)制备了各种大小的缺失突变体后,用双脱氧链终止法确定插入到pBSR1中之DNA片段的核苷酸序列。核苷酸序列示于SEQ ID NO:6。另外,研究ORFs,以致发现一个ORF以正常方向(ORF1)存在于核苷酸437-1276,一个ORF,以反向(ORF2)存在于核苷酸1279-2058。ORF1的核苷酸序列及推测的氨基酸序列示于SEQ ID NO:4,在SEQ ID NO:3只列出了氨基酸序列。ORF2的核苷酸序列和推测的氨基酸序列示于SEQ ID NO:2,在SEQ IDNO:1只列出了氨基酸序列。以各缺失突变体与BalI修饰酶活性之间的关系为基础,得出结论,ORF1编码BalI修饰酶。由于N-末端序列与ORF2的一致,所以认为ORF2编码BalI限制酶。此外,从SEQ ID NO:1的氨基酸序列得出的分子量为29.043与SDS-PAGE的结果很吻合。克隆的BalI限制和修饰系统基因的结构示于图3。在该图中,M代表修饰酶基因,R代表限制酶基因,箭头代表ORF的方向。

因此,明确了编码BalI限制-修饰系统酶之基因的结构。发现尽管克隆了完整的BalI限制酶基因,但在E.coli中,仍未表达。实施例8构建用于BalI限制酶基因的表达系统

用示于SEQ ID NO:7的引物BAL-R1引物和示于SER ID NO:8的BAL-2引物作引物对,pBSR1作模板,经25个循环(一个循环包括94℃1分钟;55℃2分钟,72℃2分钟),PCR扩增部分DRF2。由于BA-1引物的第一个碱基是A,所以将扩增基因的起始密码子从GTG变成ATG。然后将扩增的DNA片段插入载体pSTV28的SmaI位点以使BalI限制酶基因位于lac启动子的下游。所得载体称为pSRB8。

用pBSR1和pSRB8转化E.coli ER 1648。测量在所得转化子提取物中的BalI限制酶活性。如上所述,该转化子称为E.coli ER1648/pBSR1/pSRB8,并保藏于National Institute ofBioscience and Human-Technology,Agency of IndustrialScience and Teehnology,Ministry of International Tradeand Industry(FERM BP-5229)。由此得到表达BalI限制酶的转化子。实施例9从转化子生产BalI限制酶

将E.coli ER 1648/pBSR1/pSRB8(FFRM BP-5229)接种于100ml含100μg/ml氨苄青霉素和30μg/ml氯霉素的L培养液中,于37℃培养5小时。然后加入IPTG达到1mM的终浓度,于37℃进一步培养5小时。收集1g细胞,悬于5ml含10mM硫基乙醇的20mM Tris-HCl(pH 7.5)中。经超声处理破碎细胞,然后超离心(10,000g,30分)除去上清液。测量在上清液中的活性,发现每克细胞生产约70,000单位的BalI限制酶。所述活性是得自Bal菌株的约1000倍。如上所述,已建立了大量生产BalI限制酶的系统。

如上文所述,根据本发明,提供了BalI限制和修饰系统基因,和可有效生产的在遗传工程中重要的大量BalI限制酶。

序列表

(1)SEQ ID NO:1的资料

    (i)序列特征

    (A)长度:260

    (B)类型:氨基酸

    (C)链型:单链

    (D)拓扑结构:线性

    (xi)序列描述:SEQ ID NO:1Met Asp Tyr Ala Phe Arg Asp Arg Pro Leu Asp Asp Val Glu Leu1               5                  10                  15Glu Val Leu Arg Leu Val Leu Ser Ser Phe Arg Asp Gly Ser Gly

             20                  25                  30Gln Val Val Arg Pro Asn Gly Gly Thr Met Pro Gly Phe Arg Asp

             35                  40                  45Tyr Glu Arg Gly Leu Ala Ala Val Leu His Ala Ser Ala Pro Glu

             50                  55                  60Asn Lys Gly Val Phe Asp Val Ile Val Pro Val Asp Gly Asp Lys

             65                  70                  75Ser Phe Gly Ile Ser Cys Lys Met Ala Thr Thr Pro Pro Ala Lys

             80                  85                  90His Ala Ser Ser Phe Met Glu Leu Ser Asn Ser Ala Ala Gln Phe

             95                 100                 105Arg Gln Ala Leu Leu Ala Gln Gln Ile Asn Trp Ala Thr Glu Pro

            110                 115                 120Gly Leu Ala Gly Pro Ala Ile Val Arg Leu Val Thr Gly Trp His

            125                 130                 135Asp Ala Thr Ala Asp Thr His Gln Leu Asp Leu Pro Ala Ser Lys

            140                 145                 150Tyr Ser Val Leu Ala His Asn Pro Ser Trp Thr Gln Phe Gln Leu

            155                 160                 165Leu Cys Phe Pro Leu Asp Leu Gln Ile Ala Asn Pro Val Gly Glu

            170                 175                 180Val Glu Trp Leu His Glu Gly Ala Ser Leu Asn Gly Tyr Ile Asp

            185                 190                 195Asp Gly Gly Arg Arg His Arg Leu Trp Gln Cys Tyr Met Asn Ser

            200                 205                 210Gly Gly Gln Leu Lys Tyr Tyr Pro Leu Leu Arg Trp Ala Asp Trp

            215                 220                 225Val Thr Glu Pro Phe Thr Leu Glu Leu Pro Pro Val Ala Ser Pro

            230                 235                 240Ile Leu Arg Ala Arg Asp Tyr Phe Asn Glu Val Trp Pro His Gly

            245                 250                 255Trp Asp Asp Arg Asn

            260(2)SEQ ID NO:2的资料

    (i)序列特征

    (A)长度:780

    (B)类型:核酸

    (C)链型:双链

    (D)拓扑结构:线性

    (xi)序列描述:SEQ ID NO:2GTG GAT TAC GCG TTT CGT GAC CGG CCG CTC GAC GAT GTC GAG CTG    45Met Asp Tyr Ala Phe Arg Asp Arg Pro Leu Asp Asp Val Glu Leu1               5                  10                  15GAG GTC CTC CGG CTG GTA TTG AGC TCG TTC CGA GAC GGA TCC GGT    90Glu Val Leu Arg Leu Val Leu Ser Ser Phe Arg Asp Gly Ser Gly

             20                  25                  30CAG GTT GTG CGC CCC AAT GGC GGC ACA ATG CCA GGC TTC CGC GAC   135Gln Val Val Arg Pro Asn Gly Gly Thr Met Pro Gly Phe Arg Asp

             35                  40                  45TAC GAG CGT GGT CTC GCC GCC GTG CTG CAT GCG TCA GCT CCG GAG   180Tyr Glu Arg Gly Leu Ala Ala Val Leu His Ala Ser Ala Pro Glu

             50                  55                  60AAC AAG GGC GTC TTC GAC GTC ATC GTG CCC GTC GAC GGC GAT AAG   225Asn Lys Gly Val Phe Asp Val Ile Val Pro Val Asp Gly Asp Lys

             65                  70                  75TCG TTC GGG ATC TCC TGC AAA ATG GCC ACG ACA CCT CCG GCG AAG   270Ser Phe Gly Ile Ser Cys Lys Met Ala Thr Thr Pro Pro Ala Lys

             80                  85                  90CAT GCG TCG AGT TTC ATG GAG CTG TCT AAC TCC GCC GCC CAG TTC   315His Ala Ser Ser Phe Met Glu Leu Ser Asn Ser Ala Ala Gln Phe

             95                 100                 105CGC CAG GCG CTG CTG GCG CAG CAG ATC AAT TGG GCG ACC GAG CCC   360Arg Gln Ala Leu Leu Ala Gln Gln Ile Asn Trp Ala Thr Glu Pro

            110                 115                 120GGT CTT GCT GGC CCT GCG ATC GTG CGT CTG GTT ACC GGT TGG CAC   405Gly Leu Ala Gly Pro Ala Ile Val Arg Leu Val Thr Gly Trp His

            125                 130                 135GAC GCC ACC GCC GAC ACC CAT CAA CTC GAC CTG CCC GCG AGT AAG   450Asp Ala Thr Ala Asp Thr His Gln Leu Asp Leu Pro Ala Ser Lys

            140                 145                 150TAC TCG GTG TTG GCC CAC AAT CCG TCA TGG ACG CAG TTT CAG CTG   495Tyr Ser Val Leu Ala His Asn Pro Ser Trp Thr Gln Phe Gln Leu

            155                 160                 165CTC TGC TTC CCC CTG GAC TTG CAG ATC GCG AAC CCG GTG GGC GAG   540Leu Cys Phe Pro Leu Asp Leu Gln Ile Ala Asn Pro Val Gly Glu

            170                 175                 180GTG GAG TGG CTG CAC GAG GGT GCT TCG CTG AAC GGG TAT ATC GAT   585Val Glu Trp Leu His Glu Gly Ala Ser Leu Asn Gly Tyr Ile Asp

            185                 190                 195GAC GGC GGC CGA CGG CAT CGG TTG TGG CAG TGC TAC ATG AAT TCC   630Asp Gly Gly Arg Arg His Arg Leu Trp Gln Cys Tyr Met Asn Ser

            200                 205                 210GGC GGG CAG CTG AAG TAC TAC CCG CTG TTG CGG TGG GCG GAC TGG   675Gly Gly Gln Leu Lys Tyr Tyr Pro Leu Leu Arg Trp Ala Asp Trp

            215                 220                 225GTG ACG GAG CCG TTC ACG CTG GAA CTG CCG CCG GTG GCG TCA CCG   720Val Thr Glu Pro Phe Thr Leu Glu Leu Pro Pro Val Ala Ser Pro

            230                 235                 240ATC CTC CGG GCC CGT GAC TAC TTC AAC GAG GTC TGG CCG CAC GGT   765Ile Leu Arg Ala Arg Asp Tyr Phe Asn Glu Val Trp Pro His Gly

            245                 250                 255TGG GAC GAC CGT AAC                                           780Trp Asp Asp Arg Asn

            260              (i)序列特征

(3)SEQ ID NO:3的资料        (A)长度:280

                             (B)类型:氨基酸

                             (C)链型:单链

                             (D)拓扑结构:线性

                             (xi)序列描述:SEQ ID NO:3Met Thr Leu Glu Gln Ile Ser Ala Ala Leu Arg Thr Glu Arg Val1               5                  10                  15Pro Ala Ser Ser Asp Val Pro Trp Ala Ala Pro Asn Ala Ala Val

             20                  25                  30Met Arg Tyr Pro Gly Ser Lys Trp Ser Leu Ala Arg Gln Ile Val

             35                  40                  45Ala Glu Phe Asp Asp His Tyr His Tyr Val Glu Pro Phe Phe Gly

             50                  55                  60Ser Gly Ala Val Phe Phe Ser Lys Pro Pro Val Pro His Glu Ile

             65                  70                  75Leu Asn Asp Thr Asn Gly Gln Val Val Asn Leu Phe Arg Val Leu

             80                  85                  90Arg Asp Arg Thr Glu Asp Leu Val Trp Gln Leu Glu Ala Thr Pro

             95                 100                 105Trp Ser Arg Asp Glu Tyr Asp Arg Ser His Val Leu Thr Gly Asp

            110                 115                 120Asp Val Glu Asp Ala Arg Arg Phe Val Val Arg Cys Trp Gln Ala

            125                 130                 135His Ala Ser Asp Leu Ala Lys Lys Thr Gly Trp Lys Thr Arg Gly

            140                 145                 150Ala Gln Gln Arg Ala Gly Gly Met Ser Leu Arg Trp Gln Lys Val

            155                 160                 165Pro Ala Gln Leu Arg Glu Leu Ala Trp Arg Leu Leu Asp Ala Glu

            170                 175                 180Ile Glu Asn Arg Asp Ala Val Gln Val Ile Arg Arg His Asn Ala

            185                 190                 195Glu Asn Ala Leu Ile Tyr Ala Asp Pro Pro Tyr Leu His Ser Val

            200                 205                 210Arg Thr Gln Arg Met Tyr Gly Glu Glu Met Thr Asp Thr Glu His

            215                 220                 225Ile Ala Leu Leu Asp Ala Leu Leu Ala His Lys Gly Pro Val Val

            230                 235                 240Val Ser Gly Tyr Ala Asn Asp Leu Tyr Asp Thr Ala Leu Glu Gly

            245                 250                 255Trp Arg Lys Val Thr Met Lys Ala Pro Lys Val Glu Lys Gly Ala

            260                 265                 270Ala Arg Thr Glu Val Leu Trp Val Lys Arg

            275                 280

    (4)SEQ ID NO:4的资料

        (i)序列特征

        (A)长度:840

        (B)类型:核酸

        (C)链型:双链

        (D)拓扑结构:线性

        (ii)分子类型:基因组DNA

        (xi)序列描述:SEQ ID NO:4ATG ACG CTC GAG CAG ATC AGC GCG GCT CTA CGC ACG GAG CGG GTC    45Met Thr Leu Glu Gln Ile Ser Ala Ala Leu Arg Thr Glu Arg Val1               5                  10                  15CCG GCA TCT TCA GAC GTC CCA TGG GCG GCG CCG AAT GCT GCA GTG    90Pro Ala Ser Ser Asp Val Pro Trp Ala Ala Pro Asn Ala Ala Val

             20                  25                  30ATG CGC TAC CCG GGG TCG AAG TGG TCC CTC GCT CGG CAG ATT GTC   135Met Arg Tyr Pro Gly Ser Lys Trp Ser Leu Ala Arg Gln Ile Val

             35                  40                  45GCG GAA TTC GAT GAC CAC TAC CAC TAC GTG GAA CCG TTC TTC GGT   180Ala Glu Phe Asp Asp His Tyr His Tyr Val Glu Pro Phe Phe Gly

             50                  55                  60TCG GGG GCG GTG TTC TTC AGC AAG CCG CCG GTG CCG CAC GAG ATC   225Ser Gly Ala Val Phe Phe Ser Lys Pro Pro Val Pro His Glu Ile

             65                  70                  75CTC AAC GAC ACC AAC GGT CAG GTC GTG AAC CTG TTC CGG GTG CTT   270Leu Asn Asp Thr Asn Gly Gln Val Val Asn Leu Phe Arg Val Leu

             80                  85                  90CGC GAT CGG ACC GAG GAT CTG GTG TGG CAG CTT GAG GCG ACG CCT   315Arg Asp Arg Thr Glu Asp Leu Val Trp Gln Leu Glu Ala Thr Pro

             95                 100                 105TGG TCT CGG GAC GAG TAT GAC CGG TCG CAC GTC CTG ACC GGG GAT   360Trp Ser Arg Asp Glu Tyr Asp Arg Ser His Val Leu Thr Gly Asp

            110                 115                 120GAT GTC GAG GAC GCC AGA CGG TTC GTG GTT CGG TGC TGG CAG GCG   405Asp Val Glu Asp Ala Arg Arg Phe Val Val Arg Cys Trp Gln Ala

            125                 130                 135CAC GCG AGC GAC CTG GCG AAG AAG ACT GGG TGG AAG ACC CGC GGC   450His Ala Ser Asp Leu Ala Lys Lys Thr Gly Trp Lys Thr Arg Gly

            140                 145                 150GCG CAG CAG CGT GCC GGC GGG ATG TCG CTG CGG TGG CAG AAG GTG   495Ala Gln Gln Arg Ala Gly Gly Met Ser Leu Arg Trp Gln Lys Val

            155                 160                 165CCG GCG CAG CTG CGG GAG CTT GCC TGG CGG CTG TTG GAT GCG GAA   540Pro Ala Gln Leu Arg Glu Leu Ala Trp Arg Leu Leu Asp Ala Glu

            170                 175                 180ATC GAG AAC CGT GAC GCG GTG CAA GTG ATC CGC CGG CAC AAC GCC   585Ile Glu Asn Arg Asp Ala Val Gln Val Ile Arg Arg His Asn Ala

            185                 190                 195GAG AAC GCT CTG ATC TAC GCA GAC CCG CCG TAT CTA CAC AGC GTC   630Glu Asn Ala Leu Ile Tyr Ala Asp Pro Pro Tyr Leu His Ser Val

            200                 205                 210CGC ACG CAG CGC ATG TAC GGC GAG GAG ATG ACC GAC ACC GAG CAC   675Arg Thr Gln Arg Met Tyr Gly Glu Glu Met Thr Asp Thr Glu His

            215                 220                 225ATC GCC CTG CTG GAC GCG CTA CTG GCC CAC AAG GGG CCG GTG GTG   720Ile Ala Leu Leu Asp Ala Leu Leu Ala His Lys Gly Pro Val Val

            230                 235                 240GTC AGC GGG TAC GCC AAC GAC CTA TAC GAC ACT GCG CTC GAG GGG   765Val Ser Gly Tyr Ala Asn Asp Leu Tyr Asp Thr Ala Leu Glu Gly

            245                 250                 255TGG CGC AAG GTG ACA ATG AAG GCG CCG AAG GTC GAG AAG GGT GCC   810Trp Arg Lys Val Thr Met Lys Ala Pro Lys Val Glu Lys Gly Ala

            260                 265                 270GCC CGT ACT GAG GTG CTG TGG GTA AAG CGC                       840Ala Arg Thr Glu Val Leu Trp Val Lys Arg

            275                 280(5)SEQ ID NO:5的资料

    (i)序列特征

    (A)长度:26

    (B)类型:氨基酸

    (C)链型:单链

    (D)拓扑结构:线性

    (ix)特征:

    在位置1的xaa是未知氨基酸

    在位置6的xaa是未知氨基酸

    在位置24的xaa是未知氨基酸(xi)序列描述:SEQ ID NO:5:Xaa Asp Tyr Ala Phe Xaa Asp Arg Pro Leu Asp Asp Val Glu Leu1               5                  10                  15Glu Val Leu Arg Leu Val Leu Ser Xaa Phe Arg

             20                  25(6)SEQ ID NO:6的资料

    (i)序列特征

    (A)长度:3182

    (B)类型:核酸

    (C)链型:双链

    (D)拓扑结构:线性

    (ii)分子类型:基因组DNA

    (xi)序列描述:SEQ ID NO:6GATCGTCACA  AACCGAGGGT  GGTCGTCGCC  ATCGACACGC  CGGTCGGAGT  GTCCCGCGGA    60CGGTACCGCC  TGTTACGGTA  CCGGTTATGG  GACATCAGGG  GCAGCACGTG  CCGCAGGCGG   120TGCGTTGGGC  GCAGAAAGCG  CGTGAGGTGG  AGGCGTTCAC  CTCCGAATAC  ATCGAGTACC   180TGCAGGCGCA  GCTGGTCAAG  CATGCCCTGC  ACGCCACTGG  TGCAAGTCAG  CGTGAGCTCG   240CGGAGGACCT  CGGGACGAGT  AAGTCCCGGA  TCAATCGTCT  CGCGCGAGCG  TCCTCGGAGC   300CGCCGCATGC  TGCGGAGACT  GAGGACGTCG  CAGCAGCGTT  GGAGACGATC  TTCCTCGGTA   360CCCGCGTCAC  CGAGGTGCGG  GAGGGTGCTG  CTGCCTACGA  CCAGGCATCG  TCGGTGGCAG   420CTGGGACGGT  GACCCGATGA  CGCTCGAGCA  GATCAGCGCG  GCTCTACGCA  CGGAGCGGGT   480CCCGGCATCT  TCAGACGTCC  CATGGGCGGC  GCCGAATGCT  GCAGTGATGC  GCTACCCGGG   540GTCGAAGTGG  TCCCTCGCTC  GGCAGATTGT  CGCGGAATTC  GATGACCACT  ACCACTACGT   600GGAACCGTTC  TTCGGTTCGG  GGGCGGTGTT  CTTCAGCAAG  CCGCCGGTGC  CGCACGAGAT   660CCTCAACGAC  ACCAACGGTC  AGGTCGTGAA  CCTGTTCCGG  GTGCTTCGCG  ATCGGACCGA   720GGATCTGGTG  TGGCAGCTTG  AGGCGACGCC  TTGGTCTCGG  GACGAGTATG  ACCGGTCGCA   780CGTCCTGACC  GGGGATGATG  TCGAGGACGC  CAGACGGTTC  GTGGTTCGGT  GCTGGCAGGC   840GCACGCGAGC  GACCTGGCGA  AGAAGACTGG  GTGGAAGACC  CGCGGCGCGC  AGCAGCGTGC   900CGGCGGGATG  TCGCTGCGGT  GGCAGAAGGT  GCCGGCGCAG  CTGCGGGAGC  TTGCCTGGCG   960GCTGTTGGAT  GCGGAAATCG  AGAACCGTGA  CGCGGTGCAA  GTGATCCGCC  GGCACAACGC  1020CGAGAACGCT  CTGATCTACG  CAGACCCGCC  GTATCTACAC  AGCGTCCGCA  CGCAGCGCAT  1080GTACGGCGAG  GAGATGACCG  ACACCGAGCA  CATCGCCCTG  CTGGACGCGC  TACTGGCCCA  1140CAAGGGGCCG  GTGGTGGTCA  GCGGGTACGC  CAACGACCTA  TACGACACTG  CGCTCGAGGG  1200GTGGCGCAAG  GTGACAATGA  AGGCGCCGAA  GGTCGAGAAG  GGTGCCGCCC  GTACTGAGGT  1260GCTGTGGGTA  AAGCGCTAGT  TACGGTCGTC  CCAACCGTGC  GGCCAGACCT  CGTTGAAGTA  1320GTCACGGGCC  CGGAGGATCG  GTGACGCCAC  CGGCGGCAGT  TCCAGCGTGA  ACGGCTCCGT  1380CACCCAGTCC  GCCCACCGCA  ACAGCGGGTA  GTACTTCAGC  TGCCCGCCGG  AATTCATGTA  1440GCACTGCCAC  AACCGATGCC  GTCGGCCGCC  GTCATCGATA  TACCCGTTCA  GCGAAGCACC  1500CTCGTGCAGC  CACTCCACCT  CGCCCACCGG  GTTCGCGATC  TGCAAGTCCA  GGGGGAAGCA  1560GAGCAGCTGA  AACTGCGTCC  ATGACGGATT  GTGGGCCAAC  ACCGAGTACT  TACTCGCGGG  1620CAGGTCGAGT  TGATGGGTGT  CGGCGGTGGC  GTCGTGCCAA  CCGGTAACCA  GACGCACGAT  1680CGCAGGGCCA  GCAAGACCGG  GCTCGGTCGC  CCAATTGATC  TGCTGCGCCA  GCAGCGCCTG  1740GCGGAACTGG  GCGGCGGAGT  TAGACAGCTC  CATGAAACTC  GACGCATGCT  TCGCCGGAGG  1800TGTCGTGGCC  ATTTTGCAGG  AGATCCCGAA  CGACTTATCG  CCGTCGACGG  GCACGATGAC  1860GTCGAAGACG  CCCTTGTTCT  CCGGAGCTGA  CGCATGCAGC  ACGGCGGCGA  GACCACGCTC  1920GTAGTCGCGG  AAGCCTGGCA  TTGTGCCGCC  ATTGGGGCGG  ACAACCTGAC  CGGATCCGTC  1980TCGGAACGAG  CTCAATACCA  GCCGGAGGAC  CTCCAGCTCG  ACATCGTCGA  GCGGCCGGTC  2040ACGAAACGCG  TAATCCACCC  GCACATCGTA  GAAGCCAACA  AACAGTCGCC  AACGGTCATA  2100GCGCCGTGTC  GCGGTGTCGG  TTGCCGGCTG  GTTCGACATG  GCTGTTTGCC  AAGACGCGAC      2160GTCACGCCGT  CCGAGGGGGA  AGGATGACGT  GCATGGATGC  GGCACTGTGG  GGTCAGGTTG      2220TCATCGCCGC  TGTCGCTGTT  TTCGGGTCGG  TCCTTGGGTA  CATGCTCTCC  GGCCTCAATG      2280ATGCGCGGCG  TGACCGGCGT  ACGACGCTTC  GGGAGCGTGC  AGCACGGCAC  GAGGAACGCG      2340ACGCGGAAGA  CCGACGTGAG  CGGCATGCGT  TCCAACGTGC  AACGCTGCTC  GAGCTGCAGG      2400ACGCCGTTCA  ACTCATGGCT  CGGCTGACAG  GCCGAACGAT  GCACTTCGAC  CACATGCAGG      2460CGCGAGAGGG  CAAACAGACA  CAGCTTCCAT  CGCAGTACGA  CGATGAGATG  CACGCAAACG      2520GGGTCGATGT  CATCCGTTTT  CGGAACCGGC  TCCTCGACGA  CGACCTCCGT  CGGTCGATCG      2580CGGTGTTCGA  ATCGCAGTGC  GACCAGGTGT  CGAAGCTGCC  GCTGCGGTAT  CAGGGACATG      2640TCGGCGAGGA  AGCCGACGGT  GTGGCGTTCG  AGCTGATGCG  GACATTCGGC  GATCAAGTGT      2700CAGTCGTTAT  GGACGCCGTC  GGAGTAGCGC  TGCGCCTAAA  CCTCAGCACC  CCTCCCCCCT      2760TCGCCACCTC  GTCGTGACAC  ACGCTCGTGG  TGGTCGAGGT  CACCGACGCC  CATGCCCATG      2820TCCACGAGCC  ACCGCCTTAC  TTCGCGGACA  CTAAGTGGAT  ACCGTCCGTC  GGGCGCCCGA      2880TGCTGGGATG  GTGGCAGTCC  GGTAGCCGGT  CCGCCAGCAA  GCCACGAAAT  GCCTGCGGGG      2940GCTTCGGACT  CCTTCGGCTC  TGCTCTGGAG  GGAAACCCTG  TCTCACATAG  GTGGTCCGCG      3000GACTATCTCA  GTTCAGGCAC  GCTGTACGGA  CGCGTCCCAG  CGCAGGAAGG  CTGAGCCGGG      3060CGCTAGTCGA  CGTGGCCAAA  TAACCTGTCC  AACTCCGTAT  TTCCGGACAG  GTTGTGTGGC      3120AGTAGGACAA  GTTAGCCTGC  GGACGACAAC  AAACGTGTCG  ACTGCCAGCC  AACTTGTCCG      3180AT                                                                          3182(7)SEQ ID NO:7的资料

    (i)序列特征

    (A)长度:30

    (B)类型:核酸

    (C)链型:单链

    (D)拓扑结构:线性

    (ii)分子类型:其它DNA(合成的)

    (xi)序列描述:SEQ ID NO:7

    ATGGATTACG   CGTTTCGTGA   CCGGCCGCTC      30(8)SEQ ID NO:8的资料

    (i)序列特征

    (A)长度:30

    (B)类型:核酸

    (C)链型:单链

    (D)拓扑结构:线性

    (ii)分子类型:其它DNA(合成的)

    (xi)序列描述:SEQ ID NO:8

   CTAGTTACGG  TCGTCCCAAC  CGTGCGGCCA    30

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号