首页> 中国专利> 转录因子、转录因子基因、含有转录因子基因的重组载体、由所述载体转化的曲霉、和所述曲霉的用途

转录因子、转录因子基因、含有转录因子基因的重组载体、由所述载体转化的曲霉、和所述曲霉的用途

摘要

本发明提供了在培养过程中具有调节曲霉硫同化基因表达的功能的转录因子,以及编码该蛋白的基因。换句话说,涉及了含有如SEQ IDNO:3所示的氨基酸序列的蛋白质,以及编码如SEQ ID NO:3所示的氨基酸序列或含有如SEQ ID NO:2所示的碱基序列的基因。

著录项

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2012-10-24

    未缴年费专利权终止 IPC(主分类):C12N15/31 授权公告日:20100623 终止日期:20110820 申请日:20020820

    专利权的终止

  • 2010-06-23

    授权

    授权

  • 2005-08-10

    实质审查的生效

    实质审查的生效

  • 2005-06-08

    公开

    公开

说明书

技术领域

本发明涉及一种能够调节硫同化基因表达的转录因子、一种编码这种转录因子的基因,一种包含这种转录因子基因的重组载体,其中由这种载体转化的硫同化基因表达被去抑制的曲霉,以及这种曲霉的应用。

背景技术

有机体能够相应于环境因子例如营养或其它各种因子而调节基因的表达。基因的表达在各种不同的时相被调节,例如转录的起始、转录的连续、mRNA的稳定性、翻译的起始和翻译的连续。

硫是含硫氨基酸的一种组分,并且对于有机体来说它还是一种重要的营养素。已进行了大量有关涉及真核微生物的硫同化的基因(硫同化基因)的调节的研究。许多涉及阻遏剂和活化剂的事实已被阐明,特别是从基于例如,粗糙链孢霉(Neurospora crassa)的突变体和基因分离的分析的研究中(Review;Marzluf等,Anuu.Rev.Microbiol.51:73-96,1997)。

转录活化剂Cys3和转录抑制剂Scon1和Scon2已知是涉及粗糙链孢霉硫同化的转录因子。Cys3结合cys-3基因或scon-2基因的上游区域并激活它们的表达。Cys3还可结合涉及硫吸收或同化的基因的上游区域,例如ars基因或cys-14基因,以激活它们的表达。

同时,还进行了大量有关涉及构巢曲霉(Aspergillus nidulans)硫同化的基因调节的研究。尽管在构巢曲霉上花费了很多的精力,但没有鉴定出与粗糙链孢霉的Cys3相当的转录因子。然而,1999年报道了转录因子MetR。一种metR突变体能够仅利用甲硫氨酸作为硫来源。MetR被发现在DNA-结合位点上与Cys3高度同源,尽管在其它的区域二者基本上不同源。Cys-3基因不能互补于metR突变体的表型(Naorff等,Fungal Genet.Newsl.46(Suppl),59,1999)。而且,人们认为存在4种类型的转录抑制剂(Natorff等,Molec.Gen.Genet.238:185-192,1993)。上述中,SconB和SconC已被分离。

曲霉,例如黄-绿曲霉,如米曲霉(Aspergillus oryzae)、酱油曲霉(Aspergillus sojae)和溜曲霉(Aspergillus tamarii);黑曲霉,如黑曲霉(Aspergillus niger)、泡盛曲霉(Aspergillusawamori)、宇佐美曲霉(Aspergillus usamii)、和Aspergillussaitoi和白曲霉,如Aspergillus kawachii,已用于发酵、酿造或酶生产相当长的时间了。它们作为高度安全的微生物非常有用。然而,涉及这类微生物的硫同化基因的调节尚未充分阐明。这些有用的曲霉不同于上述构巢曲霉(也就是说,它属于具有有性阶段的裸胞壳Emericella(子囊菌)属的构巢曲霉的无性阶段),例如,由于其有性阶段没有鉴定出来(USP No.6,090,607)。因此,有关构巢曲霉的研究结果不总能适用。

黄-绿曲霉米曲霉和酱油曲霉分泌很多水解酶,包括蛋白水解酶。因此,通过蛋白水解作用它们被用于调味品,例如酱油或豆酱的生产。已知在米曲霉中由于缺乏任何一种碳、氮和硫源将导致胞外蛋白酶的生产被诱导或被去抑制。在米曲霉中,由于碳和氮源缺乏引起的蛋白酶表达的遗传机制已被报道,但是由于硫源缺乏导致的蛋白酶表达的机制尚未阐明。就构巢曲霉来说,已经进行了一些有关由硫源缺乏引起的蛋白酶表达的分析,但其机制尚无报道。硫源与胞外外肽酶例如黄-绿曲霉中的氨肽酶或羧肽酶的表达的调节的关系是未知的。

发明的公开

本发明的目的是提供一种能够在培养过程中调节曲霉硫同化基因的表达的转录因子及其编码它的基因。本发明的另一个目的是提供一种利用曲霉生产蛋白水解酶的有效方法。本发明还有一个目的是提供一种通过利用前述生产蛋白水解酶的方法来生产食品的有效方法。

为了达到上述目的本发明人进行了集中的研究。结果,他们成功地从黄-绿曲霉中克隆出能够调节硫-同化基因表达的转录因子基因。这使得本发明得以完成。

特别的,本发明是如下逐一进行的:

1)如下(a)或(b)的一种蛋白:

(a)一种蛋白,其含有如SEQ ID NO:3所示的氨基酸序列;

(b)一种蛋白,其含有通过缺失、取代或增加一个或多个氨基酸残基从如SEQ ID NO:3所示的氨基酸序列衍生的氨基酸序列,并且其具有转录因子的功能。

2)一种蛋白,该蛋白含有与如SEQ ID NO:3所示的氨基酸序列具有70%或更高的序列同源性的氨基酸序列或其片段,并且其具有转录因子的功能。

3)一种转录因子基因,其编码如下蛋白(a)或(b):

(a)一种蛋白,其含有如SEQ ID NO:3所示的氨基酸序列;

(b)一种蛋白,其含有通过缺失、取代或增加一个或多个氨基酸残基,从如SEQ ID NO:3所示的氨基酸序列衍生的氨基酸序列,并且其具有转录因子的功能。

4)一种转录因子基因,其含有如下DNA(a)或(b):

(a)DNA,其含有如SEQ ID NO:2所示的核苷酸序列;或

(b)DNA,其在严格条件下与包含与含有如SEQ ID NO:2所示的核苷酸序列的DNA互补的核苷酸序列的DNA杂交,并且其编码具有转录因子功能的蛋白质。

5)一种基因,其编码根据上述2)所述的蛋白质。

6)一种转录因子基因,其含有如下DNA(a)或(b):

(a)DNA,其含有编码如SEQ ID NO:3所示的氨基酸序列的核酸;或

(b)DNA,其在严格条件下与包含与含有编码如SEQ ID NO:3所示的氨基酸序列的核酸的DNA互补的核酸的DNA杂交,并且其编码能够调节硫-同化基因表达的蛋白质。

7)一种转录因子基因,其具有与含有如SEQ ID NO:2所示的核苷酸序列的DNA具有80%或更高的序列同源性的DNA,并且其编码具有转录因子功能的蛋白质。

8)一种重组载体,其含有根据上述3)、4)、5)、6)或7)所述的基因。

9)一种曲霉,其含有根据上述8)所述的重组载体,

10)一种曲霉,其中根据上述3)、4)、5)、6)或7)所述的基因在低分子量含硫物质存在的条件下表达。

11)根据上述9)或10)所述的曲霉,其能够在低分子量含硫物质存在的情况下产生胞外蛋白酶。

12)根据上述9)或10)所述的曲霉,其能够在低分子量含硫物质存在的情况下产生胞外蛋白酶和胞外外肽酶。

13)一种曲霉,其中硫-同化基因的表达被去抑制。

14)根据上述9)、10)、11)或12)所述的曲霉,其中硫-同化基因的表达被去抑制。

15)一种生产蛋白酶和/或外肽酶的方法,其包括在培养基中培养根据上述9)-14)中任何一项所述的曲霉,并且从获得的培养物中任选地收集蛋白酶和/或外肽酶。

16)一种降解含蛋白质的物质的方法,其包括用根据上述9)-14)中任何一项所述的曲霉来降解含蛋白质的物质。

17)一种生产含蛋白质物质的降解产物的方法,它包括培养根据上述9)-14)中任何一项所述的曲霉,用获得的产物降解含蛋白质的物质,和从中任选地收集含蛋白质物质的降解产物。

18)根据上述15)所述的方法,其中培养基含有0.5mM或更多低分子量的含硫物质。

在下文中,将详细描述本发明。

本申请包括日本专利申请No.2002-045090中公开的全部内容,并因此本申请要求优先权。

本发明中,在用于发酵、酿造、酶生产等的曲霉属中的微生物(曲霉)中,鉴定了硫同化基因的转录调节因子(转录因子)及编码该因子的基因,其功能被阐明,并说明了这种转录因子与产生胞外蛋白酶或胞外外肽酶的能力的关系。因此,根据本发明,成功获得了一种能够在低分子量含硫物质存在的情况下将硫同化基因的表达去抑制、并从而增强宿主曲霉产生胞外蛋白酶或胞外外肽酶能力的转录因子,以及编码它的基因。使用本发明的转录因子和/或编码该因子的基因采用曲霉可实现良好的发酵、酿造、酶生产等等。

在本发明中,术语“曲霉”是指用于食品生产的曲霉。其例子包括,但不仅限于,黄-绿曲霉,例如米曲霉、酱油曲霉和溜曲霉;黑曲霉,如黑曲霉(Aspergillus niger)、泡盛曲霉(Aspergillus awamori)、宇佐美曲霉(Aspergillus usamii)、和Aspergillus saitoi;和白曲霉,如Aspergillus kawachii。本发明所使用的曲霉优选的是一种黄-绿曲霉,例如米曲霉、酱油曲霉或溜曲霉,更优选为一种黄-绿曲霉,如米曲霉或酱油曲霉,最优选为米曲霉。

1.本发明的转录因子和转录因子基因

术语“本发明的转录因子”是指能够调节硫同化基因的表达的转录因子蛋白。在本申请的说明书中,术语“硫同化基因”是指涉及硫同化作用的基因。更具体的,这种基因编码一种蛋白质,该蛋白质涉及从培养基中吸收低分子量含硫物质进入细胞,及其降解,或向含硫氨基酸合成途径提供硫。其例子包括芳基硫酸酯酶基因、胆碱酯酶基因、硫酸盐通透酶基因和硫酸盐还原酶基因。本发明采用的硫同化基因优选为芳基硫酸酯酶基因或胆碱酯酶基因,而芳基硫酸酯酶基因是特别优选的。本说明书中,术语“能够调节硫同化基因的表达”是指通过起转录因子的作用改变硫同化基因的表达模式的能力。这种能力的具体例子包括基因表达的增强、这种表达的去抑制、这种表达的降低、这种表达的抑制和这种表达时相的改变。是否本发明的转录因子“能够调节硫同化基因的表达”可通过,例如,观察在具有本发明的转录因子和不具有本发明的转录因子的情况下一个特定的硫同化基因表达模式变化的途径来进行鉴定。更具体地说,例如,当根据常规方法测定前述基因的mRNA或由该基因编码的蛋白质的量或活性的变化或者表达时相的变化时,可以观察到硫同化基因表达模式的这种改变。一个被分析例子是由芳基硫酸酯酶基因编码的芳基硫酸酯酶的酶的活性。

本发明的转录因子当行使转录因子功能时,优选地提供一种具有生产蛋白酶或外肽酶能力的宿主曲霉。该蛋白酶或外肽酶优选为细胞外蛋白酶或细胞外外肽酶。在本说明书中,术语“行使转录因子功能”和“具有转录因子功能”表示一种蛋白能够与具有特定核苷酸序列的DNA结合并调节相应基因的表达。具体地说,本发明的蛋白质是否“具有转录因子功能”可用如下方式进行鉴定。例如,可通过证明本发明的蛋白质可与含有位于sconB基因上游的SEQ ID NO:25的核苷酸序列的DNA结合来进行鉴定,即可根据有关在粗糙链孢霉(Neurosporacrassa)中Cys3蛋白与位于scon-2基因上游的序列的结合(Proc.Natl.Acad.Sci.,USA.,92(8):3343-3347,1995),或者SEQ ID NO:26的核苷酸序列与之互补的研究推导出与MetR蛋白结合。蛋白质与特异DNA结合可通过,例如凝胶移位分析来证实。

在一个具体的实施例中,本发明的转录因子是一种含有如SEQ IDNO:3所示的氨基酸序列的蛋白质。但是,本发明的转录因子不限于前述的蛋白,只要它具有上述转录因子的功能即可。本发明的转录因子可以是含有通过缺失、取代或增加一个或多个(优选的2-50个,更优选的2-10个,进一步优选为几个)氨基酸残基,衍生自如SEQ ID NO:3所示的氨基酸序列并具有转录因子功能的蛋白质。此外,本发明的转录因子可以是含有与如SEQ ID NO:3所示的氨基酸序列具有70%或更高的序列同源性的氨基酸序列,或其片段并具有转录因子功能的蛋白质。而且,本发明转录因子可以是能够调节硫同化基因表达的蛋白质。

术语“本发明的转录因子基因”是指编码前述的本发明的转录因子蛋白的基因。在一具体的实施例中,本发明的转录因子基因含有包含如SEQ ID NO:2所示的核苷酸序列的DNA。然而,本发明的转录因子基因不仅限于前述的基因,只要其编码前述的本发明的转录因子蛋白即可。本发明的转录因子基因可编码含有如SEQ ID NO:3所示的氨基酸序列的蛋白质,或含有通过缺失、取代或增加一个或多个(优选的2-50个,更优选的2-10个,进一步优选为几个)氨基酸残基,衍生自如SEQ ID NO:3所示的氨基酸序列并具有转录因子功能的蛋白质。此外,本发明的转录因子基因可含有包含SEQ ID NO:2所示的核苷酸序列的DNA,或者在严格条件下与含有互补于包含SEQ ID NO:2所示的核苷酸序列的DNA的核苷酸序列的DNA杂交,并编码具有转录因子功能的蛋白质的DNA。此外,本发明的转录因子基因可编码含有与如SEQ ID NO:3所示的氨基酸序列具有70%或更高的序列同源性的氨基酸序列或其片段并具有转录因子功能的蛋白质。另外,本发明的转录因子基因可含有包含编码如SEQ ID NO:3所示的氨基酸序列的核苷酸的DNA,或者在严格条件下与含有互补于含有编码如SEQ ID NO:3所示的氨基酸序列的核苷酸的DNA的核苷酸序列的DNA杂交,并编码能够调节硫同化基因表达的蛋白质的DNA。

本发明的转录因子基因可通过本领域熟练的技术人员已知的基因表达技术来表达从而生产本发明的转录因子。

2.本发明转录因子基因的获得

本发明的转录因子基因的例子用SEQ ID NO:1和SEQ ID NO:2表示。本发明的转录因子基因可,例如(但不仅限于)通过从曲霉中分离来制备。例如,本发明的转录因子基因可按如下方式从曲霉中分离。首先,依据常规方法从曲霉中制备的基因组DNA或cDNA被作为模板通过PCR扩增转录因子基因部分。然后,确定扩增产物的核苷酸序列,随后用引物步移方法(primer walking method)确定周围的核苷酸序列。这样,获得转录因子基因的全长核苷酸序列。基于该核苷酸序列,然后在全长转录因子基因可被扩增的位置设计一个引物。使用上述引物进行PCR,并使用依据常规技术从曲霉制备的基因组DNA或cRNA作为模板,并且回收扩增产物并纯化,这完成了本发明的转录因子基因的制备。由最初的PCR扩增的部分被在基因的适当位置上设计的一对PCR引物夹在中间。这些PCR引物优选的在已被鉴定为在本发明的转录因子基因中高度保守的区域内设计。这种区域可通过比较转录因子基因的核苷酸序列来确定,例如SEQ ID NO:1和2的序列、本发明的转录因子基因的其它核苷酸序列、和其它转录因子基因的核苷酸序列。高度保守的区域可依据本领域熟练的技术人员已知的技术容易地鉴定,包括更具体的,例如使用多重序列对比程序(例如CLASTALV和CLASTAL W;例如也可从包括日本国家遗传学研究所(NationalInstitute of Genetics,Japan)(http:www.ddbj.nig.ac.jp)的主页在内的国际互联网的网站上获得CLASTAL W)。一旦从有机体获得了基因组克隆,从其获得了感兴趣的基因,基因组上基因的编码区域可随后利用通过RT-PCR获得的cDNA克隆鉴定。

分离本发明的转录因子基因的另一个方法的例子如下。含有如SEQID NO:1或2所示的核苷酸序列或其互补序列的标记的DNA或RNA被作为探针,并且在严格条件下与之杂交的克隆被从依据常规技术制备的上述曲霉的基因组DNA文库或cDNA文库中筛选得到。在这种情况下,探针可含有全长或部分的上述序列。此外,使用有机体的基因组DNA或cDNA作为模板通过PCR扩增的高度保守的序列制备得到的片段可用做探针。严格条件是指允许特异性杂交信号区别于非特异性杂交信号的条件,虽然该条件变化取决于杂交系统及其类型、序列、以及使用的探针的长度。该严格条件可通过杂交温度、洗涤温度或盐浓度的改变而建立。例如,如果非特异性杂交被不利地检测为强烈信号,则可通过在洗涤步骤过程中提高杂交和洗涤温度并任选地降低盐浓度来提高杂交特异性。如果连特异性杂交信号都不能检测到,则可通过在洗涤步骤过程中降低杂交和洗涤温度并任选地增加盐浓度来稳定杂交。这种优化可由本领域的研究人员容易地进行。

一个严格条件的特异性例子如下。采用一个DNA探针,并用5x的SSC、1.0%(W/V)核酸杂交封闭溶液(Boehringer Mannheim)、0.1%(W/V)N-十二烷酰肌氨酸和0.02%(W/V)SDS杂交过夜(大约8-16小时)。用0.1-0.5x的SSC、0.1%(W/V)SDS洗涤两次,优选每次用0.1x的SSC和0.1%(W/V)SDS洗涤15分钟。杂交温度和洗涤温度为55℃或更高,优选60℃或更高,更优选65℃或更高,最优选68℃或更高。

包含于本发明的转录因子基因范围内的DNA,例如编码含有与SEQID NO:3所示的氨基酸序列具有60%或更高,优选的70%或更高,更优选的80%或更高,最优选的90%或更高的序列同源性的氨基酸序列或其片段,并具有本发明的转录因子功能的蛋白质的DNA;同时编码显示与SEQ ID NO:2所示的核苷酸序列的DNA具有60%或更高,优选的70%或更高,更优选80%或更高,和最优选90%或更高的序列同源性,并具有转录因子功能的蛋白质的DNA,可基于上述的杂交来进行鉴定。换句话说,这种DNA可容易地得到,例如,从通过基因组序列分析或其它方法获得的具有未知功能的DNA组或在公共数据库中累积的核苷酸序列信息中,使用BLAST软件进行同源性检索。通过用适当的限制酶从含有上述DNA的质粒克隆中将其剪切,或通过PCR扩增含有该DNA的区域,基于杂交或序列分析鉴定的DNA可被分离作为含有本发明的转录因子基因的DNA片段。这样分离的本发明的转录因子基因的核苷酸序列可通过多种常规诱变技术进行修饰(例如定点诱变)。本发明包括本发明的转录因子基因,该基因中只要其编码具有转录因子功能的蛋白质就可引入这种修饰。

在上述序列分析中,序列被预处理,从而形成最佳的对比条件用于确定两个氨基酸序列之间,或者两个核苷酸序列之间的序列同源性。例如,一个缺口被引入其中一个序列,使之最适合与另一个序列对齐。此后,在各个位点上的氨基酸残基或核苷酸进行比较。当第一个序列中特定的位点上与第二个序列中相应的位点上的氨基酸残基或核苷酸相同时,则这些序列在该位点上彼此相同。两个序列之间的序列同源性表示为序列之间相同位点的数量相对于全部位点数量(全部氨基酸残基或核苷酸)的百分比。

基于上述原则,两个氨基酸序列之间或两个核苷酸序列之间的序列同源性通过Karlin和Altschul算法来测定(Proc.Natl.Acad.Sci.U.S.A.,87:2264-2268,1990;和Proc.Natl.Acad.Sci.U.S.A.,90:5873-5877,1993)。利用这种算法的BLAST程序由Altschul等开发(J.Mol.Biol.215:403-410,1990)。此外,Gapped BLAST是一种比BLAST程序具有更高的灵敏度的测定序列同源性的程序(Nucleic Acids Res.25:3389-3402,1997)。上述程序主要用于检索与数据库中特定的序列具有高度同源性的序列。这些程序通常采用参数的缺省值(default value)。这些程序可以在网站上获得,例如,国际互连网上的美国国家生物技术信息中心(National Center for Bilotechnology Information,U.S.A)。

当用BLAST软件不能找到具有显著序列同源性的序列时,可使用更高灵敏度的FASTA软件在数据库中检索同源序列(W.R.Pearson和D.J.Lipman,Proc.Natl.Acad.Sci.,85:2444-2448,1988)。FASTA软件可在例如GenomeNet的网站上使用。在这种情况下也可使用参数缺省值。例如,使用nr-nt数据库并在检索核苷酸序列时ktup值被设定在6。

上述各个方法主要用于检索数据库中的同源序列。在本发明中,使用Genetyx Mac Ver.11.1(软件开发有限公司SoftwareDevelopment Co.,Ltd)的同源性分析可用于测定各个序列组合的序列同源性。该程序利用基于Lipman-Pearson方法(Science,227:1435-1441,1985)的步骤,由于它的高精确性和高灵敏度此方法经常被使用。当测定核苷酸序列间的序列同源性时,如果可能,使用蛋白编码区(CDS或ORF)。作为参数,比较用单位大小(Unit Size)设定为2,挑选位置(Pick up Location)被设定为5,结果以百分比来表示。显示最高值的序列对齐的序列同源性被作为结果。当查询序列和与之排列的序列之间没有观察到30%、50%或70%或更高的重叠时,这些序列常常被推断出功能相互关联,并因此在这种情况下获得的值不被作为显示这两个序列之间的序列同源性的值。例如,如果有这样一个区域,该区域仅含有约几个核苷酸或氨基酸残基在两个序列中完全相互一致,这很可能是偶然的。当两个序列中相同的区域仅占整个序列的百分之几时,难以认为这些序列作为一个整体具有相似的功能,即使上述区域具有特异性功能基元序列。

下面的叙述可证实由这样获得的本发明的转录因子基因编码的蛋白质具有转录因子的功能和调节硫同化基因表达的功能。

本发明的转录因子可通过表达本发明的转录因子基因制得。本发明转录因子基因的表达,以及蛋白质的回收和纯化可采用本领域熟练技术人员已知的技术进行。在表达本发明的转录因子基因的一般方法中,首先制备含有整合了上述基因的重组载体。本发明还包括含有整合了本发明的转录因子基因的重组载体,该载体采用如下的方式制备。

3.重组载体的制备

本发明的重组载体可通过连接本发明的转录因子基因至适当的载体获得。可使用任何载体,只要它能使本发明的转录因子在以此转化的宿主中的产生。例如,可使用质粒、粘粒、噬菌体、病毒、染色体整合载体或人工染色体载体。

上述载体可包括能使转化细胞进行选择的标记基因。标记基因的例子包括宿主的营养缺陷型互补基因,例如URA3和niaD,和药物抗性基因例如氨苄青霉素、卡那霉素或寡霉素抗性基因。重组载体优选的含有能使本发明的基因在宿主细胞中表达的启动子,或其它调控序列(例如,增强子序列、终止子序列和聚腺苷酸化序列)。启动子的具体例子包括GAL1启动子、amyB启动子和lac启动子。当本发明的重组载体用于体外蛋白质合成时,其在宿主中产生本发明的转录因子的能力不是必需的。在这种情况下,该载体可含有适合于所使用的体外蛋白质合成系统的转录和翻译起始位点。这种载体的一个例子为pIVEX2.3-MCS(Roche Diagnostics)。

4.体外蛋白质合成

本发明的转录因子可体外合成,例如,通过常规体外蛋白质合成技术,使用通过整合本发明的转录因子基因至用于如上所述的体外蛋白质合成载体制备的重组载体。这种体外合成可,例如,根据试剂盒的介绍使用快速翻译系统RTS 100 E.coll HY Kit(RocheDiagnostics)来进行。

5.凝胶移位分析

可通过,例如,凝胶移位分析证实本发明的转录因子是一种具有转录因子功能的蛋白质。这种凝胶移位分析可依据常规步骤使用本发明的纯化转录因子或体外合成的本发明的转录因子来进行。探针DNA可以是一种标记的双链DNA,该DNA含有结合了本发明的转录因子并具有适合于所采用方法的长度的核苷酸序列。例如,可使用退火合成的DNA、PCR-扩增的DNA、从质粒等上剪切的DNA。结合了本发明的转录因子的序列的例子包括位于已知与粗糙链孢霉中MetR蛋白结合的sconB基因上游的如SEQ ID NO:25所示的核苷酸序列以及与前述序列互补的、如SEQ ID NO:26所示的核苷酸序列。

在凝胶移位分析中,例如,具有结合了本发明的转录因子的核苷酸序列的DNA在其5’-末端用荧光、热-变性进行标记,然后逐渐冷却退火。将退火的产物与体外合成的本发明的转录因子一起加入结合反应溶液中,使该混合物在室温下反应20分钟。反应产物在8%的聚丙烯酰胺凝胶上进行电泳,使用检测荧光性的检测仪,例如4200L型测序仪(Model 4200L Sequencer)(LI-COR)观察到一个条带。如果观察到在本发明的转录因子存在的情况下以序列特异性方式已经移位的移位条带,即发现本发明的转录因子与序列的DNA特异性地结合该序列DNA。

6.转化体的获得

本发明的转化体可通过用含有整合了本发明的转录因子基因的重组载体来转化宿主获得。使用的宿主可以是曲霉。曲霉包括黄-绿曲霉如米曲霉(Aspergillus oryzae)酱油曲霉、(Aspergillus sojae)和溜曲霉(Aspergillus tamarii);黑曲霉,如黑曲霉(Aspergillusniger)、泡盛曲霉(Aspergillus awamori)、宇佐美曲霉(Aspergillususamii)、和Asergillus saitoi;和白曲霉,如Aspergilluskawachii。本发明中使用的上述曲霉优选为黄-绿曲霉,如米曲霉、酱油曲霉或溜曲霉,更优选为黄绿曲霉,例如米曲霉或酱油曲霉,最优选为米曲霉。

可通过已知的转化曲霉的方法进行转化。例如,可通过包括形成原生质体然后使用聚乙二醇和氯化钙的方法来进行(Mol.Gen.Genet.,218:99-104,1989).

在这样获得的曲霉中,本发明的转录因子基因的表达可通过使用可在曲霉中表达上述基因的重组载体得以增强。在这种情况下,可在曲霉中增强本发明的转录因子基因表达的重组载体可包含如能诱导重组载体中基因的表达的启动子的序列元件。

其中本发明的转录因子基因表达被增强的曲霉也可采用不同于上述利用含有整合了本发明的转录因子基因的重组载体的转化技术的方法制备。具体地说,其中本发明的转录因子基因的表达被增强的曲霉可通过,例如,紫外线照射或辐射曲霉或用诱变剂例如亚硝基胍或甲基磺酸乙酯处理曲霉来获得。

本发明包括通过使用含有如上述整合了本发明的转录因子基因的重组载体获得的转化体以及其中本发明的转录因子基因的表达被增强的曲霉。

7.硫-代谢基因表达的去抑制

在上述部分6获得的曲霉中,硫同化基因表达的模式被改变。在一个具体的实施例中,由低分子量含硫物质造成的硫同化基因表达的抑制,在低分子量含硫物质存在于本发明的曲霉中的情况下,被本发明的转录因子提高了。这可用如下的方式证实。

被检测的曲霉菌株和野生型菌株(宿主菌株)在含有低分子量含硫物质的培养基中被单独预培养。培养物被转移到含低分子量含硫物质的培养基以及不含该物质的培养基中进一步培养。可使用任何类型的低分子量含硫物质,只要它们可以抑制野生型菌株中硫同化基因的表达。可采用的例子包括甲硫氨酸和硫酸盐。低分子量含硫物质的浓度是,例如为0.5mM或更高,优选1mM或更高,更优选5mM或更高,和最优选10mM或更高。从这些培养物中回收细胞,然后将其溶解。细胞溶解可通过,例如,将细胞置于充满液氮的研钵中,用研杵研磨细胞,将其转移到含有缓冲液和玻璃珠的微管中,使用多珠振荡器(Multi-beads shocker)MB-200(Yasui Kikai Corporation)来溶解细胞。随后,测定通过离心制备的溶解产物或其上清液中硫同化基因产物的酶活。当被检测的菌株的酶活比在低分子量含硫物质存在的情况下的野生型菌株中的酶活高至少1.5倍,优选至少2倍,更优选至少3倍,更优选至少5倍和最优选至少10倍时,可以说由低分子量含硫物质造成的硫同化基因表达的抑制被提高了。当低分子量含硫物质存在时培养的硫同化基因产物的酶活比该物质不存在时培养的硫同化基因产物的酶活高至少10%,优选20%,最优选30%时,可以说抑制被提高了。在某些条件下,已知一些类型的酶在野生型菌株的生长过程中似乎被暂时地去抑制(Biochem.J.,166:415-420,1977),在这种条件下测得的结果不采用。为了确定这种情况,需要使用野生型菌株在对照实验中证实酶的活性。被测定的硫同化基因产物的酶活包括芳基硫酸酯酶的活性。芳基硫酸酯酶的活性可通过将p-硫酸硝基酚作为底物的方法来测定(Biochem.J.,166:411-413,1977)。

8.具有比亲本菌株高的生产胞外蛋白酶和胞外外肽酶的能力的曲霉

在低分子量含硫物质存在的情况下,本发明的曲霉能够产生胞外蛋白酶和胞外外肽酶。特别地,在低分子量含硫物质存在的情况下,硫同化基因的表达被本发明的转录因子去抑制的曲霉具有比在向宿主引入上述遗传修饰中使用的亲本菌株高的生产胞外蛋白酶和胞外外肽酶的能力。这被本发明所详细阐明。相应地,具有比亲本菌株高的生产胞外蛋白酶和胞外外肽酶能力的曲霉可通过制备本发明的曲霉来获得,例如以上述的方式。生产这些酶的能力可通过,例如,依据下面描述的生产酶的方法来培养曲霉,并通过常规技术测定培养基中蛋白酶和外肽酶的活性来进行检测。蛋白酶的活性可通过,例如,使用偶氮酪蛋白作为底物的方法来测定(the Journal of the SoysauceInformation Center,16:86-89,1990)。外肽酶例如氨肽酶的活性可通过,例如,日本专利出版物(Kokai)No.11-34677 A(1999)中公开的方法来测定,其中亮氨酸-p-硝基苯胺或亮氨酰-双甘氨肽被作为底物。

9.生产本发明的酶的方法

生产本发明的酶的方法包括,在培养基中培养本发明的曲霉,并可选地从培养物中回收酶(例如,蛋白酶或外肽酶)。培养可使用液体或固体培养技术进行。所使用的培养基可含有低分子量含硫物质(即一种具有低分子量或可容易地降解为小分子的含硫物质)。在这种培养基中,野生型曲霉中的硫同化基因的表达被抑制。相反,这种基因的表达在本发明的曲霉中被去抑制,并且产生胞外蛋白酶或胞外外肽酶的能力可被增强。当培养基中低分子量含硫物质的浓度至少为0.5mM,优选至少为1mM,更优选至少为2mM,进一步优选至少为3mM,更优选至少为5mM和最优选至少为10mM时,该效果特别显著。根据调节本发明的转录因子基因表达所使用的启动子的类型,一种针对启动子的诱导的底物优选地按需要存在于培养基中,考虑到曲霉中本发明的转录因子的表达被本发明的重组载体增强,培养基中其抑制剂的浓度最好较低。可使用的启动子的例子为淀粉酶基因启动子。在这种情况下,当诱导的底物,例如淀粉、糊精或麦芽糖的量被认为较少时,可加入任何诱导的物质来促进本发明转录因子的表达。假在这种情况下,葡萄糖的浓度最好较低。

可使用任何培养温度和培养周期,只要在这种条件下可以生产出感兴趣的酶。当生产出的酶包含于培养物中时,可根据计划的用途使用。换句话说,根据常规技术可选的从培养物中提取酶,随后在使用前部分或全部纯化。

10.本发明的曲霉在含蛋白物质的降解中的应用

本发明的曲霉可用于降解含蛋白物质。具体地说,本发明的曲霉具有高的生产胞外蛋白酶和胞外外肽酶的能力。因此,它的使用能使高效率地降解含蛋白质物质。在本说明书中,术语“含蛋白质的物质”是指包含蛋白质作为其组分的物质。其例子包括:含植物蛋白的物质,例如大豆、脱脂大豆、小麦和面筋;含动物蛋白的物质,例如牛奶、脱脂乳、乳酪蛋白、动物肉和动物胶;含鱼衍生蛋白的物质,例如鱼肉或鱼蛋白;含微生物衍生蛋白的物质,例如酵母和小球藻;以及它们的加工产品。在本发明的降解含蛋白质物质的方法中,可首先根据上述部分9中描述的生产酶的方法来培养本发明的曲霉,生产出的酶可与含蛋白的物质混合以促进降解反应。换句话说,可用本发明的曲霉接种含蛋白的物质,使曲霉在含蛋白的物质中生长,从而在其中产生酶。在这种情况下,可通过适当的加工进一步加速反应,例如曲霉生长后与盐混合。这样的例子等同于,例如,生产酱油或豆瓣酱的加工过程中,曲霉制造和捣碎步骤。特别地,在用于生产酱油或豆瓣酱的培养基中的野生型曲霉中,即含蛋白的物质中,常常含有丰富的含硫物质,该物质具有低分子量或能被容易地降解为小分子,上述表达被低分子量含硫物质所抑制。相反,硫同化酶在其中的表达在低分子量含硫物质存在的情况下被去抑制的本发明的曲霉非常有用,因为它可在,例如上述涉及含蛋白的物质降解的、生产酱油或豆瓣酱的过程中高效率地生产蛋白水解酶,例如蛋白酶。本发明还包括使用本发明的曲霉降解含蛋白的物质的方法。根据采用本发明的曲霉降解含蛋白物质的方法,含蛋白物质的降解产物可首先制备成降解混合物。含蛋白物质的降解产物可根据需要以这种混合物形式使用。换句话说,如果需要,感兴趣的降解产物在使用前可从上述降解混合物中分离得到。

实施本发明的最佳方式

参考下列的实施例从而更详细地描述本发明,尽管本发明的技术范围并不局限于这些实施例。

[实施例1]

调节黄绿曲霉米曲霉(Aspergillus oryzae)的硫同化基因的转录因子基因的获得

黄绿曲霉米曲霉RIB40菌株(ATCC42149)的孢子接种至100ml的YPD培养基上并在30℃振荡培养过夜。随后,根据Iimura的方法提取基因组DNA(Argric.Biol.Chem.,323-328,51(1987))。使用该基因组DNA片段作模板并且使用基于metR和cys-3的核苷酸序列合成的下列引物进行PCR,其中metR是构巢曲霉(Aspergillusnidulans)的硫同化基因的调节因子基因,cys-3是粗糙链孢霉(Neurospora crassa)的硫同化基因的调节因子基因。

5’-ACCGC(T/C)GC(T/C)AGCGC(T/C)CG(A/G)TT-3’(SEQ IDNO:7)

5’-(G/C)GA(G/T)CC(A/G)TG(T/C)TTCTC(A/G)GT-3’(SEQID NO:8)

PCR采用Expand-HF(Roche Diagnostics)在DNA热循环仪(DNAThermal Cycler)中进行反应(Takara Shuzo Co.,Ltd.)。反应溶液组分显示如下。

(试剂/使用的体积/终浓度)

H2O/36μl

10x反应缓冲液/5μl/1x

dNTP混合物(2.5mM)/5μl/250μM

引物/2种类型各1μl/20μM

模板(0.5μg的DNA)/1μl

Expand-HF DNA聚合酶混合物/1μl/3.5U/每个实验

全部液体体积:50μl

上述反应溶液(50μl)的组分在-0.2ml的反应试管中混合,该试管被固定在DNA热循环仪上,PCR在下列温度条件下进行:

94℃3分钟一循环

94℃1分钟,50℃1分钟,和72℃1分钟30次循环;以及72℃7分钟1循环。

扩增产物经1.5%的琼脂糖凝胶电泳证实,分离、纯化感兴趣的DNA片段,随后与用于TA克隆的pT7Blue T-载体连接(Novagen)。用得到的载体转化E.coli JM 109菌株(ATCC 53323)并克隆。从具有感兴趣的DNA片段的E.coli克隆中制备质粒,分析克隆的DNA片段的核苷酸序列,使用NCBI blastx进行同源性分析(http://www.ncbi.nlm.nih.gov/BLAST/)。结果发现,该序列与构巢曲霉的MetR同源。

然后根据Chenchik等的方法(Biotechniques,21:526-534,1996)获得含有全长基因的基因组DNA克隆。

具体地说,提取的基因组DNA用各种限制性酶完全消化,这些限制性酶包括EcoRV、ScaI、DraI、PvuII和SspI,它们识别并剪切-6-bp的序列以产生平头末端。随后,(P)5’-ACCTGCCC-3’(NH2)(SEQ IDNO:9)和5’-CTAATACGACTCACTATAGGGCTCGAGCGGCCGCCCGGGCAGGT-3’(SEQ ID NO:10)的接头被连接到基因组DNA片段的两端。使用该基因组DNA片段作为模板,并使用基于上述确定的核苷酸序列合成的引物以及具有接头序列部分的引物5’-CTAATACGACTCACTATAGGGC-3’(SEQ ID NO:11)进行PCR。当获得5’区域时使用下列2个引物。

5’-TTTTCCATCTCCAGCTGGGCTACGCG-3’(SEQ ID NO:12)

5’-AGGGATCTGCGTGCTGTACTTGGTGTGT-3’(SEQ ID NO:13)

当获得3’区域时使用下列引物。

5’-TGGAACGGACAGTGCGAGAGACTA-3’(SEQ ID NO:14)

采用Expand-HF在DNA热循环仪中进行PCR。当获得5’区域和3’区域时采用DraI。反应溶液的组分显示如下。

(试剂/使用的量/终浓度)

H2O/18.25μl

10x反应缓冲液/2.5μl/1x

dNTP混合物(2.5mM)/2.5μl/250μM

引物/2种类型各0.25μl/5μM

模板(0.2μg的DNA)/1μl

Expand-HF DNA聚合酶混合物/0.25μl/1.25U/每个实验

全部液体体积:25μl

上述反应溶液(25μl)的成分在0.2ml的反应试管中混合,该试管被固定在DNA热循环仪上,在下列温度条件下进行下阶梯PCR(step-down PCR)。

95℃1分钟1循环;

95℃30秒,74℃15秒,和70℃3分钟循环3次;

95℃30秒,70℃15秒,和70℃3分钟循环3次;

95℃30秒,66℃15秒,和70℃3分钟循环3次;

95℃30秒,62℃15秒,和70℃3分钟循环3次;

95℃30秒,58℃15秒,和70℃3分钟循环3次;和

95℃30秒,54℃15秒,和70℃3分钟循环20次;

扩增产物通过1%的琼脂糖凝胶电泳证实,分离、纯化感兴趣的DNA片段,然后与用于TA克隆的pT7Blue T-载体连接。E.coli JM 109菌株用得到的载体转化并克隆。从具有感兴趣的DNA片段的E.coli克隆中制备质粒,分析克隆的DNA片段的核苷酸序列。该核苷酸序列如SEQ ID NO:1所示。使用NCBI blastx对该序列进行同源性搜索(http://www.ncbi.nlm.nih.gov/BLAST)。结果发现,该序列与构巢曲霉MetR同源。

为了确定上述基因的cDNA的核苷酸序列,使用RT-PCR扩增cDNA。米曲霉RIB 40菌株的孢子被接种至100ml的YPD培养基中,并在30℃培养20小时。随后,回收细胞,然后根据Chigwin等的方法(Biochemistry 18:5294-8299,1979)提取总RNA。接着使用寡(dT)纤维素柱(Amersham)获得mRNA。此后,使用Ready-To-Go RT-PCRBeads合成cDNA(Amersham)。使用下列2个引物。

5’-ATGTCAGATGAGCACATCGCTCGTCAG-3’(SEQ ID NO:15)

5’-CTAGTTATCGGTGCCCACACCCTTC-3’(SEQ ID NO:16)

根据试剂盒标准组分确定反应溶液的组成。反应条件如下:

42℃30分钟;

95℃5分钟;和

95℃30秒,55℃1分钟,和72℃1分钟32个循环。

扩增产物通过1%的琼脂糖凝胶电泳证实,分离、纯化感兴趣的DNA片段,然后与用于TA克隆的pT7Blue T-载体连接(Novagen)。用得到的载体转化E.coli JM 109菌株并克隆。从具有感兴趣的DNA片段的E.coli克隆中制备质粒,分析克隆的DNA片段的核苷酸序列。存在于上述确定的染色体上的该基因的序列中,但不存在于该克隆片段上的部分被确定为一个内含子。分析该cDNA的核苷酸序列,从而揭示831-bp的开放阅读框的存在(以下简称为“ORF”)。此ORF的核苷酸序列如SEQ ID NO:2所示。前述在上文核苷酸测序中获得的染色体DNA的蛋白质基因和cDNA的蛋白质基因进行相互比较。结果发现,一个732-bp的内含子存在于染色体DNA上。从cDNA的核苷酸序列推导出的氨基酸序列以SEQ ID NO:3所示。该氨基酸序列分析的结果显示在蛋白质C-末端附近存在一亮氨酸拉链结构。这表明本发明的蛋白质是一种DNA-结合蛋白。从常规的氨基酸序列数据库中检索与这个氨基酸序列具有高度的序列一致性的序列。使用NCBI blastp(http://www.ncbi.nlm.nih.gov/BLAST/)和指定的nr数据库进行检索。结果发现没有匹配的序列,而构巢曲霉(入藏登记号AAD 38380)具有最高的序列同源性。使用Genetyx Mac Ver.11.1对这些序列进行同源性搜索,发现在257-残基重叠中共有28.8%的序列同源性。由于该序列同源性低至28.8%,因此,仅基于序列同源性难以推定由获得的基因编码的蛋白质具有与MetR的蛋白质相似的功能。

搜索与SEQ ID NO:2所示的核苷酸序列高度同源的序列。使用NCBIblastn(http://www.ncbi.nlm.nih.gov/BLAST/)和指定的nr数据库进行检索。粗糙链孢霉的cys-3基因被发现与其具有最高的同源性,但匹配的区域有限。而且,构巢曲霉的metR基因不包括在该检索结果中。因此,使用具有更高灵敏度的FASTA进一步进行检索。使用GenomeNet的FASTA检索服务(http://www.genome.ad.jp),并使用nr-nt数据库。结果,发现构巢曲霉的metR基因(入藏登记号AF148535)具有最高的序列同源性。CDS区域(ORF区域)从该序列中被提取出来,并使用Genetyx Mac Ver.11.1通过同源性搜索进行研究,序列被发现在793-核苷酸的重叠中共有50%的同源。

此外,进一步搜索编码与SEQ ID NO:3所示的氨基酸序列同源的氨基酸序列的DNA。采用NCBI tblastn(http://www.ncbi.nlm.nih.gov/BLAST/)和指定的nr数据库进行搜索。结果发现构巢曲霉的metR基因(入藏登记号AF148535)与其具有最高的序列同源性,在氨基酸水平上的序列同源性如上文所述。

[实施例2]

黄绿曲霉sconB基因的部分序列的测定

丝状真菌米曲霉RIB 40菌株(ATCC 42149)的孢子被接种至100ml的YPD培养基中,并在30℃振荡培养过夜。随后,根据上述Iimura的方法提取基因组DNA。采用该基因组DNA片段作为模板,并使用下列两个引物进行PCR,这两个引物是基于构巢曲霉和粗糙链孢霉的meaB基因的核苷酸序列合成的。

5’-CG(G/A)ATGTG(T/C)GAACAACAC-3’(SEQ ID NO:17)

5’-CAA(A/C)CCCTC(G/C)AGGTG(A/C)CCGAA-3’(SEQ ID NO:18)

使用Expand-HF在DNA热循环仪中进行PCR。反应溶液组分显示如下.

(试剂/使用的体积/终浓度)

H2O/36μl

10x反应缓冲液/5μl/1x

dNTP混合物(2.5mM)/5μl/250μM

引物/2种类型各1μl/20μM

模板(0.5μg的DNA)/1μl

Expand-HF DNA聚合酶混合物/1μl/3.5U/每个实验

全部液体体积:50μl

上述反应溶液(50μl)的组分在0.2ml的反应试管中混合,该试管被固定在DNA热循环仪上,PCR在下列温度条件下进行。

94℃3分钟一循环

94℃1分钟,55℃1分钟,和72℃1分钟循环30次;以及72℃7分钟1循环。

扩增产物通过1.0%的琼脂糖凝胶电泳证实,分离、纯化感兴趣的DNA片段,然后与pT7Blue T-载体连接用于TA克隆。用得到的载体转化E.coli JM 109菌株并克隆。从具有感兴趣的DNA片段的E.coli克隆中制备质粒,分析克隆的DNA片段的核苷酸序列,使用NCBIblastx进行同源性检索(http://www.ncbi.nlm.nih.gov/BLAST/)。结果发现,该序列与构巢曲霉SconB高度同源。

然后根据Chenchik等的方法(Biotechniques,21:526-534,1996)获得含有全长基因的基因组DNA克隆。

具体地说,提取的基因组DNA用各种限制性酶完全消化,这些限制性酶包括EcoRV、ScaI、DraI、PvuII和SspI,它们识别并剪切6-bp的序列从而产生平头末端。随后,(P)5’-ACCTGCCC-3’(NH2)(SEQ IDNO:9)和5’-CTAATACGACTCACTATAGGGCTCGAGCGGCCGCCCGGGCAGGT-3’(SEQ ID NO:10)的接头被连接到基因组DNA片段的两端。采用该基因组DNA片段作为模板,并使用基于上述确定的核苷酸序列合成的引物,以及具有接头序列部分的引物5’-CTAATACGACTCACTATAGGGC-3’(SEQ ID NO:11)进行PCR。当获得5’区域时使用下列引物。

5’-AGGAAGCCCCCAGCCACATTTCTTGC-3’(SEQ ID NO:19)

当获得3’区域时使用下列引物。

5’-ACGATTCTTGCCTCAGCCTCCG-3’(SEQ ID NO:20)

使用Expand-HF在DNA热循环仪中进行PCR。当获得5’区域和3’区域时使用DraI。反应溶液的组分显示如下。

(试剂/使用的量/终浓度)

H2O/18.25μl

10x反应缓冲液/2.5μl/1x

dNTP混合物(2.5mM)/2.5μl/250μM

引物/2种类型各0.25μl/5μM

模板(0.2μg的DNA)/1μl

Expand-HF DNA聚合酶混合物/0.25μl/1.25U/每个实验

全部液体体积:25μl

上述反应溶液(25μl)的成分在0.2ml的反应试管中混合,该试管被固定在DNA热循环仪上,下阶梯PCR(step-down PCR)在下列温度条件下进行。

95℃1分钟1循环;

95℃30秒,74℃15秒,和70℃3分钟循环3次;

95℃30秒,70℃15秒,和70℃3分钟循环3次;

95℃30秒,66℃15秒,和70℃3分钟循环3次;

95℃30秒,62℃15秒,和70℃3分钟循环3次;

95℃30秒,58℃15秒,和70℃3分钟循环3次;和

95℃30秒,54℃15秒,和70℃3分钟循环20次;

扩增产物通过1%的琼脂糖凝胶电泳证实,一大约1-2kb的DNA片段被分离、纯化得到,随后与pT7Blue T-载体连接用于TA克隆。用得到的载体转化E.coli JM 109菌株并克隆。从具有感兴趣的DNA片段的E.coli克隆中制备质粒,分析克隆的DNA片段的核苷酸序列。该核苷酸序列如SEQ ID NO:4所示。使用NCBI blastx对该序列进行同源性搜索(http://www.ncbi.nlm.nih.gov/BLAST)。结果发现,该序列与构巢曲霉SconB同源。

为了确定上述基因的cDNA的核苷酸序列,采用RT-PCR扩增cDNA。米曲霉RIB 40菌株的孢子被接种至100ml的YPD培养基中,并在30℃下培养20小时。此后,回收细胞,然后根据Chigwin等的方法提取总RNA。接着使用寡(dT)纤维素柱获得mRNA(Amersham)。此后,使用Ready-To-Go RT-PCR Beads合成cDNA。使用下列2个引物。

5’-ATGGCCCAACCGACCGGAGAACTTAC-3’(SEQ ID NO:21)

5’-TTAATTGCGGAAACTGTACATGCGCA-3’(SEQ ID NO:22)

根据试剂盒的标准组分确定反应溶液的组成。反应条件如下:

42℃30分钟;

95℃5分钟;和

95℃30秒,55℃1分钟,和72℃1分钟32个循环。

扩增产物通过1%的琼脂糖凝胶电泳证实,分离、纯化感兴趣的DNA片段,然后与pT7Blue T-载体连接用于TA克隆。E.coli JM 109菌株用得到的载体转化并克隆。从具有感兴趣的DNA片段的E.coli克隆中制备质粒,并分析克隆的DNA片段的核苷酸序列。存在于上述测定的染色体DNA-衍生核苷酸序列中,但不存在于该克隆片段上的部分被确定为一个内含子。分析该cDNA的核苷酸序列。该分析揭示了2,055-bp的开放阅读框的存在。其核苷酸序列如SEQ ID NO:5所示。前述在上文核苷酸测序中获得的染色体DNA的蛋白质基因和cDNA的蛋白质基因进行相互比较。结果发现,一个48-bp的内含子存在于染色体DNA中。从上述核苷酸序列推导出的氨基酸序列如SEQ ID NO:6所示。从常规的氨基酸序列数据库中检索与这个氨基酸序列具有高度序列一致性的序列。使用NCBI blastp (http://www.ncbi.nlm.nih.gov/BLAST/)和指定的nr数据库进行检索。结果发现没有匹配的序列,而构巢曲霉的SconB蛋白(入藏登记号Q00659)具有最高的序列同源性。使用Genetyx Mac Ver.11.1对这些序列进行同源性检索,并且发现这些序列在677-残基重叠中共有80.1%的序列同源性。由获得的基因编码的蛋白相对于整个序列来说、在大约99%的重叠中与构巢曲霉的SconB高度同源;因此,这些序列被认为基本上具有相同的功能。

检索与SEQ ID NO:4所示的核苷酸序列具有高度同源的序列。使用NCBI blastn(http://www.ncbi.nlm.nih.gov/BLAST/)和指定的nr数据库进行检索。发现构巢曲霉的SconB基因(入藏登记号U21220)显示了最高的同源性。因此,从该序列中提取CDS区域(ORF区域)并用Genetyx Mac Ver.11.1通过同源性检索进行研究。结果发现,这些序列在2,036-核苷酸重叠中共有73.2%的序列的同源性。

此外,进一步检索编码与SEQ ID NO:6所示的氨基酸序列同源的氨基酸序列的DNA。使用NCBI tblastn(http://www.ncbi.nlm.nih.gov/BLAST/)和指定的nr数据库进行检索。结果发现,构巢曲霉的SconB基因(入藏登记号U21220)显示最高的序列同源性,同时在氨基酸水平上的序列同源性如上文所述。

[实施例3]

体外蛋白质合成

采用实施例1中制备的cDNA作为模板,并使用下列两个引物进行PCR反应。

5’-GAAGGAGATATACATATGGATTACGACCAG-3’(SEQ ID NO:23)

5’-CCCCCGGGAGCTCCTAGTTATCGGTGCCCA-3’(SEQ ID NO:24)

扩增片段被插入表达载体pIVEX2.3-MCS(Roche Diagnostics)的NdeI-SacI位点。使用快速翻译系统(Rapid Translation System)RTS 100 E.coli HY试剂盒(Roche Diagnostics)使反应在30℃下持续4小时。这样,具有如SEQ ID NO:3所示的氨基酸序列的蛋白质被表达。

反应系统包括下列部分。

12μl的E.coli溶菌产物

10μl的反应混合物

12μl的氨基酸

1μl的甲硫氨酸

5μl的重组缓冲液

1μl的模板DNA

这些成分相互混合,该混合物的最终体积经添加不含DNA酶/RNA酶的蒸馏水被调整至50μl。

在体外蛋白合成系统中表达的蛋白质被用于如下凝胶移位分析。

[实施例4]

凝胶移位分析

一个亮氨酸拉链结构存在于如SEQ ID NO:3所示的氨基酸序列的C-末端一侧。为了证实本发明的蛋白质具有转录因子功能,具体地说,蛋白质具有DNA-结合蛋白的功能,采用sconB基因的启动子区域作为探针进行凝胶移位分析。

使用双链DNA作为用于凝胶移位分析的探针。该双链DNA通过在94℃加热在其5’端用IRDye-800标记的5’-GGACGACTGCTACCACGGTAGCGCGCGGGC-3’(SEQ ID NO:25)和未标记的5’-GCCCGCGCGCTACCGTGGTAGCAGTCGTCC-3’(SEQ ID NO:26)5分钟,然后逐渐冷却至退火来制备。在结合反应中,将上述反应中制备的160fmol的探针和1μl实施例3中制备的蛋白质加入结合反应溶液中(10mM Tris-HCl(pH7.5),50mM NaCl,0.5mM DTT,0.5mM EDTA,2mM MgCl2,4%的甘油和0.2mg/ml BSA),使之在室温下反应20分钟,在8%的聚丙烯酰胺凝胶(79:1)上进行电泳,为了检测,使用LI-COR4200L测序仪(LI-COR)来观察移位的条带。结果,相对于该序列观察到一以序列特异性方式移动的条带。这有力地表明具有如SEQ IDNO:3所示的氨基酸序列的蛋白质与sconB基因的启动子区域结合并涉及其转录的调节。此实验的结果证实含有SEQ ID NO:3显示的氨基酸序列的蛋白质具有DNA-结合蛋白的功能。

[实施例5]

曲霉表达载体的构建

制备一种质粒其中在具有米曲霉的淀粉酶启动子的表达载体质粒pMAR5中的argB基因(一标记基因)(Biosci.Biotech.Biochem.,56:1674-1675,1992)被米曲霉的pyrG基因取代。pMAR5用SphI消化,平端化,进一步用SalI消化,并在0.7%的琼脂糖凝胶上电泳以获得大约4-kb的片段。另外,ppyrG-26(日本专利申请(Kokai)No.2001-46053A)用BamHI消化,平端化,进一步用SalI消化,并在0.7%的琼脂糖凝胶上电泳以获得包含pyrG基因的约2.2kb的DNA片段。这些片段互相连接从而产生载体,且用该载体转化E.coliJM 109菌株。获得的质粒被称做pAP。这个质粒是一种表达载体,它包含pyrG基因作为选择标记,并在淀粉酶基因的启动子和终止子之间具有SmaI位点。该质粒可在淀粉酶基因启动子的控制下通过在与启动子相同的方向将基因的ORF插入进入SmaI位点并用它转化曲霉从而表达感兴趣的基因。

用实施例1中获得的RNA作为模板,并使用RNA LA-PCR试剂盒(Takara Shuzo Co.,Ltd)来进行RT-PCR,从而获得包含具有如SEQID NO:2所示的核苷酸序列的ORF的DNA片段。

与试剂盒结合的引物被用于进行逆转录,该引物包含在oligo(dT)的3’一侧上的一个接头序列。反应溶液的组分根据试剂盒的标准组分来确定。

逆转录在如下温度条件下进行:30℃10分钟,50℃30分钟,99℃5分钟,和5℃5分钟组成。

随后,根据试剂盒的说明,向逆转录产物中加入引物、热稳定聚合酶和其它物质来进行PCR反应。使用试剂盒附带的接头引物以及下列引物,并且从紧靠5’端的起始密码子前的位置和3’端的poly(A)位点开始扩增反应。

5’-CAAGCTTCCAATATGTCAGATGAGCA-3’(SEQ ID NO:27)

在如下条件下进行PCR:94℃2分钟,94℃10秒,53℃20秒,72℃1分钟20秒进行15个循环,随后72℃5分钟。使用DNA EnginePCT-200(MJ Research)的热循环仪,其中温度通过计算控制的方法控制。

随后,采用上述RT-PCR的扩增产物作为模板,并使用上述引物(SEQID NO:28)和下列引物进行PCR反应。从紧靠5’端的起始密码子前的位置和紧靠3’端的终止密码子后的位置开始扩增。

5’-AAGCTCTAGATACACAAGGTAACAGA-3’(SEQ ID NO:28)

修饰被引入到各个引物中,这样扩增的序列在其5’端含有限制酶HindIII的识别序列,而在3’端含有限制酶XbaI的识别序列。Tbr EXTDNA聚合酶(Fynnzymes)被用作热稳定DNA聚合酶,而反应溶液组分则根据附着在聚合酶上的说明来确定。

在如下条件下进行PCR:94℃2分钟,94℃10秒,53℃20秒,72℃1分钟共30个循环,随后72℃5分钟。扩增产物的一部分在0.7%的琼脂糖凝胶上进行电泳,并观察到一约0.9-kb的条带。

随后,使用TOPO TA Cloning试剂盒,采用TOP 10细胞(Invitrogen)将扩增产物插入pCR2.1-TOPO载体中。试剂盒附带的E.coli TOP 10菌株用该载体转化,随后获得8个转化体的克隆。从每一转化体中提取质粒,用限制酶HindIII和XbaI进行酶切,并在0.7%的琼脂糖凝胶上电泳。结果,在全部克隆中均观察到约0.9kb的片段。测定了这8个克隆的核苷酸序列,鉴别出不含PCR-引入错误的一个克隆。

该质粒用HindIII和XbaI消化,平端化,并在0.7%的琼脂糖凝胶上电泳,然后提取到约0.9-kb的片段。该片段与SmaI-消化的pAP连接从而产生载体,E.coli JM 109菌株用该载体进行转化。从E.coli转化体的6个克隆中制备质粒,并检测插入片段的方向。结果,发现6个克隆中的2个在相对于淀粉酶启动子的合适方向上具有插入片段。其中1个被命名为pAM1。2002年2月19日,pAM1被保藏在国家先进工业科学和技术研究所(National Institute of AdvancedIndustrial Science and Technology),国际专利生物保藏机构(International Patent Organism Depositary),(Tsukuba Central6,1-1-1Higashi,Tsukuba,Igaraki,日本),入藏登记号为FERMBP-7907.

[实施例6]

曲霉转化体的获得

利用日本专利出版物(Kokai)No.2001-46053 A中公开的方法,采用pMA1转化从米曲霉1764菌株(IFO4206,IAM2636)中来源的pyrG-缺乏的菌株。通过涉及原生质形成的方法(Mol.Gen.Genet.,218:99-104,1989),并使用聚乙二醇和氯化钙进行转化。pyrG-缺乏的菌株使用5μg的pAM1转化,转化体在基本培养基中进行筛选,获得大约1,000个克隆。这些克隆中,12个克隆在基本培养基中被重复用于单个分生孢子的分离以稳定它们的性状。这些菌株的分生孢子被从琼脂培养基上刮下,悬浮于100μl的0.05%的Triton X-100的TE缓冲液,然后在-80℃的深度冷冻器中冷冻并在室温下解冻3次。该步骤重复3次以获得可作为PCR模板的染色体DNA。使用这种染色体DNA作为模板,以及如下所示的序列的引物进行PCR,该引物相当于位于淀粉酶启动子上游的载体区域的序列,且该引物具有插入基因的3’末端上游方向上的如SEQ ID NO:28所示的序列。

5’-GAGCGGATAACAATTTCACACAGG-3’(SEQ ID NO:29)

Tbr EXT DNA聚合酶(Fynnzymes)被作为热稳定DNA聚合酶,并且反应溶液的组分根据附着在聚合酶上的说明来确定。

PCR在如下条件下进行:94℃2分钟,接着94℃10秒,60℃20秒和72℃2分钟共45个循环。扩增产物的一部分在0.7%的琼脂糖凝胶上电泳,并在10个样品中观察到约2kb的条带。这样,发现这些菌株具有从淀粉酶启动子到插入基因的3’末端的没有中断的区域。其中一个菌株被命名为TFM1。

[实施例7]

曲霉硫同化基因的去抑制

大约106个TMF1菌株和米曲霉1764亲本菌株(硫同化基因调节系统的野生型表型)的分生孢子细胞被接种到40ml的添加了10mM甲硫氨酸的蛋白胨糊精培养基中,在150rpm和30℃下分别旋转振荡培养24小时。细胞通过离心沉淀并除去上清液。将细胞悬浮于40ml的冰水冷冻的无菌超纯水中并再次离心,用于洗涤。这样洗涤重复3次后,将细胞分别悬浮于50ml的抑制培养基(10mM甲硫氨酸存在于在不含硫源的基本培养基中)和50ml的去抑制培养基中(不含硫源的基本培养基)。将生成物被移至锥形瓶中,并在30℃下和150rpm进行旋转振荡培养。细胞通过离心14小时后,采用上述相同的方式用40ml冰水冷冻的无菌超纯水洗涤3次分离。洗涤的细胞用纸巾完全吸干水分,转移至充满液氮的研钵中,并用研杵使细胞溶解。大约一半体积的溶解细胞被转移到含有0.7ml的Tris-顺丁烯二酸缓冲液(添加了0.2M顺丁烯二酸的0.2M的Tris(pH6.9))的微管中,向其中加入0.35g的玻璃珠,并使用多珠振荡器MB-200(Yasui Kikai公司)以80%的功率输出进行细胞溶解10分钟。在10,000xg离心2分钟,使玻璃珠和不溶物质沉淀,回收溶解产物的上清液。溶解产物上清液中的蛋白质浓度采用蛋白质测定试剂盒II(Bio-Rad)测定,并用Tris-顺丁烯二酸缓冲液将上清液稀释到0.4mg/ml。20mM的硫酸对硝基苯酚Tris-顺丁烯二酸缓冲液(150μl)被加入25μl的溶解产物上清液中,并在37℃下培养15分钟。然后加入0.5M的氢氧化钠水溶液(150μl)并搅动从而终止反应。在盲试中,溶解产物是在氢氧化钠加入后加入的,而不是在氢氧化钠加入前加入。测定各个样品以及盲试样品在402nm处的吸光度,样品和盲试样品之间吸光度的差异被确定为芳基硫酸酯酶的活性值(以任意单位)。结果显示于下表1中。

表1

菌株培养基A420    盲试样品评分    吸光度差异  抑制/去抑制(100%)1764抑制培养基    0.324    0.306    0.0182.5去抑制培养基    1.015    0.297    0.718TFM1抑制培养基    0.647    0.297    0.35036.9去抑制培养基    1.251    0.303    0.948

当1764菌株在抑制培养基中的活性为在去抑制培养基中的2.5%时,TFM1菌株在抑制培养基中的活性高达在去抑制培养基中的36.9%。TFM1菌株的活性在抑制培养基中比亲本菌株的活性高约19倍,在去抑制培养基中比亲本菌株的活性高约1.3倍。这表明在该曲霉中,硫同化基因表达的抑制被低分子量含硫化合物提高。

[实施例8]

曲霉培养和胞外酶活性的测定

TFM1菌株和米曲霉1764菌株在各种培养基中培养,并且测定胞外酶活性。

a.在麦麸培养基上进行固体培养

将水或20mM甲硫氨酸水溶液(2.22ml)加入2.78g麦麸中,将其充分混合,混合物在150ml-锥形瓶中通过高压灭菌器在120℃灭菌60分钟。向其中接种上述曲霉分生孢子(约106个细胞),在30℃下静置培养。随后该容器被振荡20小时,以使培养基充分分散,培养再继续进行32小时。培养完成后,加入50ml蒸馏水,使该溶液在5℃下静置12小时,使用#2滤纸(Toyo Roshi Kaisha,Ltd.)从中除去培养基和细胞从而获得酶提取物。酶提取物的蛋白酶活性和氨肽酶活性分别采用偶氮酪蛋白和L-亮氨酸-p-硝基苯胺作为底物来进行测定。结果证实,甲硫氨酸的添加使两种菌株的两种酶活都降低了,而TFM1菌株的活性在所有条件下都较高。

b.大豆粉培养基中进行的液体培养

采用含有1.5%的经加热和加压膨胀的脱脂大豆粉,和1.5%的磷酸二氢钾的大豆粉液体培养基以及通过向上述培养基中加入10mM甲硫氨酸、20mM谷氨酸和1.5%的麦芽糖一水化物制备的培养基来进行液体培养。将上述曲霉分生孢子(约106个细胞)接种到培养基上,在30℃和130rpm旋转振荡培养48小时。采用#2滤纸(Toyo Roshi Kaisha,Ltd.)除去培养基中的细胞和一些不溶物质从而获得培养上清液。该培养上清液的蛋白酶活性和氨肽酶活性分别使用偶氮酪蛋白和L-亮氨酸-p-硝基苯胺作为底物来进行测定。结果证实,甲硫氨酸、谷氨酰胺和麦芽糖的加入使两种菌株的两种酶活性都减低,而TFM1菌株的活性在所有条件下都较高。特别地,当加入甲硫氨酸、谷氨酰胺和麦芽糖时,1764菌株两种酶的活性都被降低至基本上难以察觉的水平,而TFM1菌株的活性降低至没有加入这些物质中的任何一种时的活性的约一半。

上述部分a.和b.证实,TFM1菌株具有生产胞外蛋白酶和胞外氨肽酶的改善的能力。

这里引用的所有出版物、专利和专利申请以其全文引入作为参考。

工业适用性

本发明提供了调节曲霉硫同化基因表达的转录调节因子及其基因。这能使曲霉硫同化基因表达的调节得到修饰。而且,它显示硫同化基因表达的增强可导致其中胞外蛋白酶活性和胞外外肽酶活性被增强的曲霉的生产。使用本发明的曲霉可改善含蛋白质物质的降解效率。因此,本发明在工业上非常有用。

不含正文的序列列表

SEQ ID NOs:7、8、11、12到24,和27到29分别表示引物DNA。

SEQ ID NOs:9和10分别表示接头DNA。

SEQ ID NOs:25和26分别表示探针DNA。

序列表

序列表

<110>NODA INSTITUTE FOR SCIENTIFIC RESEARCH

NATIONAL INSTITUTE OF ADVANCED INDUSTRIAL SCIENCE AND TECHNOLOGY

<120>转录因子、转录因子基因、含有转录因子基因的重组载体、由所述载体转化的曲霉、和所述曲霉的用途

<130>PH-1627-PCT

<140>PCT/JP02/08376

<141>2002-08-20

<150>JP 2002-045090

<151>2002-02-21

<160>29

<170>PatentIn.Ver.2.1

<210>1

<211>3392

<212>DNA

<213>米曲霉

<220>

<221>CDS

<222>(349)..(612)

<220>

<221>CDS

<222>(1346)..(1912)

<400>1

atctttgcga caaatcatac aatcttggac ctgtgaaatt tgtgcattcc tggaccaatt    60

ccgagctttc ccctctttga gccgatctgg ggtttgactt tcttctctgg ttcaagcttg    120

ttctggcgcc atcgccatcc agtctggttc ctgctcttct ccaaagaaga agcagtccaa    180

aaaaaaatta aattaaatta ggtgggcgca agaggtaatt cagaagaagg aaaaagaaaa    240

aaaagaaaaa ttaccagaaa cttaaattaa agaggcaagg atcaaaacga ggccattacc    300

agaacggacg cagctctaaa acctctaaaa acccatcgcg cgagcaat atg tca gat     357

                                                     Met Ser Asp

                                                       1

gag cac atc gct cgt cag aca gcg tca agc ctc gat agg ctt gag aat      405

Glu His Ile Ala Arg Gln Thr Ala Ser Ser Leu Asp Arg Leu Glu Asn

      5                  10                  15

ttc aac ttc tta ctc tcc cga cac gat cct gcc ctg gca aag agt cga       453

Phe Asn Phe Leu Leu Ser Arg His Asp Pro Ala Leu Ala Lys Ser Arg

 20                  25                  30                  35

cat tac tct ttc gac gca gac gcg gcc ggc ttg gct cct ttt caa aac       501

His Tyr Ser Phe Asp Ala Asp Ala Ala Gly Leu Ala Pro Phe Gln Asn

                 40                  45                  50

ctg agc atg gat tac gac cag act gag gga atg ggc ggt att tcc gtc       549

Leu Ser Met Asp Tyr Asp Gln Thr Glu Gly Met Gly Gly Ile Ser Val

             55                  60                  65

agt  tcc tac gat agc att gag gat gaa cgg aac ccg atc gat gtg aga      597

Ser Ser Tyr Asp Ser Ile Glu Asp Glu Arg Asn Pro Ile Asp Val Arg

         70                  75                  80

ggg tat ccc tat cat ggtaagtctg agcttttatg actctcaatg ttgcattgtt       652

Gly Tyr Pro Tyr His

     85

tgcgccatct tctcgatccc tggttcgtgt ctcaattttg tggcctttgc ggcattaggt    712

ggaaatggta gagctattgc tgaggcgcac tcggatcgtg gccaaagctg atctcgttcg    772

tctccatcta aatatctcct ttcccttttt ccggggaaaa gcttcttctt gtttgttgtg    832

ccattagctt gtttgcaatt gttaatcgtg gctgtcattg ttggcgttgc tgtccaactc    892

ttatcgctcg tggatcactc catactttat tacccataac ctgttaaagt cgaggtttaa    952

ctttgggctc atgtatgttt tgcttcatct atctccctat tgtttttgcc tgtttttttt    1012

ttctcttttc tttttttaat ttgccaattt tcttataccc ctttggttgt attctcatct    1072

gcacccgcat gcctggttga tcacggagac gagcacgcaa tccatcacac caatgacaac    1132

gtcggtaacc ttgtcgttgg tgttgccgga cccttagcca cgcatctccc tctgttcatc    1192

taaagctccc caccaagggt cttatgtccc ccttggagct tccctcgtgt gataacactt    1252

gctccttctt tctgtcttat caccttgcta gatctatgcc tacagcgttg ctgtcctaga    1312

ttctgctcat tccgttgctt acatctattc cca gca gct gat aaa cac atc aac     1366

                                     Ala Ala Asp Lys His Ile Asn

                                          90                  95

tac tcc ctc ccc gac caa atg atc tca tat cca gct cac ccg atc tac      1414

Tyr Ser Leu Pro Asp Gln Met Ile Ser Tyr Pro Ala His Pro Ile Tyr

                100                 105                 110

cct cca atc tct tat gga cct gat gat ctg ggt cat gcc ccg ggg gct      1462

Pro Pro Ile Ser Tyr Gly Pro Asp Asp Leu Gly His Ala Pro Gly Ala

            115                 120                 125

ctg aca ccc tcg gac gtt tca tca tcc ata  tca ccc ccg aat ggt caa     1510

Leu Thr Pro Ser Asp Val Ser Ser Ser Ile Ser Pro Pro Asn Gly Gln

        130                 135                 140

ctc gga cac acc aag tac agc acg cag atc cct ggt gat cac ctc gct      1558

Leu Gly His Thr Lys Tyr Ser Thr Gln Ile Pro Gly Asp His Leu Ala

    145                 150                 155

tct gca ctt tcg caa gaa gag cat gtt cgt cgt gct gct gaa gaa gac      1606

Ser Ala Leu Ser Gln Glu Glu His Val Arg Arg Ala Ala Glu Glu Asp

160                 165                 170                 175

cgc cgg cgg cga aac acc gcg gct agc gcc cgg ttt cgc atg aaa aag      1654

Arg Arg Arg Arg Asn Thr Ala Ala Ser Ala Arg Phe Arg Met Lys Lys

                180                 185                 190

aag cag cgt gag cag acg ctg gaa cgg aca gtg cga gag act acg gag      1702

Lys Gln Arg Glu Gln Thr Leu Glu Arg Thr Val Arg Glu Thr Thr Glu

            195                 200                 205

aag aac gct act ctc gag gcc cgc gta gcc cag ctg gag atg gaa aat      1750

Lys Asu Ala Thr Leu Glu Ala Arg Val Ala Gln Leu Glu Met Glu Asn

        210                 215                 220

cga tgg ttg aag aat ctc ttg act gag aaa cac gaa tcg acg agt agt      1798

Arg Trp Leu Lys Asn Leu Leu Thr Glu Lys His Glu Ser Thr Ser Ser

    225                 230                 235

cgc atg ccg ccc cca ccg gaa gac agt aca gcc ttg aac caa aaa ggc      1846

Arg Met Pro Pro Pro Pro Glu Asp Ser Thr Ala Leu Asn Gln Lys Gly

240                 245                 250                 255

aac agt ggc gga aac ggc caa aaa cac atc cag cca aaa aag aag ggt      1894

Asn Ser Gly Gly Asn Gly Gln Lys His Ile Glu Pro Lys Lys Lys Gly

                260                 265                 270

gtg ggc acc gat aac tag agactaaaac gaagaagtct tgtttttctg             1942

Val Gly Thr Asp Asn

            275

ttaccttgtg tatcttcagc ttttccttct gtctctctcc ctcctctccc tcctctctct    2002

ccttccgaca ttactacatg ctcatgcttt gggcgttggt tccagtttcc ctcttcgcat    2062

ctgtcttcat atcctctatc tatttttggg ctggtcatcc gtcctatgat ggaggcactt    2122

gacgatgtaa tgacctttca tcatttttgt ttctgctgtg cgcgagtgcg agtgcgcgac    2182

ctgagacacg gtatcatttt ctaggctgtt tggaacgttt ttgttttttt ttccctgttt    2242

ctcttgctcg cccttctgtt cgttctttct tattagtcat gcttggtgaa tcttgcaggc    2302

aaattggggg tgatctacag ttttcttgag tcttcacgga tcagggtcag ggtctcctcc    2362

gccctgtcac ccgcaatcgg agtataagga tgggatttag ttattgtcgg tgttgaattt    2422

ggcaaaccta tatcgcacgt tggacttaca acatacgagc ctaccgtgcc cgcagtagct    2482

cggcttaaat ctctgatagg gactagagct gagaatcaac tgattggcgt tcaaatttca    2542

ttcatccgaa gtttgtccta aacccctccg cgtatagatt gcaggcgaga ggtatacaga    2602

atatatgaat cacacacagg atccaggaca caggcacatt cgagcaaatt gggtttgtgt    2662

cttgaaatat atatggggag tgttttcttg aacatacatt cgcaagggac tcggagctca    2722

tcaggctgca atgtttgcct tgctcttttt ttatcctagg gctgttctat cttggcgctt    2782

gttacggagt actggctata cgttttgaat agtgactaca tacatatcag gcttcagctt    2842

ttcatctttg gacaagagat ccaaccgcaa aaacagtatt gtactctact acaatccacg    2902

ggtcgccttt gtaagtctct gaaaagaaaa gaaaaagaaa agaaaagtac cgtagggagc    2962

agatatgtcc tctagaatca ataaaaacaa aacaccccca gaagtgatca tcaccctcga    3022

ccgaagaaaa gcggtcggtc gaaagtgtag aatccgggga acaacaaaag caacgaatgg    3082

agcatgggcg ttgacatcat actcgtcggc tattcatggt ccagaaggaa gttccggggc    3142

ggctaacgat aatcagtacc gaaacagtcc acgatcacgg ggacgtacgg cgatagttga    3202

gtttcgagtt gtctcgagtt gaaatagtca cgggattggc atttccatat gatacctgcc    3262

cgggcggccg ctcgagccct atagtgagtc gtattaggat ggaatccata tgactagtag    3322

atcctctaga gtcgacctgc aggcatgcaa gctttcccta tagtgagtcg tattagagct    3382

tggcgtaatc                                                           3392

<210>2

<211>831

<212>DNA

<213>米曲霉

<220>

<221>CDS

<222>(1)..(831)

<400>2

atg tca gat gag cac atc gct cgt cag aca gcg tca agc ctc gat agg      48

Met Ser Asp Glu His Ile Ala Arg Gln Thr Ala Ser Ser Leu Asp Arg

  1               5                  10                  15

ctt gag aat ttc aac ttc tta ctc tcc cga cac gat cct gcc ctg gca      96

Leu Glu Asn Phe Asn Phe Leu Leu Ser Arg His Asp Pro Ala Leu Ala

             20                  25                  30

aag agt cga cat tac tct ttc gac gca gac gcg gcc ggc ttg gct cct      144

Lys Ser Arg His Tyr Ser Phe Asp Ala Asp Ala Ala Gly Leu Ala Pro

         35                  40                  45

ttt caa aac ctg agc atg gat tac gac cag act gag gga atg ggc ggt      192

Phe Gln Asn Leu Ser Met Asp Tyr Asp Gln Thr Glu Gly Met Gly Gly

     50                  55                  60

att tcc gtc agt tcc tac gat agc att gag gat gaa cgg aac ccg atc      240

Ile Ser Val Ser Ser Tyr Asp Ser Ile Glu Asp Glu Arg Asn Pro Ile

 65                  70                  75                  80

gat gtg aga ggg tat ccc tat cat gca gct gat aaa cac atc aac tac      288

Asp Val Arg Gly Tyr Pro Tyr His Ala Ala Asp Lys His Ile Asn Tyr

                 85                  90                  95

tcc ctc ccc gac caa atg atc tca tat cca gct cac ccg atc tac cct      336

Ser Leu Pro Asp Gln Met Ile Ser Tyr Pro Ala His Pro Ile Tyr Pro

            100                 105                 110

cca atc tct tat gga cct gat gat ctg ggt cat gcc ccg ggg gct ctg      384

Pro Ile Ser Tyr Gly Pro Asp Asp Leu Gly His Ala Pro Gly Ala Leu

        115                 120                 125

aca ccc tcg gac gtt tca tca tcc ata tca ccc ccg aat ggt caa ctc      432

Thr Pro Ser Asp Val Ser Ser Ser Ile Ser Pro Pro Asn Gly Gln Leu

    130                 135                 140

gga cac acc aag tac agc acg cag atc cct ggt gat cac ctc get tct      480

Gly His Thr Lys Tyr Ser Thr Gln Ile Pro Gly Asp His Leu Ala Ser

145                 150                 155                 160

gca ctt tcg caa gaa gag cat gtt cgt cgt gct gct gaa gaa gac cgc      528

Ala Leu Ser Gln Glu Glu His Val Arg Arg Ala Ala Glu Glu Asp Arg

                165                 170                 175

cgg cgg cga aac acc gcg gct agc gcc cgg ttt cgc atg aaa aag aag      576

Arg Arg Arg Asn Thr Ala Ala Ser Ala Arg Phe Arg Met Lys Lys Lys

            180                 185                 190

cag cgt gag cag acg ctg gaa cgg aca gtg cga gag act acg gag aag      624

Gln Arg Glu Gln Thr Leu Glu Arg Thr Val Arg Glu Thr Thr Glu Lys

        195                 200                 205

aac gct act ctc gag gcc cgc gta gcc cag ctg gag atg gaa aat cga      672

Asn Ala Thr Leu Glu Ala Arg Val Ala Gln Leu Glu Met Glu Asn Arg

    210                 215                 220

tgg ttg aag aat ctc ttg act gag aaa cac gaa tcg acg agt agt cgc      720

Trp Leu Lys Asn Leu Leu Thr Glu Lys His Glu Ser Thr Ser Ser Arg

225                 230                 235                 240

atg ccg ccc cca ccg gaa gac agt aca gcc ttg aac caa aaa ggc aac      768

Met Pro Pro Pro Pro Glu Asp Ser Thr Ala Leu Asn Gln Lys Gly Asn

                245                 250                 255

agt ggc gga aac ggc caa aaa cac atc cag cca aaa aag aag ggt gtg      816

Ser Gly Gly Asn Gly Gln Lys His Ile Gln Pro Lys Lys Lys Gly Val

            260                 265                 270

ggc acc gat aac tag                                                  831

Gly Thr Asp Asn

        275

<210>3

<211>276

<212>PRT

<213>米曲霉

<400>3

Met Ser Asp Glu His Ile Ala Arg Gln Thr Ala Ser Ser Leu Asp Arg

  1               5                  10                  15

Leu Glu Asn Phe Asn Phe Leu Leu Ser Arg His Asp Pro Ala Leu Ala

             20                  25                  30

Lys Ser Arg His Tyr Ser Phe Asp Ala Asp Ala Ala Gly Leu Ala Pro

         35                  40                  45

Phe Gln Asn Leu Ser Met Asp Tyr Asp Gln Thr Glu Gly Met Gly Gly

     50                  55                  60

Ile Ser Val Ser Ser Tyr Asp Ser Ile Glu Asp Glu Arg Asn Pro Ile

 65                  70                  75                  80

Asp Val Arg Gly Tyr Pro Tyr His Ala Ala Asp Lys His Ile Asn Tyr

                 85                  90                  95

Ser Leu Pro Asp Gln Met Ile Ser Tyr Pro Ala His Pro Ile Tyr Pro

            100                 105                 110

Pro Ile Ser Tyr Gly Pro Asp Asp Leu Gly His Ala Pro Gly Ala Leu

        115                 120                 125

Thr Pro Ser Asp Val Ser Ser Ser Ile Ser Pro Pro Asn Gly Gln Leu

    130                 135                 140

Gly His Thr Lys Tyr Ser Thr Gln Ile Pro Gly Asp His Leu Ala Ser

145                 150                 155                 160

Ala Leu Ser Gln Glu Glu His Val Arg Arg Ala Ala Glu Glu Asp Arg

                165                 170                 175

Arg Arg Arg Asn Thr Ala Ala Ser Ala Arg Phe Arg Met Lys Lys Lys

            180                 185                 190

Gln Arg Glu Gln Thr Leu Glu Arg Thr Val Arg Glu Thr Thr Glu Lys

        195                 200                 205

Asn Ala Thr Leu Glu Ala Arg Val Ala Gln Leu Glu Met Glu Asn Arg

    210                 215                 220

Trp Leu Lys Asn Leu Leu Thr Glu Lys His Glu Ser Thr Ser Ser Arg

225                 230                 235                 240

Met Pro Pro Pro Pro Glu Asp Ser Thr Ala Leu Asn Gln Lys Gly Asn

                245                 250                 255

Ser Gly Gly Asn Gly Gln Lys His Ile Gln Pro Lys Lys Lys Gly Val

            260                 265                 270

Gly Thr Asp Asn

        275

<210>4

<211>2660

<212>DNA

<213>米曲霉

<220>

<221>CDS

<222>(443)..(814)

<220>

<221>CDS

<222>(864)..(2546)

<400>4

atcttttctt tcgggcgcat ccttctgcac gtgtttcgaa tttggctgga ccattgaaga    60

cagaaagaag aagaccctac tcctctcttc catacaccct ctctctgtcg ctttcgcttt    120

ccccatcccc gcctatcaac cactaaatct ccttatcgcg cgacctatca atccccgacg    180

gtcgccactg tcactcccct atcggcgcac aaccggatac cgcagtattg actttagact    240

tcaacaaacc ttgaagaagg tagtcgctgg cgtgatattt cgtcgtcttc tcgattttct    300

caaggttctt cattaccttc tcgggacgac tgctaccacg gtagcgcgcg ggcggtagga    360

acctcgttcc agtcacacga tgcagttcga cgaccgatca gtgcgtgaag gtagcgactc    420

ttcgcagact ttcttgatga aa atg gcc caa ccg acc gga gaa ctt aca cat     472

                         Met Ala Gln Pro Thr Gly Glu Leu Thr His

                           1               5                  10

cca tcg caa caa caa caa cta caa cta caa cag cag ttc ttc cag tct      520

Pro Ser Gln Gln Gln Gln Leu Gln Leu Gln Gln Gln Phe Phe Gln Ser

                     15                  20              25

atc ttt ggc ggc gca tcg gac acc act gag gag att gac acc gag acc      568

Ile Phe Gly Gly Ala Ser Asp Thr Thr Glu Glu Ile Asp Thr Glu Thr

             30                  35                  40

gat tct aac cat cga agg ccc cac agt ttc ggt gcc gct gcg acg act      616

Asp Ser Asn His Arg Arg Pro His Ser Phe Gly Ala Ala Ala Thr Thr

         45                  50                  55

ccc gca aag ctt gca aac aag aat gtc gca cca ttt ctc gtc aaa cac      664

Pro Ala Lys Leu Ala Asn Lys Asn Val Ala Pro Phe Leu Val Lys His

     60                  65                  70

atc ccc gaa caa tac ggt ccc ttg ggg tcg cga aga acc gac aag ttg      712

Ile Pro Glu Glu Tyr Gly Pro Leu Gly Ser Arg Arg Thr Asp Lys Leu

 75                  80                  85                  90

gag gat ttg agc agc ccg aac tcg aag ttt tgc tat cgc cac cgg cca      760

Glu Asp Leu Ser Ser Pro Asn Ser Lys Phe Cys Tyr Arg His Arg Pro

                 95                 100                 105

gac ctt aaa tgc aga cga cag gca gac gaa ccg tcc atg gat aaa cta      808

Asp Leu Lys Cys Arg Arg Gln Ala Asp Glu Pro Ser Met Asp Lys Leu

            110                 115                 120

cag agg gtagggtttc ttagggcttg tcatgtttct cttagctaat gggtcatag gaa    866

Gln Arg                                                       Glu

                                                              125

ttg gaa acg ctg cct ccc agc gac caa caa ggc att gcc cat gta tgg      914

Leu Glu Thr Leu Pro Pro Ser Asp Gln Gln Gly Ile Ala His Val Trp

                130                 135                 140

tct ctg ttt tcg gcc gct ccg gcc aag cac cgc aaa ttg atc ctc cag      962

Ser Leu Phe Ser Ala Ala Pro Ala Lys His Arg Lys Leu Ile Leu Gln

            145                 150                 155

ggg atc atg gct cag tgc tgt ttc ccg caa ctt tcg ttc gtg tcc gct      1010

Gly Ile Met Ala Gln Cys Cys Phe Pro Gln Leu Ser Phe Val Ser Ala

        160                 165                 170

acc gtt cga gac ctc atc cga atc gac ttt ctg acc gct ctt cca ccg      1058

Thr Val Arg Asp Leu Ile Arg Ile Asp Phe Leu Thr Ala Leu Pro Pro

    175                 180                 185

gag atc tcg ttc aaa att ctg tgc tac ctc gac acc acc tcg ctg tgc      1106

Glu Ile Ser Phe Lys Ile Leu Cys Tyr Leu Asp Thr Thr Ser Leu Cys

190                 195                 200                 205

aaa gcc gcc cag gtg tcc agc cgc tgg cgg gca ctg gca gat gat gat      1154

Lys Ala Ala Gln Val Ser Ser Arg Trp Arg Ala Leu Ala Asp Asp Asp

                210                 215                 220

gtg gtt tgg cat cgg atg tgc gaa caa cac atc cac cgc aaa tgc aag      1202

Val Val Trp His Arg Met Cys Glu Gln His Ile His Arg Lys Cys Lys

            225                 230                 235

aaa tgt ggc tgg ggg ctt cct ctt ctg gag cgg aaa cgt ctg cgg gag      1250

Lys Cys Gly Trp Gly Leu Pro Leu Leu Glu Arg Lys Arg Leu Arg Glu

        240                 245                 250

tcc aag cgc gaa att gaa ttg cgt gcc acc acc tgg gac gtc agc gga      1298

Ser Lys Arg Glu Ile Glu Leu Arg Ala Thr Thr Trp Asp Val Ser Gly

    255                 260                 265

ccc gcg cag aac gca gga ggt gcc gag tgc agt gca cca cat gcg gac      1346

Pro Ala Gln Asn Ala Gly Gly Ala Glu Cys Ser Ala Pro His Ala Asp

270                 275                 280                 285

gat gtg att acc cag aaa cgg aag gcg gat tcg agc gac gat gag acg      1394

Asp Val Ile Thr Gln Lys Arg Lys Ala Asp Ser Ser Asp Asp Glu Thr

                290                 295                 300

gca atc gtg aag cgg cat tgt tcc tcg ctg gat gct cga ccg gag cca      1442

Ala Ile Val Lys Arg His Cys Ser Ser Leu Asp Ala Arg Pro Glu Pro

            305                 310                 315

gat gag gat tac tat acg act cgg tat cgg ccg tgg aag gag gtc tac      1490

Asp Glu Asp Tyr Tyr Thr Thr Arg Tyr Arg Pro Trp Lys Glu Val Tyr

        320                 325                 330

aag gac cga ttc aag gtc ggc acg aat tgg aaa tac ggc cgg tgt tcc      1538

Lys Asp Arg Phe Lys Val Gly Thr Asn Trp Lys Tyr Gly Arg Cys Ser

    335                 340                 345

acc aag gtg ttc aaa ggc cac acc aac gga gtg atg tgc ttg caa ttc      1586

Thr Lys Val Phe Lys Gly His Thr Asn Gly Val Met Cys Leu Gln Phe

350                 355                 360                 365

gag gac aac att ttg gcg act ggt tca tac gac gcg acc atc aag att      1634

Glu Asp Asn Ile Leu Ala Thr Gly Ser Tyr Asp Ala Thr Ile Lys Ile

                370                 375                 380

tgg gat act gaa acc gga gaa gag ctg cgt acc cta cgc gga cac caa      1682

Trp Asp Thr Glu Thr Gly Glu Glu Leu Arg Thr Leu Arg Gly His Gln

            385                 390                 395

tcc ggt att cgc tgt ctc cag ttc gac gac aca aaa ttg atc agc ggc      1730

Ser Gly Ile Arg Cys Leu Gln Phe Asp Asp Thr Lys Leu Ile Ser Gly

        400                 405                 410

agt atg gac cgc agc ttg aag gtg tgg aat tgg cgt acg ggc gag tgc      1778

Ser Met Asp Arg Ser Leu Lys Val Trp Asn Trp Arg Thr Gly Glu Cys

    415                 420                 425

att tcc acc tac acg ggt cac cgt ggt gga gtg atc gga ctg cac ttt      1826

Ile Ser Thr Tyr Thr Gly His Arg Gly Gly Val Ile Gly Leu His Phe

430                 435                 440                 445

gat gca acg att ctt gcc tca gcc tcc gtt gat aag acg gtc aag att      1874

Asp Ala Thr Ile Leu Ala Ser Ala Ser Val Asp Lys Thr Val Lys Ile

                450                 455                 460

tgg aac ttc gag gat aag tcg aca ttt ctc ctg cgc gga cac acc gat      1922

Trp Asn Phe Glu Asp Lys Ser Thr Phe Leu Leu Arg Gly His Thr Asp

            465                 470                 475

tgg gtc aac gcg gtc cga gtg gac acg act tct cga acg gtg ttc tcg      1970

Trp Val Asn Ala Val Arg Val Asp Thr Thr Ser Arg Thr Val Phe Ser

        480                 485                 490

gct tcg gac gac tgc acc gtt cgc ttg tgg gac ttg gac acc aag gca      2018

Ala Ser Asp Asp Cys Thr Val Arg Leu Trp Asp Leu Asp Thr Lys Ala

    495                 500                 505

tgt ctc cgg acc ttc cat ggc cat gtc ggc caa gtc caa cag gtg gtt      2066

Cys Leu Arg Thr Phe His Gly His Val Gly Gln Val Gln Gln Val Val

510                 515                 520                 525

cct ttg ccc cgg gag ttc gag ttc gaa gac cac gac gct gaa tgt gat      2114

Pro Leu Pro Arg Glu Phe Glu Phe Glu Asp His Asp Ala Glu Cys Asp

                530                 535                 540

aac gat aac atg agc acc aca tct gga gac acg gaa tca aac tcc ctt      2162

Asn Asp Asn Met Ser Thr Thr Ser Gly Asp Thr Glu Ser Asn Ser Leu

            545                 550                 555

cag gca acg ctc gga ctg gag tcg aac gcc act gag acg tct gtc ttt      2210

Gln Ala Thr Leu Gly Leu Glu Ser Asn Ala Thr Glu Thr Ser Val Phe

        560                 565                 570

ggc ccc tca ttt gac aat ggc cgc cca gcc cca cca cgc tac att gtc      2258

Gly Pro Ser Phe Asp Asn Gly Arg Pro Ala Pro Pro Arg Tyr Ile Val

    575                 580                 585

acg agc goc tta gat tcc acc att cgt ctc tgg gag acc acg acc ggt      2306

Thr Ser Ala Leu Asp Ser Thr Ile Arg Leu Trp Glu Thr Thr Thr Gly

590                 595                 600                 605

cgc tgc ctg cgt acc ttc ttc ggt cac ctc gag ggc gtt tgg gcg ctc      2354

Arg Cys Leu Arg Thr Phe Phe Gly His Leu Glu Gly Val Trp Ala Leu

                610                 615                 620

ggt gct gat act ctc cga atc gtg tcc ggt gcg gaa gac cgg atg gtc      2402

Gly Ala Asp Thr Leu Arg Ile Val Ser Gly Ala Glu Asp Arg Met Val

            625                 630                 635

aag atc tgg gat ccc aga acc ggt aaa tgc gag cgc acc ttc acc ggc      2450

Lys Ile Trp Asp Pro Arg Thr Gly Lys Cys Glu Arg Thr Phe Thr Gly

        640                 645                 650

cat tcc ggc cca gtg acc tgt atc ggt ctc ggc gac agt cgg ttt gcg      2498

His Ser Gly Pro Val Thr Cys Ile Gly Leu Gly Asp Ser Arg Phe Ala

    655                 660                 665

acc ggc agt gag gat tgc gaa gtg cgc atg tac agt ttc cgc aat taa      2546

Thr Gly Ser Glu Asp Cys Glu Val Arg Met Tyr Ser Phe Arg Asn

670                 675                 680                   685

atattctgcc ttcttttttc ttcttctcgt ggcccgtctc ctgtggagac atgatgcgcc    2606

tatgtttaat gtgctttggt tacaaatacc cttcaagttg gcgctagggt cagg          2660

<210>5

<211>2055

<212>DNA

<213>米曲霉

<220>

<221>CDS

<222>(1)..(2055)

<400>5

atg gcc caa ccg acc gga gaa ctt aca cat cca tcg caa caa caa caa      48

Met Ala Glu Pro Thr Gly Glu Leu Thr His Pro Ser Gln Gln Gln Gln

  1               5                  10                  15

cta caa cta caa cag cag ttc ttc cag tct atc ttt ggc ggc gca tcg      96

Leu Gln Leu Gln Gln Gln Phe Phe Gln Ser Ile Phe Gly Gly Ala Ser

             20                  25                  30

gac acc act gag gag att gac acc gag acc gat tct aac cat cga agg      144

Asp Thr Thr Glu Glu Ile Asp Thr Glu Thr Asp Ser Asn His Arg Arg

         35                  40                  45

ccc cac agt ttc ggt gcc gct gcg acg act ccc gca aag ctt gca aac      192

Pro His Ser Phe Gly Ala Ala Ala Thr Thr Pro Ala Lys Leu Ala Asn

     50                  55                  60

aag aat gtc gca cca ttt ctc gtc aaa cac atc ccc gaa caa tac ggt      240

Lys Asn Val Ala Pro Phe Leu Val Lys His Ile Pro Glu Gln Tyr Gly

 65                  70                  75                  80

ccc ttg ggg tcg cga aga acc gac aag ttg gag gat ttg agc agc ccg      288

Pro Leu Gly Ser Arg Arg Thr Asp Lys Leu Glu Asp Leu Ser Ser Pro

                 85                  90                  95

aac tcg aag ttt tgc tat cgc cac cgg cca gac ctt aaa tgc aga cga      336

Asn Ser Lys Phe Cys Tyr Arg His Arg Pro Asp Leu Lys Cys Arg Arg

            100                 105                 110

cag gca gac gaa ccg tcc atg gat aaa cta cag agg gaa ttg gaa acg      384

Gln Ala Asp Glu Pro Ser Met Asp Lys Leu Gln Arg Glu Leu Glu Thr

        115                 120                 125

ctg cct ccc agc gac caa caa ggc att gcc cat gta tgg tct ctg ttt      432

Leu Pro Pro Ser Asp Gln Gln Gly Ile Ala His Val Trp Ser Leu Phe

    130                 135                 140

tcg gcc gct ccg gcc aag cac cgc aaa ttg atc ctc cag ggg atc atg     480

Ser Ala Ala Pro Ala Lys His Arg Lys Leu Ile Leu Gln Gly Ile Met

145                 150                 155                 160

gct cag tgc tgt ttc ccg caa ctt tcg ttc gtg tcc gct acc gtt cga      528

Ala Gln Cys Cys Phe Pro Gln Leu Ser Phe Val Ser Ala Thr Val Arg

                165                 170                 175

gac ctc atc cga atc gac ttt ctg acc gct ctt cca ccg gag atc tcg      576

Asp Leu Ile Arg Ile Asp Phe Leu Thr Ala Leu pro Pro Glu Ile Ser

           180                  185                  190

ttc aaa att ctg tgc tac ctc gac acc acc tcg ctg tgc aaa gcc gcc      624

Phe Lys Ile Leu Cys Tyr Leu Asp Thr Thr Ser Leu Cys Lys Ala Ala

        195                 200                 205

cag gtg tcc agc cgc tgg cgg gca ctg gca gat gat gat gtg gtt tgg      672

Gln Val Ser Ser Arg Trp Arg Ala Leu Ala Asp Asp Asp Val Val Trp

    210                 215                 220

cat cgg atg tgc gaa caa cac atc cac cgc aaa tgc aag aaa tgt ggc      720

His Arg Met Cys Glu Gln His Ile His Arg Lys Cys Lys Lys Cys Gly

225                 230                 235                 240

tgg ggg ctt cct ctt ctg gag cgg aaa cgt ctg cgg gag tcc aag cgc      768

Trp Gly Leu Pro Leu Leu Glu Arg Lys Arg Leu Arg Glu Ser Lys Arg

                245                 250                 255

gaa att gaa ttg cgt gcc acc acc tgg gac gtc agc gga ccc gcg cag      816

Glu Ile Glu Leu Arg Ala Thr Thr Trp Asp Val Ser Gly Pro Ala Gln

            260                 265                 270

aac gca gga ggt gcc gag tgc agt gca cca cat gcg gac gat gtg att      864

Asn Ala Gly Gly Ala Glu Cys Ser Ala Pro His Ala Asp Asp Val Ile

        275                 280                 285

acc cag aaa cgg aag gcg gat tcg agc gac gat gag acg gca atc gtg      912

Thr Gln Lys Arg Lys Ala Asp Ser Ser Asp Asp Glu Thr Ala Ile Val

    290                 295                 300

aag cgg cat tgt tcc tcg ctg gat gct cga ccg gag cca gat gag gat      960

Lys Arg His Cys Ser Ser Leu Asp Ala Arg Pro Glu Pro Asp Glu Asp

305                 310                 315                 320

tac tat acg act cgg tat cgg ccg tgg aag gag gtc tac aag gac cga      1008

Tyr Tyr Thr Thr Arg Tyr Arg Pro Trp Lys Glu Val Tyr Lys Asp Arg

                325                 330                 335

ttc aag gtc ggc acg aat tgg aaa tac ggc cgg tgt tcc acc aag gtg      1056

Phe Lys Val Gly Thr Asn Trp Lys Tyr Gly Arg Cys Ser Thr Lys Val

            340                 345                 350

ttc aaa ggc cac acc aac gga gtg atg tgc ttg caa ttc gag gac aac      1104

Phe Lys Gly His Thr Asn Gly Val Met Cys Leu Gln Phe Glu Asp Asn

        355                 360                 365

att ttg gcg act ggt tca tac gac gcg acc atc aag att tgg gat act      1152

Ile Leu Ala Thr Gly Ser Tyr Asp Ala Thr Ile Lys Ile Trp Asp Thr

    370                 375                 380

gaa acc gga gaa gag ctg cgt acc cta cgc gga cac caa tcc ggt att      1200

Glu Thr Gly Glu Glu Leu Arg Thr Leu Arg Gly His Gln Ser Gly Ile

385                  390                395                 400

cgc tgt ctc cag ttc gac gac aca aaa ttg atc agc ggc agt atg gac      1248

Arg Cys Leu Gln Phe Asp Asp Thr Lys Leu Ile Ser Gly Ser Met Asp

                405                 410                 415

cgc agc ttg aag gtg tgg aat tgg cgt acg ggc gag tgc att tcc acc      1296

Arg Ser Leu Lys Val Trp Asn Trp Arg Thr Gly Glu Cys Ile Ser Thr

            420                 425                 430

tac acg ggt cac cgt ggt gga gtg atc gga ctg cac ttt gat gca acg      1344

Tyr Thr Gly His Arg Gly Gly Val Ile Gly Leu His Phe Asp Ala Thr

        435                 440                 445

att ctt gcc tca gcc tcc gtt gat aag acg gtc aag att tgg aac ttc      1392

Ile Leu Ala Ser Ala Ser Val Asp Lys Thr Val Lys Ile Trp Asn Phe

    450                 455                 460

gag gat aag tcg aca ttt ctc ctg cgc gga cac acc gat tgg gtc aac      1440

Glu Asp Lys Ser Thr Phe Leu Leu Arg Gly His Thr Asp Trp Val Asn

465                 470                 475                 480

gcg gtc cga gtg gac acg act tct cga acg gtg ttc tcg gct tcg gac      1488

Ala Val Arg Val Asp Thr Thr Ser Arg Thr Val Phe Ser Ala Ser Asp

                485                 490                 495

gac tgc acc gtt cgc ttg tgg gac ttg gac acc aag gca tgt ctc cgg      1536

Asp Cys Thr Val Arg Leu Trp Asp Leu Asp Thr Lys Ala Cys Leu Arg

            500                 505                 510

acc ttc cat ggc cat gtc ggc caa gtc caa cag gtg gtt cct ttg ccc      1584

Thr Phe His Gly His Val Gly Gln Val Gln Glu Val Val Pro Leu Pro

        515                 520                 525

cgg gag ttc gag ttc gaa gac cac gac gct gaa tgt gat aac gat aac      1632

Arg Glu Phe Glu Phe Glu Asp His Asp Ala Glu Cys Asp Asn Asp Asn

    530                 535                 540

atg agc acc aca tct gga gac acg gaa tca aac tcc ctt cag gca acg      1680

Met Ser Thr Thr Ser Gly Asp Thr Glu Ser Asn Ser Leu Gln Ala Thr

545                 550                 555                 560

ctc gga ctg gag tcg aac gcc act gag acg tct gtc ttt ggc ccc tca      1728

Leu Gly Leu Glu Ser Asn Ala Thr Glu Thr Ser Val Phe Gly Pro Ser

                565                 570                 575

ttt gac aat ggc cgc cca gcc cca cca cgc tac att gtc acg agc gcc      1776

Phe Asp Asn Gly Arg Pro Ala Pro Pro Arg Tyr Ile Val Thr Ser Ala

            580                 585                 590

tta gat tcc acc att cgt ctc tgg gag acc acg acc ggt cgc tgc ctg      1824

Leu Asp Ser Thr Ile Arg Leu Trp Glu Thr Thr Thr Gly Arg Cys Leu

        595                 600                 605

cgt acc ttc ttc ggt cac ctc gag ggc gtt tgg gcg ctc ggt gct gat      1872

Arg Thr Phe Phe Gly His Leu Glu Gly Val Trp Ala Leu Gly Ala Asp

    610                 615                 620

act ctc cga atc gtg tcc ggt gcg gaa gac cgg atg gtc aag atc tgg      1920

Thr Leu Arg Ile Val Ser Gly Ala Glu Asp Arg Met Val Lys Ile Trp

625                 630                 635                 640

gat ccc aga acc ggt aaa tgc gag cgc acc ttc acc ggc cat tcc ggc      1968

Asp Pro Arg Thr Gly Lys Cys Glu Arg Thr Phe Thr Gly His Ser Gly

                645                 650                 655

cca gtg acc tgt atc ggt ctc ggc gac agt cgg ttt gcg acc ggc agt      2016

Pro Val Thr Cys Ile Gly Leu Gly Asp Ser Arg Phe Ala Thr Gly Ser

            660                 665                 670

gag gat tgc gaa gtg cgc atg tac agt ttc cgc aat taa                  2055

Glu Asp Cys Glu Val Arg Met Tyr Ser Phe Arg Asn

        675                 680                 685

<210>6

<211>684

<212>PRT

<213>米曲霉

<400>6

Met Ala Gln Pro Thr Gly Glu Leu Thr His Pro Ser Gln Gln Gln Gln

  1               5                  10                  15

Leu Gln Leu Gln Gln Gln Phe Phe Gln Ser Ile Phe Gly Gly Ala Ser

             20                  25                  30

Asp Thr Thr Glu Glu Ile Asp Thr Glu Thr Asp Ser Asn His Arg Arg

        35                   40                  45

Pro His Ser Phe Gly Ala Ala Ala Thr Thr Pro Ala Lys Leu Ala Asn

     50                  55                  60

Lys Asn Val Ala Pro Phe Leu Val Lys His Ile Pro Glu Gln Tyr Gly

 65                  70                  75                  80

Pro Leu Gly Ser Arg Arg Thr Asp Lys Leu Glu Asp Leu Ser Ser Pro

                 85                  90                  95

Asn Ser Lys Phe Cys Tyr Arg His Arg Pro Asp Leu Lys Cys Arg Arg

            100                 105                 110

Gln Ala Asp Glu Pro Ser Met Asp Lys Leu Gln Arg Glu Leu Glu Thr

        115                 120                 125

Leu Pro Pro Ser Asp Gln Gln Gly Ile Ala His Val Trp Ser Leu Phe

    130                 135                 140

Ser Ala Ala Pro Ala Lys His Arg Lys Leu Ile Leu Gln Gly Ile Met

145                 150                 155                 160

Ala Gln Cys Cys Phe Pro Gln Leu Ser Phe Val Ser Ala Thr Val Arg

                165                 170                 175

Asp Leu Ile Arg Ile Asp Phe Leu Thr Ala Leu Pro Pro Glu Ile Ser

            180                 185                 190

Phe Lys Ile Leu Cys Tyr Leu Asp Thr Thr Set Leu Cys Lys Ala Ala

        195                 200                 205

Gln Val Ser Ser Arg Trp Arg Ala Leu Ala Asp Asp Asp Val Val Trp

    210                 215                220

His Arg Met Cys Glu Gln His Ile His Arg Lys Cys Lys Lys Cys Gly

225                 230                 235                 240

Trp Gly Leu Pro Leu Leu Glu Arg Lys Arg Leu Arg Glu Ser Lys Arg

                245                 250                 255

Glu Ile Glu Leu Arg Ala Thr Thr Trp Asp Val Ser Gly Pro Ala Gln

            260                 265                 270

Asn Ala Gly Gly Ala Glu Cys Ser Ala Pro His Ala Asp Asp Val Ile

        275                 280                 285

Thr Gln Lys Arg Lys Ala Asp Ser Ser Asp Asp Glu Thr Ala Ile Val

    290                 295                 300

Lys Arg His Cys Ser Ser Leu Asp Ala Arg Pro Glu Pro Asp Glu Asp

305                 310                 315                 320

Tyr Tyr Thr Thr Arg Tyr Arg Pro Trp Lys Glu Val Tyr Lys Asp Arg

                325                 330                 335

Phe Lys Val Gly Thr Asn Trp Lys Tyr Gly Arg Cys Ser Thr Lys Val

            340                 345                 350

Phe Lys Gly His Thr Asn Gly Val Met Cys Leu Gln Phe Glu Asp Asn

        355                 360                 365

Ile Leu Ala Thr Gly Ser Tyr Asp Ala Thr Ile Lys Ile Trp Asp Thr

    370                 375                 380

Glu Thr Gly Glu Glu Leu Arg Thr Leu Arg Gly His Gln Ser Gly Ile

385                 390                 395                 400

Arg Cys Leu Gln Phe Asp Asp Thr Lys Leu Ile Ser Gly Ser Met Asp

                405                 410                 415

Arg Ser Leu Lys Val Trp Asn Trp Arg Thr Gly Glu Cys Ile Ser Thr

            420                 425                 430

Tyr Thr Gly His Arg Gly Gly Val Ile Gly Leu His Phe Asp Ala Thr

        435                 440                 445

Ile Leu Ala Ser Ala Ser Val Asp Lys Thr Val Lys Ile Trp Asn Phe

    450                 455                 460

Glu Asp Lys Ser Thr Phe Leu Leu Arg Gly His Thr Asp Trp Val Asn

465                 470                 475                 480

Ala Val Arg Val Asp Thr Thr Ser Arg Thr Val Phe Ser Ala Ser Asp

                485                 490                 495

Asp Cys Thr Val Arg Leu Trp Asp Leu Asp Thr Lys Ala Cys Leu Arg

            500                 505                 510

Thr Phe His Gly His Val Gly Gln Val Gln Gln Val Val Pro Leu Pro

        515                 520                 525

Arg Glu Phe Glu Phe Glu Asp His Asp Ala Glu Cys Asp Asn Asp Asn

    530                 535                 540

Met Ser Thr Thr Ser Gly Asp Thr Glu Ser Asn Ser Leu Gln Ala Thr

545                 550                 555                 560

Leu Gly Leu Glu Ser Asn Ala Thr Glu Thr Ser Val Phe Gly Pro Ser

                565                 570                 575

Phe Asp Asn Gly Arg Pro Ala Pro Pro Arg Tyr Ile Val Thr Ser Ala

            580                 585                 590

Leu Asp Ser Thr Ile Arg Leu Trp Glu Thr Thr Thr Gly Arg Cys Leu

        595                 600                 605

Arg Thr Phe Phe Gly His Leu Glu Gly Val Trp Ala Leu Gly Ala Asp

    610                 615                 620

Thr Leu Arg Ile Val Ser Gly Ala Glu Asp Arg Met Val Lys Ile Trp

625                 630                 635                 640

Asp Pro Arg Thr Gly Lys Cys Glu Arg Thr Phe Thr Gly His Ser Gly

                645                 650                 655

Pro Val Thr Cys Ile Gly Leu Gly Asp Ser Arg Phe Ala Thr Gly Ser

            660                 665                 670

Glu Asp Cys Glu Val Arg Met Tyr Ser Phe Arg Asn

        675                 680

<210>7

<211>10

<212>DNA

<213>人工序列

<220>

<223>人工序列描述:引物DNA

<400>7

accgcygcya gcgcycgrtt    10

<210>8

<211>18

<212>DNA

<213>人工序列

<220>

<223>人工序列描述:引物DNA

<400>8

sgakccrtgy ttctcrgt    18

<210>9

<211>8

<212>DNA

<213>人工序列

<220>

<223>人工序列描述:接头DNA

<400>9

acctgccc    8

<210>10

<211>44

<212>DNA

<213>人工序列

<220>

<223>人工序列描述:接头DNA

<400>10

ctaatacgac tcactatagg gctcgagcgg ccgcccgggc aggt    44

<210>11

<211>22

<212>DNA

<213>人工序列

<220>

<223>人工序列描述:引物DNA

<400>11

ctaatacgac tcactatagg gc     22

<210>12

<211>26

<212>DNA

<213>人工序列

<220>

<223>人工序列描述:引物DNA

<400>12

ttttccatct ccagctgggc tacgcg    26

<210>13

<211>28

<212>DNA

<213>人工序列

<220>

<223>人工序列描述:引物DNA

<400>13

agggatctgc gtgctgtact tggtgtgt    28

<210>14

<211>24

<212>DNA

<213>人工序列

<220>

<223>人工序列描述:引物DNA

<400>14

tggaacggac agtgcgagag acta    24

<210>15

<211>27

<212>DNA

<213>人工序列

<220>

<223>人工序列描述:引物DNA

<400>15

atgtcagatg agcacatcgc tcgtcag    27

<210>16

<211>25

<212>DNA

<213>人工序列

<220>

<223>人工序列描述:引物DNA

<400>16

ctagttatcg gtgcccacac ccttc    25

<210>17

<211>18

<212>DNA

<213>人工序列

<220>

<223>人工序列描述:引物DNA

<400>17

cgratgtgyg aacaacac    18

<210>18

<211>21

<212>DNA

<213>人工序列

<220>

<223>人工序列描述:引物DNA

<400>18

caamccctcs aggtgmccga a    21

<210>19

<211>26

<212>DNA

<213>人工序列

<220>

<223>人工序列描述:引物DNA

<400>19

aggaagcccc cagccacatt tcttgc    26

<210>20

<211>22

<212>DNA

<213>人工序列

<220>

<223>人工序列描述:引物DNA

<400>20

acgattcttg cctcagcctc cg    22

<210>21

<211>26

<212>DNA

<213>人工序列

<220>

<223>人工序列描述:引物DNA

<400>21

atggcccaac cgaccggagaacttac    26

<210>22

<211>26

<212>DNA

<213>人工序列

<220>

<223>人工序列描述:引物DNA

<400>22

ttaattgcgg aaactgtaca tgcgca    26

<210>23

<211>30

<212>DNA

<213>人工序列

<220>

<223>人工序列描述:引物DNA

<400>23

gaaggagata tacatatgga ttacgaccag    30

<210>24

<211>30

<212>DNA

<213>人工序列

<220>

<223>人工序列描述:引物DNA

<400>24

cccccgggag ctcctagtta tcggtgccca    30

<210>25

<211>30

<212>DNA

<213>人工序列

<220>

<223>人工序列描述:探针DNA

<400>25

ggacgactgc taccacggta gcgcgcgggc    30

<210>26

<211>30

<212>DNA

<213>人工序列

<220>

<223>人工序列描述:探针DNA

<400>26

gcccgcgcgc taccgtggta gcagtcgtcc    30

<210>27

<211>27

<212>DNA

<213>人工序列

<220>

<223>人工序列描述:引物DNA

<400>27

caagcttcc aatatgtcag atgagca    27

<210>28

<211>26

<212>DNA

<213>人工序列

<220>

<223>人工序列描述:引物DNA

<400>28

aagctctaga tacacaaggt aacaga    26

<210>29

<211>24

<212>DNA

<213>人工序列

<220>

<223>人工序列描述:引物DNA

<400>29

gagcggataa caatttcaca cagg    24

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号