首页> 中国专利> 编码调控金黄担子菌素敏感性的蛋白质的基因

编码调控金黄担子菌素敏感性的蛋白质的基因

摘要

本发明提供一种调控对抗霉菌性金黄担子菌素敏感性的蛋白质,编码该蛋白质的基因和该蛋白质及基因的应用。

著录项

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2015-08-26

    未缴年费专利权终止 IPC(主分类):C12N15/31 授权公告日:20070117 终止日期:20140628 申请日:19950628

    专利权的终止

  • 2007-01-17

    授权

    授权

  • 2004-09-22

    专利申请权、专利权的转移专利申请权的转移 变更前: 变更后: 登记生效日:20040820 申请日:19950628

    专利申请权、专利权的转移专利申请权的转移

  • 1996-10-09

    实质审查请求的生效

    实质审查请求的生效

  • 1996-05-15

    公开

    公开

说明书

本发明涉及调控对抗霉菌性金黄担子菌素(Aureobasidin)敏感性的蛋白质,以及编码这种蛋白质的基团,即编码调控金黄担子菌素的蛋白质的基团。本发明进一步涉及该蛋白质和基因的一系列应用。另外,本发明还涉及抗该蛋白质的抗体及其应用。

人们已经熟知许多将有用基因引入实验室中所使用的单倍体真菌细胞的技术,真菌细胞例如酿酒酵母、粟酒裂殖酵母和构巢曲霉。由于将质粒DNA掺入及固定于真菌细胞的工作很难获得成功,就需要在转化体鉴定中使用选择性标记。在最常见的情况下,可通过把营养缺陷型突变引入宿主细胞来实现这种选择。酿酒酵母中通常使用的突变实例包括ura2、leu2、trp1和his3。一种质粒携带着这些基因之一的野生型样板。由于质粒上的野生型样板对宿主染色体等位基因是显性的,具有所引入质粒的细胞能在基本培养基中进行筛选,这种培养基不合有营养缺陷型宿主细胞所需要的营养。有关转化体筛选中药物抗性的应用,已有一些公开发表的报告,不过数量不多。也就是说,有些文献已对复制载体和染色体整合载体做过记述,这些载体含有对新霉素同系物G418、潮霉素和变蓝菌素等抗生素具有抗性的基因。复制载体具有在细胞中发挥作用的DNA复制起点。这种质粒作为一种环状游离基因被保持在染色体之外并随着细胞的增殖以百分之几的比率不断减少。整合载体被插入宿主细胞的染色体中,因而保持稳定状态。这样就不必在培养基中再加入药物以发挥保持载体序列的选择功能。

就工业用真菌而言,需要以稳定状态保持已赋予真菌的有用特性。染色体整合载体对实现这一目的是有用的。    

真菌已广泛应用于诸如米酒、啤酒和葡萄酒的制酒上以及诸如酱(发酵的大豆糊)和酱油的发酵食品上。对于培养这些用于工业目的的真菌而言,为了赋予其有用的特性,遗传工程技术也是非常有效的。这样就需要有选择性标记物,其可以用于高效率筛选转化体。工业用酵母通常都是双倍或多倍体细胞。因此很难将一种营养缺陷型标记物(该标记物在单倍体细胞,例如实验室中使用的酵母的单倍体细胞中是有效的)引入这些工业用酵母中。除此之外,由于诱变很有可能引起其它基因的突变,因此,很难得到只具有引入的所需营养缺陷型突变的突变体。药物抗性的利用使筛选任意酵母的稳定转变体成为可能,而不管染色体数目为多少或特异性突变是否发生。不过,这些工业用真菌中的许多菌株都对抗生素(如G—418和潮霉素)不敏感,这就不可能利用抗这些抗生素的基因。而且,这些抗性基因都是来自原核生物细菌的基因或蛋白质,与这些基因相应的基因在诸如酵母的真菌中根本不存在。具有这些整合的外来基因的真菌细胞的应用受到严格限制。源于酿酒酵母的变蓝菌素抗性基因(PDR4)可用于酿酒酵母(包括酿造酵母)的转化。然而,它除了带来对变蓝菌素的抗性也带来了对药物的抗性,这在实际使用中可能会发生一些问题。因此,PDR4根本无法满足今后培养具有改良特性的工业用真菌(包括酿酒酵母)的需要。这样就需要利用真菌本身所携带的基因来开发抗药性标记物。

本发明旨在鉴别一种用来编码调控对抗霉菌性金黄担子菌素之敏感性的蛋白质的基因;提供一种调控对由此基因编码的金黄担子菌素之敏感性的蛋白质;提供一种能与此基因杂交的核酸探针;提供一种利用该基因生产调控对金黄担子菌素之敏感性的蛋白质的方法,诸此等等。

在这些情况下,本发明还旨在提供一种新型染色体整合载体,其能够赋予真菌转化体一种具有新的药物抗性的选择性标记,以及一种由该载体转化的转化体。

再者,本发明还旨在提供一种蛋白质,其可以充当真菌遗传工程中使用的一种选择性标记物,可以产生对金黄担子菌素的抗性,以及一种编码这种蛋白质的DNA。

本发明可综述如下:本发明的第1项发明涉及一种编码调控金黄担子菌素敏感性的蛋白质的隔离基因,即一种调控金黄担子菌素敏感性的基因。第2项发明涉及一种克隆调控金黄担子菌素敏感性的基因的方法,其特征在于通过使用第1项发明的调控金黄担子菌素敏感性的基因或其一部分作为探针。第3项发明涉及一种核酸探针,其可以与调控金黄担子菌素敏感性之基因进行杂交,包括由15或15以上个碱基组成的序列。第4项发明涉及一重组质粒,其内含有一种可调控金黄担子菌素敏感性的基因。第5项发明涉及一种具有引入的上述质粒的转化体。

第6项发明涉及宿主真菌的染色体整合载体,其特征在于含有金黄担子菌素抗性基因。这种染色体整合载体有时含有一外来基因。第7项发明涉及一种生产金黄担子菌素抗性转化体的方法,其特征在于包括:

(1)获得含有金黄担子菌素抗性基因的复制载体的步骤,

(2)在上述步骤所得到的复制载体中的某一部位切割金黄担子菌素抗性基因以得到宿主真菌的染色体整合载体的步骤,

(3)将上述步骤中得到的宿主真菌染色体整合载体整合到宿主真菌染色体中的步骤,

(4)选择宿主的步骤,该宿主在金黄担子菌素存在下已转变为金黄担子菌素抗性宿主。

在这种生产金黄担子菌素抗性转化体的方法中,复制载体有时含有一外来基因。第8项发明涉及一种转化体,其特征在于该转化体是用第7项发明的方法得到的。

第9项发明涉及一种利用第5项发明的转化体生产调控金黄担子菌素敏感性之蛋白质的方法。第10项发明涉及一种调控金黄担子菌素敏感性的蛋白质。

第11项发明涉及一种能够产生金黄担子菌素抗性的蛋白质,其中,在以序列目录中SEQ ID NO.8表示的能产生金黄担子菌素敏感性的蛋白质中,至少第240氨基酸残基丙氨酸(Ala)已被另一个氨基酸残基所置换,或者涉及另一种能产生金黄担子菌素抗性的蛋白质,其具有通过对上述蛋白质进行至少一种选自氨基酸残基的置换、插入和缺失的修饰而得到的氨基酸序列,其生物学活性与上述蛋白质的生物学活性相似。第12项发明涉及一种DNA,其用来编码第11项发明的能够产生金黄担子菌素抗性之蛋白质。

金黄担子菌素[日本专利公开NO.138296(1990,NO.22995/1991,NO.220199/1991)和NO.279384/1993,日本专利申请NO.303177/1992,J.Antibiotics,44(9),919—924,ibid.,44(9),925—933,ibid,44(11),1187—1198(1991)]是一种环状缩肽类,作为出芽短梗孢NO.R106(FERM BP—1938)菌株的发酵产物而得到。它与其它抗霉菌素的结构完全不同。如表1和表2所示,典型金黄担子菌素化合物金黄担子菌素A对假丝酵母属的多种酵母(包括白假丝酵母)、新型隐球酵母、荚膜组织孢桨菌、皮炎类芽生菌和曲霉属真菌(日本专利公开NO.138296/1990)具有强有效的抗霉菌的活性,但是对哺乳动物却只有极低的毒性。这样,这种化合物在选择性毒性方面是一种优异的抗霉菌剂。

                             表1

    试验菌株TIMM No.MIC(ug/ml)白假丝酵母白假丝酵母stellatoidea    变种热带假丝酵母乳酒假丝酵母近平滑假丝酵母克鲁斯假丝酵母季也蒙氏假丝酵母glabrata假丝酵母新型隐球酵母土隐球酵母深红酵母烟曲霉棒曲霉    0136    1308    0312    0298    0287    0270    0257    1062    0354    0424    0923    0063    0056    ≤0.04    ≤0.04    0.08    0.16    0.16    ≤0.04    0.08    ≤0.04    0.63    0.31    0.63    20    0.16

                           表2

    试验菌株TIMM No.MIC(ug/ml)无冠构巢曲霉土曲霉普通青霉须发癣菌絮状皮癣菌佩德罗索氏产色芽生菌Exophiala werneckiiban tianum分枝孢荚膜组织孢浆菌Paracoccidioides brasilien-自地霉             sis皮炎类芽生菌    0112    0120    1331    1189    0431    0482    1334    0343    0713    0880    0694    0126    0.16    5    1.25    10    2.5    0.31    1.25    0.63    0.16    0.31    0.63    0.31

本发明人以前就曾发现,诸如粟酒裂殖酵母和酿酒酵母的真菌表现出对金黄担子菌素的敏感性。

                 表3

    试验菌株或细胞    MIC(μg/ml)    粟酒裂殖酵母    酿酒酵母    0.08    0.31

本发明人对粟酒裂殖酵母或酿酒酵母野生型菌株(这两种菌株对金黄担子菌素具有敏感性)进行了诱变处理,得到了抗性突变体。我们进一步从这些抗性突变体中成功地分离出能够产生金黄担子菌素抗性的基因(抗性基因),并从相应的敏感性细胞中分离出能够产生金黄担子菌素敏感性的另一种基因(敏感性基因)。另外,我们还揭示出由这些基因的每一种所编码的蛋白质的存在。本发明人还通过制备含有这种基因的复制载体并培养用该载体转化的细胞成功地表达了这种基因。使用这种基因的DNA片段作为探针,本发明人进而成功地发现了一种新的基因,该基因可调控对金黄担子菌素敏感的另一种真菌的金黄担子菌素敏感性。

表1和表2列举的具有金黄担子菌素敏感性的真菌和表3列举的真菌各自携带调控金黄担子菌素敏感性的蛋白质和编码该蛋白质的基因。本文中所用的术语“调控金黄担子菌素敏感性的蛋白质”是指对金黄担子菌素具有敏感性的真菌中所含有的一种蛋白质。这种蛋白质用来表达对金黄担子菌素的敏感性或抗性。当然,与上述蛋白质具有35%或更多同源性并具有相似功能的蛋白质也是调控金黄担子菌素敏感性之蛋白质中的一种。此外,通过用遗传工程方法修饰这些蛋白质而得到的蛋白质是调控金黄担子菌素敏感性的成员。调控金黄担子菌素敏感性的基因是指编码这种调控金黄担子菌素敏感性之蛋白质的基因(如上所述),同时涉及敏感性基因和抗性基因。

为了分离调控金黄担子菌素敏感性的基因,首先要对金黄担子菌素敏感性细胞(一野生菌株)进行诱变处理,以从中获得一抗性菌株。下一步,由该抗性菌株的染色体DNA或cDNA制备DNA库,对该库中能够产生抗性的基因(抗性基因)进行克隆。另外,通过制备野生菌株的DNA库,从该库中分离出能与抗性基因杂交的DNA分子并进行克隆可以分离出敏感性基因。

可利用化学品,如甲磺酸乙酯(EMS)或N—甲基—N’—硝基—N—亚硝基胍(MNNG)处理或通过紫外或其它辐射进行诱变。通过在适宜培养条件下在含有适当浓度的金黄担子菌素的营养培养基中对诱变细胞进行培养,对已获得抗性的细胞进行筛选。这样得到的抗性菌株可能因用于诱变所选择的方法和条件而有所不同。

aur1基因可以作为本发明的调控金黄担子菌素敏感性之基因(名命为aur)的典型例子。aur1基因的典型例子包括分离自粟酒裂殖酵母的spaur1基因和分离自酿酒酵母的scaur1基因。spaur1基因可使用商业上可得到的粟酒裂殖酵母,例如粟酒裂殖酵母ATCC24843,ATCC24844,ATCC24969,ATCC24970和ATCC24971(可购自美国典型培养物保藏中心),并按照本说明书所阐述的程序而获得。另外,scaur1基因可通过商业上可得到的酿酒酵母,例如酿酒酵母ATCC26235、ATCC26236、ATCC26237、ATCC32689、ATCC32690(可购自美国典型培养物保藏中心),并按照本说明书所阐述的程序而获得。下面将描述本发明人分离自抗性突变体的抗性基因(spaur1R和scaur1R)和分离自敏感性野生型菌株的敏感性基因(spau-r1S和scaur1S)。

图3显示出调控金黄担子菌素敏感性的基因spaur1R和spaur1S的限制性酶图谱,图4显示出scaur1R和scaur1S的限制性酶图谱。

用甲磺酸乙酯诱变对金黄担子菌素敏感的粟酒裂殖酵母并制备所得抗性菌株的基因组库。从这个库中,分离出含有抗性基因(spau-r1R)和具有图3所示的限制性酶图谱的DNA片段。该基因具有以序列目录中SEQ ID NO.1表示的核苷酸序列。由该基因编码的蛋白质的氨基酸序列(根据该核苷酸序列推测)是以序列目录中SEQ IDNO.2表示的序列。通过用该抗性基因作为探针进行杂交,从敏感性菌株中分离出含有敏感性基因(spaur1S)和具有图3所示的限制性酶图谱的DNA片段。该基因具有以序列目录中SEQ ID NO.3表示的核苷酸序列。由该基因编码的蛋白质的氨基酸序列(根据该核苷酸序列推测)是以序列目录中SEQ ID NO.4表示的序列。SEQ ID NO.3和SEQ ID NO.4之序列间的比较表明从G到T的突变发生在第1053位的碱基上,而SEQ ID NO.4和SEQ ID NO.2之序列间的比较则表明在氨基酸水平上第240位的甘氨酸残基转变为半胱氨酸,由此产生了抗性。

另外,用甲磺酸乙酯诱变对金黄担子菌素敏感的酿酒酵母并制备抗性菌株的基因组库。分离出含有作为显性突变体的抗性基因(scaur1S)和具有图4所示的限制性酶图谱的DNA片段。

scaur1R基因之蛋白质的编码区的核苷酸序列是以序列目录中SEQ ID NO.5表示的序列。由该基因编码的蛋白质氨基酸序列(根据以上核苷酸序列推测)是以序列目录中SEQ ID NO.6表示的序列。通过用该抗性基因scaur1R作为探针进行杂交,从敏感性菌株中分离出含有敏感性基因(scaur1S)和具有图4所示的限制性酶图谱的DNA片段。该基因具有以序列目录中SEQ IDNO.7表示的核苷酸序列。由该基因编码的蛋白质的氨基酸序列(根据该核苷酸序列推测)是以序列目录中SEQ ID NO.8表示的序列。SEQ ID NO.7和SEQ IDNO.5之序列间的比较表明T到A的突变发生在第852位的碱基上,而SEQ ID NO.8和SEQ ID NO.6之序列间的比较则表明在氨基酸水平上第158位的苯丙氨酸残基转变为酪氨酸,由此产生了抗性。在氨基酸水平上spaur1基因与scaur1基因具有58%的同源性。显然,它们是编码具有彼此间相似功能的蛋白质的基因。当从资料库中查寻与spaur1和scaur1基因及由此编码的蛋白质具有序列同源性的基因和蛋白质时,没有发现有达到或超过35%的同源性。因此,显然这些基因和由此编码的蛋白质是迄今人们尚不了解的一些新型分子。

下一步,根据SEQ ID NO.1所示spaur1R基因的DNA碱基序列合成出序列目录中SEQ ID NO.9及NO.10所示的一对引物。利用这些引物,用致病性真菌白假丝酵母的cDNA作为模板进行聚合酶链反应(RCR)。将由此得到的RCR产物在琼脂糖凝胶上进行电泳,并用溴化乙锭染色以证实DNA片段的特异性扩增。

利用由此得到的DNA片段作为探针,对白假丝酵母基因组DNA库进行筛选。由此得到含基因(caaur1)的DNA分子,其功能与spaur1和scaur1基因的功能相似,其限制性酶图谱如图5所示。该caaur1基因的碱基序列是序列目录中SEQ ID NO.11所示的序列。由该基因编码的蛋白质之氨基酸序列(根据其碱基序列推测)是序列目录中SEQ ID NO.12所示的序列。这种蛋白质与由spaur1和scaur1基因编码的蛋白质具有高度同源性。caaur1基因可利用商业上可得到的白假丝酵母,如白假丝酵母ATCC752,ATCC753,ATCC2091、ATCC14053、ATCC18527(可购自美国典型培养物保藏中心)并按照本说明书所阐述的程序而得到。

上述例子清楚地表明,可使用对金黄担子菌素具有敏感性的生物作为起始材料并且按照上述方法进行各种诱变和/或筛选处理而实现克隆。分离出调控相应于每种生物或每种方法的金黄担子菌素敏感性的基因。而且,可以分离出能与这些基因杂交的基因。当然,通过用化学、物理或遗传工程技术部分改变以上所得到的能调控金黄担子菌素敏感性的基因有可能制备出修饰基因。

在本发明中,金黄担子菌素抗性基因是指这样一种基因,当整合到宿主真菌中时,它能产生对抗霉菌性金黄担子菌素的抗性。该基因用来编码具有金黄担子菌素抗性的蛋白质。

上述spaur1R和scaur1R就是金黄担子菌素基因的典型例证。这样的基因显性作用,由该基因获得的抗性对金黄担子菌素具有选择性。这就是说,它不会引起对其它药物敏感性方面的显著变化。

金黄担子菌素抗性基因也包括这样一些基因,它们可与spaur1R和scaur1R杂交,并赋予宿主真菌金黄担子菌素抗性(例如,用化学、酶、物理或遗传工程技术部分改变spaur1R或scaur1R基因而制备的基因)。

另外,金黄担子菌素抗性基因也包括编码蛋白质的基因,该蛋白质具有通过对能产生金黄担子菌素抗性的蛋白质(Aur 1Rp)进行选自氨基酸残基的置换、插入或缺失的至少一种修饰而获得的氨基酸序列并且表现出产生金黄担子菌素抗性的活性。

Aur 1Rp的氨基酸残基的置换、插入和缺失是通过位点特异性诱变来实现的。编码隔离的AurIRp的DNA和编码能够产生金黄担子菌素敏感性之蛋白质的DNA可以通过实现核苷酸的置换、插入和缺失的至少一种而容易地得到修饰,从而得到编码AurIRp突变体的DNA。关于氨基酸残基的置换、插入和缺失,氨基酸的转化基于可在不损害生物学活性的前提下用遗传工程技术实现的转化。为了在特异性位点上对残基适当地进行突变,可对靶密码子进行随机诱变,而具有所需活性的突变体可从所表达的众多突变体中筛选出来。通过插入得到的突变体涉及一种融合蛋白质,其中AurIRp或其片段在Aur1Rp氨基末端和/或羧基末端上通过肽键与另一种蛋白质或多肽或其片段结合。为了删掉氨基酸残基,也可利用缺口双螺旋法用终止密码子置换氨基酸序列中的任意氨基酸密码子,以从氨基酸序列中删掉所置换的氨基酸残基羧基末端侧的区域。另外,编码蛋白质的DNA(其中任意长度的氨基末端和/或羧基末端区域已被删掉)可通过缺失方法(包括降解与氨基酸序列的氨基末端和/或羧基末端相对应区域的编码DNA)而得到[基因,33,103—119(1985)],或者通过利用含有起始密码子和/或终止密码子的引物之PCR法而得到。位点特异性诱变的已知实例包括使用寡核苷酸的缺口双螺旋法[酶学方法,154,350—367(1987)],使用寡核苷酸的尿嘧啶DNA法[酶学方法,154,367—382(1987)],亚硝酸突变法[Proc.Natl.Acad.Sci.USA.79,7258—7262(1982)]以及暗盒突变法[基因,34,315—323(1985)]。

本发明人已发现,可用另一氨基酸残基置换第240丙氨酸残基而使序列目录中SEQ ID NO.8所示的Aur1Sp转变为Aur1Rp,从而完成了第11和12项发明。

第11项发明的Aur1Rp是这样的,其中序列目录中SEQ IDNO.8所示的Aur1SP第240丙氨酸残基已被另一氨基酸残基所置换。只要生物学活性不遭受损坏,其它氨基酸残基也可用化学、物理或遗传工程技术予以置换、插入或删除。利用编码序列目录中SEQID NO.23所示的Aur1SP的DNA,通过遗传工程技术可适当地制备出第11项发明的Aur1Rp。测度金黄担子菌素敏感性细胞转变为抗性细胞之活性,可以测定Aur1Rp的生物学活性。与序列目录中SEQ IDNO.6所示的Aur1Rp相比第11项发明的Aur1Rp是金黄担子菌素敏感性细胞转变为抗性细胞之活性得以增强的Aur1Rp。

与序列目录中SEQ ID NO.6所示Aur1PR相比,优选的Aur1Rp是金黄担子菌素敏感性细胞转变为抗性细胞之活性得以增强的Aur1Rp。编码该Aur1Rp的DNA可适当用于本发明。

在Aur1Rp的更优选实例中,可通过用半胱氨酸置换第240丙氨酸残基而获得一突变体。一例这种突变体的氨基酸序列如序列目录中SEQ ID NO.18所示。此突变体被称为Aur1Rp(A240C)。也有可能得到一突变体,其中Aur1SP的第158苯丙氨酸残基和第240丙氨酸残基已分别被酪氨酸和半胱氨酸所置换。此突变体的氨基酸序列如序列目录中SEQ ID NO.19所示。该突变体被称为Aur1Rp(F158Y,A240C)。与序列目录中SEQ ID NO.16所示蛋白质[Aur1Rp(F158Y)]相比,这些突变体各自具有产生金黄担子菌素抗性的更强能力,其中Aur1SP第158苯丙氨酸残基已被酪氨酸所置换。

本发明所使用的金黄担子菌素抗性基因可由序列目录中SEQID NO.20—22所示的DNA来例证。序列目录中SEQ ID NO.22所示的DNA是编码Aur1Rp(F158Y)的基因,序列目录中SEQ ID NO.20所示的DNA是编码Aur1Rp(A240C)的基因,序列目录中SEQ IDNO.21所示的DNA是编码Aur1Rp(F158Y,A240C)的基因。

可通过将编码调控金黄担子菌素敏感性的蛋白质之基因整合到适宜的载体中制备出一复制质粒。例如,通过将金黄担子菌素抗性基因整合到适宜的酵母载体中制备的质粒作为选择性标记基因是极为有用的,因为可根据使用金黄担子菌素的药物抗性很容易地选择出转化体。作为酵母的载体,可选用YRP、YCP、YEP和YIP类型的载体。

另外,复制质粒可由诸如大肠杆菌稳定地携带。其中可使用的载体实例包括pUC118、pWH5、pAU—PS、Traplex119和pTV118。具有整合的scaur1S基因的pAU—PS被命名为pSPAR1。具有整合的spaur1S基因的pWH5被命名为pSCAR1。具有整合的caaur1基因的Traplex119载体被命名为pCAAR1。这些重组质粒的每一种被转化到大肠杆菌中。也有可能在适宜的宿主中表达这些质粒。这种基因专一性地简化为开放解读密码(ORF),ORF通过用适宜的限制性酶切割而转译为蛋白质,如果需要的话,再与一适宜的载体结合。这样就能得到一表达重组质粒。当使用大肠杆菌作为宿主时,诸如pTV118的质粒可用作表达质粒的载体。当使用酵母作为宿主时,诸如pYES2的质粒可用作载体。由具有整合的scaur1S基因的pSPAR1转化的大肠杆菌JM109已被命名为大肠杆菌JM109/pSPAR1并按照布达佩斯条约贮藏于工业科学技术院生物科学及人类技术国立研究所中(1—3,Higashi 1 chome Tsukuba—shi Ibaraki—Ken 305,日本),注册号为FERM—BP—4485。由具有整合的spaur1S基因的pSCAR1转化的大肠杆菌HB101已被命名为大肠杆菌HB101/pSCAR1并按照布达佩斯条约贮藏于工业科学技术院生物科学及人类技术国立研究所中,注册号为FERM BP—4483。由具有整合入caaur1S基因的pCCAR1转化的大肠杆菌HB101已被命名为大肠杆菌HB101/pCAAR1并按照布达佩斯条约贮藏于工业科学技术院生物科学及人类技术国立研究所中,注册号为FERM BP—4482。

如前所述使用公知和商业上可得到的微生物菌株并按照本说明书中阐述的程序,本领域技术人员可以很容易地制备出本发明的调控金黄担子菌素敏感性的基因。因此并不一定要贮藏这些基因本身,进行贮藏只是出于谨慎的原因。

含有本发明的金黄担子菌素抗性基因的整合载体是一种线性载体,其通常可通过将含有金黄担子菌素抗性基因的复制质粒切割成线性形态而制得。复制质粒的切点将在下文中描述。

图1表示染色体整合载体中的金黄担子菌素抗性基因与宿主染色体(其与金黄担子菌素敏感性基因具有同源性)发生同源性重组,由此金黄担子菌素敏感性细胞转变为金黄担子菌素抗性细胞的过程。借助适宜的限制性酶,含有金黄担子菌素抗性基因的复制质粒在金黄担子菌素抗性基因序列中的某一位置被切割成线性形态。这样线性化的载体与宿主染色体中的金黄担子菌素敏感性基因(其具有同源性)发生同源性重组。这样,金黄担子菌素抗性被传递给宿主细胞。当复制质粒含有一外来基因时,则金黄担子菌素抗性和外来基因都被传递给宿主细胞。例如,可以制备出用于制备线性载体的复制载体pAUR1aare,其含有日本专利公开NO.254680/1991中所描述的scaur1R和人类酰基氨基酸释放酶(AARE)。具有所引入的该载体的大肠杆菌JM109菌株被命名为大肠杆菌JM109/pAUR1aare并已贮藏于工业科学技术院生物科学及人类技术国立研究所中,注册号为FERM P—14366。为了使复制载体线性化,可有效地利用限制性酶切割位点,其在靶外来基因部分和金黄担子菌素抗性基因中都存在。例如,就源于酿酒酵母的scaur1R和源于粟酒裂殖酵母的spaur1R而言,通常可分别使用StuI等和BalII等的限制性酶位点。

在优选的形态中,本发明的载体可含有金黄担子菌素基因和外来基因,而源于复制载体的其它基因可被从中删掉。可根据宿主的特性选择用于表达金黄担子菌素抗性基因和外来基因的启动子、终止区等。当然,序列目录中SEQ ID NO.1和NO.5所示DNA启动子部分可用作表达金黄担子菌素抗性基因功能的启动子。对于酿酒酵母来说,可以利用例如乙醇脱氢酶基因(ADH1)和甘油醛—3—磷酸脱氢酶基因(GPD)的启动子和细胞色素C1基因(CYC1)的终止区。这些启动子和终止区与表达金黄担子菌素抗性基因的启动子和终止区可能不同。

在本发明中,术语“外来基因”是指对宿主真菌细胞而言为外来性的基因,即异源基因。其实例包括非真菌基因、修饰基因,与宿主不同的真菌种类基因和自我克隆基因。更具体地说,参与发酵、耐醇性、糖化作用和味道组分或香味组分形成的基因都属于该范畴。

第2项发明涉及一种产生金黄担子菌素抗性转化体的方法。例如通过制备含有上述金黄担子菌素抗性基因的复制载体,在复制载体中的金黄担子菌素抗性基因的某一位置进行切割以产生宿主真菌的线性染色体整合载体,在能使真菌细胞转化的条件下将该载体加入到金黄担子菌素敏感性宿主真菌细胞中,这样将载体整合到宿主染色体中,在适合于宿主细胞增殖的含有抗生素金黄担子菌素的培养基中对转化体进行培养,并对如此增殖的金黄担子菌素抗性转化体进行筛选可产生金黄担子菌素抗性转化体。按照公知的方法如原生质体生成程序、乙酸锂程序或电击程序实现上述转化。这里所用的培养基并无特别限制,只要其适用于真菌增殖即可。通常使用的这类培养基的例子包括:Sabouraud氏右旋糖培养基,YPD培养基,察氏培养基和YNBG培养基。所加入的金黄担子菌素的浓度依宿主真菌细胞所具有的敏感性大小而有所变化,一般范围在0.05—80μg/ml。

可用第2项发明的方法得到第3项发明的转化体。

作为本发明中的转化体的一个实例,含有整合到染色体中的scaur1R和AARE基因的米酒酵母Kyokai K—701已被贮藏于工业科学技术院生物科学及人类技术国立研究所中,注册号为FERM P—14379。利用本发明的染色体整合载体而得到的转化体具有所赋予的金黄担子菌素抗性和所整合的外来基因,该外来基因在染色体上保持着稳定状态。这些属性在工业应用上极为有益。

第11项发明的Aur1Rp能够赋予单倍体酵母和双倍体酵母,特别是那些有实际应用价值的酵母金黄担子菌素抗性。也就是说,它在培养酿酒酵母方面是非常有用的,酿酒酵母已广泛应用于制酒如米酒、Shochu、啤酒和葡萄酒以及发酵性食品如面包。第11项发明的Aur1Rp也可应用于酿酒酵母以外的真菌,并且在例如其它真菌的培育和遗传工程应用中是有用的。

例如,第11项发明的Aur1Rp能赋予白假丝酵母金黄担子菌素抗性。具有编码该Aur1Rp之DNA的载体是白假丝酵母遗传工程应用中的首选载体。

人们知道,白假丝酵母是引起真菌病的一种真菌。随着近年来机会性感染的增加,需要进行搞清致病原因的研究工作。第11项发明的Aur1Rp和上述载体在白假丝酵母的遗传学研究方面是极其有用的。

[图1.]作为本发明实例的载体的构建,以及载体在染色体中的整合。

[图2.]经限制性酶消化的基因组DNA电泳后的Sourthern杂交图谱。

[图3.]基因spaur1R和spaur1S的限制性酶图谱。

[图4.]基因scaur1R和scaur1S的限制性酶图谱。

[图5.]基因caaur1的限制性酶图谱。

为了进一步详细论证本发明,特给出以下实施例。不过必须明白本发明并不仅限于这些实施例。

实施例1:含有金黄担子菌素抗性基因的染色体整合载体的构建

(1)含有scaur1R的复制载体的构建

由大肠杆菌HB101/pSCAR1(FERM BP—4483)制备出质粒pSCAR1,该大肠杆菌菌株携带有含scaur1S的质粒pSCAR1。然后将得到的质粒用HindIII进行部分酶切,这样从中分离出含scaur1S的3.5Kb DNA。将pUC118载体用HindIII酶切,再与上述DNA(3.5Kb)连接,由此制得质粒pU scaur1S。将该质粒pUscaur1S转化到大肠杆菌CJ236中以制备出ssDNA。

下一步,利用序列目录中SEQ ID NO.13所示的用于引入突变的合成寡核苷酸(已合成并纯化)和上述ssDNA,通过使用Mutan—K药盒(由Takara Shuzo有限公司生产)来引入位点特异性DNA突变。也就是说,利用序列目录中SEQ ID NO.13所示的寡核苷酸有可能获得scaur1R,其中基因scaur1S ORF中第158氨基酸残基苯丙氨酸的密码子TTT已被酪氨酸密码子TAT所替代。这个具有编码Aur1Rp(F158 Y)之DNA的质粒被称做pUscaur1R。

(2)通过PCR方法扩增scaur1R

利用携带着含scaur1R的3.5Kb HindIII片段的质粒pUscaur1R,通过PCR法扩增scaur1R(约1.9Kb)。关于这里所用的引物,为了将扩增的scaur1R克隆至质粒载体的pYES2(Invitrogen公司产生)中,在引物中已标示出xhoI和KpnI位点。这样便合成出序列目录中SEQID NO.14和NO.15所示的引物。

反应是按下述方法进行的。将含28μl PCR缓冲液100μl[终浓度能达到10mM Tris HCl(pH8.3),50mM KCl,1.5mM MgCl2,0.1mMdATP,0.1mM dCTP,0.1mM dTIP和0.1mM dGTP]、1μl、2.5U的Ampli Taq DNA聚合酶(Perkin—Elmer生产)0.5μl、序列目录中SEQ ID NO.14和NO.15所示的20pmol引物每份1μl质粒和69μl水的PCR溶液在94℃的初始温度下保持1分钟,然后相继在94℃下加热1分钟,在50℃下加热2分钟和在72℃下加热3分钟。将此加热循环重复35次。下一步,将反应混合液在72℃下保持10分钟,用PCR进行扩增。然后将PCR扩增产物用KpnI和XhoI进行酶切,在琼脂糖凝胶上进行电泳,从凝胶中回收约1.9Kb的靶DNA片段并用SuprecTM—O1(Takara Shuzo有限公司生产)进行提纯。

(3)DNA连接和转化

使用DNA连接药盒(Takara Shuzo有限公司生产),将约0.3μg上述步骤中提纯的DNA片段(约1.9Kb)连接到约0.1μg已用XhoI和KpnI消化过的pYES2上。

下一步,将7μl上述连接混合液加入到200μl大肠杆菌HB101的感受态细胞中。将这些细胞置于冰上30分钟,在42℃维持1分钟,再置于冰上1分钟。然后加入800μl Soc培养基[Sambrook等人,分子克隆,实验室手册,冷泉港实验室出版物(1989)]。在37℃下培养1小时,然后将这些大肠杆菌细胞涂布到内含50μg/ml氨苄青霉素的L—肉汤琼脂培养基中,在37℃下培养过夜。这样得到一转化体。

在37℃下,将该转化体在5ml的内含50μg/ml氨苄青霉素的L—肉汤培养基中培养过夜。根据碱法(“分子克隆”,引文如上),从该培养液中制备出质粒DNA。这样得到的质粒被命名为pYES2aur1。

(4)染色体整合载体的构建

将约0.4μg上述质粒pYES2aur1用Xba1和KpnI进行消化并在琼脂糖凝胶上进行电泳。然后从凝胶中回收含有scaur1R的约1.9Kb的DNA片段,并用Suprec—O1提纯。

同样,用SspI和PvuII消化约0.4μg质粒载体pUC19并在琼脂糖凝胶上进行电泳。然后从凝胶中回收含有氨苄青霉素抗性基因和ColE1起点的DNA片段(约1.8Kb)并提纯。利用DNA钝化药盒(Takara Shuzo有限公司生产),对约0.1μg上述提纯的DNA片段进行末端钝化处理。另外,对约0.1μg这些钝化的DNA片段进行连接反应。利用DNA连接药盒(Takara Shuzo有限公司生产)来实现连接反应。

随后,将质粒整合到大肠杆菌JM109中。经培养后制备出转化体和质粒DNA。这样得到的质粒被命名为质粒pAUR1。下一步,将该质粒用StuI进行酶切以制备出染色体整合载体。

实施例2:含有金黄担子菌素抗性基因的染色体整合载体的构建

(1)用PCR扩增具有引入的突变的scaur1R的DNA片段

为了用半胱氨酸置换Aur1Rp(F 158Y)的第240氨基酸残基丙氨酸,合成并提纯序列目录中SEQ ID NO.24所示的引物,其中丙氨酸密码子GCT已被转变为半胱氨酸密码子TGT。利用实施例1—(1)中描述的质粒pUscaur1R[其携带着HindIII片段(3.5Kb),在pUC119 HindIII位点上含有scaur1R)作为模板,通过使用序列目录中SEQ ID NO.24所示引物和引物M13M4的PCR方法,对在Aur1Rp(F158Y,A240C)(末端侧含有编码氨基酸序列的序列(约500bp)的DNA片段(约1.4Kb)(其中GCT已被转变为TGT)进行扩增。以下列方式实现PCR。在28μl的PCR缓冲液[终浓度能够达到10mMTris HCl(pH8.3),50mM KCl,1.5mM MgCl2、0.1mM dATP,0.1mM dcTP,0.1mM dTTP和0.1mM dGTP]中,加入2.5U的AmpliTaq DNA聚合酶,序列目录中SEQ ID NO.24所示的引物和引物M13M4各100pmol,1ng的pU scaur1R和蒸馏水,得到100μl PCR溶液。然后将此反应混合液相继在94℃下加热1分钟,在55℃下加热1.5分钟和在72℃下加热1.5分钟。将这种循环重复30次。下一步,将PCR产物用SalI和SnaI进行酶切并在琼脂糖凝胶上进行电泳。从凝胶中回收约1.3Kb的靶DNA片段并进行提纯。

(2)含有编码Aur1Rp(F158Y,A240C)之DNA的质粒的构建

用SalI和SnaI酶切PU scaur1R并在琼脂糖凝胶上进行电泳。回收约5.3Kb的靶DNA片段并进行提纯。将该DNA片段与得自实施例2—(1)的1.3Kb DNA片段连接。所得到的具有编码Aur1Rp(F158Y,A240C)之DNA(scaur1R—C)的质粒被命名为pU scaur1R—C。为了通过将其整合到米酒酵母的染色体中而实现转化,在使用前用StuI酶切使pU scaur1R—C线性化。作为对照组,pU scaur1R也用StuI进行线性化。

(3)含有编码Aur1Rp(A240C)之DNA的质粒的构建

用SalI和SuaI酶切pU scaur1S并在琼脂糖凝胶上进行电泳。回收5.3Kb的靶DNA片段并进行提纯。在该DNA片段上连接得自实施例2—(1)的1.3Kb DNA片段。所得到的质粒具有编码Aur1Rp的DNA,其中Aur1Sp第240丙氨酸残基已被半胱氨酸所置换,该质粒被命名为pU scaur1 A240C。为了通过将其整合到米酒酵母中而实现转化,在使用前用StuI酶切使pUscaur A240C线性化。

实施例3:用米酒酵母作为宿主进行转化

(1)用乙酸锂方法[微生物学期刊,153,163(1983)]将约10μg实施例1中所述质粒pAUR1的线性化载体引入米酒酵母Kyokai K—701中。

也就是说,将米酒酵母Kyokai K—701悬浮于0.1M的乙酸锂水溶液中(约1.3×108细胞/100μl 0.1M乙酸锂),在其中加入10μg载体(通过在某一位置上用StuI酶切使scaur1R线性化而制备)。在30℃下处理30分钟,然后在42℃下处理15分钟,之后经离心收获细胞并在5ml的YPD液体培养中进行预培养。该培养基含0.4μg/ml的金黄担子菌素A,在预培养之后,在YPD琼脂培养基(含0.8μg/ml的金黄担子菌素A)上得到一转化体。该转化体被命名为米酒酵母Kyokai K—701/pAUR1。

在缺乏金黄担子菌素A的条件下,对该转化体进行三代继代培养,随后检测对金黄担子菌素的敏感性。结果,与亲代菌株(即米酒酵母Kyokai K—701)相比,其金黄担子菌素抗性增长了8倍(MIC1.56μg/ml),这表明保留住了金黄担子菌素抗性。因此已证实了在宿主染色体上引入的金黄担子菌素抗性可用作选择性标记。

(2)为了对实施例2—(2)中制备的pU scaur1R—C,实施例2—(3)中制备的pU scaur1 A240C,实施例1—(1)中制备的pU scaur1R之活性进行比较,用乙酸锂法将5μg的质粒(已用StuI线性化)引入米酒酵母Kyokai K—701中。即,向已悬浮于0.1M的乙酸锂水溶液(pH7.5)中并使其变为感受态的米酒酵母中加入5μg质粒(已用StuI在某一位置上线性化)和850μl的40%聚乙二醇/0.1M乙酸锂。在30℃下处理30分钟,再在42℃下保温15分钟,之后收获细胞,在5mlYPD液体培养基中培养1小时或过夜,然后涂抹在含有不同浓度的金黄担子菌素A的YPD琼脂培养基上。在30℃下培养3—4天,得到具有金黄担子菌素A抗性的转化体。如表4所示,利用StuI线性化pU scaur1R—C制备的转化体甚至在含有5μg/ml金黄担子菌素A的培养基中也能生长。与亲代菌株相比,即使在进行多代继代培养之后,这些转化体所保留的金黄担子菌素A抗性也至少要高10倍。使用线性化pU scaur1R—C得到的转化体表现出20μg/ml或以上对金黄担子菌素A的最小抑制浓度(MIC)。因此证实,Aur1Rp(F158Y,A240C)可用作米酒酵母的有效选择性标记。如表4所示,在产生抗性的活性方面,StuI—线性化pU scaur1 A240C超过了StuI—线性化pU scaur1R,这就是说,第240丙氨酸残基处的突变导致了产生较强抗性的活性的表达。

                                 表4

    质粒预培养时间    转化体数量/μg DMA    金黄担子菌素A浓度(μg/ml)    0.5    1.0    5.0StuI-线性化pUscaur1R Stu I-线性化pUscaur1R—C Stu I-线性化pUscaur 1A240C    无质粒    (对照)    1小时    过夜    1小时    过夜    1小时    过夜    1小对    过夜    0    170    2368    18    160    0    0    0    4    73    2024     1    152    0    0    0    0    0    64    0    0    0    0

实施例4:利用含金黄担子菌素抗性基因和AARE基因的染色体整合载体进行转化

(1)含有AARE基因的质粒的构建

用SphI酶切0.5μg的质粒pAUR1并在琼脂糖凝胶上进行电泳。然后从凝胶中回收线性化质粒pAUR1并进行提纯。

下一步,从酵母BJ2168中制备质粒pYHA201,该酵母携带含日本专利公开NO.254680/1991所述的AARE基因的质粒pYHA201,即酿酒酵母BJ2168/pYHA201;FERM P—11570)。用SphI消化0.5μg的该质粒pYHA201,分离并提纯所产生的DNA片段(约3.2Kb)。

约3.2Kb的该DNA片段含有结合到ADHI启动子下游的AARE基因。

利用纯化的SphI酶切的DNA片段各0.2μg,使用DNA连接药盒(由Takara Shuzo有限公司生产)实现连接反应。随后,将质粒整合到大肠杆菌JM109中并进行培养,由此得到转化体和质粒DNA。将这样得到的质粒命名为质粒pAUR1aare,而将如此得到的转化体命名为大肠杆菌JM109/pAUR1aare并贮藏于工业科学技术院生物科学及人类技术国立研究所,注册号为FERM P—14366。

(2)AARE在米酒酵母中的表达

使用约10μg上述质粒pAUR1aare,按实施例3中所述的方法将线性化质粒pAUR1aare转化到米酒酵母Kyokai K—701中。随后在含0.4μg/ml金黄担子菌素A的YPD琼脂培养基上得到金黄担子菌素抗性转化体。

这样得到的转化体被命名为酿酒酵母K701/pAUR1aare并贮藏于工业科学技术院生物科学及人类技术国立研究所中,注册号为FERM P—14379。

下一步,将该转化体接种到5ml基本培养基[0.67%的Bacto酵母氮基质W/O氨基酸(由Difco生产),2%的葡萄糖]中,在30℃下培养两天,然后经离心收获细胞。

弃去上清液之后,用2ml的水冲洗细胞并再经离心收获细胞。

其后,将细胞悬浮于700μl的0.2M磷酸钠缓冲溶液(pH7.2)中。

在该悬浮液中加入400μl的玻璃珠(直径0.4—0.6mm),在冰冷却条件下剧烈搅拌而使细胞破碎。

离心之后,回收上清液并将其视为提取物。

另外,以相同方法制备米酒酵母Kyokai K—701提取物和实施例3中得到的米酒酵母Kyokai K—701/pAUR1提取物。

用以下方法测定所得到的每种提取物的酰基氨基酸释放酶活性。将0.89ml含有由N—乙酰—L—甲硫氨酸和7—氨基—4—甲基香豆素(AMC)制备的0.020mM酰胺之0.5%二甲基甲酰胺—0.2M磷酸钠缓冲溶液(pH7.2)在37℃下预热约5分钟。然后加入100μl上述提取物,将形成的混合液在37℃下保温15分钟。反应完全后,加入10μl 10%的SDS来终止反应并用荧光计测定荧光强度。即,将激发波长和测定波长分别定在380nm和440nm。通过用已知浓度的AMC样品制备标准曲线和与所得数据相比较来确定释放出的AMC量。

在以上反应体系中,100μl酿酒酵母K701/pAUR1aare的提取物具有在15分钟内释放大约25pmol AMC的活性。

另一方面,没有质粒的米酒酵母Kyokai K—701提取物和实施例3中所得到的米酒酵母Kyokai K—701/pAUR1提取物都不具有AARE活性。

另外,使用金黄担子菌素抗性基因作为探针进行Southern杂交来进行分析。作为杂交作用中的探针,使用了scaur1R片段(约1.6Kb),其已通过利用质粒pAUR1作为模板和使用序列目录中SEQID NO.16和NO.17所示的引物的PCR法进行了扩增。通过使用BcaBESTTM标记药盒标记100ng的所得片段。用不同的限制性酶(在pAUR1aare上没有酶切位点的HpaI,在pAUR1aare上具两个酶切位点的BamHI)酶切米酒酵母Kyokai K—701和酿酒酵母K701/pAUR-1aare的基因组DNA,在琼脂糖凝胶上进行电泳并转移到杂交滤器上。

图2中,泳道1和泳道3表示用HpaI(泳道1)或BamHI(泳道3)酵切米酒酵母Kyokai K—701的基因组DNA并进行Southern杂交而得到的结果,而泳道2和泳道4则表示用HpaI(2)或BamHI(泳道4)酶切酿酒酵母K701/pAUR1aare的基因组DNA并进行Southern杂交而得到的结果。由于HpaI在质粒pAUR1aare上没有酶切位点,而是专一性地酶切基因组DNA,泳道1和2证明了金黄担子菌素抗性基因已被整合到一对染色性之一中。

泳道3和4证实了在米酒酵母染色体上金黄担子菌素抗性基因已被同源性整合到金黄担子菌素敏感性基因中。

这些结果表明,金黄担子菌素抗性基因的随机整合并没有破坏米酒酵母的基因。

如上所述,通过使用本发明的染色体整合载体,可以将抗性传递给金黄担子菌素敏感性真菌,而且外来基因也能得到表达。

实施例5:含金黄担子菌素抗性基因的重组质粒的构建

(1)携带编码Aur1Rp(F158Y,A240C)之DNA的pYC载体的构建

用pU scaur1R—C作为模板,使用序列目录中SEQ ID NO.25和26所示的引物来实现PCR。PCR产物(大约2.2Kb)含有编码扩增的Aur1Rp(F158Y,A240C)之DNA,用XhoI和KpnI进行酶切并使用钝化药盒(由Takara Shuzo有限公司生产)使其末端钝化。

用EcoRI和BamI酶切pYC载体pYEUra3(由Clontech股份有限公司实验室生产),并用钝化药盒来进化末端钝化。然后将其连接到上述末端钝化的PCR产物(2.2Kb)上。将这样得到的质粒命名为pYCscaur1R—C。用pU scaur1R作为模板,使用序列目录中NO.25及26所示的引物以同样方式来实现PCR。PCR产物(约2.2Kb)含有编码扩增的Aur1Rp(F158Y)之DNA,将其用XhoI和KpnI酶切并用钝化药盒(Takara Shuzo有限公司生产)进行末端钝化。用EcoRI和BamHI酶切pYEUra3并用钝化药盒进行末端钝化。然后将其连接到如上所述的末端钝化的PCR产物(约2.2Kb)上。这样得到的质粒被命名为pYC scaur1R。

(2)携带编码Aur1Rp(F158Y,A240C)之DNA的pYE载体的构建

用pU scaur1R—C作为模板,通过使用序列目录中SEQ IDNO.25所示的引物和引物M13M4的PCR扩增含有编码Aur1Rp(F158Y,A240C)之DNA的DNA片段。用BamHI酶切PCR产物并在琼脂糖凝胶上进行电泳。从凝胶中回收靶DNA片段(约1.8Kb)并进行提纯。用BamHI酶切质粒pSCAR1,由此得到11.7Kb的DNA片段,含有scaur1S的2.8Kb的DNA片段已被从中删去。将该11.7Kb的DNA片段连接到含有编码Aur1Rp(F158Y,A240C)之DNA的上述DNA片段(1.8Kb)上。然后选择出具有按所需方向插入的1.8Kb片段的质粒。这种含有编码Aur1Rp(F158Y,A240C)DNA之基因的质粒被命名为pW scaur1R—C并用于实验室中的酵母转化。

实施例6:用酵母作为宿主的转化

(1)米酒酵母通过pYCscaur1R—C的转化

使用5μg pYC质粒pYC scaur1R—C,用实施例1—(1)中所述的乙酸锂法转化米酒酵母KyokaiK—701。如表5所示,所得结果与线性化质粒中所得结果相似。即使经多代继代培养之后,与亲代菌株相比,这些转化体保持的金黄担子菌素A抗性也至少要高10倍。因此已证实AurIRp(F158Y,A240C)可用作米酒酵母经复制载体进行转化的一种有效的选择性标记。

                           表5

    质粒预培养时间    转化体数量/μg DNA    金黄担子菌素A浓度(μg/ml)    0.5    1.0    2.0    5.0 pYCscaur1R pYCscaur1R-C    1小时    过夜    1小时    过夜    0    24    386    4824    0    21    172    4792    0    0    18    1692    0    0    1    136

(2)利用pW scaur1R—C进行实验室酵母的转化

用实验室用单倍体酵母DKD—5D(a,his3,trp1、leu2—3,112)作为宿主,通过实施例3—(1)中所述的乙酸锂法转化5μg的pW scaur1R—C。

为了比较,利用质粒中所含的营养缺陷型标记物在基本培养基上对转化体进行筛选。如表6所示,已证实Aur1Rp(F158Y,A240C)可用作选择性标记,该标记与单倍体酵母中的常规营养缺陷型标记相似。

                           表6

    质粒预培养时间    转化体数量/μg DNA    最低金黄担子菌素A浓度(μg/ml)  中等    0.5    1.0    5.0 pWscaur1R-C    1小时    过夜    192    2500    248    2780    181    2524    58    2044

实施例7:用白假丝酵母作为宿主的转化

使用能在pUC119区域中某一位点酶切的SalI酶切pU scau-r1R—C而制备出线性质粒,将5μg线性质粒通过乙酸锂法转化到白假丝酵母TIMM136中。转化完成后,将细胞在YPD培养基中培养1小时或过夜,然后涂抹在含有金黄担子菌素A的YPD琼脂培养基上。如表7所示,通过进行过夜预培养得到了具有金黄担子菌素抗性的转化体。这些转化体均显示出10μg/ml或以上的最小抑制浓度。

                       表7

    预培养质粒             时间    转化体数量/μg DNA    金黄担子菌素A浓度(μg/ml)    0.25    1.0 SalI-线性化    1小时pUscaur1R-C     过夜    0       0    180     0

本发明利用对金黄担子菌素的抗性作为选择性标记,提供了一种染色体整合载体,其在真菌(尤其是工业真菌)的遗传重组中是有用的;提供了一种生产具有该引入的载体的转化体的方法,以及通过该方法而得到的转化体。它们可有效地应用于生产有用的蛋白质及培育的转化体的生成。

本发明还提供了一种能产生强金黄担子菌素抗性的蛋白质以及编码该蛋白质的DNA。它们给具有金黄担子菌素敏感性的生物带来了抗性,可用作筛选获得了抗性的生物的选择性标记。它们在某些方面特别有用,例如可用于实用性酵母的遗传工程培育和白假丝酵母遗传信息的分析。尤其是,源于酿酒酵母的金黄担子菌素抗性基因在酿酒酵母的培育和用于产生有用蛋白质的转化体的制备方面是极其有用的,因此酿酒酵母不仅广泛用作工业酵母,而且在遗传重组中非常安全。序列目录SEQ ID NO:1序列长度:2385序列类型:核酸链况:双链拓扑学:线性分子类型:基因组DNA序列描述AAGCTTTTTT  GCCTCTGCAA  AAGTTCCTTT  CTCGAATTGG  TTTTTTGAGG  AAAAGCAAGT       60TAATAAACTA  ATTATATTAT  ATATAATTAG  CAATTTTATA  AAAAAAATAA  AAAAATAGCC      120CTGATTGCTG  GCAACTGTGA  GCTGAACATT  GGTTAATCGG  TCCATCTTTT  TTTAAATATT      180TTACATCGCT  ACTTTTAAGT  GCTTGACACT  TGCATTTAAT  AGCTACTTTC  TTTCCTTCAT      240AAAAATTCCT  TTTTTTTCCT  TTAGTTTTCC  GGTTAATTCC  TTACGAAATT  TTTTTCGTAC      300GCTTCCCTTT  TTTACTCTGA  TAATTCTTTG  AAGCAATGTC  TGCTCTTTCG  ACCTTAAAAA      360AGCGCCTTGC  TGCGTGTAAC  CGAGCATCCC  AATACAAGTT  GGAAACAAGC  TTAAACCCTA      420TGCCTACATT  TCGTTTGCTA  CGCAATACGA  AATGGTCATG  GACACATTTG  CAATATGTGT      480TTCTAGCAGG  TAATTTGATT  TTTGCTTGTA  TTGTCATTGA  ATCTCCTGGA  TTCTGGGGGA      540AATTTGGCAT  TGCCTGTCTT  TTGGCCATTG  CGTTGACCGT  TCCTTTAACA  CGCCAAATTT      600TTTTTCCTGC  CATTGTTATC  ATCACCTGGG  CAATTTTATT  TTACTCTTGT  AGGTTTATTC      660CAGAACGCTG  GCGTCCACCC  ATATGGGTTC  GTGTTTTACC  CACACTTGAA  AATATTCTTT      720ATGGCTCTAA  TCTTTCTAGT  CTTCTCTCGA  AAACCACGCA  TAGCATCCTT  GATATTTTGG      780CCTGGGTTCC  ATATGGAGTC  ATGCATTATT  CGGCTCCTTT  TATCATTTCA  TTTATTCTTT      840TCATCTTTGC  ACCTCCTGGA  ACTCTTCCAG  TTTGGGCTCG  AACTTTTGGT  TATATGAATT      900TATTTGGTGT  TCTTATCCAA  ATGGCTTTCC  CCTGTTCTCC  TCCTTGGTAT  GAAAATATGT      960ATGGTTTAGA  ACCTGCCACG  TATGCAGTAC  GTGGCTCTCC  TGGTGGATTG  GCCCGTATTG     1020ATGCTCTCTT  CGGCACTAGC  ATTTACACTG  ATTGTTTTTC  TAACTCTCCG  GTTGTTTTTG     1080GTGCCTTTCC  ATCTCTTCAC  GCTGGATGGG  CCATGCTGGA  AGCACTTTTC  CTTTCGCATG     1140TGTTTCCTCG  ATACCGCTTC  TGCTTTTATG  GATATGTTCT  ATGGCTTTGC  TGGTGTACTA     1200TGTACCTTAC  CCACCACTAC  TTTGTAGATT  TGGTCGGCGG  TATGTGTTTA  GCTATTATAT     1260GCTTCGTTTT TGCTCAAAAG CTACGCCTCC CACAGTTGCA AACTGGTAAA ATCCTTCGTT  1320GGGAATACGA GTTTGTTATC CACGGTCATG GTCTTTCCGA AAAAACCAGC AACTCCTTGG  1380CTCGTACCGG CAGCCCATAC TTACTTGGAA GGGATTCTTT TACTCAAAAC CCTAATGCAG  1440TAGCCTTCAT GAGTGGTCTT AACAATATGG AACTTGCTAA CACCGATCAT GAATGGTCCG  1500TGGGTTCATC ATCACCTGAG CCGTTACCTA GTCCTGCTGC TGATTTGATT GATCGTCCTG  1560CCAGTACCAC TTCCTCCATC TTTGATGCAA GTCATCTTCC TTAAATCAAC GTGCTTTAAG  1620AATATATTTC CAAAAGCTAC ATGATACATT GACTAGAATC GGTTTGATTC ATAGTGGTAT  1680TGGAATGATG TTGTTCATTG TGTTTTTTAA CTGTTAATCT GACATCCATT GAGTCATTCT  1740TTACAATTTG TAAAATTAAT TTGTATCACT AATTTTGAAG GAAGCTATTT TGGTATTAAT  1800ACCGCTTTTG GTCTCCACTT CCTTTTCGAA ACTCTTAACA GCGATTAGGC CGGGTATCTT  1860CCAGTGTGAT GTATAGGTAT TTGTCGTTTT TTTATCATTT CCGTTAATAA AGAACTCTTT  1920TATCCAGCTT CTTACACTGT CAACTGTTGT GAAAGGAACA CATTTAGAAT TTCATTTTCC  1980TTATTTGTTG TGATTTAAAT CGTTTGACAT AATTTTAAAT TTGGTTTGAA ATGTGTGTGA  2040GAAGGCTTGT TTTATTCATT TAGTTTATTG CTTGTTTGCA CGAAAATCCA GAACGGAGCA  2100TTAATGTAAT CCTTTTTTAT TCTGTAAAGC GTTTTTATAC AAATGTTGGT TATACGTTTC  2160TAAAATAAGA ATATTGTTAT AATAATATAG TTTTTTCTAT CATTTGTTAC ACACACTAAA  2220GAGACATTAA GGATAAGCAA ATGTGTTAAA ATGATAATAT ATTTTGGAAA CATTTATAAA  2280GAAATTAAGC AGCTTTGACT AACTACATTT TTGTTTTTTT CCTAAGCAAA ACTGTATAGT  2310TATACACGCG AGCTGTATTC ACTTCCATTG TAGTGACTTG AGCTC                  2385SEQ ID NO:2序列长度:422序列类型:氨基酸链况:单链拓扑学:线性分子类型:肽序列描述Met Ser Ala Leu Ser Thr Leu Lys Lys Arg Leu AlaAla Cys Asn  1               5                  10                 15Arg Ala Ser Gln Tyr Lys Leu Glu Thr Ser Leu Asn Pro Met Pro

             20                  25                  30Thr Phe Arg Leu Leu Arg Asn Thr Lys Trp Ser Trp Thr His Leu

             35                  40                  45Gln Tyr Val Phe Leu Ala Gly Asn Leu Ile Phe Ala Cys Ile Val

             50                  55                  60Ile Glu Ser Pro Gly Phe Trp Gly Lys Phe Gly Ile Ala Cys Leu

             65                  70                  75Leu Ala Ile Ala Leu Thr Val Pro Leu Thr Arg Gln Ile Phe Phe

             80                  85                  90Pro Ala Ile Val Ile Ile Thr Trp Ala Ile Leu Phe Tyr Ser Cys

             95                 100                 105Arg Phe Ile Pro Glu Arg Trp Arg Pro Pro Ile Trp Val Arg Val

            110                 115                 120Leu Pro Thr Leu Glu Asn Ile Leu Tyr Gly Ser Asn Leu Ser Ser

            125                 130                 135Leu Leu Ser Lys Thr Thr His Ser Ile Leu Asp Ile Leu Ala Trp

            140                 145                 150Val Pro Tyr Gly Val Met His Tyr Ser Ala Pro Phe Ile Ile Ser

            155                 160                 165Phe Ile Leu Phe Ile Phe Ala Pro Pro Gly Thr Leu Pro Val Trp

            170                 175                 180Ala Arg Thr Phe Gly Tyr Met Asn Leu Phe Gly Val Leu Ile Gln

            185                 190                 195Met Ala Phe Pro Cys Ser Pro Pro Trp Tyr Glu Ash Met Tyr Gly

            200                 205                 210Leu Glu Pro Ala Thr Tyr Ala Val Arg Gly Ser Pro Gly Gly Leu

            215                 220                 225Ala Arg Ile Asp Ala Leu Phe Gly Thr Ser Ile Tyr Thr Asp Cys

            230                 235                 240Phe Ser Asn Ser Pro Val Val Phe Gly Ala Phe Pro Ser Leu His

            245                 250                 255Ala Gly Trp Ala Met Leu Glu Ala Leu Phe Leu Ser His Val Phe

            260                 265                 270Pro Arg Tyr Arg Phe Cys Phe Tyr Gly Tyr Val Leu Trp Leu Cys

            275                 380                 285Trp Cys Thr Met Tyr Leu Thr His His Tyr Phe Val Asp Leu Val

            290                 295                 300Gly Gly Met Cys Leu Ala Ile Ile Cys Phe Val Phe Ala Gln Lys

            305                 310                 315Leu Arg Leu Pro Gln Leu Gln Thr Gly Lys Ile Leu Arg Trp Glu

            320                 335                 330Tyr Glu Phe Val Ile His Gly His Gly Leu Ser Glu Lys Thr Ser

            335                 340                 345Asn Ser Leu Ala Arg Thr Gly Ser Pro Tyr Leu Leu Gly Arg Asp

            350                 355                 360Ser Phe Thr Gln Asn Pro Asn Ala Val Ala Phe Met Ser Gly Leu

            365                 370                 375Asn Asn Met Glu Leu Ala Asn Thr Asp His Glu Trp Ser Val Gly

            380                 385                 390Ser Ser Ser Pro Glu Pro Leu Pro Ser Pro Ala Ala Asp Leu Ile

            395                 400                 405Asp Arg Pro Ala Ser Thr Thr Ser Ser Ile Phe Asp Ala Ser His

            410                 415                 420Leu ProSEQ ID NO:3序列长度:2385序列类型:核酸链况:双链拓扑学:线性分子类型:基因组DNA序列描述AAGCTTTTTT  GCCTCTGCAA  AAGTTCCTTT  CTCGAATTGG  TTTTTTGAGG  AAAAGCAAGT      60TAATAAACTA  ATTATATTAT  ATATAATTAG  CAATTTTATA  AAAAAAATAA  AAAAATAGCC     120CTGATTGCTG  GCAACTGTGA  GCTGAACATT  GGTTAATCGG  TCCATCTTTT  TTTAAATATT     180TTACATCGCT  ACTTTTAAGT  GCTTGACACT  TGCATTTAAT  AGCTACTTTC  TTTCCTTCAT     240AAAAATTCCT  TTTTTTTCCT  TTAGTTTTCC  GGTTAATTCC  TTACGAAATT  TTTTTCGTAC     300GCTTCCCTTT  TTTACTCTGA  TAATTCTTTG  AAGCAATGTC  TGCTCTTTCG  ACCTTAAAAA     360AGCGCCTTGC  TGCGTGTAAC  CGAGCATCCC  AATACAAGTT  GGAAACAAGC  TTAAACCCTA     420TGCCTACATT  TCGTTTGCTA  CGCAATACGA  AATGGTCATG  GACACATTTG  CAATATGTGT     480TTCTAGCAGG  TAATTTGATT  TTTGCTTGTA  TTGTCATTGA  ATCTCCTGGA  TTCTGGGGGA     540AATTTGGCAT  TGCCTGTCTT  TTGGCCATTG  CGTTGACCGT  TCCTTTAACA  CGCCAAATTT     600TTTTTCCTGC  CATTGTTATC  ATCACCTGGG  CAATTTTATT  TTACTCTTGT  AGGTTTATTC     660CAGAACGCTG  GCGTCCACCC  ATATGGGTTC  GTGTTTTACC  CACACTTGAA  AATATTCTTT     720ATGGCTCTAA  TCTTTCTAGT  CTTCTCTCGA  AAACCACGCA  TAGCATCCTT  GATATTTTGG     780CCTGGGTTCC  ATATGGAGTC  ATGCATTATT  CGGCTCCTTT  TATCATTTCA  TTTATTCTTT     840TCATCTTTGC  ACCTCCTGGA  ACTCTTCCAG  TTTGGGCTCG  AACTTTTGGT  TATATGAATT     900TATTTGGTGT  TCTTATCCAA  ATGGCTTTCC  CCTGTTCTCC  TCCTTGGTAT  GAAAATATGT     960ATGGTTTAGA  ACCTGCCACG  TATGCAGTAC  GTGGCTCTCC  TGGTGGATTG  GCCCGTATTG    1020ATGCTCTCTT  CGGCACTAGC  ATTTACACTG  ATGGTTTTTC  TAACTCTCCG  GTTGTTTTTG    1080GTGCCTTTCC  ATCTCTTCAC  GCTGGATGGG  CCATGCTGGA  AGCACTTTTC  CTTTCGCATG    1140TGTTTCCTCG  ATACCGCTTC  TGCTTTTATG  GATATGTTCT  ATGGCTTTGC  TGGTGTACTA    1200TGTACCTTAC  CCACCACTAC  TTTGTAGATT  TGGTCGGCGG  TATGTGTTTA  GCTATTATAT    1260GCTTCGTTTT  TGCTCAAAAG  CTACGCCTCC  CACAGTTGCA  AACTGGTAAA  ATCCTTCGTT    1320GGGAATACGA  GTTTGTTATC  CACGGTCATG  GTCTTTCCGA  AAAAACCAGC  AACTCCTTGG    1380CTCGTACCGG  CAGCCCATAC  TTACTTGGAA  GGGATTCTTT  TACTCAAAAC  CCTAATGCAG    1440TAGCCTTCAT  GAGTGGTCTT  AACAATATGG  AACTTGCTAA  CACCGATCAT  GAATGGTCCG   1500TGGGTTCATC  ATCACCTGAG  CCGTTACCTA  GTCCTGCTGC  TGATTTGATT  GATCGTCCTG   1560CCAGTACCAC  TTCCTCCATC  TTTGATGCAA  GTCATCTTCC  TTAAATCAAC  GTGCTTTAAG   1620AATATATTTC  CAAAAGCTAC  ATGATACATT  GACTAGAATC  GGTTTGATTC  ATAGTGGTAT   1880TGGAATGATG  TTGTTCATTG  TGTTTTTTAA  CTGTTAATCT  GACATCCATT  CAGTCATTCT   1740TTACAATTTG  TAAAATTAAT  TTGTATCACT  AATTTTGAAG  GAAGCTATTT  TGGTATTAAT   1800ACCGCTTTTG  GTCTCCACTT  CCTTTTCGAA  ACTCTTAACA  GCGATTAGGC  CGGGTATCTT   1860CCAGTGTGAT  GTATAGGTAT  TTGTCGTTTT  TTTATCATTT  CCGTTAATAA  AGAACTCTTT   1920TATCCAGCTT  CTTACACTGT  CAACTGTTGT  GAAAGGAACA  CATTTAGAAT  TTCATTTTCC   1980TTATTTGTTG  TGATTTAAAT  CGTTTGACAT  AATTTTAAAT  TTGGTTTGAA  ATGTGTGTGA   2040GAAGGCTTGT  TTTATTCATT  TAGTTTATTG  CTTGTTTGCA  CGAAAATCCA  GAACGGAGCA   2100TTAATGTAAT  CCTTTTTTAT  TCTGTAAAGC  GTTTTTATAC  AAATGTTGGT  TATACGTTTC   2160TAAAATAAGA  ATATTGTTAT  AATAATATAG  TTTTTTCTAT  CATTTGTTAC  ACACACTAAA   2220GAGACATTAA  GGATAAGCAA  ATGTGTTAAA  ATGATAATAT  ATTTTGGAAA  CATTTATAAA   2280GAAATTAAGC  AGCTTTGACT  AACTACATTT  TTGTTTTTTT  CCTAAGCAAA  ACTGTATAGT   2340TATACACGCG  AGCTGTATTC  ACTTCCATTG  TAGTGACTTG  AGCTC                                       2385SEQ ID NO:4序列长度:422序列类型:氨基酸链况:单链拓扑学:线性分子类型:肽序列描述Met Ser Ala Leu Ser Thr Leu Lys Lys Arg Leu Ala Ala Cys Asn  1               5                  10                  15Arg Ala Ser Gln Tyr Lys Leu Glu Thr Ser Leu Asn Pro Met Pro

             20                  25                  30Thr Phe Arg Leu Leu Arg Asn Thr Lys Trp Ser Trp Thr His Leu

             35                  40                  45Gln Tyr Val Phe Leu Ala Gly Ash Leu Ile Phe Ala Cys Ile Val

             50                  55                  60Ile Glu Ser Pro Gly Phe Trp Gly Lys Phe Gly Ile Ala Cys Leu

             65                  70                  75Leu Ala Ile Ala Leu Thr Val Pro Leu Thr Arg Gln Ile Phe Phe

             80                  85                  90Pro Ala Ile Val Ile Ile Thr Trp Ala Ile Leu Phe Tyr Ser Cys

             95                 100                 105Arg Phe Ile Pro Glu Arg Trp Arg Pro Pro Ile Trp Val Arg Val

            110                 115                 120Leu Pro Thr Leu Glu Asn Ile Leu Tyr Gly Ser Asn Leu Ser Ser

            125                 130                 135Leu Leu Ser Lys Thr Thr His Ser Ile Leu Asp Ile Leu Ala Trp

            140                 145                 150Val Pro Tyr Gly Val Met His Tyr Ser Ala Pro Phe Ile Ile Ser

            155                 160                 165Phe Ile Leu Phe Ile Phe Ala Pro Pro Gly Thr Leu Pro Val Trp

            170                 175                 180Ala Arg Thr Phe Gly Tyr Met Asn Leu Phe Gly Val Leu Ile Gln

            185                 190                 195Met Ala Phe Pro Cys Ser Pro Pro Trp Tyr Glu Asn Met Tyr Gly

            200                 205                 210Leu Glu Pro Ala Thr Tyr Ala Val Arg Gly Ser Pro Gly Gly Leu

            215                 220                 225Ala Arg Ile Asp Ala Leu Phe Gly Thr Ser Ile Tyr Thr Asp Gly

            230                 235                 240Phe Ser Asn Ser Pro Val Val Phe Gly Ala Phe Pro Ser Leu His

            245                 250                 255Ala Gly Trp Ala Met Leu Glu Ala Leu Phe Leu Ser His Val Phe

            260                 265                 270Pro Arg Tyr Arg Phe Cys Phe Tyr Gly Tyr Val Leu Trp Leu Cys

            275                 280                 285Trp Cys Thr Met Tyr Leu Thr His His Tyr Phe Val Asp Leu Val

            290                 295                 300Gly Gly Met Cys Leu Ala Ile Ile Cys Phe Val Phe Ala Gln Lys

            305                 310                 315Leu Arg Leu Pro Gln Leu Gln Thr Gly Lys Ile Leu Arg Trp Glu

            320                 325                 330Tyr Glu Phe Val Ile His Gly His Gly Leu Ser Glu Lys Thr Ser

            335                 340                 345Asn Ser Leu Ala Arg Thr Gly Ser Pro Tyr Leu Leu Gly Arg Asp

            350                 355                 360Ser Phe Thr Gln Asn Pro Asn Ala Val Ala Phe Met Ser Gly Leu

            365                 370                 375Asn Asn Met Glu Leu Ala Asn Thr Asp His Glu Trp Ser Val Gly

            380                 385                 390Ser Ser Ser Pro Glu Pro Leu Pro Ser Pro Ala Ala Asp Leu Ile

            395                 400                 405Asp Arg Pro Ala Ser Thr Thr Ser Ser Ile Phe Asp Ala Ser His

            410                 415                 420Leu ProSEQ ID NO:5序列长度:2340序列类型:核酸链况:双链拓扑学:线性分子类型:基因组DNA序列描述TTTCTTTCTG TCAAAGAATA ATAAAGTGCC CATCAGTGTT CATATTTGTT ACAAAGTGGT   60TTTCTGATTT GGTACTACTG CAGAGGCGTA TTTTTTGCTT CAGTTACCAT AGCGTAAGAA  120CACTAGCGAC TTTTGTTCGT GAACCAACAG AGTAGGATTT CTACTGCTAC ATCTCTTAGG  180TAGTTGGTTA GTCCGATCGC TCACTTTTGG TTGTTGTTAA GTACTTCATA AGTTTATCCT  240TTTCCTTTTT CACACTGAGC TACTTTGGGT ATAGCTTTTG GCCCAAGGAT CTTTGAATTT  300TCTCCAAAAG TACTTTATTT TATATCCTAC AGGTTGCGGT TTTCATATTT TAAAAAGCTT  360TTTAATCATT CCTTTGCGTA TGGCAAACCC TTTTTCGAGA TGGTTTCTAT CAGAGAGACC  420TCCAAACTGC CATGTAGCCG ATTTAGAAAC AAGTTTAGAT CCCCATCAAA CGTTGTTGAA  480GGTGCAAAAA TACAAACCCG CTTTAAGCGA CTGGGTGCAT TACATCTTCT TGGGATCCAT  540CATGCTGTTT GTGTTCATTA CTAATCCCGC ACCTTGGATC TTCAAGATCC TTTTTTATTG  600TTTCTTGGGC ACTTTATTCA TCATTCCAGC TACGTCACAG TTTTTCTTCA ATGCCTTGCC  660CATCCTAACA TGGGTGGCGC TGTATTTCAC TTCATCGTAC TTTCCAGATG ACCGCAGGCC  720TCCTATTACT GTCAAAGTGT TACCAGCGGT GGAAACAATT TTATACGGCG ACAATTTAAG  780TGATATTCTT GCAACATCGA CGAATTCCTT TTTGGACATT TTAGCATGGT TACCGTACGG  840ACTATTTCAT TATGGGGCCC CATTTGTCGT TGCTGCCATC TTATTCGTAT TTGGTCCACC  900AACTGTTTTG CAAGGTTATG CTTTTGCATT TGGTTATATG AACCTGTTTG GTGTTATCAT  960GCAAAATGTC TTTCCAGCCG CTCCCCCATG GTATAAAATT CTCTATGGAT TGCAATCAGC 1020CAACTATGAT ATGCATGGCT CGCCTGGTGG ATTAGCTAGA ATTGATAAGC TACTCGGTAT 1080TAATATGTAT ACTACAGCTT TTTCAAATTC CTCCGTCATT TTCGGTGCTT TTCCTTCACT 1140GCATTCCGGG TGTGCTACTA TGGAAGCCCT GTTTTTCTGT TATTGTTTTC CAAAATTGAA 1200GCCCTTGTTT ATTGCTTATG TTTGCTGGTT ATGGTGGTCA ACTATGTATC TGACACACCA 1260TTATTTTGTA GACCTTATGG CAGGTTCTGT GCTGTCATAC GTTATTTTCC AGTACACAAA 1320GTACACACAT TTACCAATTG TAGATACATC TCTTTTTTGC AGATGGTCAT ACACTTCAAT 1380TGAGAAATAC GATATATCAA AGAGTGATCC ATTGGCTGCA GATTCAAACG ATATCGAAAG 1440TGTCCCTTTG TCCAACTTGG AACTTGACTT TGATCTTAAT ATGACTGATG AACCCAGTGT 1500AAGCCCTTCG TTATTTGATG GATCTACTTC TGTTTCTCGT TCGTCCGCCA CGTCTATAAC 1560GTCACTAGGT GTAAAGAGGG CTTAATGAGT ATTTTATCTG CAATTACGGA TACGGTTGGT 1620CTTATGTAGA TACATATAAA TATATATCTT TTTCTTTCTT TTTCTTAGTC AGGATTGTCG 1680TTTAGCATAA TATACATGTA GTTTATTTAA TCACATACCA CTGATTATCT TTAGAATTTT 1740ATAAATTTTT GAAATAAATG GGTGGCTTTT AATGGTGTCT ATGTTAAGTG AGGCTTTTAG 1800AATGCTCTTC CTGCTTTGTT TATTATATGT GTATGAAAGA TATGTATGTA TTTACATGTG 1860TTTGTAGCGT CCCCAGTCAA AACCTGTGCG CTATACCTAA ATGGATTGAT AATCTTCATT 1920CACTAATTCT AAAATAGACT TCTTCCCCAA AGAACGGTGT AACGATGAGG CTCTATCCAG 1980CTGCTTATCT AAATCAACTT TAACGATGGA TGATCTTATG ACACGGGGAT CTTTCTTTAA 2040AGTTCTTAGA ATTTCAGACT GTACCGCAGC TGATGAATCA AACAGCATTA AAAAGTGATA 2100TGCTCGAAAA TGTTTTTCCT GGTCTTTCTT CATTATTTTA GGAAGATACC TTATGCCCAT 2160GGGTACAATG TCCCTCACCA CACCTCTGTT TTGAATAATC AGTTTCCCGA TTGTGGAAGA 2220CAATTCTTTT GCTTCCAACT TTGGCGCATT GGAGTTGGTT ATGCGAACAA GTCCGATCAG 2280CTCATAAAGC ATCTTAGTGA AAAGGGTGGT TTTGCGTTAT TCTTTCCTCT GTTGAAGCTT 2340SEQ ID NO:6序列长度:401序列类型:氨基酸链况:单链拓扑学:线性分子类型:肽序列描述Met Ala Asn Pro Phe Ser Arg Trp Phe Leu Ser Glu Arg Pro Pro  1               5                  10                  15Asn Cys His Val Ala Asp Leu Glu Thr Ser Leu Asp Pro His Gln

             20                  25                  30Thr Leu Leu Lys Val Gln Lys Tyr Lys Pro Ala Leu Ser Asp Trp

             35                  40                  45Val His Tyr Ile Phe Leu Gly Ser Ile Met Leu Phe Val Phe Ile

             50                  55                  60Thr Asn Pro Ala Pro Trp Ile Phe Lys Ile Leu Phe Tyr Cys Phe

             65                  70                  75Leu Gly Thr Leu Phe Ile Ile Pro Ala Thr Ser Gln Phe Phe Phe

             80                  85                  90Asn Ala Leu Pro Ile Leu Thr Trp Val Ala Leu Tyr Phe Thr Ser

             95                 100                 105Ser Tyr Phe Pro Asp Asp Arg Arg Pro Pro Ile Thr Val Lys Val

            110                 115                 120Leu Pro Ala Val Glu Thr Ile Leu Tyr Gly Asp Asn Leu Ser Asp

            125                 130                 135Ile Leu Ala Thr Ser Thr Asn Ser Phe Leu Asp Ile Leu Ala Trp

            140                 145                 150Leu Pro Tyr Gly Leu Phe His Tyr Gly Ala Pro Phe Val Val Ala

            155                 160                 165Ala Ile Leu Phe Val Phe Gly Pro Pro Thr Val Leu Gln Gly Tyr

            170                 175                 180Ala Phe Ala Phe Gly Tyr Met Asn Leu Phe Gly Val Ile Met Gln

            185                 190                 195Asn Val Phe Pro Ala Ala Pro Pro Trp Tyr Lys Ile Leu Tyr Gly

            200                 205                 210Leu Gln Ser Ala Asn Tyr Asp Met His Gly Ser Pro Gly Gly Leu

            215                 220                 225Ala Arg Ile Asp Lys Leu Leu Gly Ile Asn Met Tyr Thr Thr Ala

            230                 235                 240Phe Ser Asn Ser Ser Val Ile Phe Gly Ala Phe Pro Ser Leu His

            245                 250                 255Ser Gly Cys Ala Thr Met Glu Ala Leu Phe Phe Cys Tyr Cys Phe

            260                 265                 270Pro Lys Leu Lys Pro Leu Phe Ile Ala Tyr Val Cys Trp Leu Trp

            275                 280                 285Trp Ser Thr Met Tyr Leu Thr His His Tyr Phe Val Asp Leu Met

            290                 295                 300Ala Gly Ser Val Leu Ser Tyr Val Ile Phe Gln Tyr Thr Lys Tyr

            305                 310                 315Thr His Leu Pro Ile Val Asp Thr Ser Leu Phe Cys Arg Trp Ser

            320                 325                 330Tyr Thr Ser Ile Glu Lys Tyr Asp Ile Ser Lys Ser Aso Pro Leu

            335                 340                 345Ala Ala Asp Ser Asn Asp Ile Glu Ser Val Pro Leu Ser Asn Leu

            350                 355                 360Glu Leu Asp Phe Asp Leu Asn Met Thr Asp Glu Pro Ser Val Ser

            365                 370                 375Pro Ser Leu Phe Asp Gly Ser Thr Ser Val Ser Arg Ser Ser Ala

            380                 385                 390Thr Ser Ile Thr Ser Leu Gly Val Lys Arg Ala

            395                 400SEQ ID NO:7序列长度:2340序列类型:核酸链况:双链拓扑学:线性分子类型:基因组DNA序列描述TTTCTTTCTG  TCAAAGAATA  ATAAAGTGCC  CATCAGTGTT  CATATTTGTT  ACAAAGTGGT      60TTTCTGATTT  GGTACTACTG  CAGAGGCGTA  TTTTTTGCTT  CAGTTACCAT  AGCGTAAGAA     120CACTAGCGAC  TTTTGTTCGT  GAACCAACAG  AGTAGGATTT  CTACTGCTAC  ATCTCTTAGG     180TAGTTGGTTA  GTCCGATCGC  TCACTTTTGG  TTGTTGTTAA  GTACTTCATA  AGTTTATCCT     240TTTCCTTTTT  CACACTGAGC  TACTTTGGGT  ATAGCTTTTG  GCCCAAGGAT  CTTTGAATTT     300TCTCCAAAAG  TACTTTATTT  TATATCCTAC  AGGTTGCGGT  TTTCATATTT  TAAAAAGCTT     360TTTAATCATT  CCTTTGCGTA  TGGCAAACCC  TTTTTCGAGA  TGGTTTCTAT  CAGAGAGACC     420TCCAAACTGC  CATGTAGCCG  ATTTAGAAAC  AAGTTTAGAT  CCCCATCAAA  CGTTGTTGAA     480GGTGCAAAAA  TACAAACCCG  CTTTAAGCGA  CTGGGTGCAT  TACATCTTCT  TGGGATCCAT     540CATGCTGTTT  GTGTTCATTA  CTAATCCCGC  ACCTTGGATC  TTCAAGATCC  TTTTTTATTG     600TTTCTTGGGC  ACTTTATTCA  TCATTCCAGC  TACGTCACAG  TTTTTCTTCA  ATGCCTTGCC     660CATCCTAACA  TGGGTGGCGC  TGTATTTCAC  TTCATCGTAC  TTTCCAGATG  ACCGCAGGCC     720TCCTATTACT  GTCAAAGTGT  TACCAGCGGT  GGAAACAATT  TTATACGGCG  ACAATTTAAG     780TGATATTCTT  GCAACATCGA  CGAATTCCTT  TTTGGACATT  TTAGCATGGT  TACCGTACGG     840ACTATTTCAT  TTTGGGGCCC  CATTTGTCGT  TGCTGCCATC  TTATTCGTAT  TTGGTCCACC     900AACTGTTTTG  CAAGGTTATG  CTTTTGCATT  TGGTTATATG  AACCTGTTTG  GTGTTATCAT     960GCAAAATGTC  TTTCCAGCCG  CTCCCCCATG  GTATAAAATT  CTCTATGGAT  TGCAATCAGC    1020CAACTATGAT  ATGCATGGCT  CGCCTGGTGG  ATTAGCTAGA  ATTGATAAGC  TACTCGGTAT    1080TAATATGTAT  ACTACAGCTT  TTTCAAATTC  CTCCGTCATT  TTCGGTGCTT  TTCCTTCACT    1140GCATTCCGGG  TGTGCTACTA  TGGAAGCCCT  GTTTTTCTGT  TATTGTTTTC  CAAAATTGAA    1200GCCCTTGTTT  ATTGCTTATG  TTTGCTGGTT  ATGGTGGTCA  ACTATGTATC  TGACACACCA    1260TTATTTTGTA  GACCTTATGG  CAGGTTCTGT  GCTGTCATAC  GTTATTTTCC  AGTACACAAA    1320GTACACACAT  TTACCAATTG  TAGATACATC  TCTTTTTTGC  AGATGGTCAT  ACACTTCAAT    1380TGAGAAATAC  GATATATCAA  AGAGTGATCC  ATTGGCTGCA  GATTCAAACG  ATATCGAAAG    1440TGTCCCTTTG  TCCAACTTGG  AACTTGACTT  TGATCTTAAT  ATGACTGATG  AACCCAGTGT    1500AAGCCCTTCG  TTATTTGATG  GATCTACTTC  TGTTTCTCGT  TCGTCCGCCA  CGTCTATAAC    1560GTCACTAGGT  GTAAAGAGGG  CTTAATGAGT  ATTTTATCTG  CAATTACGGA  TACGGTTGGT    1620CTTATGTAGA  TACATATAAA  TATATATCTT  TTTCTTTCTT  TTTCTTAGTC  AGGATTGTCG    1680TTTAGCATAA  TATACATGTA  GTTTATTTAA  TCACATACCA  CTGATTATCT  TTAGAATTTT    1740ATAAATTTTT  GAAATAAATG  GGTGGCTTTT  AATGGTGTCT  ATGTTAAGTG  AGGCTTTTAG    1800AATGCTCTTC  CTGCTTTGTT  TATTATATGT  GTATGAAAGA  TATGTATGTA  TTTACATGTG    1860TTTGTAGCGT  CCCCAGTCAA  AACCTGTGCG  CTATACCTAA  ATGGATTGAT  AATCTTCATT    1920CACTAATTCT  AAAATAGACT  TCTTCCCCAA  AGAACGGTGT  AACGATGAGG  CTCTATCCAG    1980CTGCTTATCT  AAATCAACTT  TAACGATGGA  TGATCTTATG  ACACGGGGAT  CTTTCTTTAA    2040AGTTCTTAGA  ATTTCAGACT  GTACCGCAGC  TGATGAATCA  AACAGCATTA  AAAAGTGATA   2100TGCTCGAAAA  TGTTTTTCCT  GGTCTTTCTT  CATTATTTTA  GGAAGATACC  TTATGCCCAT   2160GGGTACAATG  TCCCTCACCA  CACCTCTGTT  TTGAATAATC  AGTTTCCCGA  TTGTGGAAGA   2220CAATTCTTTT  GCTTCCAACT  TTGGCGCATT  GGAGTTGGTT  ATGCGAACAA  GTCCGATCAG   2280CTCATAAAGC  ATCTTAGTGA  AAAGGGTGGT  TTTGCGTTAT  TCTTTCCTCT  GTTGAAGCTT   2340SEQ ID NO:8序列长度:401序列类型:氨基酸链况:单链拓扑学:线性分子类型:肽序列描述Met Ala Asn Pro Phe Ser Arg Trp Phe Leu Ser Glu Arg Pro Pro  1               5                  10                  15Asn Cys His Val Ala Asp Leu Glu Thr Ser Leu Asp Pro His Gln

             20                  25                  30Thr Leu Leu Lys Val Gln Lys Tyr Lys Pro Ala Leu Ser Asp Trp

             35                  40                  45Val His Tyr Ile Phe Leu Gly Ser Ile Met Leu Phe Val Phe Ile

             50                  55                  60Thr Asn Pro Ala Pro Trp Ile Phe Lys Ile Leu Phe Tyr Cys Phe

             65                  70                  75Leu Gly Thr Leu Phe Ile Ile Pro Ala Thr Ser Gln Phe Phe Phe

             80                  85                  90Asn Ala Leu Pro Ile Leu Thr Trp Val Ala Leu Tyr Phe Thr Ser

             95                 100                 105Ser Tyr Phe Pro Asp Asp Arg Arg Pro Pro Ile Thr Val Lys Val

            110                 115                 120Leu Pro Ala Val Glu Thr Ile Leu Tyr Gly Asp Asn Leu Ser Asp

            125                 130                 135Ile Leu Ala Thr Ser Thr Asn Ser Phe Leu Asp Ile Leu Ala Trp

            140                 145                 150Leu Pro Tyr Gly Leu Phe His Phe Gly Ala Pro Phe Val Val Ala

            155                 160                 165Ala Ile Leu Phe Val Phe Gly Pro Pro Thr Val Leu Gln Gly Tyr

            170                 175                 180Ala Phe Ala Phe Gly Tyr Met Asn Leu Phe Gly Val Ile Met Gln

            185                 190                 195Asn Val Phe Pro Ala Ala Pro Pro Trp Tyr Lys Ile Leu Tyr Gly

            200                 205                 210Leu Gln Ser Ala Asn Tyr Asp Met His Gly Ser Pro Gly Gly Leu

            215                 220                 225Ala Arg Ile Asp Lys Leu Leu Gly Ile Asn Met Tyr Thr Thr Ala

            230                 235                 240Phe Ser Asn Ser Ser Val Ile Phe Gly Ala Phe Pro Ser Leu His

            245                 250                 255Ser Gly Cys Ala Thr Met Glu Ala Leu Phe Phe Cys Tyr Cys Phe

            260                 265                 270Pro Lys Leu Lys Pro Leu Phe Ile Ala Tyr Val Cys Trp Leu Trp

            275                 280                 285Trp Ser Thr Met Tyr Leu Thr His His Tyr Phe Val Asp Leu Met

            290                 295                 300Ala Gly Ser Val Leu Ser Tyr Val Ile Phe Gln Tyr Thr Lys Tyr

            305                 310                 315Thr His Leu Pro Ile Val Asp Thr Ser Leu Phe Cys Arg Trp Ser

            320                 325                 330Tyr Thr Ser Ile Glu Lys Tyr Asp Ile Ser Lys Ser Aso Pro Leu

            335                 340                 345Ala Ala Asp Ser Asn Asp Ile Glu Ser Val Pro Leu Ser Asn Leu

            350                 355                 360Glu Leu Asp Phe Asp Leu Asn Met Thr Asp Glu Pro Ser Val Ser

            365                 370                 375Pro Ser Leu Phe Asp Gly Ser Thr Ser Val Ser Arg Ser Ser Ala

            380                 385                 390Thr Ser Ile Thr Ser Leu Gly Va  Lys Arg Ala

            395                 400SEQ ID NO:9序列长度:26序列类型:核酸链况:单链拓扑学:线性分子类型:其它核酸(合成的DNA)序列描述TTTGGTTAYA TGAAYYTNTT YGGNGT 26SEQ ID NO:10序列长度:29序列类型:核酸链况:单链拓扑学:线性分子类型:其它核酸(合成的DNA)序列描述TCTACAAART APTGGTGNGT NARRTACAT 29SEQ ID NO:11序列长度:227l序列类型:核酸链况:双链拓扑学:线性分子类型:基因组DNA序列描述TTATATATAT  TATTGATTTG  TTCCTGTTGT  TATTTAGTTT  AGAATCAGAC  GACTACACCA     60GAACCACAAT  TCAACCAACA  CTTATATAGA  ACCTGGCTTG  GAAAAAAGTA  ACATTTATCA    120TTCCTATACT  TTTTTAGCAA  ACATAATCCG  TGTTTTACAT  ATATTATTCA  CCCAATATCA    180TAACAAAAAC  AAACTGAATA  ATGGCGTCTT  CTATTTTGCG  TTCCAAAATA  ATACAAAAAC    240CGTACCAATT  ATTCCACTAC  TATTTTCTTC  TGGAGAAGGC  TCCTGGTTCT  ACAGTTAGTG    300ATTTGAATTT  TGATACAAAC  ATACAAACGA  GTTTACGTAA  ATTAAAGCAT  CATCATTGGA    360CGGTGGGAGA  AATATTCCAT  TATGGGTTTT  TGGTTTCCAT  ACTTTTTTTC  GTGTTTGTGG    420TTTTCCCAGC  TTCATTTTTT  ATAAAATTAC  CAATAATCTT  AGCATTTGCT  ACTTGTTTTT    480TAATACCCTT  AACATCACAA  TTTTTTCTTC  CTGCCTTGCC  CGTTTTCACT  TGGTTGGCAT    540TATATTTTAC  GTGTGCTAAA  ATACCTCAAG  AATGGAAACC  AGCTATCACA  GTTAAAGTTT    600TACCAGCTAT  GGAAACAATT  TTGTACGGCG  ATAATTTATC  AAATGTTTTG  GCAACCATCA    660CTACCGGAGT  GTTAGATATA  TTGGCATGGT  TACCATATGG  GATTATTCAT  TTCAGTTTCC    720CATTTGTACT  TGCTGCTATT  ATATTTTTAT  TTGGGCCACC  GACGGCATTA  AGATCATTTG    780GATTTGCCTT  TGGTTATATG  AACTTGCTTG  GAGTCTTGAT  TCAAATGGCA  TTCCCAGCTG    840CTCCTCCATG  GTACAAAAAC  TTGCACGGAT  TAGAACCAGC  TAATTATTCA  ATGCACGGGT    900CTCCTGGTGG  ACTTGGAAGG  ATAGATAAAT  TGTTAGGTGT  TGATATGTAT  ACCACAGGGT    960TTTCCAATTC  ATCAATCATT  TTTGGGGCAT  TCCCATCGTT  ACATTCAGGA  TGTTGTATCA   1020TGGAAGTGTT  ATTTTTGTGT  TGGTTGTTTC  CACGATTCAA  GTTTGTGTGG  GTTACATACG   1080CATCTTGGCT  TTGGTGGAGC  ACGATGTATT  TGACCCATCA  CTACTTTGTC  GATTTGATTG   1140GTGGAGCCAT  GCTATCTTTG  ACTGTTTTTG  AGTTCACCAA  ATATAAATAT  TTGCCAAAAA   1200ACAAAGAAGG  CCTTTTCTGT  CGTTGGTCAT  ACACTGAAAT  TGAAAAAATC  GATATCCAAG   1260AGATTGACCC  TTTATCATAC  AATTATATCC  CTGTCAACAG  CAATGATAAT  GAAAGCAGAT   1320TGTATACGAG  AGTGTACCAA  GAGTCTCAGG  TTAGTCCCCC  ACAGAGAGCT  GAAACACCTG   1380AAGCATTTGA  GATGTCAAAT  TTTTCTAGGT  CTAGACAAAG  CTCAAAGACT  CAGGTTCCAT   1440TGAGTAATCT  TACTAACAAT  GATCAAGTGT  CTGGAATTAA  CGAAGAGGAT  GAAGAAGAAG   1500AAGGCGATGA  AATTTCATCG  AGTACTCCTT  CGGTGTTTGA  AGACGAACCA  CAGGGTAGCA   1560CATATGCTGC  ATCCTCAGCT  ACATCAGTAG  ATGATTTGGA  TTCCAAAAGA  AATTAGTAAA   1620ATAACAGTTT  CTATTAATTT  CTTTATTTCC  TCCTAATTAA  TGATTTTATG  CTCAATACCT   1680ACACTATCTG  TTTTTAATTT  CCTACTTTTT  TTTTATTATT  GTTGAGTTCA  TTTGCTGTTC   1740ATTGAATATT  TACAATTTTG  CATTAATTAC  CATCAATATA  GAATGGGCAC  AGTTTTTTTA   1800AGTTTTTTTG  TTTTTGTGTT  TGTCTTTCTT  TTTTTACATT  AATGTGTTTG  GATTGTTTTA   1860GGTTCCTTTA  TCCCTTAGCC  CCCTCAGAAT  ACTATTTTAT  CTAATTAATT  TGTTTTTATT   1920TTCTGATATT  TACCAATTGC  TTTTTCTTTT  GGATATTTAT  AATAGCATCC  CCTAATAATT   1980AATATACAAC  TGTTTCATAT  ATATACGTGT  ATGTCCTGTA  GTGGTGGAAA  CTGGAGTCAA   2040CATTTGTATT  AATGTGTACA  AGAAAGCAGT  GTTAATGCTA  CTATTATAAT  TTTTGAGGTG   2100CAAATCAAGA  GGTTGGCAGC  TTTCTTATGG  CTATGACCGT  GAATGAAGGC  TTGTAAACCA   2160CGTAATAAAC  AAAAGCCAAC  AAGTTTTTTT  AGAGCCTTTA  ACAACATACG  CAATGAGAGT   2220GATTGCAATA  CTACAAGATA  TAGCCCAAAA  AATTGAATGC  ATTTCAACAA  CAAC         2274SEQ ID NO:12序列长度:471序列类型:氨基酸链况:单链拓扑学:线性分子类型:肽序列描述Met Ala Ser Ser Ile Leu Arg Ser Lys Ile Ile Gln Lys Pro Tyr  1               5                  10                  15Gln Leu Phe His Tyr Tyr Phe Leu Ser Glu Lys Ala Pro Gly Ser

             20                  25                  30Thr Val Ser Asp Leu Asn Phe Asp Thr Asn Ile Gln Thr Ser Leu

             35                  40                  45Arg Lys Leu Lys His His His Trp Thr Val Gly Glu Ile Phe His

             50                  55                  60Tyr Gly Phe Leu Val Ser Ile Leu Phe Phe Val Phe Val Val Phe

             65                  70                  75Pro Ala Ser Phe Phe Ile Lys Leu Pro Ile Ile Leu Ala Phe Ala

             80                  85                  90Thr Cys Phe Leu Ile Pro Leu Thr Ser Gln Phe Phe Leu Pro Ala

             95                 100                 105Leu Pro Val Phe Thr Trp Leu Ala Leu Tyr Phe Thr Cys Ala Lys

            110                 115                 120Ile Pro Gln Glu Trp Lys Pro Ala Ile Thr Val Lys Val Leu Pro

            125                 130                 135Ala Met Glu Thr Ile Leu Tyr Gly Asp Asn Leu Ser Asn Val Leu

            140                 145                 150Ala Thr Ile Thr Thr Gly Val Leu Asp Ile Leu Ala Trp Leu Pro

            155                 160                 165Tyr Gly Ile Ile His Phe Ser Phe Pro Phe Val Leu Ala Ala Ile

            170                 175                 180Ile Phe Leu Phe Gly Pro Pro Thr Ala Leu Arg Ser Phe Gly Phe

            185                 190                 195Ala Phe Gly Tyr Met Asn Leu Leu Gly Val Leu Ile Gln Met Ala

            200                 205                 210Phe Pro Ala Ala Pro Pro Trp Tyr Lys Asn Leu His Gly Leu Glu

            215                 220                 225Pro Ala Asn Tyr Ser Met His Gly Ser Pro Gly Gly Leu Gly Arg

            230                 235                 240Ile Asp Lys Leu Leu Gly Val Asp Met Tyr Thr Thr Gly Phe Ser

            245                 250                 255Asn Ser Ser Ile Ile Phe Gly Ala Phe Pro Ser Leu His Ser Gly

            260                 265                 270Cys Cys Ile Met Glu Val Leu Phe Leu Cys Trp Leu Phe Pro Arg

            275                 280                 285Phe Lys Phe Val Trp Val Thr Tyr Ala Ser Trp Leu Trp Trp Ser

            290                 295                 300Thr Met Tyr Leu Thr His His Tyr Phe Val Asp Leu Ile Gly Gly

            305                 310                 315Ala Met Leu Ser Leu Thr Val Phe Glu Phe Thr Lys Tyr Lys Tyr

            320                 325                 330Leu Pro Lys Asn Lys Glu Gly Leu Phe Cys Arg Trp Ser Tyr Thr

            335                 340                 345Glu Ile Glu Lys Ile Asp Ile Gln Glu Ile Asp Pro Leu Ser Tyr

            350                 355                 360Asn Tyr Ile Pro Val Asn Ser Asn Asp Asn Glu Ser Arg Leu Tyr

            365                 370                 375Thr Arg Val Tyr Gln Glu Ser Gln Val Ser Pro Pro Gln Arg Ala

            380                 385                 390Glu Thr Pro Glu Ala Phe Glu Met Ser Asn Phe Ser Arg Ser Arg

            395                 400                 405Gln Ser Ser Lys Thr Gln Val Pro Leu Ser Asn Leu Thr Asn Asn

            410                 415                 420Asp Gln Val Ser Gly Ile Asn Glu Glu Asp Glu Glu Glu Glu Gly

            425                 430                 435Asp Glu Ile Ser Ser Ser Thr Pro Ser Val Phe Glu Asp Glu Pro

            440                 445                 450Gln Gly Ser Thr Tyr Ala Ala Ser Ser Ala Thr Ser Val Asp Asp

            455                 460                 465Leu Asp Ser Lys Arg Asn

            470SEQ ID NO:13序列长度:22序列类型:核酸链况:单链拓扑学:线性分子类型:其它核酸(合成的DNA)序列描述    GACTATTTCA TTATGGGGCC CC 22SEQ ID NO:14序列长度:30序列类型:核酸链况:单链拓扑学:线性分子类型:其它核酸(合成的DNA)序列描述GTTAACTCGA GAAAGTGCCC ATCAGTGTTC 30SEQ ID NO:15序列长度:29序列类型:核酸链况:单链拓扑学:线性分子类型:其它核酸(合成的DNA)序列描述GTTAACGGTA CCTCATCGTT ACACCGTTC 29SEQ ID NO:16序列长度:19序列类型:核酸链况:单链    拓扑学:线性分子类型:其它核酸(合成的DNA)序列描述GCTAAACGAC AATCCTGAC 19SEQ ID NO:17序列长度:21序列类型:核酸链况:单链拓扑学:线性分子类型:其它核酸(合成的DNA)序列描述CGTTGGCCGA TTCATTAATG C 21SEQ ID NO:18序列长度:401序列类型:氨基酸链况:单链拓扑学:线性分子类型:肽序列描述Met Ala Asn Pro Phe Ser Arg Trp Phe Leu Ser Glu Arg Pro Pro  1               5                  10                  15Asn Cys His Val Ala Asp Leu Glu Thr Ser Leu Asp Pro His Gln

             20                  25                  30Thr Leu Leu Lys Val Gln Lys Tyr Lys Pro Ala Leu Ser Asp Trp

             35                  40                  45Val His Tyr Ile Phe Leu Gly Ser Ile Met Leu Phe Val Phe Ile

             50                  55                  60Thr Asn Pro Ala Pro Trp Ile Phe Lys Ile Leu Phe Tyr Cys Phe

             65                  70                  75Leu Gly Thr Leu Phe Ile Ile Pro Ala Thr Ser Gln Phe Phe Phe

             80                  85                  90Asn Ala Leu Pro Ile Leu Thr Trp Val Ala Leu Tyr Phe Thr Ser

             95                 100                 105Ser Tyr Phe Pro Asp Asp Arg Arg Pro Pro Ile Thr Val Lys Val

            110                 115                 120Leu Pro Ala Val Glu Thr Ile Leu Tyr Gly Asp Asn Leu Ser Asp

            125                 130                 135Ile Leu Ala Thr Ser Thr Asn Ser Phe Leu Asp Ile Leu Ala Trp

            140                 145                 150Leu Pro Tyr Gly Leu Phe His Phe Gly Ala Pro Phe Val Val Ala

            155                 160                 165Ala Ile Leu Phe Val Phe Gly Pro Pro Thr Val Leu Gln Gly Tyr

            170                 175                 180Ala Phe Ala Phe Gly Tyr Met Asn Leu Phe Gly Val Ile Met Gln

            185                 190                 195Asn Val Phe Pro Ala Ala Pro Pro Trp Tyr Lys Ile Leu Tyr Gly

            200                 205                 210Leu Gln Ser Ala Asn Tyr Asp Met His Gly Ser Pro Gly Gly Leu

            215                 220                 225Ala Arg Ile Asp Lys Leu Leu Gly Ile Asn Met Tyr Thr Thr Cys

            230                 235                 240Phe Ser Asn Ser Ser Val Ile Phe Gly Ala Phe Pro Ser Leu His

            245                 250                 255Ser Gly Cys Ala Thr Met Glu Ala Leu Phe Phe Cys Tyr Cys Phe

            260                 265                 270Pro Lys Leu Lys Pro Leu Phe Ile Ala Tyr Val Cys Trp Leu Trp

            275                 280                 285Trp Ser Thr Met Tyr Leu Thr His His Tyr Phe Val Asp Leu Met

            290                 295                 300Ala Gly Ser Val Leu Ser Tyr Val Ile Phe Gln Tyr Thr Lys Tyr

            305                 310                 315Thr His Leu Pro Ile Val Asp Thr Ser Leu Phe Cys Arg Trp Ser

            320                 325                 330Tyr Thr Ser Ile Glu Lys Tyr Asp Ile Ser Lys Ser Asp Pro Leu

            335                 340                 345Ala Ala Asp Ser Asn Asp Ile Glu Ser Val Pro Leu Ser Asn Leu

            350                 355                 360Glu Leu Asp Phe Asp Leu Asn Met Thr Asp Glu Pro Ser Val Ser

            365                 370                 375Pro Ser Leu Phe Asp Gly Ser Thr Ser Val Ser Arg Ser Ser Ala

            380                 385                 390Thr Ser Ile Thr Ser Leu Gly Val Lys Arg Ala

            395                 400SEQ ID NO:19序列长度:40l序列类型:氨基酸链况:单链拓扑学:线性分子类型:肽序列描述Met Ala Asn Pro Phe Ser Arg Trp Phe Leu Ser Glu Arg Pro Pro  1               5                  10                  15Asn Cys His Val Ala Asp Leu Glu Thr Ser Leu Asp Pro His Gln

             20                  25                  30Thr Leu Leu Lys Val Gln Lys Tyr Lys Pro Ala Leu Ser Asp Trp

             35                  40                  45Val His Tyr Ile Phe Leu Gly Ser Ile Met Leu Phe Val Phe Ile

             50                  55                  60Thr Asn Pro Ala Pro Trp Ile Phe Lys Ile Leu Phe Tyr Cys Phe

             65                  70                  75Leu Gly Thr Leu Phe Ile Ile Pro Ala Thr Ser Gln Phe Phe Phe

             80                  85                  90Ash Ala Leu Pro Ile Leu Thr Trp Val Ala Leu Tyr Phe Thr Ser

             95                 100                 105Ser Tyr Phe Pro Asp Asp Arg Arg Pro Pro Ile Thr Val Lys Val

            110                 115                 120Leu Pro Ala Val Glu Thr Ile Leu Tyr Gly Asp Asn Leu Ser Asp

            125                 130                 135Ile Leu Ala Thr Ser Thr Asn Ser Phe Leu Asp Ile Leu Ala Trp

            140                 145                 150Leu Pro Tyr Gly Leu Phe His Tyr Gly Ala Pro Phe Val Val Ala

            155                 160                 165Ala Ile Leu Phe Val Phe Gly Pro Pro Thr Val Leu Gln Gly Tyr

            170                 175                 180Ala Phe Ala Phe Gly Tyr Met Asn Leu Phe Gly Val Ile Met Gln

            185                 190                 195Asn Val Phe Pro Ala Ala Pro Pro Trp Tyr Lys Ile Leu Tyr Gly

            200                 205                 210Leu Gln Ser Ala Asn Tyr Asp Met His Gly Ser Pro Gly Gly Leu

            215                 220                 225Ala Arg Ile Asp Lys Leu Leu Gly Ile Asn Met Tyr Thr Thr Cys

            230                 235                 240Phe Ser Asn Ser Ser Val Ile Phe Gly Ala Phe Pro Ser Leu His

            245                 250                 255Ser Gly Cys Ala Thr Met Glu Ala Leu Phe Phe Cys Tyr Cys Phe

            260                 265                 270Pro Lys Leu Lys Pro Leu Phe Ile Ala Tyr Val Cys Trp Leu Trp

            275                 280                 285Trp Ser Thr Met Tyr Leu Thr His His Tyr Phe Val Asp Leu Met

            290                 295                 300Ala Gly Ser Val Leu Ser Tyr Val Ile Phe Gln Tyr Thr Lys Tyr

            305                 310                 315Thr His Leu Pro Ile Val Asp Thr Ser Leu Phe Cys Arg Trp Ser

            320                 325                 330Tyr Thr Ser Ile Glu Lys Tyr Asp Ile Ser Lys Ser Asp Pro Leu

            335                 340                 345Ala Ala Asp Ser Asn Asp Ile Glu Ser Val Pro Leu Ser Asn Leu

            350                 355                 360Glu Leu Asp Phe Asp Leu Asn Met Thr Asp Glu Pro Ser Val Ser

            365                 370                 375Pro Ser Leu Phe Asp Gly Ser Thr Ser Val Ser Arg Ser Ser Ala

            380                 385                 390Thr Ser Ile Thr Ser Leu Gly Val Lys Arg Ala

            395                 400SEQ ID NO:20序列长度:1206序列类型:核酸链况:双链拓扑学:线性分子类型:基因组DNA序列描述ATGGCAAACC  CTTTTTCGAG  ATGGTTTCTA  TCAGAGAGAC  CTCCAAACTG  CCATGTAGCC     60GATTTAGAAA  CAAGTTTAGA  TCCCCATCAA  ACGTTGTTGA  AGGTGCAAAA  ATACAAACCC    120GCTTTAAGCG  ACTGGGTGCA  TTACATCTTC  TTGGGATCCA  TCATGCTGTT  TGTGTTCATT    180ACTAATCCCG  CACCTTGGAT  CTTCAAGATC  CTTTTTTATT  GTTTCTTGGG  CACTTTATTC    240ATCATTCCAG  CTACGTCACA  GTTTTTCTTC  AATGCCTTGC  CCATCCTAAC  ATGGGTGGCG    300CTGTATTTCA  CTTCATCGTA  CTTTCCAGAT  GACCGCAGGC  CTCCTATTAC  TGTCAAAGTG    360TTACCAGCGG  TGGAAACAAT  TTTATACGGC  GACAATTTAA  GTGATATTCT  TGCAACATCG    420ACGAATTCCT  TTTTGGACAT  TTTAGCATGG  TTACCGTACG  GACTATTTCA  TTTTGGGGCC    480CCATTTGTCG  TTGCTGCCAT  CTTATTCGTA  TTTGGTCCAC  CAACTGTTTT  GCAAGGTTAT    540GCTTTTGCAT  TTGGTTATAT  GAACCTGTTT  GGTGTTATCA  TGCAAAATGT  CTTTCCAGCC    600GCTCCCCCAT  GGTATAAAAT  TCTCTATGGA  TTGCAATCAG  CCAACTATGA  TATGCATGGC    660TCGCCTGGTG  GATTAGCTAG  AATTGATAAG  CTACTCGGTA  TTAATATGTA  TACTACATGT    720TTTTCAAATT  CCTCCGTCAT  TTTCGGTGCT  TTTCCTTCAC  TGCATTCCGG  GTGTGCTACT    780ATGGAAGCCC  TGTTTTTCTG  TTATTGTTTT  CCAAAATTGA  AGCCCTTGTT  TATTGCTTAT    840GTTTGCTGGT  TATGGTGGTC  AACTATGTAT  CTGACACACC  ATTATTTTGT  AGACCTTATG    900GCAGGTTCTG  TGCTGTCATA  CGTTATTTTC  CAGTACACAA  AGTACACACA  TTTACCAATT    960GTAGATACAT  CTCTTTTTTG  CAGATGGTCA  TACACTTCAA  TTGAGAAATA  CGATATATCA   1020AAGAGTGATC  CATTGGCTGC  AGATTCAAAC  GATATCGAAA  GTGTCCCTTT  GTCCAACTTG   1080GAACTTGACT  TTGATCTTAA  TATGACTGAT  GAACCCAGTG  TAAGCCCTTC  GTTATTTGAT   1140GGATCTACTT  CTGTTTCTCG  TTCGTCCGCC  ACGTCTATAA  CGTCACTAGG  TGTAAAGAGG   1200GCTTAA                                                                   1206SEQ ID NO:21序列长度:1206序列类型:核酸链况:双链拓扑学:线性分子类型:基因组DNA序列描述ATGGCAAACC  CTTTTTCGAG  ATGGTTTCTA  TCAGAGAGAC  CTCCAAACTG  CCATGTAGCC     60GATTTAGAAA  CAAGTTTAGA  TCCCCATCAA  ACGTTGTTGA  AGGTGCAAAA  ATACAAACCC    120GCTTTAAGCG  ACTGGGTGCA  TTACATCTTC  TTGGGATCCA  TCATGCTGTT  TGTGTTCATT    180ACTAATCCCG  CACCTTGGAT  CTTCAAGATC  CTTTTTTATT  GTTTCTTGGG  CACTTTATTC    240ATCATTCCAG  CTACGTCACA  GTTTTTCTTC  AATGCCTTGC  CCATCCTAAC  ATGGGTGGCG    300CTGTATTTCA  CTTCATCGTA  CTTTCCAGAT  GACCGCAGGC  CTCCTATTAC  TGTCAAAGTG    360TTACCAGCGG  TGGAAACAAT  TTTATACGGC  GACAATTTAA  GTGATATTCT  TGCAACATCG    420ACGAATTCCT  TTTTGGACAT  TTTAGCATGG  TTACCGTACG  GACTATTTCA  TTATGGGGCC    480CCATTTGTCG  TTGCTGCCAT  CTTATTCGTA  TTTGGTCCAC  CAACTGTTTT  GCAAGGTTAT    540GCTTTTGCAT  TTGGTTATAT  GAACCTGTTT  GGTGTTATCA  TGCAAAATGT  CTTTCCAGCC    600GCTCCCCCAT  GGTATAAAAT  TCTCTATGGA  TTGCAATCAG  CCAACTATGA  TATGCATGGC    660TCGCCTGGTG  GATTAGCTAG  AATTGATAAG  CTACTCGGTA  TTAATATGTA  TACTACATGT    720TTTTCAAATT  CCTCCGTCAT  TTTCGGTGCT  TTTCCTTCAC  TGCATTCCGG  GTGTGCTACT    780ATGGAAGCCC  TGTTTTTCTG  TTATTGTTTT  CCAAAATTGA  AGCCCTTGTT  TATTGCTTAT    840GTTTGCTGGT  TATGGTGGTC  AACTATGTAT  CTGACACACC  ATTATTTTGT  AGACCTTATG    900GCAGGTTCTG  TGCTGTCATA  CGTTATTTTC  CAGTACACAA  AGTACACACA  TTTACCAATT    960GTAGATACAT  CTCTTTTTTG  CAGATGGTCA  TACACTTCAA  TTGAGAAATA  CGATATATCA   1020AAGAGTGATC  CATTGGCTGC  AGATTCAAAC  GATATCGAAA  GTGTCCCTTT  GTCCAACTTG   1080GAACTTGACT  TTGATCTTAA  TATGACTGAT  GAACCCAGTG  TAAGCCCTTC  GTTATTTGAT   1140GGATCTACTT  CTGTTTCTCG  TTCGTCCGCC  ACGTCTATAA  CGTCACTAGG  TGTAAAGAGG   1200GCTTAA                                                                   1206SEQ ID NO:22序列长度:1206序列类型:核酸链况:双链拓扑学:线性分子类型:基因组DNA序列描述ATGGCAAACC  CTTTTTCGAG  ATGGTTTCTA  TCAGAGAGAC  CTCCAAACTG  CCATGTAGCC     60GATTTAGAAA  CAAGTTTAGA  TCCCCATCAA  ACGTTGTTGA  AGGTGCAAAA  ATACAAACCC    120GCTTTAAGCG  ACTGGGTGCA  TTACATCTTC  TTGGGATCCA  TCATGCTGTT  TGTGTTCATT    180ACTAATCCCG  CACCTTGGAT  CTTCAAGATC  CTTTTTTATT  GTTTCTTGGG  CACTTTATTC    240ATCATTCCAG  CTACGTCACA  GTTTTTCTTC  AATGCCTTGC  CCATCCTAAC  ATGGGTGGCG    300CTGTATTTCA  CTTCATCGTA  CTTTCCAGAT  GACCGCAGGC  CTCCTATTAC  TGTCAAAGTG    360TTACCAGCGG  TGGAAACAAT  TTTATACGGC  GACAATTTAA  GTGATATTCT  TGCAACATCG    420ACGAATTCCT  TTTTGGACAT  TTTAGCATGG  TTACCGTACG  GACTATTTCA  TTATGGGGCC    480CCATTTGTCG  TTGCTGCCAT  CTTATTCGTA  TTTGGTCCAC  CAACTGTTTT  GCAAGGTTAT    540GCTTTTGCAT  TTGGTTATAT  GAACCTGTTT  GGTGTTATCA  TGCAAAATGT  CTTTCCAGCC    600GCTCCCCCAT  GGTATAAAAT  TCTCTATGGA  TTGCAATCAG  CCAACTATGA  TATGCATGGC    660TCGCCTGGTG  GATTAGCTAG  AATTGATAAG  CTACTCGGTA  TTAATATGTA  TACTACAGCT    720TTTTCAAATT  CCTCCGTCAT  TTTCGGTGCT  TTTCCTTCAC  TGCATTCCGG  GTGTGCTACT    780ATGGAAGCCC  TGTTTTTCTG  TTATTGTTTT  CCAAAATTGA  AGCCCTTGTT  TATTGCTTAT    840GTTTGCTGGT  TATGGTGGTC  AACTATGTAT  CTGACACACC  ATTATTTTGT  AGACCTTATG    900GCAGGTTCTG  TGCTGTCATA  CGTTATTTTC  CAGTACACAA  AGTACACACA  TTTACCAATT    960GTAGATACAT  CTCTTTTTTG  CAGATGGTCA  TACACTTCAA  TTGAGAAATA  CGATATATCA   1020AAGAGTGATC  CATTGGCTGC  AGATTCAAAC  GATATCGAAA  GTGTCCCTTT  GTCCAACTTG   1080GAACTTGACT  TTGATCTTAA  TATGACTGAT  GAACCCAGTG  TAAGCCCTTC  GTTATTTGAT   1140GGATCTACTT  CTGTTTCTCG  TTCGTCCGCC  ACGTCTATAA  CGTCACTAGG  TGTAAAGAGG   1200GCTTAA                                                                   1206SEQ ID NO:23序列长度:1206序列类型:核酸链况:双链拓扑学:线性分子类型:基因组DNA序列描述ATGGCAAACC  CTTTTTCGAG  ATGGTTTCTA  TCAGAGAGAC  CTCCAAACTG  CCATGTAGCC      60GATTTAGAAA  CAAGTTTAGA  TCCCCATCAA  ACGTTGTTGA  AGGTGCAAAA  ATACAAACCC     120GCTTTAAGCG  ACTGGGTGCA  TTACATCTTC  TTGGGATCCA  TCATGCTGTT  TGTGTTCATT     180ACTAATCCCG  CACCTTGGAT  CTTCAAGATC  CTTTTTTATT  GTTTCTTGGG  CACTTTATTC     240ATCATTCCAG  CTACGTCACA  GTTTTTCTTC  AATGCCTTGC  CCATCCTAAC  ATGGGTGGCG     300CTGTATTTCA  CTTCATCGTA  CTTTCCAGAT  GACCGCAGGC  CTCCTATTAC  TGTCAAAGTG     360TTACCAGCGG  TGGAAACAAT  TTTATACGGC  GACAATTTAA  GTGATATTCT  TGCAACATCG     420ACGAATTCCT  TTTTGGACAT  TTTAGCATGG  TTACCGTACG  GACTATTTCA  TTTTGGGGCC     480CCATTTGTCG  TTGCTGCCAT  CTTATTCGTA  TTTGGTCCAC  CAACTGTTTT  GCAAGGTTAT     540GCTTTTGCAT  TTGGTTATAT  GAACCTGTTT  GGTGTTATCA  TGCAAAATGT  CTTTCCAGCC     600GCTCCCCCAT  GGTATAAAAT  TCTCTATGGA  TTGCAATCAG  CCAACTATGA  TATGCATGGC     660TCGCCTGGTG  GATTAGCTAG  AATTGATAAG  CTACTCGGTA  TTAATATGTA  TACTACAGCT     720TTTTCAAATT  CCTCCGTCAT  TTTCGGTGCT  TTTCCTTCAC  TGCATTCCGG  GTGTGCTACT     780ATGGAAGCCC  TGTTTTTCTG  TTATTGTTTT  CCAAAATTGA  AGCCCTTGTT  TATTGCTTAT     840GTTTGCTGGT  TATGGTGGTC  AACTATGTAT  CTGACACACC  ATTATTTTGT  AGACCTTATG     900GCAGGTTCTG  TGCTGTCATA  CGTTATTTTC  CAGTACACAA  AGTACACACA  TTTACCAATT     960GTAGATACAT  CTCTTTTTTG  CAGATGGTCA  TACACTTCAA  TTGAGAAATA  CGATATATCA    1020AAGAGTGATC  CATTGGCTGC  AGATTCAAAC  GATATCGAAA  GTGTCCCTTT  GTCCAACTTG    1080GAACTTGACT  TTGATCTTAA  TATGACTGAT  GAACCCAGTG  TAAGCCCTTC  GTTATTTGAT    1140GGATCTACTT  CTGTTTCTCG  TTCGTCCGCC  ACGTCTATAA  CGTCACTAGG  TGTAAAGAGG    1200GCTTAA                                                                    1206SEQ ID NO:24序列长度:30序列类型:核酸链况:单链拓扑学:线性分子类型:其它核酸(合成的DNA)SEQUENCE DESCRIPTION:AATATGTATA CTACATGTTT TTCAAATTCC 30SEQ ID NO:25序列长度:30序列类型:核酸链况:单链拓扑学:线性分子类型:其它核酸(合成的DNA)序列描述GTTAACTCGA GAAAGTGCCC ATCAGTGTTC 30SEQ ID NO:26序列长度:29序列类型:核酸链况:单链拓扑学:线性分子类型:其它核酸(合成的DNA)序列描述GTTAACGGTA CCAGAGGAAA GAATAACGC 29

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号