法律状态公告日
法律状态信息
法律状态
2015-08-26
未缴年费专利权终止 IPC(主分类):C12N15/31 授权公告日:20070117 终止日期:20140628 申请日:19950628
专利权的终止
2007-01-17
授权
授权
2004-09-22
专利申请权、专利权的转移专利申请权的转移 变更前: 变更后: 登记生效日:20040820 申请日:19950628
专利申请权、专利权的转移专利申请权的转移
1996-10-09
实质审查请求的生效
实质审查请求的生效
1996-05-15
公开
公开
本发明涉及调控对抗霉菌性金黄担子菌素(Aureobasidin)敏感性的蛋白质,以及编码这种蛋白质的基团,即编码调控金黄担子菌素的蛋白质的基团。本发明进一步涉及该蛋白质和基因的一系列应用。另外,本发明还涉及抗该蛋白质的抗体及其应用。
人们已经熟知许多将有用基因引入实验室中所使用的单倍体真菌细胞的技术,真菌细胞例如酿酒酵母、粟酒裂殖酵母和构巢曲霉。由于将质粒DNA掺入及固定于真菌细胞的工作很难获得成功,就需要在转化体鉴定中使用选择性标记。在最常见的情况下,可通过把营养缺陷型突变引入宿主细胞来实现这种选择。酿酒酵母中通常使用的突变实例包括ura2、leu2、trp1和his3。一种质粒携带着这些基因之一的野生型样板。由于质粒上的野生型样板对宿主染色体等位基因是显性的,具有所引入质粒的细胞能在基本培养基中进行筛选,这种培养基不合有营养缺陷型宿主细胞所需要的营养。有关转化体筛选中药物抗性的应用,已有一些公开发表的报告,不过数量不多。也就是说,有些文献已对复制载体和染色体整合载体做过记述,这些载体含有对新霉素同系物G418、潮霉素和变蓝菌素等抗生素具有抗性的基因。复制载体具有在细胞中发挥作用的DNA复制起点。这种质粒作为一种环状游离基因被保持在染色体之外并随着细胞的增殖以百分之几的比率不断减少。整合载体被插入宿主细胞的染色体中,因而保持稳定状态。这样就不必在培养基中再加入药物以发挥保持载体序列的选择功能。
就工业用真菌而言,需要以稳定状态保持已赋予真菌的有用特性。染色体整合载体对实现这一目的是有用的。
真菌已广泛应用于诸如米酒、啤酒和葡萄酒的制酒上以及诸如酱(发酵的大豆糊)和酱油的发酵食品上。对于培养这些用于工业目的的真菌而言,为了赋予其有用的特性,遗传工程技术也是非常有效的。这样就需要有选择性标记物,其可以用于高效率筛选转化体。工业用酵母通常都是双倍或多倍体细胞。因此很难将一种营养缺陷型标记物(该标记物在单倍体细胞,例如实验室中使用的酵母的单倍体细胞中是有效的)引入这些工业用酵母中。除此之外,由于诱变很有可能引起其它基因的突变,因此,很难得到只具有引入的所需营养缺陷型突变的突变体。药物抗性的利用使筛选任意酵母的稳定转变体成为可能,而不管染色体数目为多少或特异性突变是否发生。不过,这些工业用真菌中的许多菌株都对抗生素(如G—418和潮霉素)不敏感,这就不可能利用抗这些抗生素的基因。而且,这些抗性基因都是来自原核生物细菌的基因或蛋白质,与这些基因相应的基因在诸如酵母的真菌中根本不存在。具有这些整合的外来基因的真菌细胞的应用受到严格限制。源于酿酒酵母的变蓝菌素抗性基因(PDR4)可用于酿酒酵母(包括酿造酵母)的转化。然而,它除了带来对变蓝菌素的抗性也带来了对药物的抗性,这在实际使用中可能会发生一些问题。因此,PDR4根本无法满足今后培养具有改良特性的工业用真菌(包括酿酒酵母)的需要。这样就需要利用真菌本身所携带的基因来开发抗药性标记物。
本发明旨在鉴别一种用来编码调控对抗霉菌性金黄担子菌素之敏感性的蛋白质的基因;提供一种调控对由此基因编码的金黄担子菌素之敏感性的蛋白质;提供一种能与此基因杂交的核酸探针;提供一种利用该基因生产调控对金黄担子菌素之敏感性的蛋白质的方法,诸此等等。
在这些情况下,本发明还旨在提供一种新型染色体整合载体,其能够赋予真菌转化体一种具有新的药物抗性的选择性标记,以及一种由该载体转化的转化体。
再者,本发明还旨在提供一种蛋白质,其可以充当真菌遗传工程中使用的一种选择性标记物,可以产生对金黄担子菌素的抗性,以及一种编码这种蛋白质的DNA。
本发明可综述如下:本发明的第1项发明涉及一种编码调控金黄担子菌素敏感性的蛋白质的隔离基因,即一种调控金黄担子菌素敏感性的基因。第2项发明涉及一种克隆调控金黄担子菌素敏感性的基因的方法,其特征在于通过使用第1项发明的调控金黄担子菌素敏感性的基因或其一部分作为探针。第3项发明涉及一种核酸探针,其可以与调控金黄担子菌素敏感性之基因进行杂交,包括由15或15以上个碱基组成的序列。第4项发明涉及一重组质粒,其内含有一种可调控金黄担子菌素敏感性的基因。第5项发明涉及一种具有引入的上述质粒的转化体。
第6项发明涉及宿主真菌的染色体整合载体,其特征在于含有金黄担子菌素抗性基因。这种染色体整合载体有时含有一外来基因。第7项发明涉及一种生产金黄担子菌素抗性转化体的方法,其特征在于包括:
(1)获得含有金黄担子菌素抗性基因的复制载体的步骤,
(2)在上述步骤所得到的复制载体中的某一部位切割金黄担子菌素抗性基因以得到宿主真菌的染色体整合载体的步骤,
(3)将上述步骤中得到的宿主真菌染色体整合载体整合到宿主真菌染色体中的步骤,
(4)选择宿主的步骤,该宿主在金黄担子菌素存在下已转变为金黄担子菌素抗性宿主。
在这种生产金黄担子菌素抗性转化体的方法中,复制载体有时含有一外来基因。第8项发明涉及一种转化体,其特征在于该转化体是用第7项发明的方法得到的。
第9项发明涉及一种利用第5项发明的转化体生产调控金黄担子菌素敏感性之蛋白质的方法。第10项发明涉及一种调控金黄担子菌素敏感性的蛋白质。
第11项发明涉及一种能够产生金黄担子菌素抗性的蛋白质,其中,在以序列目录中SEQ ID NO.8表示的能产生金黄担子菌素敏感性的蛋白质中,至少第240氨基酸残基丙氨酸(Ala)已被另一个氨基酸残基所置换,或者涉及另一种能产生金黄担子菌素抗性的蛋白质,其具有通过对上述蛋白质进行至少一种选自氨基酸残基的置换、插入和缺失的修饰而得到的氨基酸序列,其生物学活性与上述蛋白质的生物学活性相似。第12项发明涉及一种DNA,其用来编码第11项发明的能够产生金黄担子菌素抗性之蛋白质。
金黄担子菌素[日本专利公开NO.138296(1990,NO.22995/1991,NO.220199/1991)和NO.279384/1993,日本专利申请NO.303177/1992,J.Antibiotics,44(9),919—924,ibid.,44(9),925—933,ibid,44(11),1187—1198(1991)]是一种环状缩肽类,作为出芽短梗孢NO.R106(FERM BP—1938)菌株的发酵产物而得到。它与其它抗霉菌素的结构完全不同。如表1和表2所示,典型金黄担子菌素化合物金黄担子菌素A对假丝酵母属的多种酵母(包括白假丝酵母)、新型隐球酵母、荚膜组织孢桨菌、皮炎类芽生菌和曲霉属真菌(日本专利公开NO.138296/1990)具有强有效的抗霉菌的活性,但是对哺乳动物却只有极低的毒性。这样,这种化合物在选择性毒性方面是一种优异的抗霉菌剂。
表1
表2
本发明人以前就曾发现,诸如粟酒裂殖酵母和酿酒酵母的真菌表现出对金黄担子菌素的敏感性。
表3
本发明人对粟酒裂殖酵母或酿酒酵母野生型菌株(这两种菌株对金黄担子菌素具有敏感性)进行了诱变处理,得到了抗性突变体。我们进一步从这些抗性突变体中成功地分离出能够产生金黄担子菌素抗性的基因(抗性基因),并从相应的敏感性细胞中分离出能够产生金黄担子菌素敏感性的另一种基因(敏感性基因)。另外,我们还揭示出由这些基因的每一种所编码的蛋白质的存在。本发明人还通过制备含有这种基因的复制载体并培养用该载体转化的细胞成功地表达了这种基因。使用这种基因的DNA片段作为探针,本发明人进而成功地发现了一种新的基因,该基因可调控对金黄担子菌素敏感的另一种真菌的金黄担子菌素敏感性。
表1和表2列举的具有金黄担子菌素敏感性的真菌和表3列举的真菌各自携带调控金黄担子菌素敏感性的蛋白质和编码该蛋白质的基因。本文中所用的术语“调控金黄担子菌素敏感性的蛋白质”是指对金黄担子菌素具有敏感性的真菌中所含有的一种蛋白质。这种蛋白质用来表达对金黄担子菌素的敏感性或抗性。当然,与上述蛋白质具有35%或更多同源性并具有相似功能的蛋白质也是调控金黄担子菌素敏感性之蛋白质中的一种。此外,通过用遗传工程方法修饰这些蛋白质而得到的蛋白质是调控金黄担子菌素敏感性的成员。调控金黄担子菌素敏感性的基因是指编码这种调控金黄担子菌素敏感性之蛋白质的基因(如上所述),同时涉及敏感性基因和抗性基因。
为了分离调控金黄担子菌素敏感性的基因,首先要对金黄担子菌素敏感性细胞(一野生菌株)进行诱变处理,以从中获得一抗性菌株。下一步,由该抗性菌株的染色体DNA或cDNA制备DNA库,对该库中能够产生抗性的基因(抗性基因)进行克隆。另外,通过制备野生菌株的DNA库,从该库中分离出能与抗性基因杂交的DNA分子并进行克隆可以分离出敏感性基因。
可利用化学品,如甲磺酸乙酯(EMS)或N—甲基—N’—硝基—N—亚硝基胍(MNNG)处理或通过紫外或其它辐射进行诱变。通过在适宜培养条件下在含有适当浓度的金黄担子菌素的营养培养基中对诱变细胞进行培养,对已获得抗性的细胞进行筛选。这样得到的抗性菌株可能因用于诱变所选择的方法和条件而有所不同。
aur1基因可以作为本发明的调控金黄担子菌素敏感性之基因(名命为aur)的典型例子。aur1基因的典型例子包括分离自粟酒裂殖酵母的spaur1基因和分离自酿酒酵母的scaur1基因。spaur1基因可使用商业上可得到的粟酒裂殖酵母,例如粟酒裂殖酵母ATCC24843,ATCC24844,ATCC24969,ATCC24970和ATCC24971(可购自美国典型培养物保藏中心),并按照本说明书所阐述的程序而获得。另外,scaur1基因可通过商业上可得到的酿酒酵母,例如酿酒酵母ATCC26235、ATCC26236、ATCC26237、ATCC32689、ATCC32690(可购自美国典型培养物保藏中心),并按照本说明书所阐述的程序而获得。下面将描述本发明人分离自抗性突变体的抗性基因(spaur1R和scaur1R)和分离自敏感性野生型菌株的敏感性基因(spau-r1S和scaur1S)。
图3显示出调控金黄担子菌素敏感性的基因spaur1R和spaur1S的限制性酶图谱,图4显示出scaur1R和scaur1S的限制性酶图谱。
用甲磺酸乙酯诱变对金黄担子菌素敏感的粟酒裂殖酵母并制备所得抗性菌株的基因组库。从这个库中,分离出含有抗性基因(spau-r1R)和具有图3所示的限制性酶图谱的DNA片段。该基因具有以序列目录中SEQ ID NO.1表示的核苷酸序列。由该基因编码的蛋白质的氨基酸序列(根据该核苷酸序列推测)是以序列目录中SEQ IDNO.2表示的序列。通过用该抗性基因作为探针进行杂交,从敏感性菌株中分离出含有敏感性基因(spaur1S)和具有图3所示的限制性酶图谱的DNA片段。该基因具有以序列目录中SEQ ID NO.3表示的核苷酸序列。由该基因编码的蛋白质的氨基酸序列(根据该核苷酸序列推测)是以序列目录中SEQ ID NO.4表示的序列。SEQ ID NO.3和SEQ ID NO.4之序列间的比较表明从G到T的突变发生在第1053位的碱基上,而SEQ ID NO.4和SEQ ID NO.2之序列间的比较则表明在氨基酸水平上第240位的甘氨酸残基转变为半胱氨酸,由此产生了抗性。
另外,用甲磺酸乙酯诱变对金黄担子菌素敏感的酿酒酵母并制备抗性菌株的基因组库。分离出含有作为显性突变体的抗性基因(scaur1S)和具有图4所示的限制性酶图谱的DNA片段。
scaur1R基因之蛋白质的编码区的核苷酸序列是以序列目录中SEQ ID NO.5表示的序列。由该基因编码的蛋白质氨基酸序列(根据以上核苷酸序列推测)是以序列目录中SEQ ID NO.6表示的序列。通过用该抗性基因scaur1R作为探针进行杂交,从敏感性菌株中分离出含有敏感性基因(scaur1S)和具有图4所示的限制性酶图谱的DNA片段。该基因具有以序列目录中SEQ IDNO.7表示的核苷酸序列。由该基因编码的蛋白质的氨基酸序列(根据该核苷酸序列推测)是以序列目录中SEQ ID NO.8表示的序列。SEQ ID NO.7和SEQ IDNO.5之序列间的比较表明T到A的突变发生在第852位的碱基上,而SEQ ID NO.8和SEQ ID NO.6之序列间的比较则表明在氨基酸水平上第158位的苯丙氨酸残基转变为酪氨酸,由此产生了抗性。在氨基酸水平上spaur1基因与scaur1基因具有58%的同源性。显然,它们是编码具有彼此间相似功能的蛋白质的基因。当从资料库中查寻与spaur1和scaur1基因及由此编码的蛋白质具有序列同源性的基因和蛋白质时,没有发现有达到或超过35%的同源性。因此,显然这些基因和由此编码的蛋白质是迄今人们尚不了解的一些新型分子。
下一步,根据SEQ ID NO.1所示spaur1R基因的DNA碱基序列合成出序列目录中SEQ ID NO.9及NO.10所示的一对引物。利用这些引物,用致病性真菌白假丝酵母的cDNA作为模板进行聚合酶链反应(RCR)。将由此得到的RCR产物在琼脂糖凝胶上进行电泳,并用溴化乙锭染色以证实DNA片段的特异性扩增。
利用由此得到的DNA片段作为探针,对白假丝酵母基因组DNA库进行筛选。由此得到含基因(caaur1)的DNA分子,其功能与spaur1和scaur1基因的功能相似,其限制性酶图谱如图5所示。该caaur1基因的碱基序列是序列目录中SEQ ID NO.11所示的序列。由该基因编码的蛋白质之氨基酸序列(根据其碱基序列推测)是序列目录中SEQ ID NO.12所示的序列。这种蛋白质与由spaur1和scaur1基因编码的蛋白质具有高度同源性。caaur1基因可利用商业上可得到的白假丝酵母,如白假丝酵母ATCC752,ATCC753,ATCC2091、ATCC14053、ATCC18527(可购自美国典型培养物保藏中心)并按照本说明书所阐述的程序而得到。
上述例子清楚地表明,可使用对金黄担子菌素具有敏感性的生物作为起始材料并且按照上述方法进行各种诱变和/或筛选处理而实现克隆。分离出调控相应于每种生物或每种方法的金黄担子菌素敏感性的基因。而且,可以分离出能与这些基因杂交的基因。当然,通过用化学、物理或遗传工程技术部分改变以上所得到的能调控金黄担子菌素敏感性的基因有可能制备出修饰基因。
在本发明中,金黄担子菌素抗性基因是指这样一种基因,当整合到宿主真菌中时,它能产生对抗霉菌性金黄担子菌素的抗性。该基因用来编码具有金黄担子菌素抗性的蛋白质。
上述spaur1R和scaur1R就是金黄担子菌素基因的典型例证。这样的基因显性作用,由该基因获得的抗性对金黄担子菌素具有选择性。这就是说,它不会引起对其它药物敏感性方面的显著变化。
金黄担子菌素抗性基因也包括这样一些基因,它们可与spaur1R和scaur1R杂交,并赋予宿主真菌金黄担子菌素抗性(例如,用化学、酶、物理或遗传工程技术部分改变spaur1R或scaur1R基因而制备的基因)。
另外,金黄担子菌素抗性基因也包括编码蛋白质的基因,该蛋白质具有通过对能产生金黄担子菌素抗性的蛋白质(Aur 1Rp)进行选自氨基酸残基的置换、插入或缺失的至少一种修饰而获得的氨基酸序列并且表现出产生金黄担子菌素抗性的活性。
Aur 1Rp的氨基酸残基的置换、插入和缺失是通过位点特异性诱变来实现的。编码隔离的AurIRp的DNA和编码能够产生金黄担子菌素敏感性之蛋白质的DNA可以通过实现核苷酸的置换、插入和缺失的至少一种而容易地得到修饰,从而得到编码AurIRp突变体的DNA。关于氨基酸残基的置换、插入和缺失,氨基酸的转化基于可在不损害生物学活性的前提下用遗传工程技术实现的转化。为了在特异性位点上对残基适当地进行突变,可对靶密码子进行随机诱变,而具有所需活性的突变体可从所表达的众多突变体中筛选出来。通过插入得到的突变体涉及一种融合蛋白质,其中AurIRp或其片段在Aur1Rp氨基末端和/或羧基末端上通过肽键与另一种蛋白质或多肽或其片段结合。为了删掉氨基酸残基,也可利用缺口双螺旋法用终止密码子置换氨基酸序列中的任意氨基酸密码子,以从氨基酸序列中删掉所置换的氨基酸残基羧基末端侧的区域。另外,编码蛋白质的DNA(其中任意长度的氨基末端和/或羧基末端区域已被删掉)可通过缺失方法(包括降解与氨基酸序列的氨基末端和/或羧基末端相对应区域的编码DNA)而得到[基因,33,103—119(1985)],或者通过利用含有起始密码子和/或终止密码子的引物之PCR法而得到。位点特异性诱变的已知实例包括使用寡核苷酸的缺口双螺旋法[酶学方法,154,350—367(1987)],使用寡核苷酸的尿嘧啶DNA法[酶学方法,154,367—382(1987)],亚硝酸突变法[Proc.Natl.Acad.Sci.USA.79,7258—7262(1982)]以及暗盒突变法[基因,34,315—323(1985)]。
本发明人已发现,可用另一氨基酸残基置换第240丙氨酸残基而使序列目录中SEQ ID NO.8所示的Aur1Sp转变为Aur1Rp,从而完成了第11和12项发明。
第11项发明的Aur1Rp是这样的,其中序列目录中SEQ IDNO.8所示的Aur1SP第240丙氨酸残基已被另一氨基酸残基所置换。只要生物学活性不遭受损坏,其它氨基酸残基也可用化学、物理或遗传工程技术予以置换、插入或删除。利用编码序列目录中SEQID NO.23所示的Aur1SP的DNA,通过遗传工程技术可适当地制备出第11项发明的Aur1Rp。测度金黄担子菌素敏感性细胞转变为抗性细胞之活性,可以测定Aur1Rp的生物学活性。与序列目录中SEQ IDNO.6所示的Aur1Rp相比第11项发明的Aur1Rp是金黄担子菌素敏感性细胞转变为抗性细胞之活性得以增强的Aur1Rp。
与序列目录中SEQ ID NO.6所示Aur1PR相比,优选的Aur1Rp是金黄担子菌素敏感性细胞转变为抗性细胞之活性得以增强的Aur1Rp。编码该Aur1Rp的DNA可适当用于本发明。
在Aur1Rp的更优选实例中,可通过用半胱氨酸置换第240丙氨酸残基而获得一突变体。一例这种突变体的氨基酸序列如序列目录中SEQ ID NO.18所示。此突变体被称为Aur1Rp(A240C)。也有可能得到一突变体,其中Aur1SP的第158苯丙氨酸残基和第240丙氨酸残基已分别被酪氨酸和半胱氨酸所置换。此突变体的氨基酸序列如序列目录中SEQ ID NO.19所示。该突变体被称为Aur1Rp(F158Y,A240C)。与序列目录中SEQ ID NO.16所示蛋白质[Aur1Rp(F158Y)]相比,这些突变体各自具有产生金黄担子菌素抗性的更强能力,其中Aur1SP第158苯丙氨酸残基已被酪氨酸所置换。
本发明所使用的金黄担子菌素抗性基因可由序列目录中SEQID NO.20—22所示的DNA来例证。序列目录中SEQ ID NO.22所示的DNA是编码Aur1Rp(F158Y)的基因,序列目录中SEQ ID NO.20所示的DNA是编码Aur1Rp(A240C)的基因,序列目录中SEQ IDNO.21所示的DNA是编码Aur1Rp(F158Y,A240C)的基因。
可通过将编码调控金黄担子菌素敏感性的蛋白质之基因整合到适宜的载体中制备出一复制质粒。例如,通过将金黄担子菌素抗性基因整合到适宜的酵母载体中制备的质粒作为选择性标记基因是极为有用的,因为可根据使用金黄担子菌素的药物抗性很容易地选择出转化体。作为酵母的载体,可选用YRP、YCP、YEP和YIP类型的载体。
另外,复制质粒可由诸如大肠杆菌稳定地携带。其中可使用的载体实例包括pUC118、pWH5、pAU—PS、Traplex119和pTV118。具有整合的scaur1S基因的pAU—PS被命名为pSPAR1。具有整合的spaur1S基因的pWH5被命名为pSCAR1。具有整合的caaur1基因的Traplex119载体被命名为pCAAR1。这些重组质粒的每一种被转化到大肠杆菌中。也有可能在适宜的宿主中表达这些质粒。这种基因专一性地简化为开放解读密码(ORF),ORF通过用适宜的限制性酶切割而转译为蛋白质,如果需要的话,再与一适宜的载体结合。这样就能得到一表达重组质粒。当使用大肠杆菌作为宿主时,诸如pTV118的质粒可用作表达质粒的载体。当使用酵母作为宿主时,诸如pYES2的质粒可用作载体。由具有整合的scaur1S基因的pSPAR1转化的大肠杆菌JM109已被命名为大肠杆菌JM109/pSPAR1并按照布达佩斯条约贮藏于工业科学技术院生物科学及人类技术国立研究所中(1—3,Higashi 1 chome Tsukuba—shi Ibaraki—Ken 305,日本),注册号为FERM—BP—4485。由具有整合的spaur1S基因的pSCAR1转化的大肠杆菌HB101已被命名为大肠杆菌HB101/pSCAR1并按照布达佩斯条约贮藏于工业科学技术院生物科学及人类技术国立研究所中,注册号为FERM BP—4483。由具有整合入caaur1S基因的pCCAR1转化的大肠杆菌HB101已被命名为大肠杆菌HB101/pCAAR1并按照布达佩斯条约贮藏于工业科学技术院生物科学及人类技术国立研究所中,注册号为FERM BP—4482。
如前所述使用公知和商业上可得到的微生物菌株并按照本说明书中阐述的程序,本领域技术人员可以很容易地制备出本发明的调控金黄担子菌素敏感性的基因。因此并不一定要贮藏这些基因本身,进行贮藏只是出于谨慎的原因。
含有本发明的金黄担子菌素抗性基因的整合载体是一种线性载体,其通常可通过将含有金黄担子菌素抗性基因的复制质粒切割成线性形态而制得。复制质粒的切点将在下文中描述。
图1表示染色体整合载体中的金黄担子菌素抗性基因与宿主染色体(其与金黄担子菌素敏感性基因具有同源性)发生同源性重组,由此金黄担子菌素敏感性细胞转变为金黄担子菌素抗性细胞的过程。借助适宜的限制性酶,含有金黄担子菌素抗性基因的复制质粒在金黄担子菌素抗性基因序列中的某一位置被切割成线性形态。这样线性化的载体与宿主染色体中的金黄担子菌素敏感性基因(其具有同源性)发生同源性重组。这样,金黄担子菌素抗性被传递给宿主细胞。当复制质粒含有一外来基因时,则金黄担子菌素抗性和外来基因都被传递给宿主细胞。例如,可以制备出用于制备线性载体的复制载体pAUR1aare,其含有日本专利公开NO.254680/1991中所描述的scaur1R和人类酰基氨基酸释放酶(AARE)。具有所引入的该载体的大肠杆菌JM109菌株被命名为大肠杆菌JM109/pAUR1aare并已贮藏于工业科学技术院生物科学及人类技术国立研究所中,注册号为FERM P—14366。为了使复制载体线性化,可有效地利用限制性酶切割位点,其在靶外来基因部分和金黄担子菌素抗性基因中都存在。例如,就源于酿酒酵母的scaur1R和源于粟酒裂殖酵母的spaur1R而言,通常可分别使用StuI等和BalII等的限制性酶位点。
在优选的形态中,本发明的载体可含有金黄担子菌素基因和外来基因,而源于复制载体的其它基因可被从中删掉。可根据宿主的特性选择用于表达金黄担子菌素抗性基因和外来基因的启动子、终止区等。当然,序列目录中SEQ ID NO.1和NO.5所示DNA启动子部分可用作表达金黄担子菌素抗性基因功能的启动子。对于酿酒酵母来说,可以利用例如乙醇脱氢酶基因(ADH1)和甘油醛—3—磷酸脱氢酶基因(GPD)的启动子和细胞色素C1基因(CYC1)的终止区。这些启动子和终止区与表达金黄担子菌素抗性基因的启动子和终止区可能不同。
在本发明中,术语“外来基因”是指对宿主真菌细胞而言为外来性的基因,即异源基因。其实例包括非真菌基因、修饰基因,与宿主不同的真菌种类基因和自我克隆基因。更具体地说,参与发酵、耐醇性、糖化作用和味道组分或香味组分形成的基因都属于该范畴。
第2项发明涉及一种产生金黄担子菌素抗性转化体的方法。例如通过制备含有上述金黄担子菌素抗性基因的复制载体,在复制载体中的金黄担子菌素抗性基因的某一位置进行切割以产生宿主真菌的线性染色体整合载体,在能使真菌细胞转化的条件下将该载体加入到金黄担子菌素敏感性宿主真菌细胞中,这样将载体整合到宿主染色体中,在适合于宿主细胞增殖的含有抗生素金黄担子菌素的培养基中对转化体进行培养,并对如此增殖的金黄担子菌素抗性转化体进行筛选可产生金黄担子菌素抗性转化体。按照公知的方法如原生质体生成程序、乙酸锂程序或电击程序实现上述转化。这里所用的培养基并无特别限制,只要其适用于真菌增殖即可。通常使用的这类培养基的例子包括:Sabouraud氏右旋糖培养基,YPD培养基,察氏培养基和YNBG培养基。所加入的金黄担子菌素的浓度依宿主真菌细胞所具有的敏感性大小而有所变化,一般范围在0.05—80μg/ml。
可用第2项发明的方法得到第3项发明的转化体。
作为本发明中的转化体的一个实例,含有整合到染色体中的scaur1R和AARE基因的米酒酵母Kyokai K—701已被贮藏于工业科学技术院生物科学及人类技术国立研究所中,注册号为FERM P—14379。利用本发明的染色体整合载体而得到的转化体具有所赋予的金黄担子菌素抗性和所整合的外来基因,该外来基因在染色体上保持着稳定状态。这些属性在工业应用上极为有益。
第11项发明的Aur1Rp能够赋予单倍体酵母和双倍体酵母,特别是那些有实际应用价值的酵母金黄担子菌素抗性。也就是说,它在培养酿酒酵母方面是非常有用的,酿酒酵母已广泛应用于制酒如米酒、Shochu、啤酒和葡萄酒以及发酵性食品如面包。第11项发明的Aur1Rp也可应用于酿酒酵母以外的真菌,并且在例如其它真菌的培育和遗传工程应用中是有用的。
例如,第11项发明的Aur1Rp能赋予白假丝酵母金黄担子菌素抗性。具有编码该Aur1Rp之DNA的载体是白假丝酵母遗传工程应用中的首选载体。
人们知道,白假丝酵母是引起真菌病的一种真菌。随着近年来机会性感染的增加,需要进行搞清致病原因的研究工作。第11项发明的Aur1Rp和上述载体在白假丝酵母的遗传学研究方面是极其有用的。
[图1.]作为本发明实例的载体的构建,以及载体在染色体中的整合。
[图2.]经限制性酶消化的基因组DNA电泳后的Sourthern杂交图谱。
[图3.]基因spaur1R和spaur1S的限制性酶图谱。
[图4.]基因scaur1R和scaur1S的限制性酶图谱。
[图5.]基因caaur1的限制性酶图谱。
为了进一步详细论证本发明,特给出以下实施例。不过必须明白本发明并不仅限于这些实施例。
实施例1:含有金黄担子菌素抗性基因的染色体整合载体的构建
(1)含有scaur1R的复制载体的构建
由大肠杆菌HB101/pSCAR1(FERM BP—4483)制备出质粒pSCAR1,该大肠杆菌菌株携带有含scaur1S的质粒pSCAR1。然后将得到的质粒用HindIII进行部分酶切,这样从中分离出含scaur1S的3.5Kb DNA。将pUC118载体用HindIII酶切,再与上述DNA(3.5Kb)连接,由此制得质粒pU scaur1S。将该质粒pUscaur1S转化到大肠杆菌CJ236中以制备出ssDNA。
下一步,利用序列目录中SEQ ID NO.13所示的用于引入突变的合成寡核苷酸(已合成并纯化)和上述ssDNA,通过使用Mutan—K药盒(由Takara Shuzo有限公司生产)来引入位点特异性DNA突变。也就是说,利用序列目录中SEQ ID NO.13所示的寡核苷酸有可能获得scaur1R,其中基因scaur1S ORF中第158氨基酸残基苯丙氨酸的密码子TTT已被酪氨酸密码子TAT所替代。这个具有编码Aur1Rp(F158 Y)之DNA的质粒被称做pUscaur1R。
(2)通过PCR方法扩增scaur1R
利用携带着含scaur1R的3.5Kb HindIII片段的质粒pUscaur1R,通过PCR法扩增scaur1R(约1.9Kb)。关于这里所用的引物,为了将扩增的scaur1R克隆至质粒载体的pYES2(Invitrogen公司产生)中,在引物中已标示出xhoI和KpnI位点。这样便合成出序列目录中SEQID NO.14和NO.15所示的引物。
反应是按下述方法进行的。将含28μl PCR缓冲液100μl[终浓度能达到10mM Tris HCl(pH8.3),50mM KCl,1.5mM MgCl2,0.1mMdATP,0.1mM dCTP,0.1mM dTIP和0.1mM dGTP]、1μl、2.5U的Ampli Taq DNA聚合酶(Perkin—Elmer生产)0.5μl、序列目录中SEQ ID NO.14和NO.15所示的20pmol引物每份1μl质粒和69μl水的PCR溶液在94℃的初始温度下保持1分钟,然后相继在94℃下加热1分钟,在50℃下加热2分钟和在72℃下加热3分钟。将此加热循环重复35次。下一步,将反应混合液在72℃下保持10分钟,用PCR进行扩增。然后将PCR扩增产物用KpnI和XhoI进行酶切,在琼脂糖凝胶上进行电泳,从凝胶中回收约1.9Kb的靶DNA片段并用SuprecTM—O1(Takara Shuzo有限公司生产)进行提纯。
(3)DNA连接和转化
使用DNA连接药盒(Takara Shuzo有限公司生产),将约0.3μg上述步骤中提纯的DNA片段(约1.9Kb)连接到约0.1μg已用XhoI和KpnI消化过的pYES2上。
下一步,将7μl上述连接混合液加入到200μl大肠杆菌HB101的感受态细胞中。将这些细胞置于冰上30分钟,在42℃维持1分钟,再置于冰上1分钟。然后加入800μl Soc培养基[Sambrook等人,分子克隆,实验室手册,冷泉港实验室出版物(1989)]。在37℃下培养1小时,然后将这些大肠杆菌细胞涂布到内含50μg/ml氨苄青霉素的L—肉汤琼脂培养基中,在37℃下培养过夜。这样得到一转化体。
在37℃下,将该转化体在5ml的内含50μg/ml氨苄青霉素的L—肉汤培养基中培养过夜。根据碱法(“分子克隆”,引文如上),从该培养液中制备出质粒DNA。这样得到的质粒被命名为pYES2aur1。
(4)染色体整合载体的构建
将约0.4μg上述质粒pYES2aur1用Xba1和KpnI进行消化并在琼脂糖凝胶上进行电泳。然后从凝胶中回收含有scaur1R的约1.9Kb的DNA片段,并用Suprec—O1提纯。
同样,用SspI和PvuII消化约0.4μg质粒载体pUC19并在琼脂糖凝胶上进行电泳。然后从凝胶中回收含有氨苄青霉素抗性基因和ColE1起点的DNA片段(约1.8Kb)并提纯。利用DNA钝化药盒(Takara Shuzo有限公司生产),对约0.1μg上述提纯的DNA片段进行末端钝化处理。另外,对约0.1μg这些钝化的DNA片段进行连接反应。利用DNA连接药盒(Takara Shuzo有限公司生产)来实现连接反应。
随后,将质粒整合到大肠杆菌JM109中。经培养后制备出转化体和质粒DNA。这样得到的质粒被命名为质粒pAUR1。下一步,将该质粒用StuI进行酶切以制备出染色体整合载体。
实施例2:含有金黄担子菌素抗性基因的染色体整合载体的构建
(1)用PCR扩增具有引入的突变的scaur1R的DNA片段
为了用半胱氨酸置换Aur1Rp(F 158Y)的第240氨基酸残基丙氨酸,合成并提纯序列目录中SEQ ID NO.24所示的引物,其中丙氨酸密码子GCT已被转变为半胱氨酸密码子TGT。利用实施例1—(1)中描述的质粒pUscaur1R[其携带着HindIII片段(3.5Kb),在pUC119 HindIII位点上含有scaur1R)作为模板,通过使用序列目录中SEQ ID NO.24所示引物和引物M13M4的PCR方法,对在Aur1Rp(F158Y,A240C)(末端侧含有编码氨基酸序列的序列(约500bp)的DNA片段(约1.4Kb)(其中GCT已被转变为TGT)进行扩增。以下列方式实现PCR。在28μl的PCR缓冲液[终浓度能够达到10mMTris HCl(pH8.3),50mM KCl,1.5mM MgCl2、0.1mM dATP,0.1mM dcTP,0.1mM dTTP和0.1mM dGTP]中,加入2.5U的AmpliTaq DNA聚合酶,序列目录中SEQ ID NO.24所示的引物和引物M13M4各100pmol,1ng的pU scaur1R和蒸馏水,得到100μl PCR溶液。然后将此反应混合液相继在94℃下加热1分钟,在55℃下加热1.5分钟和在72℃下加热1.5分钟。将这种循环重复30次。下一步,将PCR产物用SalI和SnaI进行酶切并在琼脂糖凝胶上进行电泳。从凝胶中回收约1.3Kb的靶DNA片段并进行提纯。
(2)含有编码Aur1Rp(F158Y,A240C)之DNA的质粒的构建
用SalI和SnaI酶切PU scaur1R并在琼脂糖凝胶上进行电泳。回收约5.3Kb的靶DNA片段并进行提纯。将该DNA片段与得自实施例2—(1)的1.3Kb DNA片段连接。所得到的具有编码Aur1Rp(F158Y,A240C)之DNA(scaur1R—C)的质粒被命名为pU scaur1R—C。为了通过将其整合到米酒酵母的染色体中而实现转化,在使用前用StuI酶切使pU scaur1R—C线性化。作为对照组,pU scaur1R也用StuI进行线性化。
(3)含有编码Aur1Rp(A240C)之DNA的质粒的构建
用SalI和SuaI酶切pU scaur1S并在琼脂糖凝胶上进行电泳。回收5.3Kb的靶DNA片段并进行提纯。在该DNA片段上连接得自实施例2—(1)的1.3Kb DNA片段。所得到的质粒具有编码Aur1Rp的DNA,其中Aur1Sp第240丙氨酸残基已被半胱氨酸所置换,该质粒被命名为pU scaur1 A240C。为了通过将其整合到米酒酵母中而实现转化,在使用前用StuI酶切使pUscaur A240C线性化。
实施例3:用米酒酵母作为宿主进行转化
(1)用乙酸锂方法[微生物学期刊,153,163(1983)]将约10μg实施例1中所述质粒pAUR1的线性化载体引入米酒酵母Kyokai K—701中。
也就是说,将米酒酵母Kyokai K—701悬浮于0.1M的乙酸锂水溶液中(约1.3×108细胞/100μl 0.1M乙酸锂),在其中加入10μg载体(通过在某一位置上用StuI酶切使scaur1R线性化而制备)。在30℃下处理30分钟,然后在42℃下处理15分钟,之后经离心收获细胞并在5ml的YPD液体培养中进行预培养。该培养基含0.4μg/ml的金黄担子菌素A,在预培养之后,在YPD琼脂培养基(含0.8μg/ml的金黄担子菌素A)上得到一转化体。该转化体被命名为米酒酵母Kyokai K—701/pAUR1。
在缺乏金黄担子菌素A的条件下,对该转化体进行三代继代培养,随后检测对金黄担子菌素的敏感性。结果,与亲代菌株(即米酒酵母Kyokai K—701)相比,其金黄担子菌素抗性增长了8倍(MIC1.56μg/ml),这表明保留住了金黄担子菌素抗性。因此已证实了在宿主染色体上引入的金黄担子菌素抗性可用作选择性标记。
(2)为了对实施例2—(2)中制备的pU scaur1R—C,实施例2—(3)中制备的pU scaur1 A240C,实施例1—(1)中制备的pU scaur1R之活性进行比较,用乙酸锂法将5μg的质粒(已用StuI线性化)引入米酒酵母Kyokai K—701中。即,向已悬浮于0.1M的乙酸锂水溶液(pH7.5)中并使其变为感受态的米酒酵母中加入5μg质粒(已用StuI在某一位置上线性化)和850μl的40%聚乙二醇/0.1M乙酸锂。在30℃下处理30分钟,再在42℃下保温15分钟,之后收获细胞,在5mlYPD液体培养基中培养1小时或过夜,然后涂抹在含有不同浓度的金黄担子菌素A的YPD琼脂培养基上。在30℃下培养3—4天,得到具有金黄担子菌素A抗性的转化体。如表4所示,利用StuI线性化pU scaur1R—C制备的转化体甚至在含有5μg/ml金黄担子菌素A的培养基中也能生长。与亲代菌株相比,即使在进行多代继代培养之后,这些转化体所保留的金黄担子菌素A抗性也至少要高10倍。使用线性化pU scaur1R—C得到的转化体表现出20μg/ml或以上对金黄担子菌素A的最小抑制浓度(MIC)。因此证实,Aur1Rp(F158Y,A240C)可用作米酒酵母的有效选择性标记。如表4所示,在产生抗性的活性方面,StuI—线性化pU scaur1 A240C超过了StuI—线性化pU scaur1R,这就是说,第240丙氨酸残基处的突变导致了产生较强抗性的活性的表达。
表4
实施例4:利用含金黄担子菌素抗性基因和AARE基因的染色体整合载体进行转化
(1)含有AARE基因的质粒的构建
用SphI酶切0.5μg的质粒pAUR1并在琼脂糖凝胶上进行电泳。然后从凝胶中回收线性化质粒pAUR1并进行提纯。
下一步,从酵母BJ2168中制备质粒pYHA201,该酵母携带含日本专利公开NO.254680/1991所述的AARE基因的质粒pYHA201,即酿酒酵母BJ2168/pYHA201;FERM P—11570)。用SphI消化0.5μg的该质粒pYHA201,分离并提纯所产生的DNA片段(约3.2Kb)。
约3.2Kb的该DNA片段含有结合到ADHI启动子下游的AARE基因。
利用纯化的SphI酶切的DNA片段各0.2μg,使用DNA连接药盒(由Takara Shuzo有限公司生产)实现连接反应。随后,将质粒整合到大肠杆菌JM109中并进行培养,由此得到转化体和质粒DNA。将这样得到的质粒命名为质粒pAUR1aare,而将如此得到的转化体命名为大肠杆菌JM109/pAUR1aare并贮藏于工业科学技术院生物科学及人类技术国立研究所,注册号为FERM P—14366。
(2)AARE在米酒酵母中的表达
使用约10μg上述质粒pAUR1aare,按实施例3中所述的方法将线性化质粒pAUR1aare转化到米酒酵母Kyokai K—701中。随后在含0.4μg/ml金黄担子菌素A的YPD琼脂培养基上得到金黄担子菌素抗性转化体。
这样得到的转化体被命名为酿酒酵母K701/pAUR1aare并贮藏于工业科学技术院生物科学及人类技术国立研究所中,注册号为FERM P—14379。
下一步,将该转化体接种到5ml基本培养基[0.67%的Bacto酵母氮基质W/O氨基酸(由Difco生产),2%的葡萄糖]中,在30℃下培养两天,然后经离心收获细胞。
弃去上清液之后,用2ml的水冲洗细胞并再经离心收获细胞。
其后,将细胞悬浮于700μl的0.2M磷酸钠缓冲溶液(pH7.2)中。
在该悬浮液中加入400μl的玻璃珠(直径0.4—0.6mm),在冰冷却条件下剧烈搅拌而使细胞破碎。
离心之后,回收上清液并将其视为提取物。
另外,以相同方法制备米酒酵母Kyokai K—701提取物和实施例3中得到的米酒酵母Kyokai K—701/pAUR1提取物。
用以下方法测定所得到的每种提取物的酰基氨基酸释放酶活性。将0.89ml含有由N—乙酰—L—甲硫氨酸和7—氨基—4—甲基香豆素(AMC)制备的0.020mM酰胺之0.5%二甲基甲酰胺—0.2M磷酸钠缓冲溶液(pH7.2)在37℃下预热约5分钟。然后加入100μl上述提取物,将形成的混合液在37℃下保温15分钟。反应完全后,加入10μl 10%的SDS来终止反应并用荧光计测定荧光强度。即,将激发波长和测定波长分别定在380nm和440nm。通过用已知浓度的AMC样品制备标准曲线和与所得数据相比较来确定释放出的AMC量。
在以上反应体系中,100μl酿酒酵母K701/pAUR1aare的提取物具有在15分钟内释放大约25pmol AMC的活性。
另一方面,没有质粒的米酒酵母Kyokai K—701提取物和实施例3中所得到的米酒酵母Kyokai K—701/pAUR1提取物都不具有AARE活性。
另外,使用金黄担子菌素抗性基因作为探针进行Southern杂交来进行分析。作为杂交作用中的探针,使用了scaur1R片段(约1.6Kb),其已通过利用质粒pAUR1作为模板和使用序列目录中SEQID NO.16和NO.17所示的引物的PCR法进行了扩增。通过使用BcaBESTTM标记药盒标记100ng的所得片段。用不同的限制性酶(在pAUR1aare上没有酶切位点的HpaI,在pAUR1aare上具两个酶切位点的BamHI)酶切米酒酵母Kyokai K—701和酿酒酵母K701/pAUR-1aare的基因组DNA,在琼脂糖凝胶上进行电泳并转移到杂交滤器上。
图2中,泳道1和泳道3表示用HpaI(泳道1)或BamHI(泳道3)酵切米酒酵母Kyokai K—701的基因组DNA并进行Southern杂交而得到的结果,而泳道2和泳道4则表示用HpaI(2)或BamHI(泳道4)酶切酿酒酵母K701/pAUR1aare的基因组DNA并进行Southern杂交而得到的结果。由于HpaI在质粒pAUR1aare上没有酶切位点,而是专一性地酶切基因组DNA,泳道1和2证明了金黄担子菌素抗性基因已被整合到一对染色性之一中。
泳道3和4证实了在米酒酵母染色体上金黄担子菌素抗性基因已被同源性整合到金黄担子菌素敏感性基因中。
这些结果表明,金黄担子菌素抗性基因的随机整合并没有破坏米酒酵母的基因。
如上所述,通过使用本发明的染色体整合载体,可以将抗性传递给金黄担子菌素敏感性真菌,而且外来基因也能得到表达。
实施例5:含金黄担子菌素抗性基因的重组质粒的构建
(1)携带编码Aur1Rp(F158Y,A240C)之DNA的pYC载体的构建
用pU scaur1R—C作为模板,使用序列目录中SEQ ID NO.25和26所示的引物来实现PCR。PCR产物(大约2.2Kb)含有编码扩增的Aur1Rp(F158Y,A240C)之DNA,用XhoI和KpnI进行酶切并使用钝化药盒(由Takara Shuzo有限公司生产)使其末端钝化。
用EcoRI和BamI酶切pYC载体pYEUra3(由Clontech股份有限公司实验室生产),并用钝化药盒来进化末端钝化。然后将其连接到上述末端钝化的PCR产物(2.2Kb)上。将这样得到的质粒命名为pYCscaur1R—C。用pU scaur1R作为模板,使用序列目录中NO.25及26所示的引物以同样方式来实现PCR。PCR产物(约2.2Kb)含有编码扩增的Aur1Rp(F158Y)之DNA,将其用XhoI和KpnI酶切并用钝化药盒(Takara Shuzo有限公司生产)进行末端钝化。用EcoRI和BamHI酶切pYEUra3并用钝化药盒进行末端钝化。然后将其连接到如上所述的末端钝化的PCR产物(约2.2Kb)上。这样得到的质粒被命名为pYC scaur1R。
(2)携带编码Aur1Rp(F158Y,A240C)之DNA的pYE载体的构建
用pU scaur1R—C作为模板,通过使用序列目录中SEQ IDNO.25所示的引物和引物M13M4的PCR扩增含有编码Aur1Rp(F158Y,A240C)之DNA的DNA片段。用BamHI酶切PCR产物并在琼脂糖凝胶上进行电泳。从凝胶中回收靶DNA片段(约1.8Kb)并进行提纯。用BamHI酶切质粒pSCAR1,由此得到11.7Kb的DNA片段,含有scaur1S的2.8Kb的DNA片段已被从中删去。将该11.7Kb的DNA片段连接到含有编码Aur1Rp(F158Y,A240C)之DNA的上述DNA片段(1.8Kb)上。然后选择出具有按所需方向插入的1.8Kb片段的质粒。这种含有编码Aur1Rp(F158Y,A240C)DNA之基因的质粒被命名为pW scaur1R—C并用于实验室中的酵母转化。
实施例6:用酵母作为宿主的转化
(1)米酒酵母通过pYCscaur1R—C的转化
使用5μg pYC质粒pYC scaur1R—C,用实施例1—(1)中所述的乙酸锂法转化米酒酵母KyokaiK—701。如表5所示,所得结果与线性化质粒中所得结果相似。即使经多代继代培养之后,与亲代菌株相比,这些转化体保持的金黄担子菌素A抗性也至少要高10倍。因此已证实AurIRp(F158Y,A240C)可用作米酒酵母经复制载体进行转化的一种有效的选择性标记。
表5
(2)利用pW scaur1R—C进行实验室酵母的转化
用实验室用单倍体酵母DKD—5D(a,his3,trp1、leu2—3,112)作为宿主,通过实施例3—(1)中所述的乙酸锂法转化5μg的pW scaur1R—C。
为了比较,利用质粒中所含的营养缺陷型标记物在基本培养基上对转化体进行筛选。如表6所示,已证实Aur1Rp(F158Y,A240C)可用作选择性标记,该标记与单倍体酵母中的常规营养缺陷型标记相似。
表6
实施例7:用白假丝酵母作为宿主的转化
使用能在pUC119区域中某一位点酶切的SalI酶切pU scau-r1R—C而制备出线性质粒,将5μg线性质粒通过乙酸锂法转化到白假丝酵母TIMM136中。转化完成后,将细胞在YPD培养基中培养1小时或过夜,然后涂抹在含有金黄担子菌素A的YPD琼脂培养基上。如表7所示,通过进行过夜预培养得到了具有金黄担子菌素抗性的转化体。这些转化体均显示出10μg/ml或以上的最小抑制浓度。
表7
本发明利用对金黄担子菌素的抗性作为选择性标记,提供了一种染色体整合载体,其在真菌(尤其是工业真菌)的遗传重组中是有用的;提供了一种生产具有该引入的载体的转化体的方法,以及通过该方法而得到的转化体。它们可有效地应用于生产有用的蛋白质及培育的转化体的生成。
本发明还提供了一种能产生强金黄担子菌素抗性的蛋白质以及编码该蛋白质的DNA。它们给具有金黄担子菌素敏感性的生物带来了抗性,可用作筛选获得了抗性的生物的选择性标记。它们在某些方面特别有用,例如可用于实用性酵母的遗传工程培育和白假丝酵母遗传信息的分析。尤其是,源于酿酒酵母的金黄担子菌素抗性基因在酿酒酵母的培育和用于产生有用蛋白质的转化体的制备方面是极其有用的,因此酿酒酵母不仅广泛用作工业酵母,而且在遗传重组中非常安全。序列目录SEQ ID NO:1序列长度:2385序列类型:核酸链况:双链拓扑学:线性分子类型:基因组DNA序列描述AAGCTTTTTT GCCTCTGCAA AAGTTCCTTT CTCGAATTGG TTTTTTGAGG AAAAGCAAGT 60TAATAAACTA ATTATATTAT ATATAATTAG CAATTTTATA AAAAAAATAA AAAAATAGCC 120CTGATTGCTG GCAACTGTGA GCTGAACATT GGTTAATCGG TCCATCTTTT TTTAAATATT 180TTACATCGCT ACTTTTAAGT GCTTGACACT TGCATTTAAT AGCTACTTTC TTTCCTTCAT 240AAAAATTCCT TTTTTTTCCT TTAGTTTTCC GGTTAATTCC TTACGAAATT TTTTTCGTAC 300GCTTCCCTTT TTTACTCTGA TAATTCTTTG AAGCAATGTC TGCTCTTTCG ACCTTAAAAA 360AGCGCCTTGC TGCGTGTAAC CGAGCATCCC AATACAAGTT GGAAACAAGC TTAAACCCTA 420TGCCTACATT TCGTTTGCTA CGCAATACGA AATGGTCATG GACACATTTG CAATATGTGT 480TTCTAGCAGG TAATTTGATT TTTGCTTGTA TTGTCATTGA ATCTCCTGGA TTCTGGGGGA 540AATTTGGCAT TGCCTGTCTT TTGGCCATTG CGTTGACCGT TCCTTTAACA CGCCAAATTT 600TTTTTCCTGC CATTGTTATC ATCACCTGGG CAATTTTATT TTACTCTTGT AGGTTTATTC 660CAGAACGCTG GCGTCCACCC ATATGGGTTC GTGTTTTACC CACACTTGAA AATATTCTTT 720ATGGCTCTAA TCTTTCTAGT CTTCTCTCGA AAACCACGCA TAGCATCCTT GATATTTTGG 780CCTGGGTTCC ATATGGAGTC ATGCATTATT CGGCTCCTTT TATCATTTCA TTTATTCTTT 840TCATCTTTGC ACCTCCTGGA ACTCTTCCAG TTTGGGCTCG AACTTTTGGT TATATGAATT 900TATTTGGTGT TCTTATCCAA ATGGCTTTCC CCTGTTCTCC TCCTTGGTAT GAAAATATGT 960ATGGTTTAGA ACCTGCCACG TATGCAGTAC GTGGCTCTCC TGGTGGATTG GCCCGTATTG 1020ATGCTCTCTT CGGCACTAGC ATTTACACTG ATTGTTTTTC TAACTCTCCG GTTGTTTTTG 1080GTGCCTTTCC ATCTCTTCAC GCTGGATGGG CCATGCTGGA AGCACTTTTC CTTTCGCATG 1140TGTTTCCTCG ATACCGCTTC TGCTTTTATG GATATGTTCT ATGGCTTTGC TGGTGTACTA 1200TGTACCTTAC CCACCACTAC TTTGTAGATT TGGTCGGCGG TATGTGTTTA GCTATTATAT 1260GCTTCGTTTT TGCTCAAAAG CTACGCCTCC CACAGTTGCA AACTGGTAAA ATCCTTCGTT 1320GGGAATACGA GTTTGTTATC CACGGTCATG GTCTTTCCGA AAAAACCAGC AACTCCTTGG 1380CTCGTACCGG CAGCCCATAC TTACTTGGAA GGGATTCTTT TACTCAAAAC CCTAATGCAG 1440TAGCCTTCAT GAGTGGTCTT AACAATATGG AACTTGCTAA CACCGATCAT GAATGGTCCG 1500TGGGTTCATC ATCACCTGAG CCGTTACCTA GTCCTGCTGC TGATTTGATT GATCGTCCTG 1560CCAGTACCAC TTCCTCCATC TTTGATGCAA GTCATCTTCC TTAAATCAAC GTGCTTTAAG 1620AATATATTTC CAAAAGCTAC ATGATACATT GACTAGAATC GGTTTGATTC ATAGTGGTAT 1680TGGAATGATG TTGTTCATTG TGTTTTTTAA CTGTTAATCT GACATCCATT GAGTCATTCT 1740TTACAATTTG TAAAATTAAT TTGTATCACT AATTTTGAAG GAAGCTATTT TGGTATTAAT 1800ACCGCTTTTG GTCTCCACTT CCTTTTCGAA ACTCTTAACA GCGATTAGGC CGGGTATCTT 1860CCAGTGTGAT GTATAGGTAT TTGTCGTTTT TTTATCATTT CCGTTAATAA AGAACTCTTT 1920TATCCAGCTT CTTACACTGT CAACTGTTGT GAAAGGAACA CATTTAGAAT TTCATTTTCC 1980TTATTTGTTG TGATTTAAAT CGTTTGACAT AATTTTAAAT TTGGTTTGAA ATGTGTGTGA 2040GAAGGCTTGT TTTATTCATT TAGTTTATTG CTTGTTTGCA CGAAAATCCA GAACGGAGCA 2100TTAATGTAAT CCTTTTTTAT TCTGTAAAGC GTTTTTATAC AAATGTTGGT TATACGTTTC 2160TAAAATAAGA ATATTGTTAT AATAATATAG TTTTTTCTAT CATTTGTTAC ACACACTAAA 2220GAGACATTAA GGATAAGCAA ATGTGTTAAA ATGATAATAT ATTTTGGAAA CATTTATAAA 2280GAAATTAAGC AGCTTTGACT AACTACATTT TTGTTTTTTT CCTAAGCAAA ACTGTATAGT 2310TATACACGCG AGCTGTATTC ACTTCCATTG TAGTGACTTG AGCTC 2385SEQ ID NO:2序列长度:422序列类型:氨基酸链况:单链拓扑学:线性分子类型:肽序列描述Met Ser Ala Leu Ser Thr Leu Lys Lys Arg Leu AlaAla Cys Asn 1 5 10 15Arg Ala Ser Gln Tyr Lys Leu Glu Thr Ser Leu Asn Pro Met Pro
20 25 30Thr Phe Arg Leu Leu Arg Asn Thr Lys Trp Ser Trp Thr His Leu
35 40 45Gln Tyr Val Phe Leu Ala Gly Asn Leu Ile Phe Ala Cys Ile Val
50 55 60Ile Glu Ser Pro Gly Phe Trp Gly Lys Phe Gly Ile Ala Cys Leu
65 70 75Leu Ala Ile Ala Leu Thr Val Pro Leu Thr Arg Gln Ile Phe Phe
80 85 90Pro Ala Ile Val Ile Ile Thr Trp Ala Ile Leu Phe Tyr Ser Cys
95 100 105Arg Phe Ile Pro Glu Arg Trp Arg Pro Pro Ile Trp Val Arg Val
110 115 120Leu Pro Thr Leu Glu Asn Ile Leu Tyr Gly Ser Asn Leu Ser Ser
125 130 135Leu Leu Ser Lys Thr Thr His Ser Ile Leu Asp Ile Leu Ala Trp
140 145 150Val Pro Tyr Gly Val Met His Tyr Ser Ala Pro Phe Ile Ile Ser
155 160 165Phe Ile Leu Phe Ile Phe Ala Pro Pro Gly Thr Leu Pro Val Trp
170 175 180Ala Arg Thr Phe Gly Tyr Met Asn Leu Phe Gly Val Leu Ile Gln
185 190 195Met Ala Phe Pro Cys Ser Pro Pro Trp Tyr Glu Ash Met Tyr Gly
200 205 210Leu Glu Pro Ala Thr Tyr Ala Val Arg Gly Ser Pro Gly Gly Leu
215 220 225Ala Arg Ile Asp Ala Leu Phe Gly Thr Ser Ile Tyr Thr Asp Cys
230 235 240Phe Ser Asn Ser Pro Val Val Phe Gly Ala Phe Pro Ser Leu His
245 250 255Ala Gly Trp Ala Met Leu Glu Ala Leu Phe Leu Ser His Val Phe
260 265 270Pro Arg Tyr Arg Phe Cys Phe Tyr Gly Tyr Val Leu Trp Leu Cys
275 380 285Trp Cys Thr Met Tyr Leu Thr His His Tyr Phe Val Asp Leu Val
290 295 300Gly Gly Met Cys Leu Ala Ile Ile Cys Phe Val Phe Ala Gln Lys
305 310 315Leu Arg Leu Pro Gln Leu Gln Thr Gly Lys Ile Leu Arg Trp Glu
320 335 330Tyr Glu Phe Val Ile His Gly His Gly Leu Ser Glu Lys Thr Ser
335 340 345Asn Ser Leu Ala Arg Thr Gly Ser Pro Tyr Leu Leu Gly Arg Asp
350 355 360Ser Phe Thr Gln Asn Pro Asn Ala Val Ala Phe Met Ser Gly Leu
365 370 375Asn Asn Met Glu Leu Ala Asn Thr Asp His Glu Trp Ser Val Gly
380 385 390Ser Ser Ser Pro Glu Pro Leu Pro Ser Pro Ala Ala Asp Leu Ile
395 400 405Asp Arg Pro Ala Ser Thr Thr Ser Ser Ile Phe Asp Ala Ser His
410 415 420Leu ProSEQ ID NO:3序列长度:2385序列类型:核酸链况:双链拓扑学:线性分子类型:基因组DNA序列描述AAGCTTTTTT GCCTCTGCAA AAGTTCCTTT CTCGAATTGG TTTTTTGAGG AAAAGCAAGT 60TAATAAACTA ATTATATTAT ATATAATTAG CAATTTTATA AAAAAAATAA AAAAATAGCC 120CTGATTGCTG GCAACTGTGA GCTGAACATT GGTTAATCGG TCCATCTTTT TTTAAATATT 180TTACATCGCT ACTTTTAAGT GCTTGACACT TGCATTTAAT AGCTACTTTC TTTCCTTCAT 240AAAAATTCCT TTTTTTTCCT TTAGTTTTCC GGTTAATTCC TTACGAAATT TTTTTCGTAC 300GCTTCCCTTT TTTACTCTGA TAATTCTTTG AAGCAATGTC TGCTCTTTCG ACCTTAAAAA 360AGCGCCTTGC TGCGTGTAAC CGAGCATCCC AATACAAGTT GGAAACAAGC TTAAACCCTA 420TGCCTACATT TCGTTTGCTA CGCAATACGA AATGGTCATG GACACATTTG CAATATGTGT 480TTCTAGCAGG TAATTTGATT TTTGCTTGTA TTGTCATTGA ATCTCCTGGA TTCTGGGGGA 540AATTTGGCAT TGCCTGTCTT TTGGCCATTG CGTTGACCGT TCCTTTAACA CGCCAAATTT 600TTTTTCCTGC CATTGTTATC ATCACCTGGG CAATTTTATT TTACTCTTGT AGGTTTATTC 660CAGAACGCTG GCGTCCACCC ATATGGGTTC GTGTTTTACC CACACTTGAA AATATTCTTT 720ATGGCTCTAA TCTTTCTAGT CTTCTCTCGA AAACCACGCA TAGCATCCTT GATATTTTGG 780CCTGGGTTCC ATATGGAGTC ATGCATTATT CGGCTCCTTT TATCATTTCA TTTATTCTTT 840TCATCTTTGC ACCTCCTGGA ACTCTTCCAG TTTGGGCTCG AACTTTTGGT TATATGAATT 900TATTTGGTGT TCTTATCCAA ATGGCTTTCC CCTGTTCTCC TCCTTGGTAT GAAAATATGT 960ATGGTTTAGA ACCTGCCACG TATGCAGTAC GTGGCTCTCC TGGTGGATTG GCCCGTATTG 1020ATGCTCTCTT CGGCACTAGC ATTTACACTG ATGGTTTTTC TAACTCTCCG GTTGTTTTTG 1080GTGCCTTTCC ATCTCTTCAC GCTGGATGGG CCATGCTGGA AGCACTTTTC CTTTCGCATG 1140TGTTTCCTCG ATACCGCTTC TGCTTTTATG GATATGTTCT ATGGCTTTGC TGGTGTACTA 1200TGTACCTTAC CCACCACTAC TTTGTAGATT TGGTCGGCGG TATGTGTTTA GCTATTATAT 1260GCTTCGTTTT TGCTCAAAAG CTACGCCTCC CACAGTTGCA AACTGGTAAA ATCCTTCGTT 1320GGGAATACGA GTTTGTTATC CACGGTCATG GTCTTTCCGA AAAAACCAGC AACTCCTTGG 1380CTCGTACCGG CAGCCCATAC TTACTTGGAA GGGATTCTTT TACTCAAAAC CCTAATGCAG 1440TAGCCTTCAT GAGTGGTCTT AACAATATGG AACTTGCTAA CACCGATCAT GAATGGTCCG 1500TGGGTTCATC ATCACCTGAG CCGTTACCTA GTCCTGCTGC TGATTTGATT GATCGTCCTG 1560CCAGTACCAC TTCCTCCATC TTTGATGCAA GTCATCTTCC TTAAATCAAC GTGCTTTAAG 1620AATATATTTC CAAAAGCTAC ATGATACATT GACTAGAATC GGTTTGATTC ATAGTGGTAT 1880TGGAATGATG TTGTTCATTG TGTTTTTTAA CTGTTAATCT GACATCCATT CAGTCATTCT 1740TTACAATTTG TAAAATTAAT TTGTATCACT AATTTTGAAG GAAGCTATTT TGGTATTAAT 1800ACCGCTTTTG GTCTCCACTT CCTTTTCGAA ACTCTTAACA GCGATTAGGC CGGGTATCTT 1860CCAGTGTGAT GTATAGGTAT TTGTCGTTTT TTTATCATTT CCGTTAATAA AGAACTCTTT 1920TATCCAGCTT CTTACACTGT CAACTGTTGT GAAAGGAACA CATTTAGAAT TTCATTTTCC 1980TTATTTGTTG TGATTTAAAT CGTTTGACAT AATTTTAAAT TTGGTTTGAA ATGTGTGTGA 2040GAAGGCTTGT TTTATTCATT TAGTTTATTG CTTGTTTGCA CGAAAATCCA GAACGGAGCA 2100TTAATGTAAT CCTTTTTTAT TCTGTAAAGC GTTTTTATAC AAATGTTGGT TATACGTTTC 2160TAAAATAAGA ATATTGTTAT AATAATATAG TTTTTTCTAT CATTTGTTAC ACACACTAAA 2220GAGACATTAA GGATAAGCAA ATGTGTTAAA ATGATAATAT ATTTTGGAAA CATTTATAAA 2280GAAATTAAGC AGCTTTGACT AACTACATTT TTGTTTTTTT CCTAAGCAAA ACTGTATAGT 2340TATACACGCG AGCTGTATTC ACTTCCATTG TAGTGACTTG AGCTC 2385SEQ ID NO:4序列长度:422序列类型:氨基酸链况:单链拓扑学:线性分子类型:肽序列描述Met Ser Ala Leu Ser Thr Leu Lys Lys Arg Leu Ala Ala Cys Asn 1 5 10 15Arg Ala Ser Gln Tyr Lys Leu Glu Thr Ser Leu Asn Pro Met Pro
20 25 30Thr Phe Arg Leu Leu Arg Asn Thr Lys Trp Ser Trp Thr His Leu
35 40 45Gln Tyr Val Phe Leu Ala Gly Ash Leu Ile Phe Ala Cys Ile Val
50 55 60Ile Glu Ser Pro Gly Phe Trp Gly Lys Phe Gly Ile Ala Cys Leu
65 70 75Leu Ala Ile Ala Leu Thr Val Pro Leu Thr Arg Gln Ile Phe Phe
80 85 90Pro Ala Ile Val Ile Ile Thr Trp Ala Ile Leu Phe Tyr Ser Cys
95 100 105Arg Phe Ile Pro Glu Arg Trp Arg Pro Pro Ile Trp Val Arg Val
110 115 120Leu Pro Thr Leu Glu Asn Ile Leu Tyr Gly Ser Asn Leu Ser Ser
125 130 135Leu Leu Ser Lys Thr Thr His Ser Ile Leu Asp Ile Leu Ala Trp
140 145 150Val Pro Tyr Gly Val Met His Tyr Ser Ala Pro Phe Ile Ile Ser
155 160 165Phe Ile Leu Phe Ile Phe Ala Pro Pro Gly Thr Leu Pro Val Trp
170 175 180Ala Arg Thr Phe Gly Tyr Met Asn Leu Phe Gly Val Leu Ile Gln
185 190 195Met Ala Phe Pro Cys Ser Pro Pro Trp Tyr Glu Asn Met Tyr Gly
200 205 210Leu Glu Pro Ala Thr Tyr Ala Val Arg Gly Ser Pro Gly Gly Leu
215 220 225Ala Arg Ile Asp Ala Leu Phe Gly Thr Ser Ile Tyr Thr Asp Gly
230 235 240Phe Ser Asn Ser Pro Val Val Phe Gly Ala Phe Pro Ser Leu His
245 250 255Ala Gly Trp Ala Met Leu Glu Ala Leu Phe Leu Ser His Val Phe
260 265 270Pro Arg Tyr Arg Phe Cys Phe Tyr Gly Tyr Val Leu Trp Leu Cys
275 280 285Trp Cys Thr Met Tyr Leu Thr His His Tyr Phe Val Asp Leu Val
290 295 300Gly Gly Met Cys Leu Ala Ile Ile Cys Phe Val Phe Ala Gln Lys
305 310 315Leu Arg Leu Pro Gln Leu Gln Thr Gly Lys Ile Leu Arg Trp Glu
320 325 330Tyr Glu Phe Val Ile His Gly His Gly Leu Ser Glu Lys Thr Ser
335 340 345Asn Ser Leu Ala Arg Thr Gly Ser Pro Tyr Leu Leu Gly Arg Asp
350 355 360Ser Phe Thr Gln Asn Pro Asn Ala Val Ala Phe Met Ser Gly Leu
365 370 375Asn Asn Met Glu Leu Ala Asn Thr Asp His Glu Trp Ser Val Gly
380 385 390Ser Ser Ser Pro Glu Pro Leu Pro Ser Pro Ala Ala Asp Leu Ile
395 400 405Asp Arg Pro Ala Ser Thr Thr Ser Ser Ile Phe Asp Ala Ser His
410 415 420Leu ProSEQ ID NO:5序列长度:2340序列类型:核酸链况:双链拓扑学:线性分子类型:基因组DNA序列描述TTTCTTTCTG TCAAAGAATA ATAAAGTGCC CATCAGTGTT CATATTTGTT ACAAAGTGGT 60TTTCTGATTT GGTACTACTG CAGAGGCGTA TTTTTTGCTT CAGTTACCAT AGCGTAAGAA 120CACTAGCGAC TTTTGTTCGT GAACCAACAG AGTAGGATTT CTACTGCTAC ATCTCTTAGG 180TAGTTGGTTA GTCCGATCGC TCACTTTTGG TTGTTGTTAA GTACTTCATA AGTTTATCCT 240TTTCCTTTTT CACACTGAGC TACTTTGGGT ATAGCTTTTG GCCCAAGGAT CTTTGAATTT 300TCTCCAAAAG TACTTTATTT TATATCCTAC AGGTTGCGGT TTTCATATTT TAAAAAGCTT 360TTTAATCATT CCTTTGCGTA TGGCAAACCC TTTTTCGAGA TGGTTTCTAT CAGAGAGACC 420TCCAAACTGC CATGTAGCCG ATTTAGAAAC AAGTTTAGAT CCCCATCAAA CGTTGTTGAA 480GGTGCAAAAA TACAAACCCG CTTTAAGCGA CTGGGTGCAT TACATCTTCT TGGGATCCAT 540CATGCTGTTT GTGTTCATTA CTAATCCCGC ACCTTGGATC TTCAAGATCC TTTTTTATTG 600TTTCTTGGGC ACTTTATTCA TCATTCCAGC TACGTCACAG TTTTTCTTCA ATGCCTTGCC 660CATCCTAACA TGGGTGGCGC TGTATTTCAC TTCATCGTAC TTTCCAGATG ACCGCAGGCC 720TCCTATTACT GTCAAAGTGT TACCAGCGGT GGAAACAATT TTATACGGCG ACAATTTAAG 780TGATATTCTT GCAACATCGA CGAATTCCTT TTTGGACATT TTAGCATGGT TACCGTACGG 840ACTATTTCAT TATGGGGCCC CATTTGTCGT TGCTGCCATC TTATTCGTAT TTGGTCCACC 900AACTGTTTTG CAAGGTTATG CTTTTGCATT TGGTTATATG AACCTGTTTG GTGTTATCAT 960GCAAAATGTC TTTCCAGCCG CTCCCCCATG GTATAAAATT CTCTATGGAT TGCAATCAGC 1020CAACTATGAT ATGCATGGCT CGCCTGGTGG ATTAGCTAGA ATTGATAAGC TACTCGGTAT 1080TAATATGTAT ACTACAGCTT TTTCAAATTC CTCCGTCATT TTCGGTGCTT TTCCTTCACT 1140GCATTCCGGG TGTGCTACTA TGGAAGCCCT GTTTTTCTGT TATTGTTTTC CAAAATTGAA 1200GCCCTTGTTT ATTGCTTATG TTTGCTGGTT ATGGTGGTCA ACTATGTATC TGACACACCA 1260TTATTTTGTA GACCTTATGG CAGGTTCTGT GCTGTCATAC GTTATTTTCC AGTACACAAA 1320GTACACACAT TTACCAATTG TAGATACATC TCTTTTTTGC AGATGGTCAT ACACTTCAAT 1380TGAGAAATAC GATATATCAA AGAGTGATCC ATTGGCTGCA GATTCAAACG ATATCGAAAG 1440TGTCCCTTTG TCCAACTTGG AACTTGACTT TGATCTTAAT ATGACTGATG AACCCAGTGT 1500AAGCCCTTCG TTATTTGATG GATCTACTTC TGTTTCTCGT TCGTCCGCCA CGTCTATAAC 1560GTCACTAGGT GTAAAGAGGG CTTAATGAGT ATTTTATCTG CAATTACGGA TACGGTTGGT 1620CTTATGTAGA TACATATAAA TATATATCTT TTTCTTTCTT TTTCTTAGTC AGGATTGTCG 1680TTTAGCATAA TATACATGTA GTTTATTTAA TCACATACCA CTGATTATCT TTAGAATTTT 1740ATAAATTTTT GAAATAAATG GGTGGCTTTT AATGGTGTCT ATGTTAAGTG AGGCTTTTAG 1800AATGCTCTTC CTGCTTTGTT TATTATATGT GTATGAAAGA TATGTATGTA TTTACATGTG 1860TTTGTAGCGT CCCCAGTCAA AACCTGTGCG CTATACCTAA ATGGATTGAT AATCTTCATT 1920CACTAATTCT AAAATAGACT TCTTCCCCAA AGAACGGTGT AACGATGAGG CTCTATCCAG 1980CTGCTTATCT AAATCAACTT TAACGATGGA TGATCTTATG ACACGGGGAT CTTTCTTTAA 2040AGTTCTTAGA ATTTCAGACT GTACCGCAGC TGATGAATCA AACAGCATTA AAAAGTGATA 2100TGCTCGAAAA TGTTTTTCCT GGTCTTTCTT CATTATTTTA GGAAGATACC TTATGCCCAT 2160GGGTACAATG TCCCTCACCA CACCTCTGTT TTGAATAATC AGTTTCCCGA TTGTGGAAGA 2220CAATTCTTTT GCTTCCAACT TTGGCGCATT GGAGTTGGTT ATGCGAACAA GTCCGATCAG 2280CTCATAAAGC ATCTTAGTGA AAAGGGTGGT TTTGCGTTAT TCTTTCCTCT GTTGAAGCTT 2340SEQ ID NO:6序列长度:401序列类型:氨基酸链况:单链拓扑学:线性分子类型:肽序列描述Met Ala Asn Pro Phe Ser Arg Trp Phe Leu Ser Glu Arg Pro Pro 1 5 10 15Asn Cys His Val Ala Asp Leu Glu Thr Ser Leu Asp Pro His Gln
20 25 30Thr Leu Leu Lys Val Gln Lys Tyr Lys Pro Ala Leu Ser Asp Trp
35 40 45Val His Tyr Ile Phe Leu Gly Ser Ile Met Leu Phe Val Phe Ile
50 55 60Thr Asn Pro Ala Pro Trp Ile Phe Lys Ile Leu Phe Tyr Cys Phe
65 70 75Leu Gly Thr Leu Phe Ile Ile Pro Ala Thr Ser Gln Phe Phe Phe
80 85 90Asn Ala Leu Pro Ile Leu Thr Trp Val Ala Leu Tyr Phe Thr Ser
95 100 105Ser Tyr Phe Pro Asp Asp Arg Arg Pro Pro Ile Thr Val Lys Val
110 115 120Leu Pro Ala Val Glu Thr Ile Leu Tyr Gly Asp Asn Leu Ser Asp
125 130 135Ile Leu Ala Thr Ser Thr Asn Ser Phe Leu Asp Ile Leu Ala Trp
140 145 150Leu Pro Tyr Gly Leu Phe His Tyr Gly Ala Pro Phe Val Val Ala
155 160 165Ala Ile Leu Phe Val Phe Gly Pro Pro Thr Val Leu Gln Gly Tyr
170 175 180Ala Phe Ala Phe Gly Tyr Met Asn Leu Phe Gly Val Ile Met Gln
185 190 195Asn Val Phe Pro Ala Ala Pro Pro Trp Tyr Lys Ile Leu Tyr Gly
200 205 210Leu Gln Ser Ala Asn Tyr Asp Met His Gly Ser Pro Gly Gly Leu
215 220 225Ala Arg Ile Asp Lys Leu Leu Gly Ile Asn Met Tyr Thr Thr Ala
230 235 240Phe Ser Asn Ser Ser Val Ile Phe Gly Ala Phe Pro Ser Leu His
245 250 255Ser Gly Cys Ala Thr Met Glu Ala Leu Phe Phe Cys Tyr Cys Phe
260 265 270Pro Lys Leu Lys Pro Leu Phe Ile Ala Tyr Val Cys Trp Leu Trp
275 280 285Trp Ser Thr Met Tyr Leu Thr His His Tyr Phe Val Asp Leu Met
290 295 300Ala Gly Ser Val Leu Ser Tyr Val Ile Phe Gln Tyr Thr Lys Tyr
305 310 315Thr His Leu Pro Ile Val Asp Thr Ser Leu Phe Cys Arg Trp Ser
320 325 330Tyr Thr Ser Ile Glu Lys Tyr Asp Ile Ser Lys Ser Aso Pro Leu
335 340 345Ala Ala Asp Ser Asn Asp Ile Glu Ser Val Pro Leu Ser Asn Leu
350 355 360Glu Leu Asp Phe Asp Leu Asn Met Thr Asp Glu Pro Ser Val Ser
365 370 375Pro Ser Leu Phe Asp Gly Ser Thr Ser Val Ser Arg Ser Ser Ala
380 385 390Thr Ser Ile Thr Ser Leu Gly Val Lys Arg Ala
395 400SEQ ID NO:7序列长度:2340序列类型:核酸链况:双链拓扑学:线性分子类型:基因组DNA序列描述TTTCTTTCTG TCAAAGAATA ATAAAGTGCC CATCAGTGTT CATATTTGTT ACAAAGTGGT 60TTTCTGATTT GGTACTACTG CAGAGGCGTA TTTTTTGCTT CAGTTACCAT AGCGTAAGAA 120CACTAGCGAC TTTTGTTCGT GAACCAACAG AGTAGGATTT CTACTGCTAC ATCTCTTAGG 180TAGTTGGTTA GTCCGATCGC TCACTTTTGG TTGTTGTTAA GTACTTCATA AGTTTATCCT 240TTTCCTTTTT CACACTGAGC TACTTTGGGT ATAGCTTTTG GCCCAAGGAT CTTTGAATTT 300TCTCCAAAAG TACTTTATTT TATATCCTAC AGGTTGCGGT TTTCATATTT TAAAAAGCTT 360TTTAATCATT CCTTTGCGTA TGGCAAACCC TTTTTCGAGA TGGTTTCTAT CAGAGAGACC 420TCCAAACTGC CATGTAGCCG ATTTAGAAAC AAGTTTAGAT CCCCATCAAA CGTTGTTGAA 480GGTGCAAAAA TACAAACCCG CTTTAAGCGA CTGGGTGCAT TACATCTTCT TGGGATCCAT 540CATGCTGTTT GTGTTCATTA CTAATCCCGC ACCTTGGATC TTCAAGATCC TTTTTTATTG 600TTTCTTGGGC ACTTTATTCA TCATTCCAGC TACGTCACAG TTTTTCTTCA ATGCCTTGCC 660CATCCTAACA TGGGTGGCGC TGTATTTCAC TTCATCGTAC TTTCCAGATG ACCGCAGGCC 720TCCTATTACT GTCAAAGTGT TACCAGCGGT GGAAACAATT TTATACGGCG ACAATTTAAG 780TGATATTCTT GCAACATCGA CGAATTCCTT TTTGGACATT TTAGCATGGT TACCGTACGG 840ACTATTTCAT TTTGGGGCCC CATTTGTCGT TGCTGCCATC TTATTCGTAT TTGGTCCACC 900AACTGTTTTG CAAGGTTATG CTTTTGCATT TGGTTATATG AACCTGTTTG GTGTTATCAT 960GCAAAATGTC TTTCCAGCCG CTCCCCCATG GTATAAAATT CTCTATGGAT TGCAATCAGC 1020CAACTATGAT ATGCATGGCT CGCCTGGTGG ATTAGCTAGA ATTGATAAGC TACTCGGTAT 1080TAATATGTAT ACTACAGCTT TTTCAAATTC CTCCGTCATT TTCGGTGCTT TTCCTTCACT 1140GCATTCCGGG TGTGCTACTA TGGAAGCCCT GTTTTTCTGT TATTGTTTTC CAAAATTGAA 1200GCCCTTGTTT ATTGCTTATG TTTGCTGGTT ATGGTGGTCA ACTATGTATC TGACACACCA 1260TTATTTTGTA GACCTTATGG CAGGTTCTGT GCTGTCATAC GTTATTTTCC AGTACACAAA 1320GTACACACAT TTACCAATTG TAGATACATC TCTTTTTTGC AGATGGTCAT ACACTTCAAT 1380TGAGAAATAC GATATATCAA AGAGTGATCC ATTGGCTGCA GATTCAAACG ATATCGAAAG 1440TGTCCCTTTG TCCAACTTGG AACTTGACTT TGATCTTAAT ATGACTGATG AACCCAGTGT 1500AAGCCCTTCG TTATTTGATG GATCTACTTC TGTTTCTCGT TCGTCCGCCA CGTCTATAAC 1560GTCACTAGGT GTAAAGAGGG CTTAATGAGT ATTTTATCTG CAATTACGGA TACGGTTGGT 1620CTTATGTAGA TACATATAAA TATATATCTT TTTCTTTCTT TTTCTTAGTC AGGATTGTCG 1680TTTAGCATAA TATACATGTA GTTTATTTAA TCACATACCA CTGATTATCT TTAGAATTTT 1740ATAAATTTTT GAAATAAATG GGTGGCTTTT AATGGTGTCT ATGTTAAGTG AGGCTTTTAG 1800AATGCTCTTC CTGCTTTGTT TATTATATGT GTATGAAAGA TATGTATGTA TTTACATGTG 1860TTTGTAGCGT CCCCAGTCAA AACCTGTGCG CTATACCTAA ATGGATTGAT AATCTTCATT 1920CACTAATTCT AAAATAGACT TCTTCCCCAA AGAACGGTGT AACGATGAGG CTCTATCCAG 1980CTGCTTATCT AAATCAACTT TAACGATGGA TGATCTTATG ACACGGGGAT CTTTCTTTAA 2040AGTTCTTAGA ATTTCAGACT GTACCGCAGC TGATGAATCA AACAGCATTA AAAAGTGATA 2100TGCTCGAAAA TGTTTTTCCT GGTCTTTCTT CATTATTTTA GGAAGATACC TTATGCCCAT 2160GGGTACAATG TCCCTCACCA CACCTCTGTT TTGAATAATC AGTTTCCCGA TTGTGGAAGA 2220CAATTCTTTT GCTTCCAACT TTGGCGCATT GGAGTTGGTT ATGCGAACAA GTCCGATCAG 2280CTCATAAAGC ATCTTAGTGA AAAGGGTGGT TTTGCGTTAT TCTTTCCTCT GTTGAAGCTT 2340SEQ ID NO:8序列长度:401序列类型:氨基酸链况:单链拓扑学:线性分子类型:肽序列描述Met Ala Asn Pro Phe Ser Arg Trp Phe Leu Ser Glu Arg Pro Pro 1 5 10 15Asn Cys His Val Ala Asp Leu Glu Thr Ser Leu Asp Pro His Gln
20 25 30Thr Leu Leu Lys Val Gln Lys Tyr Lys Pro Ala Leu Ser Asp Trp
35 40 45Val His Tyr Ile Phe Leu Gly Ser Ile Met Leu Phe Val Phe Ile
50 55 60Thr Asn Pro Ala Pro Trp Ile Phe Lys Ile Leu Phe Tyr Cys Phe
65 70 75Leu Gly Thr Leu Phe Ile Ile Pro Ala Thr Ser Gln Phe Phe Phe
80 85 90Asn Ala Leu Pro Ile Leu Thr Trp Val Ala Leu Tyr Phe Thr Ser
95 100 105Ser Tyr Phe Pro Asp Asp Arg Arg Pro Pro Ile Thr Val Lys Val
110 115 120Leu Pro Ala Val Glu Thr Ile Leu Tyr Gly Asp Asn Leu Ser Asp
125 130 135Ile Leu Ala Thr Ser Thr Asn Ser Phe Leu Asp Ile Leu Ala Trp
140 145 150Leu Pro Tyr Gly Leu Phe His Phe Gly Ala Pro Phe Val Val Ala
155 160 165Ala Ile Leu Phe Val Phe Gly Pro Pro Thr Val Leu Gln Gly Tyr
170 175 180Ala Phe Ala Phe Gly Tyr Met Asn Leu Phe Gly Val Ile Met Gln
185 190 195Asn Val Phe Pro Ala Ala Pro Pro Trp Tyr Lys Ile Leu Tyr Gly
200 205 210Leu Gln Ser Ala Asn Tyr Asp Met His Gly Ser Pro Gly Gly Leu
215 220 225Ala Arg Ile Asp Lys Leu Leu Gly Ile Asn Met Tyr Thr Thr Ala
230 235 240Phe Ser Asn Ser Ser Val Ile Phe Gly Ala Phe Pro Ser Leu His
245 250 255Ser Gly Cys Ala Thr Met Glu Ala Leu Phe Phe Cys Tyr Cys Phe
260 265 270Pro Lys Leu Lys Pro Leu Phe Ile Ala Tyr Val Cys Trp Leu Trp
275 280 285Trp Ser Thr Met Tyr Leu Thr His His Tyr Phe Val Asp Leu Met
290 295 300Ala Gly Ser Val Leu Ser Tyr Val Ile Phe Gln Tyr Thr Lys Tyr
305 310 315Thr His Leu Pro Ile Val Asp Thr Ser Leu Phe Cys Arg Trp Ser
320 325 330Tyr Thr Ser Ile Glu Lys Tyr Asp Ile Ser Lys Ser Aso Pro Leu
335 340 345Ala Ala Asp Ser Asn Asp Ile Glu Ser Val Pro Leu Ser Asn Leu
350 355 360Glu Leu Asp Phe Asp Leu Asn Met Thr Asp Glu Pro Ser Val Ser
365 370 375Pro Ser Leu Phe Asp Gly Ser Thr Ser Val Ser Arg Ser Ser Ala
380 385 390Thr Ser Ile Thr Ser Leu Gly Va Lys Arg Ala
395 400SEQ ID NO:9序列长度:26序列类型:核酸链况:单链拓扑学:线性分子类型:其它核酸(合成的DNA)序列描述TTTGGTTAYA TGAAYYTNTT YGGNGT 26SEQ ID NO:10序列长度:29序列类型:核酸链况:单链拓扑学:线性分子类型:其它核酸(合成的DNA)序列描述TCTACAAART APTGGTGNGT NARRTACAT 29SEQ ID NO:11序列长度:227l序列类型:核酸链况:双链拓扑学:线性分子类型:基因组DNA序列描述TTATATATAT TATTGATTTG TTCCTGTTGT TATTTAGTTT AGAATCAGAC GACTACACCA 60GAACCACAAT TCAACCAACA CTTATATAGA ACCTGGCTTG GAAAAAAGTA ACATTTATCA 120TTCCTATACT TTTTTAGCAA ACATAATCCG TGTTTTACAT ATATTATTCA CCCAATATCA 180TAACAAAAAC AAACTGAATA ATGGCGTCTT CTATTTTGCG TTCCAAAATA ATACAAAAAC 240CGTACCAATT ATTCCACTAC TATTTTCTTC TGGAGAAGGC TCCTGGTTCT ACAGTTAGTG 300ATTTGAATTT TGATACAAAC ATACAAACGA GTTTACGTAA ATTAAAGCAT CATCATTGGA 360CGGTGGGAGA AATATTCCAT TATGGGTTTT TGGTTTCCAT ACTTTTTTTC GTGTTTGTGG 420TTTTCCCAGC TTCATTTTTT ATAAAATTAC CAATAATCTT AGCATTTGCT ACTTGTTTTT 480TAATACCCTT AACATCACAA TTTTTTCTTC CTGCCTTGCC CGTTTTCACT TGGTTGGCAT 540TATATTTTAC GTGTGCTAAA ATACCTCAAG AATGGAAACC AGCTATCACA GTTAAAGTTT 600TACCAGCTAT GGAAACAATT TTGTACGGCG ATAATTTATC AAATGTTTTG GCAACCATCA 660CTACCGGAGT GTTAGATATA TTGGCATGGT TACCATATGG GATTATTCAT TTCAGTTTCC 720CATTTGTACT TGCTGCTATT ATATTTTTAT TTGGGCCACC GACGGCATTA AGATCATTTG 780GATTTGCCTT TGGTTATATG AACTTGCTTG GAGTCTTGAT TCAAATGGCA TTCCCAGCTG 840CTCCTCCATG GTACAAAAAC TTGCACGGAT TAGAACCAGC TAATTATTCA ATGCACGGGT 900CTCCTGGTGG ACTTGGAAGG ATAGATAAAT TGTTAGGTGT TGATATGTAT ACCACAGGGT 960TTTCCAATTC ATCAATCATT TTTGGGGCAT TCCCATCGTT ACATTCAGGA TGTTGTATCA 1020TGGAAGTGTT ATTTTTGTGT TGGTTGTTTC CACGATTCAA GTTTGTGTGG GTTACATACG 1080CATCTTGGCT TTGGTGGAGC ACGATGTATT TGACCCATCA CTACTTTGTC GATTTGATTG 1140GTGGAGCCAT GCTATCTTTG ACTGTTTTTG AGTTCACCAA ATATAAATAT TTGCCAAAAA 1200ACAAAGAAGG CCTTTTCTGT CGTTGGTCAT ACACTGAAAT TGAAAAAATC GATATCCAAG 1260AGATTGACCC TTTATCATAC AATTATATCC CTGTCAACAG CAATGATAAT GAAAGCAGAT 1320TGTATACGAG AGTGTACCAA GAGTCTCAGG TTAGTCCCCC ACAGAGAGCT GAAACACCTG 1380AAGCATTTGA GATGTCAAAT TTTTCTAGGT CTAGACAAAG CTCAAAGACT CAGGTTCCAT 1440TGAGTAATCT TACTAACAAT GATCAAGTGT CTGGAATTAA CGAAGAGGAT GAAGAAGAAG 1500AAGGCGATGA AATTTCATCG AGTACTCCTT CGGTGTTTGA AGACGAACCA CAGGGTAGCA 1560CATATGCTGC ATCCTCAGCT ACATCAGTAG ATGATTTGGA TTCCAAAAGA AATTAGTAAA 1620ATAACAGTTT CTATTAATTT CTTTATTTCC TCCTAATTAA TGATTTTATG CTCAATACCT 1680ACACTATCTG TTTTTAATTT CCTACTTTTT TTTTATTATT GTTGAGTTCA TTTGCTGTTC 1740ATTGAATATT TACAATTTTG CATTAATTAC CATCAATATA GAATGGGCAC AGTTTTTTTA 1800AGTTTTTTTG TTTTTGTGTT TGTCTTTCTT TTTTTACATT AATGTGTTTG GATTGTTTTA 1860GGTTCCTTTA TCCCTTAGCC CCCTCAGAAT ACTATTTTAT CTAATTAATT TGTTTTTATT 1920TTCTGATATT TACCAATTGC TTTTTCTTTT GGATATTTAT AATAGCATCC CCTAATAATT 1980AATATACAAC TGTTTCATAT ATATACGTGT ATGTCCTGTA GTGGTGGAAA CTGGAGTCAA 2040CATTTGTATT AATGTGTACA AGAAAGCAGT GTTAATGCTA CTATTATAAT TTTTGAGGTG 2100CAAATCAAGA GGTTGGCAGC TTTCTTATGG CTATGACCGT GAATGAAGGC TTGTAAACCA 2160CGTAATAAAC AAAAGCCAAC AAGTTTTTTT AGAGCCTTTA ACAACATACG CAATGAGAGT 2220GATTGCAATA CTACAAGATA TAGCCCAAAA AATTGAATGC ATTTCAACAA CAAC 2274SEQ ID NO:12序列长度:471序列类型:氨基酸链况:单链拓扑学:线性分子类型:肽序列描述Met Ala Ser Ser Ile Leu Arg Ser Lys Ile Ile Gln Lys Pro Tyr 1 5 10 15Gln Leu Phe His Tyr Tyr Phe Leu Ser Glu Lys Ala Pro Gly Ser
20 25 30Thr Val Ser Asp Leu Asn Phe Asp Thr Asn Ile Gln Thr Ser Leu
35 40 45Arg Lys Leu Lys His His His Trp Thr Val Gly Glu Ile Phe His
50 55 60Tyr Gly Phe Leu Val Ser Ile Leu Phe Phe Val Phe Val Val Phe
65 70 75Pro Ala Ser Phe Phe Ile Lys Leu Pro Ile Ile Leu Ala Phe Ala
80 85 90Thr Cys Phe Leu Ile Pro Leu Thr Ser Gln Phe Phe Leu Pro Ala
95 100 105Leu Pro Val Phe Thr Trp Leu Ala Leu Tyr Phe Thr Cys Ala Lys
110 115 120Ile Pro Gln Glu Trp Lys Pro Ala Ile Thr Val Lys Val Leu Pro
125 130 135Ala Met Glu Thr Ile Leu Tyr Gly Asp Asn Leu Ser Asn Val Leu
140 145 150Ala Thr Ile Thr Thr Gly Val Leu Asp Ile Leu Ala Trp Leu Pro
155 160 165Tyr Gly Ile Ile His Phe Ser Phe Pro Phe Val Leu Ala Ala Ile
170 175 180Ile Phe Leu Phe Gly Pro Pro Thr Ala Leu Arg Ser Phe Gly Phe
185 190 195Ala Phe Gly Tyr Met Asn Leu Leu Gly Val Leu Ile Gln Met Ala
200 205 210Phe Pro Ala Ala Pro Pro Trp Tyr Lys Asn Leu His Gly Leu Glu
215 220 225Pro Ala Asn Tyr Ser Met His Gly Ser Pro Gly Gly Leu Gly Arg
230 235 240Ile Asp Lys Leu Leu Gly Val Asp Met Tyr Thr Thr Gly Phe Ser
245 250 255Asn Ser Ser Ile Ile Phe Gly Ala Phe Pro Ser Leu His Ser Gly
260 265 270Cys Cys Ile Met Glu Val Leu Phe Leu Cys Trp Leu Phe Pro Arg
275 280 285Phe Lys Phe Val Trp Val Thr Tyr Ala Ser Trp Leu Trp Trp Ser
290 295 300Thr Met Tyr Leu Thr His His Tyr Phe Val Asp Leu Ile Gly Gly
305 310 315Ala Met Leu Ser Leu Thr Val Phe Glu Phe Thr Lys Tyr Lys Tyr
320 325 330Leu Pro Lys Asn Lys Glu Gly Leu Phe Cys Arg Trp Ser Tyr Thr
335 340 345Glu Ile Glu Lys Ile Asp Ile Gln Glu Ile Asp Pro Leu Ser Tyr
350 355 360Asn Tyr Ile Pro Val Asn Ser Asn Asp Asn Glu Ser Arg Leu Tyr
365 370 375Thr Arg Val Tyr Gln Glu Ser Gln Val Ser Pro Pro Gln Arg Ala
380 385 390Glu Thr Pro Glu Ala Phe Glu Met Ser Asn Phe Ser Arg Ser Arg
395 400 405Gln Ser Ser Lys Thr Gln Val Pro Leu Ser Asn Leu Thr Asn Asn
410 415 420Asp Gln Val Ser Gly Ile Asn Glu Glu Asp Glu Glu Glu Glu Gly
425 430 435Asp Glu Ile Ser Ser Ser Thr Pro Ser Val Phe Glu Asp Glu Pro
440 445 450Gln Gly Ser Thr Tyr Ala Ala Ser Ser Ala Thr Ser Val Asp Asp
455 460 465Leu Asp Ser Lys Arg Asn
470SEQ ID NO:13序列长度:22序列类型:核酸链况:单链拓扑学:线性分子类型:其它核酸(合成的DNA)序列描述 GACTATTTCA TTATGGGGCC CC 22SEQ ID NO:14序列长度:30序列类型:核酸链况:单链拓扑学:线性分子类型:其它核酸(合成的DNA)序列描述GTTAACTCGA GAAAGTGCCC ATCAGTGTTC 30SEQ ID NO:15序列长度:29序列类型:核酸链况:单链拓扑学:线性分子类型:其它核酸(合成的DNA)序列描述GTTAACGGTA CCTCATCGTT ACACCGTTC 29SEQ ID NO:16序列长度:19序列类型:核酸链况:单链 拓扑学:线性分子类型:其它核酸(合成的DNA)序列描述GCTAAACGAC AATCCTGAC 19SEQ ID NO:17序列长度:21序列类型:核酸链况:单链拓扑学:线性分子类型:其它核酸(合成的DNA)序列描述CGTTGGCCGA TTCATTAATG C 21SEQ ID NO:18序列长度:401序列类型:氨基酸链况:单链拓扑学:线性分子类型:肽序列描述Met Ala Asn Pro Phe Ser Arg Trp Phe Leu Ser Glu Arg Pro Pro 1 5 10 15Asn Cys His Val Ala Asp Leu Glu Thr Ser Leu Asp Pro His Gln
20 25 30Thr Leu Leu Lys Val Gln Lys Tyr Lys Pro Ala Leu Ser Asp Trp
35 40 45Val His Tyr Ile Phe Leu Gly Ser Ile Met Leu Phe Val Phe Ile
50 55 60Thr Asn Pro Ala Pro Trp Ile Phe Lys Ile Leu Phe Tyr Cys Phe
65 70 75Leu Gly Thr Leu Phe Ile Ile Pro Ala Thr Ser Gln Phe Phe Phe
80 85 90Asn Ala Leu Pro Ile Leu Thr Trp Val Ala Leu Tyr Phe Thr Ser
95 100 105Ser Tyr Phe Pro Asp Asp Arg Arg Pro Pro Ile Thr Val Lys Val
110 115 120Leu Pro Ala Val Glu Thr Ile Leu Tyr Gly Asp Asn Leu Ser Asp
125 130 135Ile Leu Ala Thr Ser Thr Asn Ser Phe Leu Asp Ile Leu Ala Trp
140 145 150Leu Pro Tyr Gly Leu Phe His Phe Gly Ala Pro Phe Val Val Ala
155 160 165Ala Ile Leu Phe Val Phe Gly Pro Pro Thr Val Leu Gln Gly Tyr
170 175 180Ala Phe Ala Phe Gly Tyr Met Asn Leu Phe Gly Val Ile Met Gln
185 190 195Asn Val Phe Pro Ala Ala Pro Pro Trp Tyr Lys Ile Leu Tyr Gly
200 205 210Leu Gln Ser Ala Asn Tyr Asp Met His Gly Ser Pro Gly Gly Leu
215 220 225Ala Arg Ile Asp Lys Leu Leu Gly Ile Asn Met Tyr Thr Thr Cys
230 235 240Phe Ser Asn Ser Ser Val Ile Phe Gly Ala Phe Pro Ser Leu His
245 250 255Ser Gly Cys Ala Thr Met Glu Ala Leu Phe Phe Cys Tyr Cys Phe
260 265 270Pro Lys Leu Lys Pro Leu Phe Ile Ala Tyr Val Cys Trp Leu Trp
275 280 285Trp Ser Thr Met Tyr Leu Thr His His Tyr Phe Val Asp Leu Met
290 295 300Ala Gly Ser Val Leu Ser Tyr Val Ile Phe Gln Tyr Thr Lys Tyr
305 310 315Thr His Leu Pro Ile Val Asp Thr Ser Leu Phe Cys Arg Trp Ser
320 325 330Tyr Thr Ser Ile Glu Lys Tyr Asp Ile Ser Lys Ser Asp Pro Leu
335 340 345Ala Ala Asp Ser Asn Asp Ile Glu Ser Val Pro Leu Ser Asn Leu
350 355 360Glu Leu Asp Phe Asp Leu Asn Met Thr Asp Glu Pro Ser Val Ser
365 370 375Pro Ser Leu Phe Asp Gly Ser Thr Ser Val Ser Arg Ser Ser Ala
380 385 390Thr Ser Ile Thr Ser Leu Gly Val Lys Arg Ala
395 400SEQ ID NO:19序列长度:40l序列类型:氨基酸链况:单链拓扑学:线性分子类型:肽序列描述Met Ala Asn Pro Phe Ser Arg Trp Phe Leu Ser Glu Arg Pro Pro 1 5 10 15Asn Cys His Val Ala Asp Leu Glu Thr Ser Leu Asp Pro His Gln
20 25 30Thr Leu Leu Lys Val Gln Lys Tyr Lys Pro Ala Leu Ser Asp Trp
35 40 45Val His Tyr Ile Phe Leu Gly Ser Ile Met Leu Phe Val Phe Ile
50 55 60Thr Asn Pro Ala Pro Trp Ile Phe Lys Ile Leu Phe Tyr Cys Phe
65 70 75Leu Gly Thr Leu Phe Ile Ile Pro Ala Thr Ser Gln Phe Phe Phe
80 85 90Ash Ala Leu Pro Ile Leu Thr Trp Val Ala Leu Tyr Phe Thr Ser
95 100 105Ser Tyr Phe Pro Asp Asp Arg Arg Pro Pro Ile Thr Val Lys Val
110 115 120Leu Pro Ala Val Glu Thr Ile Leu Tyr Gly Asp Asn Leu Ser Asp
125 130 135Ile Leu Ala Thr Ser Thr Asn Ser Phe Leu Asp Ile Leu Ala Trp
140 145 150Leu Pro Tyr Gly Leu Phe His Tyr Gly Ala Pro Phe Val Val Ala
155 160 165Ala Ile Leu Phe Val Phe Gly Pro Pro Thr Val Leu Gln Gly Tyr
170 175 180Ala Phe Ala Phe Gly Tyr Met Asn Leu Phe Gly Val Ile Met Gln
185 190 195Asn Val Phe Pro Ala Ala Pro Pro Trp Tyr Lys Ile Leu Tyr Gly
200 205 210Leu Gln Ser Ala Asn Tyr Asp Met His Gly Ser Pro Gly Gly Leu
215 220 225Ala Arg Ile Asp Lys Leu Leu Gly Ile Asn Met Tyr Thr Thr Cys
230 235 240Phe Ser Asn Ser Ser Val Ile Phe Gly Ala Phe Pro Ser Leu His
245 250 255Ser Gly Cys Ala Thr Met Glu Ala Leu Phe Phe Cys Tyr Cys Phe
260 265 270Pro Lys Leu Lys Pro Leu Phe Ile Ala Tyr Val Cys Trp Leu Trp
275 280 285Trp Ser Thr Met Tyr Leu Thr His His Tyr Phe Val Asp Leu Met
290 295 300Ala Gly Ser Val Leu Ser Tyr Val Ile Phe Gln Tyr Thr Lys Tyr
305 310 315Thr His Leu Pro Ile Val Asp Thr Ser Leu Phe Cys Arg Trp Ser
320 325 330Tyr Thr Ser Ile Glu Lys Tyr Asp Ile Ser Lys Ser Asp Pro Leu
335 340 345Ala Ala Asp Ser Asn Asp Ile Glu Ser Val Pro Leu Ser Asn Leu
350 355 360Glu Leu Asp Phe Asp Leu Asn Met Thr Asp Glu Pro Ser Val Ser
365 370 375Pro Ser Leu Phe Asp Gly Ser Thr Ser Val Ser Arg Ser Ser Ala
380 385 390Thr Ser Ile Thr Ser Leu Gly Val Lys Arg Ala
395 400SEQ ID NO:20序列长度:1206序列类型:核酸链况:双链拓扑学:线性分子类型:基因组DNA序列描述ATGGCAAACC CTTTTTCGAG ATGGTTTCTA TCAGAGAGAC CTCCAAACTG CCATGTAGCC 60GATTTAGAAA CAAGTTTAGA TCCCCATCAA ACGTTGTTGA AGGTGCAAAA ATACAAACCC 120GCTTTAAGCG ACTGGGTGCA TTACATCTTC TTGGGATCCA TCATGCTGTT TGTGTTCATT 180ACTAATCCCG CACCTTGGAT CTTCAAGATC CTTTTTTATT GTTTCTTGGG CACTTTATTC 240ATCATTCCAG CTACGTCACA GTTTTTCTTC AATGCCTTGC CCATCCTAAC ATGGGTGGCG 300CTGTATTTCA CTTCATCGTA CTTTCCAGAT GACCGCAGGC CTCCTATTAC TGTCAAAGTG 360TTACCAGCGG TGGAAACAAT TTTATACGGC GACAATTTAA GTGATATTCT TGCAACATCG 420ACGAATTCCT TTTTGGACAT TTTAGCATGG TTACCGTACG GACTATTTCA TTTTGGGGCC 480CCATTTGTCG TTGCTGCCAT CTTATTCGTA TTTGGTCCAC CAACTGTTTT GCAAGGTTAT 540GCTTTTGCAT TTGGTTATAT GAACCTGTTT GGTGTTATCA TGCAAAATGT CTTTCCAGCC 600GCTCCCCCAT GGTATAAAAT TCTCTATGGA TTGCAATCAG CCAACTATGA TATGCATGGC 660TCGCCTGGTG GATTAGCTAG AATTGATAAG CTACTCGGTA TTAATATGTA TACTACATGT 720TTTTCAAATT CCTCCGTCAT TTTCGGTGCT TTTCCTTCAC TGCATTCCGG GTGTGCTACT 780ATGGAAGCCC TGTTTTTCTG TTATTGTTTT CCAAAATTGA AGCCCTTGTT TATTGCTTAT 840GTTTGCTGGT TATGGTGGTC AACTATGTAT CTGACACACC ATTATTTTGT AGACCTTATG 900GCAGGTTCTG TGCTGTCATA CGTTATTTTC CAGTACACAA AGTACACACA TTTACCAATT 960GTAGATACAT CTCTTTTTTG CAGATGGTCA TACACTTCAA TTGAGAAATA CGATATATCA 1020AAGAGTGATC CATTGGCTGC AGATTCAAAC GATATCGAAA GTGTCCCTTT GTCCAACTTG 1080GAACTTGACT TTGATCTTAA TATGACTGAT GAACCCAGTG TAAGCCCTTC GTTATTTGAT 1140GGATCTACTT CTGTTTCTCG TTCGTCCGCC ACGTCTATAA CGTCACTAGG TGTAAAGAGG 1200GCTTAA 1206SEQ ID NO:21序列长度:1206序列类型:核酸链况:双链拓扑学:线性分子类型:基因组DNA序列描述ATGGCAAACC CTTTTTCGAG ATGGTTTCTA TCAGAGAGAC CTCCAAACTG CCATGTAGCC 60GATTTAGAAA CAAGTTTAGA TCCCCATCAA ACGTTGTTGA AGGTGCAAAA ATACAAACCC 120GCTTTAAGCG ACTGGGTGCA TTACATCTTC TTGGGATCCA TCATGCTGTT TGTGTTCATT 180ACTAATCCCG CACCTTGGAT CTTCAAGATC CTTTTTTATT GTTTCTTGGG CACTTTATTC 240ATCATTCCAG CTACGTCACA GTTTTTCTTC AATGCCTTGC CCATCCTAAC ATGGGTGGCG 300CTGTATTTCA CTTCATCGTA CTTTCCAGAT GACCGCAGGC CTCCTATTAC TGTCAAAGTG 360TTACCAGCGG TGGAAACAAT TTTATACGGC GACAATTTAA GTGATATTCT TGCAACATCG 420ACGAATTCCT TTTTGGACAT TTTAGCATGG TTACCGTACG GACTATTTCA TTATGGGGCC 480CCATTTGTCG TTGCTGCCAT CTTATTCGTA TTTGGTCCAC CAACTGTTTT GCAAGGTTAT 540GCTTTTGCAT TTGGTTATAT GAACCTGTTT GGTGTTATCA TGCAAAATGT CTTTCCAGCC 600GCTCCCCCAT GGTATAAAAT TCTCTATGGA TTGCAATCAG CCAACTATGA TATGCATGGC 660TCGCCTGGTG GATTAGCTAG AATTGATAAG CTACTCGGTA TTAATATGTA TACTACATGT 720TTTTCAAATT CCTCCGTCAT TTTCGGTGCT TTTCCTTCAC TGCATTCCGG GTGTGCTACT 780ATGGAAGCCC TGTTTTTCTG TTATTGTTTT CCAAAATTGA AGCCCTTGTT TATTGCTTAT 840GTTTGCTGGT TATGGTGGTC AACTATGTAT CTGACACACC ATTATTTTGT AGACCTTATG 900GCAGGTTCTG TGCTGTCATA CGTTATTTTC CAGTACACAA AGTACACACA TTTACCAATT 960GTAGATACAT CTCTTTTTTG CAGATGGTCA TACACTTCAA TTGAGAAATA CGATATATCA 1020AAGAGTGATC CATTGGCTGC AGATTCAAAC GATATCGAAA GTGTCCCTTT GTCCAACTTG 1080GAACTTGACT TTGATCTTAA TATGACTGAT GAACCCAGTG TAAGCCCTTC GTTATTTGAT 1140GGATCTACTT CTGTTTCTCG TTCGTCCGCC ACGTCTATAA CGTCACTAGG TGTAAAGAGG 1200GCTTAA 1206SEQ ID NO:22序列长度:1206序列类型:核酸链况:双链拓扑学:线性分子类型:基因组DNA序列描述ATGGCAAACC CTTTTTCGAG ATGGTTTCTA TCAGAGAGAC CTCCAAACTG CCATGTAGCC 60GATTTAGAAA CAAGTTTAGA TCCCCATCAA ACGTTGTTGA AGGTGCAAAA ATACAAACCC 120GCTTTAAGCG ACTGGGTGCA TTACATCTTC TTGGGATCCA TCATGCTGTT TGTGTTCATT 180ACTAATCCCG CACCTTGGAT CTTCAAGATC CTTTTTTATT GTTTCTTGGG CACTTTATTC 240ATCATTCCAG CTACGTCACA GTTTTTCTTC AATGCCTTGC CCATCCTAAC ATGGGTGGCG 300CTGTATTTCA CTTCATCGTA CTTTCCAGAT GACCGCAGGC CTCCTATTAC TGTCAAAGTG 360TTACCAGCGG TGGAAACAAT TTTATACGGC GACAATTTAA GTGATATTCT TGCAACATCG 420ACGAATTCCT TTTTGGACAT TTTAGCATGG TTACCGTACG GACTATTTCA TTATGGGGCC 480CCATTTGTCG TTGCTGCCAT CTTATTCGTA TTTGGTCCAC CAACTGTTTT GCAAGGTTAT 540GCTTTTGCAT TTGGTTATAT GAACCTGTTT GGTGTTATCA TGCAAAATGT CTTTCCAGCC 600GCTCCCCCAT GGTATAAAAT TCTCTATGGA TTGCAATCAG CCAACTATGA TATGCATGGC 660TCGCCTGGTG GATTAGCTAG AATTGATAAG CTACTCGGTA TTAATATGTA TACTACAGCT 720TTTTCAAATT CCTCCGTCAT TTTCGGTGCT TTTCCTTCAC TGCATTCCGG GTGTGCTACT 780ATGGAAGCCC TGTTTTTCTG TTATTGTTTT CCAAAATTGA AGCCCTTGTT TATTGCTTAT 840GTTTGCTGGT TATGGTGGTC AACTATGTAT CTGACACACC ATTATTTTGT AGACCTTATG 900GCAGGTTCTG TGCTGTCATA CGTTATTTTC CAGTACACAA AGTACACACA TTTACCAATT 960GTAGATACAT CTCTTTTTTG CAGATGGTCA TACACTTCAA TTGAGAAATA CGATATATCA 1020AAGAGTGATC CATTGGCTGC AGATTCAAAC GATATCGAAA GTGTCCCTTT GTCCAACTTG 1080GAACTTGACT TTGATCTTAA TATGACTGAT GAACCCAGTG TAAGCCCTTC GTTATTTGAT 1140GGATCTACTT CTGTTTCTCG TTCGTCCGCC ACGTCTATAA CGTCACTAGG TGTAAAGAGG 1200GCTTAA 1206SEQ ID NO:23序列长度:1206序列类型:核酸链况:双链拓扑学:线性分子类型:基因组DNA序列描述ATGGCAAACC CTTTTTCGAG ATGGTTTCTA TCAGAGAGAC CTCCAAACTG CCATGTAGCC 60GATTTAGAAA CAAGTTTAGA TCCCCATCAA ACGTTGTTGA AGGTGCAAAA ATACAAACCC 120GCTTTAAGCG ACTGGGTGCA TTACATCTTC TTGGGATCCA TCATGCTGTT TGTGTTCATT 180ACTAATCCCG CACCTTGGAT CTTCAAGATC CTTTTTTATT GTTTCTTGGG CACTTTATTC 240ATCATTCCAG CTACGTCACA GTTTTTCTTC AATGCCTTGC CCATCCTAAC ATGGGTGGCG 300CTGTATTTCA CTTCATCGTA CTTTCCAGAT GACCGCAGGC CTCCTATTAC TGTCAAAGTG 360TTACCAGCGG TGGAAACAAT TTTATACGGC GACAATTTAA GTGATATTCT TGCAACATCG 420ACGAATTCCT TTTTGGACAT TTTAGCATGG TTACCGTACG GACTATTTCA TTTTGGGGCC 480CCATTTGTCG TTGCTGCCAT CTTATTCGTA TTTGGTCCAC CAACTGTTTT GCAAGGTTAT 540GCTTTTGCAT TTGGTTATAT GAACCTGTTT GGTGTTATCA TGCAAAATGT CTTTCCAGCC 600GCTCCCCCAT GGTATAAAAT TCTCTATGGA TTGCAATCAG CCAACTATGA TATGCATGGC 660TCGCCTGGTG GATTAGCTAG AATTGATAAG CTACTCGGTA TTAATATGTA TACTACAGCT 720TTTTCAAATT CCTCCGTCAT TTTCGGTGCT TTTCCTTCAC TGCATTCCGG GTGTGCTACT 780ATGGAAGCCC TGTTTTTCTG TTATTGTTTT CCAAAATTGA AGCCCTTGTT TATTGCTTAT 840GTTTGCTGGT TATGGTGGTC AACTATGTAT CTGACACACC ATTATTTTGT AGACCTTATG 900GCAGGTTCTG TGCTGTCATA CGTTATTTTC CAGTACACAA AGTACACACA TTTACCAATT 960GTAGATACAT CTCTTTTTTG CAGATGGTCA TACACTTCAA TTGAGAAATA CGATATATCA 1020AAGAGTGATC CATTGGCTGC AGATTCAAAC GATATCGAAA GTGTCCCTTT GTCCAACTTG 1080GAACTTGACT TTGATCTTAA TATGACTGAT GAACCCAGTG TAAGCCCTTC GTTATTTGAT 1140GGATCTACTT CTGTTTCTCG TTCGTCCGCC ACGTCTATAA CGTCACTAGG TGTAAAGAGG 1200GCTTAA 1206SEQ ID NO:24序列长度:30序列类型:核酸链况:单链拓扑学:线性分子类型:其它核酸(合成的DNA)SEQUENCE DESCRIPTION:AATATGTATA CTACATGTTT TTCAAATTCC 30SEQ ID NO:25序列长度:30序列类型:核酸链况:单链拓扑学:线性分子类型:其它核酸(合成的DNA)序列描述GTTAACTCGA GAAAGTGCCC ATCAGTGTTC 30SEQ ID NO:26序列长度:29序列类型:核酸链况:单链拓扑学:线性分子类型:其它核酸(合成的DNA)序列描述GTTAACGGTA CCAGAGGAAA GAATAACGC 29
机译: 编码调节金黄担子素敏感性的蛋白质的基因
机译: 编码调节金黄担子素敏感性的蛋白质的基因
机译: 编码调节金黄担子素敏感性的蛋白质的基因