首页> 中国专利> 来自菌株产加尔巴丁游动放线菌和利古里亚游动放线菌中的羊毛硫细菌素的生物合成成簇基因

来自菌株产加尔巴丁游动放线菌和利古里亚游动放线菌中的羊毛硫细菌素的生物合成成簇基因

摘要

本发明涉及羊毛硫细菌素类抗菌肽阿肽加定的生物合成成簇基因的表征,一种新型变种阿肽加定与其基因合成簇的鉴定。本发明还涉及生产与使用如下多肽的方法,其包括:阿肽加定,一种新的阿肽加定变体即本文中的阿肽加定B,以及根据本发明应用已表征的生物合成成簇基因中的基因所生产出的这两种多肽的变体形式。

著录项

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2017-03-08

    未缴年费专利权终止 IPC(主分类):C07K7/08 授权公告日:20130605 终止日期:20160117 申请日:20070117

    专利权的终止

  • 2013-06-05

    授权

    授权

  • 2009-05-13

    实质审查的生效

    实质审查的生效

  • 2009-03-18

    公开

    公开

说明书

技术领域

本发明涉及羊毛硫细菌素类抗菌肽阿肽加定(actagardine)的生物合成成簇基因的表征,一种新型阿肽加定变异体与它的基因合成簇的鉴定。本发明还涉及生产与使用如下多肽的方法,其包括:阿肽加定,菌株利古里亚游动放线菌中的一种新的阿肽加定变体形式,以及根据本发明应用已表征的生物合成成簇基因中的基因所生产出的这两种多肽的变体形式。

背景技术

羊毛硫细菌素类抗菌肽是一类革兰氏阳性细菌合成的具有包括抗菌能力在内的多种活性的多肽。除了其他类型的残基修饰以外,它们通过硫醚氨基酸羊毛硫氨酸和甲基羊毛硫氨酸将肽链相互交联,形成一种多环的结构。根据一种并不绝对的分类标准,这类抗菌肽可以分为2种类型,A型和B型。A型羊毛硫细菌素类抗菌肽是一类较为延伸的亲水脂类肽,它们具有在细菌膜以及其他原生质膜上形成孔洞的能力。如乳链菌肽(Nisin)和枯草菌素(subtilin)。相反的,B型羊毛硫细菌素类抗菌肽是一类球形的,有确定构象的多肽,它们能够抑制特异的酶的活性。如肉桂霉素(cinnamycin)和耐久霉素(duramycin)。

B型羊毛硫细菌素类抗菌肽例如肉桂霉素(cinnamycin)的活性包括:抑制细菌活性(提供潜在的抗生素应用前景),抑制血管紧张素转换酶活性(提供潜在的血压调节应用前景),通过抑制磷脂酶A2活性实现的免疫调节(提供潜在的抗炎药物应用前景),以及对前列腺素和白三烯的生物合成的干扰。

B型羊毛硫细菌素类抗菌肽看来能通过封阻酶的底物从而干扰酶的活性。例如,研究发现mersacidin和阿肽加定这样的B型羊毛硫细菌素类抗菌肽可以抑制肽聚糖的生物合成;转糖基反应被确认为靶反应。这个反应的反应底物是lipid II,它是形成脂结合细胞壁的前体。尽管它同时也是羊毛硫细菌素类抗菌肽万古霉素的作用靶点,但这个反应的反应位点是与之不同的一个新的作用位点,还没有运用于任何现有的抗菌类药物中。

研究表明B型羊毛硫细菌素抗菌肽的麻西那霉素(cinnamycin)类具有抗菌活性,尤其是针对芽孢杆菌,并且描述了麻西那霉素对细菌膜功能的影响,对三磷酸腺苷依赖的质子转运,钙离子的摄取以及三磷酸腺苷酶活性的影响。此外,也有报道说明麻西那霉素能导致含有磷脂酰乙醇胺的细菌扁平膜产生边界分明的孔洞。这些效应都可以归因与上述这些B型羊毛硫细菌素抗菌肽与磷脂酰乙醇胺的特异性结合。

羊毛硫细菌素类抗菌肽已应用于作为食品添加剂以及对抗痤疮丙酸杆菌(Propionibacterium acnes)和一些难对付的病原菌如对常用的抗生素产生抗药性的耐甲氧西林金黄色葡萄球菌(MRSA)以及肺炎链球菌(Streptococcus pneumoniae),并表现出了其有效性和实用性。更详尽的综述,可以参阅如下文献:SahI和Bierbaum(1998)Annual Rev.Microbiol.52:41-79;Jack和SahI(1995)TIBTECH 13:269-278;Gasson(1995)羊毛硫细菌素s,第十章,在Vining和Stuttard(eds)Biotechnology Series:Genetics and Biochemistry of Antibiotic Production,Biotechnological I 30Series 28,283-306页。

在抗生素领域,对新型抗菌化合物总是有着持续性的需求,以此克服抗药性,生物兼容性以及毒性等各种问题。同样,对生产羊毛硫细菌素类抗菌肽及其变体形式(具有与其天然形式不同的活性特征)也有着相应的需求。

阿肽加定是一种已知的B型四环的羊毛硫细菌素类抗菌肽,其肽段包含19个氨基酸(1890Da)。它在体外实验和体内的模式动物实验中,均表现出强大的抑制重要的革兰氏阳性病原菌如金黄色葡萄球菌(Staphylococcus aureus)和化脓性链球菌(Streptococcus pyogenes)活力的能力。阿肽加定的结构如图4所示。该化合物由一个前原肽(pre-pro-peptide)生成,此前原肽的C末端部分的多肽序列为SSGWVCTL TIECGTVICAC(序列编号为SEQ ID NO:4)。这段多肽(SEQID NO:4)通过以下步骤的交联反应修饰,形成其二级结构和三级结构:1-6交联,形成羊毛硫氨酸(Ser-Cys);7-12交联,形成β甲基羊毛硫氨酸(Thr-Cys);9-17交联,形成β甲基羊毛硫氨酸(Thr-Cys);14-19交联,形成形成β甲基羊毛硫氨酸亚砜(Thr-Cys)。

有报道表明,阿肽加定可以由游动放线菌属(Actinoplanes)中的两个菌种产加尔巴丁游动放线菌(A.garbadinensis))和利古里亚游动放线菌(A.liguriae)产生。同时产生的还有一种阿肽加定的类似物,其14-19交联没有被氧化,也就是指它是一个β甲基羊毛硫氨酸而不是β甲基羊毛硫氨酸亚砜。本文中称为脱氧阿肽加定(deoxy-actagardine)。

专利US6,022,851中描述了从产加尔巴丁游动放线菌和A.liguriae的分离株中提取阿肽加定的方法。

发明内容

本发明涉及与源于产加尔巴丁游动放线菌(Actinoplanes garbadinensis)和利古里亚游动放线菌(Actinoplanes liguriae)中的B型羊毛硫细菌素类抗菌肽阿肽加定相关的生物合成成簇基因的信息,包括克隆的,测序的,已阐明的结构信息和调控信息。

本发明还在利古里亚游动放线菌的分离株中惊奇地发现,所述分离株在这里命名为利古里亚游动放线菌NCIMB 41362,其产生一种新的形式的阿肽加定,这里命名为阿肽加定B(actagardine B),其非氧化形式命名为脱氧阿肽加定B(deoxy-actagardine B)。这些形式都具有同阿肽加定相似的抗微生物活性,并且都是由序列编号为SEQ ID NO:1的起始多肽通过与生成阿肽加定相似的交联反应步骤生成。这些变体形式可以作为阿肽加定新的有用的替代物。并且,在鉴定阿肽加定B与阿肽加定之间所拥有的不同氨基酸残基信息之后,可以基于这些不同研发出更多的羊毛硫细菌素类抗菌肽。

本发明也提供了从产生阿肽加定的菌株产加尔巴丁游动放线菌和利古里亚游动放线菌NCIMB 41362中分别分离出的包含产生阿肽加定和阿肽加定B相关的基因的成簇基因的信息。

一方面,本发明提供了一种新的阿肽加定B及其变体形式,包括基于初级多肽序列SEQ ID NO:2和SEQ ID NO:3的变体形式以及这些变体形式的变体形式。

另一方面,本发明提供了编码阿肽加定B及其变体形式的核酸,提供了源于上文中所提到的成簇基因的一系列核酸以及它们的变体形式,提供了生成阿肽加定B及其变体形式的方法,还提供了生成新的阿肽加定B变体形式的方法。

附图说明

图1提供了从产加尔巴丁游动放线菌中分离出的阿肽加定编码和调控成簇基因的图谱。

图2提供了从利古里亚游动放线菌中分离出的编码阿肽加定(actagardine)的新变体形式的编码和调控成簇基因的图谱,所述阿肽加定的新变体形式在这里被称为actagardine B。

图3提供了利用从产加尔巴丁游动放线菌或者利古里亚游动放线菌中分离得到的核酸序列产生新的阿肽加定变体形式的方法的示意图。

图4是一个成熟的阿肽加定的一级结构示意图。其中,X1-X2代表Val-Ile,Y代表-S(O)-,Z表示NH2。“脱氧阿肽加定B(deoxy-actagardineB)”是第15位的Val突变为Leu,第16位的Ile突变为Val,该变体形式的AbuS14和AlaS19之间存在一个非氧化形式的甲基羊毛硫氨酸桥。

序列说明

为了方便阅读,本申请中提到的序列用数字非连续地编号如下(:SEQ ID NO:1是阿肽加定B(Actagardine B)多肽的一级结构序列:SSGWVCTLTIECGTLVCAC.

SEQ ID NO:2是阿肽加定B(Actagardine B)变体VV多肽的一级结构序列:

SSGWVCTLTIECGTVVCAC.

SEQ ID NO:3是阿肽加定B(Actagardine B)变体LI多肽的一级结构序列:

SSGWVCTLTIECGTLICAC.

SEQ ID NO:4是阿肽加定多肽(Actagardine)的一级结构序列:

SSGWVCTLTIECGTVICAC;

SEQ ID NO:11是丙氨酰阿肽加定多肽B(Ala-Actagardine B)的一级结构序列:

ASSGWVCTLTIECGTLVCAC.

SEQ ID NO:12是丙氨酰阿肽加定多肽B(Ala-Actagardine B)变体VV的一级结构序列:

ASSGWVCTLTIECGTVVCAC.

SEQ ID NO:13是丙氨酰阿肽加定多肽B(Ala-Actagardine B)变体LI的一级结构序列:

ASSGWVCTLTIECGTLICAC.

SEQ ID NO:14是丙氨酰阿肽加定多肽(Ala-Actagardine)的一级结构序列:

ASSGWVCTLTIECGTVICAC.

SEQ ID NO:212是阿肽加定B的前原肽(pre-pro-Actagardine B)的一级结构序列:

MSAITVETTWKNTDLREDLTAHPAGLGFGELSFEDLREDRTIYAASSGWVCTLTIECGTLVCAC.

SEQ ID NO:22是阿肽加定B的前原肽(pre-pro-Actagardine B)变体VV的一级结构序列:

MSAITVETTWKNTDLREDLTAHPAGLGFGELSFEDLREDRTIYAASSGWVCTLTIECGTVVCAC.

SEQ ID NO:23是阿肽加定B的前原肽(pre-pro-Actagardine B)变体LI的一级结构序列:

MSALAIEKSWKDVDLRDGATSHPAGLGFGELTFEDLREDRTIYAASSGWVCTLTIECGTLICAC.

SEQ ID NO:119是阿肽加定的前原肽(pre-pro-Actagardine)的一级结构序列:

MSALAIEKSWKDVDLRDGATSHPAGLGFGELTFEDLREDRTIYAASSGWVCTLTIECGTVICAC.

SEQ ID NO:100是粘粒CosAG14中源于产加尔巴丁游动放线菌且不含载体序列的核酸序列。

SEQ ID NOs:101-132分别是SEQ ID NO:100中的开放阅读框orf1-orf32对应的多肽序列。

SEQ ID NO:200是粘粒CosAL02中源于利古里亚游动放线菌且不含载体序列的核酸序列。

SEQ ID NOs:201-231分别是SEQ ID NO:200中的开放阅读框orf1-orf31对应的多肽序列。

SEQ ID NOs:300-312是下文记载的引物序列。

发明详述

本发明涉及SEQ ID NO:100和SEQ ID NO:200所列成簇基因以及这些成簇基因所编码的多肽及其变体形式。SEQ ID NO:119所列多肽是阿肽加定的前原肽(pre-pro-actagardine),SEQ ID NO:212所列多肽是阿肽加定B的前原肽(pre-pro-actagardine B)。其余本发明涉及的多肽以及它们的变体形式(本文中定义了的)在本文中统称为“成簇多肽”(clusterpolypeptides)。源于序列SEQ ID NO:100的成簇多肽称为“1XX多肽系列”,相应的,源于序列SEQ ID NO:200的成簇多肽称为“2XX多肽系列”。与一个成簇多肽在序列和长度上都是100%一致的多肽称为野生型多肽。源于序列SEQ ID NO:100和SEQ ID NO:200的成簇多肽可以是野生型,也可以是变体形式。

多肽可以是基本分离的形式,本发明中分离出的多肽就是指那些上文中定义的序列的分离形式,它不含有,或者基本不含有别的天然条件下与之结合的物质,如细菌中的其它多肽。例如,这些多肽天然可以与稀释剂或者佐剂一起配制,为了实用的目的又将其分离出来。

同样本发明中的多肽可能是一种基本纯化的形式,这种情况下,在制备物中有不少于90%,例如95%,98%,甚至99%的多肽是本发明的多肽。

羊毛硫细菌素多肽以及Lantibiotic A基因

本发明中,提及羊毛硫细菌素A或者LanA多肽时,羊毛硫细菌素A或者LanA基因,一般是指一种B型的羊毛硫细菌素类抗菌肽的多肽,以及编码该多肽的基因。因此,当提及上述表述形式时,即指包括如下在内的多肽或者基因:肉桂霉素(cinnamycin),mersacidin,阿肽加定和阿肽加定B(actagardine B)以及编码这些多肽的基因。当提及一种能产生羊毛硫细菌素类抗菌肽的宿主细胞,即是指能够在天然形式下产生LanA多肽的任意一种宿主细胞,下文将会有更加详细的定义。

LanA多肽是指一种具有抗菌活性的多肽。抗菌活性可通过测定该多肽抗某种参照微生物如藤黄微球菌(Micrococcus luteus)的MIC值来确定。一种LanA多肽展现出抗菌活性是指其MIC值小于或等于阿肽加定抗同种参照微生物菌株的MIC值的16倍。在本发明中,菌株产加尔巴丁游动放线菌中的LanA基因记为actA,同时利古里亚游动放线菌中的LanA基因记为LigA。

其他类型的Lan多肽

本文中如提及“LanM”多肽,是指源于羊毛硫细菌素类抗菌肽成簇基因的一种多肽,其是一种在前体多肽转换为具有羊毛硫细菌素类抗菌肽性质化合物的过程中所必需的修饰因子。LanM多肽包括:SEQ IDNO:120(ActM)及其变体形式,SEQ ID NO:213(LigM)及其变体形式。专利WO02/088367中定义的多肽cinM,Altena等人2000年报道的多肽mrsM,以及与能够产生B型羊毛硫细菌素类抗菌肽的细菌成簇基因同源的多肽。

本文中如提及“LanR”多肽,是指源于Lantibiotic类抗菌肽成簇基因的一种多肽,其是一种在前体多肽的合成调控过程中必需的调控因子。LanR多肽包括:SEQ ID NO:122(ActR)及其变体形式,SEQ ID NO:216(LigR)及其变体形式,专利WO02/088367中定义的多肽cinR1,Altena等人2000年报道的多肽mrsR1,以及与能够产生B型羊毛硫细菌素类抗菌肽的细菌成簇基因同源的多肽。

本文中如提及“LanT”多肽,是指源于羊毛硫细菌素类抗菌肽成簇基因的一种多肽,其是一种在生成羊毛硫细菌素类化合物的前体多肽的过程中必需的转运因子。LanT多肽包括:SEQ ID NO:123(ActT)及其变体形式,SEQ ID NO:214(LigT)及其变体形式,专利WO02/088367中定义的多肽cinT,Altena等人2000年报道的多肽mrsT,以及与能够产生B型羊毛硫细菌素类抗菌肽的细菌成簇基因同源的多肽。

本文中如提及“LanO”多肽,是指源于羊毛硫细菌素类抗菌肽成簇基因的一种多肽,它被认为参与了一个氧化反应使脱氧形式的阿肽加定被氧化成为阿肽加定或者使本发明的化合物中的Y被氧化成-S(O)-。

LanO多肽包括:SEQ ID NO:122(ActO)及其变体形式,SEQ IDNO:215(LigO)及其变体形式,以及与能够产生B型羊毛硫细菌素类抗菌肽的细菌成簇基因同源的多肽。

成簇多肽

一方面,本发明提供了下述成簇多肽的分离形式,他们的序列编号如下:SEQ ID NO:101,102,103,104,105,106,107,108,109,110,111,112,113,114,115,116,117,118,120,121,122,123,124,125,126,127,128,129,130,131,132,201,202,203,204,205,206,207,208,209,210,211,213,214,215,216,217,218,219,220,221,222,223,224,225,226,227,228,229,230和231。另一方面,本发明还提供了一种成簇多肽,它是上述任一序列的变体形式。

成簇多肽中值得特别关注的多肽包括属于1XX多肽系列和2XX多肽系列的LanM,LanR,LanT或者LanO类型的多肽。

与一个成簇多肽相关的变体是指:其多肽的氨基酸序列与参照多肽的氨基酸序列(这里指所有野生型的成簇多肽)相比,表现出显著的氨基酸序列同一性,但又不完全相同的多肽及其片段。

除非特别指出,优选的显著的氨基酸序列同一性是指至少80%同一性,更优选的为85%,90%或者95%,更加优选的为98%或者99%。变体的长度最好与野生型成簇多肽相同,至少具有其70%的长度,优选地为至少80%,更优选的为至少90%,更优选的为至少具有其95%的长度。

“氨基酸序列同一性百分数(%)”是指在如有必要的情况下,在对准序列和引入空位后,且不考虑保守替换作为序列同一性的一部分情况下,一个候选序列与其所比较的序列在达到了最大的序列同一性时,它们在序列上一致的氨基酸所占的百分数。本文中所用到的氨基酸序列同一性百分数的值是由软件BLAST-2生成,该软件由Altschul等人与1996年发布,可以在网址http://blast.wustl/edu/blast/README.html获得其信息。WU-BLAST-2软件在使用时所用到的参数大部分被设为默认值,可调整的参数使用了如下的设置:overlap span=1,overlap fraction=0.125,wordthreshold(T)=11。参数HSPS和HSPS2是由程序自身根据特定序列的组成和针对被搜索的目标序列的特定数据库的组成所生成的一个动态参数,但其可以被调整用于增加程序的敏感度。氨基酸序列同一性百分比的数值A%是用比对后一致的残基数目除以比对区域中“较长”序列的总氨基酸残基数乘以100后得到的数值。“较长”序列是指在对准区域中含有实际残基数最多的序列(WU BLAST-2程序为了使对准分数最大化而引入的空缺在这里忽略不计)。

一般来说可取的,变体形式将保留其对应多肽的生物学功能。在本发明中,变体形式具有生物学功能是指该变体同其成簇基因的其他成员共同存在于宿主细胞中的时候,宿主细胞具有产生羊毛硫细菌素类抗菌肽的能力。这个可以通过如下方式验证,例如,如果要验证是1XX多肽系列的成簇多肽的一个变体形式,则使用含有SEQ ID NO:100序列的宿主细胞,或者对于2XX多肽系列的成簇多肽的一个变体形式则使用含有SEQ IDNO:200序列的宿主细胞,将核苷酸序列修饰为编码其对应变体形式多肽的核苷酸序列,此时如果宿主细胞仍然能够产生相应检测的羊毛硫细菌素类抗菌肽多肽是否依然产生。

前体多肽

另一方面,本发明提供了一种多肽,优选分离形式的多肽,所述多肽是生成本发明化合物或者阿肽加定的前体。前体多肽包括下述多肽:SEQID NOs:1-4,SEQ ID NOs:11-14,SEQ ID NOs:212,22,23和119,同时还包括这些序列的能转化成为羊毛硫细菌素类抗菌肽多肽的变体形式和衍生物形式。

序列编号为SEQ ID NOs:1-4中的任意一个前体多肽的变体形式是指其序列中的一个或多个,例如1-5个,比如1,2,3或4个,氨基酸残基被其他氨基酸残基所替换的多肽。优选SEQ ID NOs:1-4中任意一个序列的前体多肽如下位置的氨基酸残基被替换掉:2,3,4,5,8,10,11,13或18。

序列编号为SEQ ID NOs:11-14中的任意一个前体多肽的变体形式是指其序列中的一个或多个,例如1-5个,比如1,2,3或4个,氨基酸残基被其他氨基酸残基所替换的多肽。优选SEQ ID NOs:11-14中任意一个序列的前体多肽如下位置的氨基酸残基被替换掉:3,4,5,6,9,11,12,14或19。

序列编号为SEQ ID NOs:212,22,23和119中的任意一个前体多肽的变体形式是指其与序列SEQ ID NOs:1-4分别对应的C末端区域(46-64位氨基酸残基)序列中的一个或多个,例如1-5个,比如1,2,3或4个,氨基酸残基被其他的氨基酸残基所替换掉的多肽。优选该前体多肽的变体形式中对应于SEQ ID NOs:1-4中的任意一个序列的如下位置的氨基酸残基被替换掉:2,3,4,5,8,10,11,13,18。这种变体也许还会进一步包括N末端的变化,这种变化至少要保留70%,例如至少80%,优选的为至少90%,例如至少95%的N末端区域(1-45位残基)。例如,SEQ IDNO:212或者SEQ ID NO:119N末端的变体形式可能包含了一个或者多个替换(例如,1-12个,比如1-5个,又如1,2或3个替换发生于如下位置4,5,6,8,9,12,13,17,18,19,21和32,我们所示的数据是在SEQ ID NO:212和SEQ ID NO:119之间变化)。

替换可以是一种氨基酸被另一种天然存在的氨基酸所替代,它可以是保守替换也可以是非保守替换。保守替换包含下表所列的情况,表中氨基酸位于第二列的同一个区间,,且优选它们在第三列的同一行中可以被彼此取代:

对SEQ ID NO:212而言,替换的氨基酸可以是与SEQ ID NO:119相对应位置的氨基酸残基不相同的,反之亦然。无论出现哪种情况,SEQ IDNO:119中的氨基酸发生替换后,都将使其转变成了SEQ ID NO:212的氨基酸序列,反之亦然。(例如,SEQ ID NO:212的第4位Ile被Leu取代,等等)。

前体多肽也可以在一个不表达羊毛硫细菌素类抗菌肽的细菌中通过表达编码其多肽的核酸来获得。

化合物

一方面,本发明提供了一种如下通式的化合物:

其中:

-X1-X2-代表-Leu-Val-,-Val-Val-或者-Leu-Ile-;

Y代表-S-或者-S(O)-;和

Z代表H2N-或者Ala-,

或其药学上可接受的盐。另一方面,本发明提供了一些来源于这些化合物的变体形式以及具有生物学活性的衍生物。

如果-X1-X2-表示的是-Leu-Val-,Y表示的是-S(O)-并且Z是NH2,本发明的该化合物也称为阿肽加定B(actagardine B)。

如果-X1-X2-表示的是-Leu-Val-,Y表示的是-S(O)-并且Z是Ala-,本发明的该化合物也称为丙氨酰阿肽加定B(ala-actagardine B)。

如果-X1-X2-表示的是-Leu-Val-,Y表示的是-S-并且Z是NH2,本发明的该化合物也称为脱氧阿肽加定B(deoxy-actagardine B)。

如果-X1-X2-表示的是-Leu-Val-,Y表示的是-S-并且Z是Ala-,本发明的该化合物也称为丙氨酰脱氧阿肽加定B(ala-deoxy-actagardine B)。

当Z表示H2N-基团的时候,是指上述化合物1位丙氨酸残基的N末端的NH2基团。相应的,当Z所表示的基团是Ala-的时候,是指一个丙氨酸残基,按照本领域惯例应该表示成Ala(0),它通过酰胺键与1位的丙氨酸相连。

变体形式

上述通式(I)所示的化合物的变体形式是指化合物中的1个或者多个如1-5个,比如1,2,3或者4个,氨基酸残基被替换成了其他的氨基酸残基。优选替换如下位置的氨基酸残基:通式(I)中的2,3,4,5,8,10,11,13或18位。

变体形式也可以包括15位或者16位的替换,如果15位和16位都发生了替换,并且其他位置的氨基酸并没有发生替换,则15位和16位分别不是Val和Ile。

当Z基团代表的是Ala-的时候,本发明化合物的变体包括该Ala-被其他氨基酸(特别是由遗传密码编码的天然氨基酸,或者其D型异构体)替换了的形式,更特别指被如下氨基酸基团所替换:Ile-,Lys-,Phe-,Val-,Glu-,Asp-,His-,Leu,Arg-,Ser-以及Trp-。一方面,如果变体形式发生替换的氨基酸是从Ile-,Lys-,Phe-,Val-,Glu-,Asp-,His-,Leu,Arg-,Ser-这些基团中选出的话,这样的变体形式可以用专利US 6,022,815中所提到的向Z=H2N的化合物中添加化学加成上述氨基酸残基的化学方法合成。要注意的是,采用化学加入加成的方法可以使允许氨基酸处于L构型或D构型。其包含了D-Ala,以及上述提到的各种氨基酸的D型异构体。

衍生物

本发明提供的化合物(包括其变体)的衍生物是指它的一个或者多个氨基酸侧链被修饰过了的产物,例如被酯化,酰胺化或者氧化的产物。

本发明提供的化合物的衍生物可以是阿肽加定中一个羧基官能团的单酰胺衍生物,特别是在C末端。更确切的说,这种衍生物可以是本发明化合物的C末端为-COR的形式,其中R表示基团-NR1R2,而R1和R2独立地代表:

(i)氢原子;

(ii)通式为-(CH2)n-NR3R4的基团,其中n代表从2到8的整数,并且R3和R4独立地代表氢原子或(C1-C4)烷基,或者R3和R4合起来代表-(CH2)3-,-(CH2)4-,(CH2)2-O-(CH2)2-,-(CH2)2-S-(CH2)2-或-(CH2)5-基团;或者R1和R2与邻近的氮原子合起来代表一个4位被如下取代物所取代的哌嗪:

(a)(C1-C4)烷基;

(b)(C5-C7)-环烷基,

(c)吡啶基,

(d)-(CH2)p-NR5R6,其中p代表一个从1到8的整数,并且R5和R6独立地代表氢原子或(C1-C4)烷基;

(e)哌啶基;

(f)被取代的哌啶基,所述被取代的哌啶基有一个(C1-C4)烷基的N-取代基。

(g)苄基;和

(h)被取代的苄基,其苯环部分带有1个或者2个取代基,所述取代基选自氯原子,溴原子,硝基,(C1-C4)烷基以及(C1-C4)烷氧基。

在一个实施例中,通式-COR中的R代表基团-NR1R2,其中R1和R2独立地代表氢原子和一个通式为-(CH2)n-NR3R4的基团,其中n表示2到8的整数,R3和R4独立地代表氢原子或(C1-C4)烷基或者R3和R4合起来代表基团-(CH2)3-,-(CH2)4-,(CH2)2-O-(CH2)2-,-(CH2)2-S-(CH2)2-或者-(CH2)5-,或者R1和R2和邻近的氮原子合起来代表了一个4位被如下取代基所取代的哌嗪:(C1-C4)烷基,(C5-C7)-环烷基,吡啶基,苄基,以及被取代的苄基,所述被取代的苄基的苯环部分带有1个或者2个取代基,取代基可以是氯原子,溴原子,硝基,(C1-C4)烷基以及(C1-C4)烷氧基。

另外,衍生物可以包括内部残基的侧链羧基官能团-COOH被修饰为-COOR5的化合物,所述内部残基例如是Glu,其中R5代表氢原子,(C1-C4)烷基或者(C1-C4)烷氧基以及(C2-C4)烷基。

本发明化合物的N末端衍生物是N末端的氨基-NH2被取代为-NHR6基团,其中R6代表(C1-C4)烷基。

“(C1-C4)烷基”是指含有1到4个碳原子的直链或者支链烷基链,例如:甲基,乙基,丙基,1-甲基乙基,丁基,1-甲基丙基或1,1-二甲基乙基。“(C2-C4)烷基”是指含有2-4个碳原子的直链或者支链烷基链,例如:乙基,丙基,1-甲基乙基,丁基,1-甲基丙基,1,1-二甲基乙基。“(C5-C7)环烷基”是指选自环戊烷基,环己基或环庚烷基中的一个环烷基基团。

“(C1-C4)烷氧基”所表示的意思是指含有1-4个碳原子的直链或者支链烷氧基链,例如甲氧基,乙氧基,丙氧基,1-甲基乙氧基,丁氧基,1-甲基丙氧基和1,1-二甲基乙氧基。

本发明中的衍生物可以参照专利EP-0195359中所描述的生产阿肽加定衍生物的方法得到,其内容作为参考文件列入此处。

进一步的实施方案

衍生物的C末端通式是-COR,其中R代表基团-NR1R2,一些实施例中,R1代表氢原子,R2代表了一个通式为-(CH2)n-NR3R4的基团,其中n表示2到8之间的整数,R3和R4独立地代表了氢原子或者(C1-C4)烷基或者R3与R4合起来代表了如下基团:-(CH2)3-,-(CH2)4-,(CH2)2-O-(CH2)2-,-(CH2)2-S-(CH2)2-或者-(CH2)5-。在这些实施例中,R3和R4优选地代表氢原子或者(C1-C4)烷基。更优选地代表(C1-C2)烷基,如甲基。整数n优选地在2-5之间,更优选地在2-4之间,例如3。

在另一个实施方案中,R1和R2和邻近的氮原子一起代表了一个哌嗪。,优选地4位N-取代基选自如下基团:

(a)(C1-C4)烷基;

(b)(C5-C7)-环烷基,

(d)-(CH2)p-NR5R6,其中p代表一个从1到8的整数,R5和R6独立地代表氢原子或者(C1-C4)烷基;

(e)哌啶基;和

(f)被取代的哌啶基,所述被取代的哌啶基有一个(C1-C4)烷基的N-取代基。

其中氮原子优选地位于哌啶基和被取代的哌啶基的4位上。

该N-取代基更优选地选自如下基团:

(d)-(CH2)p-NR5R6,其中p代表一个从1到8的整数,并且R5和R6独立地代表氢原子或(C1-C4)烷基;和

(f)被取代的哌啶基,所述被取代的哌啶基有一个(C1-C4)烷基的N-取代基。

如果N-取代基是-(CH2)p-NR5R6,那么R5和R6优选地为(C1-C4)烷基,更优选地为(C1-C2)烷基,例如甲基。p优选地为1到4之间的整数,例如3。

如果N取代基是被取代的哌啶基,那么N-取代优选地为(C1-C2)烷基,如甲基。如上所述,氮原子优选地位于4位。

核酸

本发明中的核酸,可以是指DNA,也可以是指RNA,一般是指DNA。本发明中的核酸序列可以是单链的,也可以是双链的。一方面,本发明提供了一种分离形式的编码了成簇多肽的核酸。另一方面,本发明也提供了一种分离形式的编码前体多肽或其变体形式或其部份片段的核酸。

另一方面,本发明提供了一种分离形式的核酸,所述核酸可以包括序列SEQ ID NO:100或者SEQ ID NO:200的完整序列或其一部分片段,也包括本发明中公开的含有基因间隔区的片段。这样的基因间隔区可以包含有调控本发明中的成簇多肽或者多肽前体表达的启动子元件和其他类型的调控元件。

对于本领域技术人员来说,25个碱基的核苷酸是其数量足以确定其是否特异于本文中所公开的某个特定的基因或成簇基因或其亚序列。因此,包括序列SEQ ID NO:100或SEQ ID NO:200,以及与其序列具有显著同一性的变体形式在内的这些片段,在长度上至少要大于25个碱基,例如,其核苷酸长度至少大于30,或者至少大于50,或者至少大于100,或者至少大于250。

本发明同时也包括基因间序列的变体形式的启动子元件,优选地实施例中,启动子元件是基因间序列(或其一部分)的某特定序列。在所有的情况下,优选地实施例中提到的开放阅读框,基因,核酸,多肽或者启动子都是指某一特定序列,从广义上来讲,本发明还提供了含有特定序列的变体形式的实施例。

这里所用到的有关特定核酸的“变体形式”是指:与参照核苷酸序列有所不同的并满足如下条件的任一核酸序列:与参照序列相比,或者与参照序列的互补序列相比,或者与参照序列的一个片段相比,或者与该片段的互补序列相比,可以与之互补的序列,或者在序列上表现出高度的同一性的序列,或者在严格的反应条件下可以与之互补的序列。也可以指编码与参照核酸序列表达的氨基酸序列高度一致的氨基酸序列的核酸序列,或者该核苷序列的一个片段。“变体形式”还可以指那些仅仅是彼此的遗传密码简并性不同,而编码出相同的氨基酸序列的不相同的核酸。本发明中所提到的核酸的变体形式更进一步具有如下特性:将本发明中的核酸变体形式导入到本发明鉴定的成簇基因中,使相应的部分序列发生了改变,再将这个重组的片段转入到一个合适的宿主细胞中在适合生产羊毛硫细菌素类抗菌肽的条件下培养(例如本文的实施例中的情况),最后生产出的分子能够具有一种或者多种羊毛硫细菌素类抗菌肽的活性(特别是抗菌的活性)。优选将生产调整到高细胞密度下进行。

显著的核酸序列同一性优选地为至少50%一致,更优选地为60%,70%,80%,90%,,更优选地为95%,98%或者99%。在核苷酸变体形式(或其一部分)与比较片段比对核酸序列是否具有显著同一性的时候,该比较片段优选地为至少具有参照片段中的30个碱基序列,更优选地是该片段具有参照片段中的60个碱基,90个碱基或者120个碱基,更优选地为具有参照片段中的180个碱基,240个碱基或者300个碱基序列。最优选地情况是使用整个参照片段与其比对。

“核酸序列同一性百分数”定义为候选序列与比对序列一致的碱基数目所占的百分比。本文中用到的这个值是由软件WU BLAST-2中的BLASTN模块计算得到,除了overlap span和overlap fraction这两个参数的值分别设为1和0.125以外,其他的参数均采用默认值。

本发明中所涉及的启动子变体形式的核酸序列的同一性的评估优选地需要超过30个残基的序列,更优选地需要40个碱基或者50个碱基,更优选地需要60个碱基。

“严格条件”或者“高严格条件”根据如下条件定义:(1)使用低离子强度和高温洗脱,例如0.015M的氯化钠/0.0015M的柠檬酸钠/0.1%的十二烷基硫酸钠(SDS),50℃;(2)在杂交的过程中使用变性剂,例如使用甲酰胺,如50%(v/v)甲酰胺和0.1%的牛血清白蛋白/0.1%的Ficoll/0.1%的聚乙烯吡咯烷酮/pH6.5的50mM磷酸钠缓冲液和750mM的氯化钠,75mM的42℃的柠檬酸钠;或者(3)使用50%甲酰胺,5×SSC(0.75M的氯化钠,0.075M的柠檬酸钠),50mM的磷酸钠(pH6.8),0.1%的焦磷酸钠,5×Denhardt溶液,超声处理的鲑鱼精DNA(50g/ml),0.1%的SDS,以及42℃的10%的硫酸葡聚糖于,并于42℃的0.2×SSC(氯化钠/柠檬酸钠)洗脱,再在55℃的50%甲酰胺中洗脱,最后使用含有EDTA的0.1×SSC组成的洗液在55℃下进行高严谨度洗脱。

当一个目的核酸序列被称作与启动子或者调控序列“调控相联”的时候,是指这个启动子或者调控序列在一个适宜的表达系统中可以指导这个核酸序列的转录,并且使该核酸序列可以在正确的阅读框中进行翻译。优选地是指当一个核酸与启动子或者调控序列调控相联的时候,该核酸的转录本还包含了一个适合核糖体结合的位点,这样可以在一个适宜的表达系统中表达出该核酸序列所编码的多肽。其实例可查阅Sambrook等人1989年的工作以及Ausubel等人1995年的工作。

当一个核酸被称为分离的核酸的时候,是指该序列已经从正常存在于菌株产加尔巴丁游动放线菌和/或者利古里亚游动放线菌的一些或者所有其他的核酸序列中完全的或者基本地分离出来。这里特别是指核酸序列从那些不属于本发明的成簇基因片段的序列混合物中分离出来。

根据上文所提到的内容,本发明提供了编码阿肽加定或者阿肽加定B(actagardine B)的生物合成成簇基因的核酸序列或者一组核酸序列。相应的,整个成簇基因或其具有至少25个连续核苷酸的一部分的用途十分广泛,其包括但不限于:表达阿肽加定或者阿肽加定B(actagardine B);将其作为探针在其他的物种中筛选相关的分子;用其诱导基因沉默等类似用途。

表达构件

本发明的另一方面是提供了一个表达构件,它包含一个可以编码本发明中的成簇多肽或者羊毛硫细菌素类抗菌肽的核酸,并且可操作的连接在一个启动子后。

另一方面,本发明提供了一组表达构件。一组表达构件包括本发明中提到的两个或者更多的多肽编码序列,以及至少一个适合上述序列表达的启动子。所述启动子(多个启动子)可以是这些多肽基因天然连接的启动子(或者就一个变体来说,该基因的启动子就是该变体的来源的启动子),或者可以是一个构成性的或者可诱导的并且在宿主细胞中正常行使功能的启动子。这样的启动子包括那些位于表1和表2中所列开放读码框上游的序列SEQ ID NO:100或序列SEQ ID NO:200的基因间隔区。启动子可操作的连接在表达构件的核酸上。这里所提到的通过“可操作的连接”是指该启动子在一个适宜的表达系统中可以指导目的核酸序列的转录,并且使该核酸序列可以在正确的阅读框中进行翻译。优选地情况是,当一个目的核酸与启动子或者调控序列调控相联的时候该核酸序列的转录本还包含了一个适合核糖体结合的位点,这样可以在一个适宜的表达系统中表达出该核酸序列所编码的多肽。其实例可查阅Sambrook等人1989年的工作,Ausubel等人2002年的工作以及Kieser 2000年的工作。

本发明中所提及的以组为单位的表达构件包含了编码上文中定义的前体多肽和成簇多肽的基因的多种排列。在本发明的许多方面,一组表达构件中至少包含一个LanA基因。这样的组的例子可参照下文中的“Set 1”至“Set 7”,其作为说明,组构件的形式并不局限于此。

Set 1:一个编码前体多肽的LanA基因,优选地为编码可以转化成为本发明的化合物的前体多肽基因,加上一个编码LanM多肽的LanM基因。该LanM多肽优选地为序列SEQ ID NO:120或其变体,或者SEQ ID NO:213或其变体。

Set2:一个编码前体多肽的LanA基因,优选地为编码可以转化成为本发明的化合物的前体多肽的基因,加上一个编码LanR多肽的LanR基因,该LanR多肽优选地为序列SEQ ID NO:122或其变体,或者SEQ ID NO:216或其变体。

Set3:一个编码前体多肽的LanA基因,优选地为编码可以转化成为本发明的化合物的前体多肽的基因,加上一个编码LanM多肽的LanM基因,加上一个编码LanR多肽的LanR基因。该LanM多肽优选地为序列SEQ ID NO:120或其变体,或者SEQ ID NO:213或其变体。该LanR多肽优选为序列SEQ ID NO:122或其变体,或者SEQ ID NO:216或其变体。

Set4:第三组的所有基因再加上一个编码LanO多肽的LanO基因。该LanO多肽优选为序列SEQ ID NO:122或其变体,或者SEQ ID NO:215或其变体。

Set5:第三组或者第四组的所有基因再加上一个编码LanT多肽的LanT基因。该LanT多肽优选为序列SEQ ID NO:123或其变体,或者SEQID NO:214或其变体。

Set6:序列SEQ ID NOs:116至127或它们变体的基因。

Set7:序列SEQ ID NOs:206至220或它们变体的基因。

一方面来说,一组表达构件包含的序列都是编码1XX多肽系列的多肽的序列或者都是编码2XX多肽系列的多肽的序列。但是本发明并不排除那些同时包含了2种系列多肽的表达构件。

重组表达载体

一方面,本发明提供了一种重组载体其包含了本发明中的一个或者多个表达构件。另一方面,本发明提供了一组重组载体,其包含了本发明中的一组表达构件。选取和构建适宜的导入核酸序列至细菌中的载体的条件包含如下方面:如有需要,可以有附加的合适的调控元件,包括附加的启动子,终止子片段,增强子元件,标记基因以及其他合适的元件。载体可以视情况选择质粒,病毒,如噬菌体,或者噬菌粒。更详细的实例信息,可以查阅Sambrook等人编写的分子克隆,实验室操作手册第二版1989年出版,冷泉港的冷泉港实验室出版社出版。该书介绍了很多现有的技术和核酸操作方法如核酸构件的准备,突变,测序。而将DNA导入细菌种,以及基因表达,和蛋白质的分析方法,这些实验方法可以查阅1995年Ausubel等人的Current Protocols in Molecular Biology一书,由WileyInterscience Publishers出版社出版。在链霉菌(Streptomyces spp)中使用这些技术的很多内容都在1985年Hopwood等人的Genetic manipulation ofStreptomyces a aboratory manual(Norwich:John Innes)一书中有详细记载,以及Kieser T.等人所著Practical Streptomyces Genetics(2000),(The johninnes foundation)第386页。还有Sambrook等人,Ausubel等人,Hopwood等人以及Kieser等人的工作成果均作为参考文献列入此处,以作为参考。

表达盒

另一方面,发明人开发出了一种有效的生产和筛选阿肽加定B(actagardine B)的抗菌肽类衍生物的载体系统。这是通过导入一个或者多个限制性内切酶识别位点至编码SEQ ID NO:1,11或者212多肽的LanA基因序列中从而构建出一个表达盒系统来实现的。因此,从另一方面来讲,本发明提供了一个重组DNA表达盒,它包含了编码阿肽加定B(actagardineB)前体多肽的核酸序列,其中所述序列包含:

位于或者邻近编码序列N末端的第一限制性内切酶位点;

位于第一限制性内切酶位点下游且位于编码序列之中的任意的第二限制性内切酶位点;

位于或者邻近邻近编码序列C末端编码区的第三限制性酶切位点。

其中至少有一个所述的限制性酶切位点没有出现在编码序列为SEQID NO:200的LanA编码序列中。

另一方面,本发明还提供了一个重组DNA盒,它包含了编码阿肽加定前体多肽的核苷酸序列,所述核苷酸序列包含:

位于或者邻近编码序列N末端的第一限制性内切酶位点;

位于第一限制性内切酶位点的下游且位于编码序列之中的任意的第二限制性内切酶位点;

位于或者邻近邻近编码序列C末端编码区的第三限制性酶切位点。

其中至少一个所述的限制性酶切位点没有出现在编码序列为SEQ IDNO:100的LanA编码序列中。

一般来说,所有这2个或者3个酶切位点都各不相同,最好是当这个表达盒被整合进入一个载体后,这些酶切位点在该载体中也应当是唯一的。

在一个优选的方面中,非天然存在的限制性内切酶位点是第二酶切位点,其位于编码多肽SEQ ID NO:1或SEQ ID NO:4的序列的第5个和第16个密码子之间,例如在第6个密码子至第15个密码子之间。

所述表达盒最好能包括一个LanA基因的引导序列和LanA基因的启动子,并包括一个或者多个成簇基因,特别是当所述成簇基因为宿主细胞互补其缺失的基因所必需的时候。

本发明所描述的表达盒可以用多种方法改造。例如,通过切割位于第一和第二,第一和第三,或者第二和第三限制酶切位点之间的表达盒而获得的片段,该片段可以使用编码某个羊毛硫细菌素类抗菌肽或其变体的变体编码序列替换。因此本发明也提供了这种表达盒的变体形式,其中所述变体形式在编码序列的编码区中有1-15个核苷酸发生替换。

作为生成这种变体的中间产物,其第一和第二限制酶切位点之间,第一和第三限制酶切位点之间,第二和第三限制酶切位点之间,可以被大填充片段所替换。

另一方面,编码羊毛硫细菌素类抗菌肽衍生物的表达盒可以转化宿主细胞去表达出这些衍生物,例如可以用这种方法评估该衍生物抗菌的特性。

一方面,可以构建多个表达盒从而提供一个含有不同衍生物的库,所述库可以用于筛选其中有活性的衍生物。

本发明的表达盒可以来源于本领域中用于在宿主细胞中表达基因的任何克隆和表达载体。这样的载体包含一个或多个复制起点,其可以是对温度敏感的。这样的载体可以含有选择标记基因,例如氯霉素乙酰基转移酶基因,红霉素抗性基因,安普霉素抗性基因或者四环素抗性基因。该载体也可以含有靶区域,该区域是宿主细胞中LanA成簇基因以外的基因组序列的同源序列。这种载体可以用于整合表达盒到与靶区域同源的基因组序列中。

该表达盒可以包含一个或者多个除LanA基因及其衍生物以外的成簇基因。当宿主细胞是一种ΔLanA型菌株,其中LanA基因没有活性,从某种意义上讲,其中的成簇基因也被失活的时候(例如Altena等人2000年文章中提到的菌株),就需要表达盒提供这样的基因或者其等效基因。

这里所提到的“位于或邻近编码区的N末端”是指限制性酶切位点的第一个碱基位于LanA引导序列的密码子ATG上游6个碱基处到前导肽(propeptide)的第一个密码子的下游6个密码子距离的区间内。优选的情况是限制性酶切位点的第一个碱基位于前导肽编码序列的第一个密码子上游12个残基处,更优选的情况是上游6个残基处,至第一个密码子下游6个残基处的区间内。

一方面,第一限制酶切位点是BglII酶切位点。

类似的,这里提到的“位于或邻近C末端编码区”是指限制性酶切位点的第一个碱基至少包含了前导肽的终止密码子中的一个核苷酸,或者限制酶切位点的5’端或者3’端分别不超出终止密码子下游或者上游12个残基,优选的情况是6个残基。

一方面,第三限制酶切位点是AvrII。

如果第二限制酶切位点存在,那么它将位于第一和第三限制酶切位点之间。优选的情况是该限制酶切位点包含位于前导肽编码序列的第5-16密码子中的至少一个核苷酸,优选情况是第8-16密码子中的至少一个核苷酸。相应的实施例中,通过改变ActA的编码序列中第6和第7位的密码子,引入一个BsrG1酶切位点。当然,其他的修改方式本发明同样也考虑在内。

对表达盒还可以做更多的改变,例如可以在表达盒的第一个限制酶切位点和第三个限制酶切位点中引入2个或者更多的位点。

表达盒可以包括2个或者3个非天然存在的限制性酶切位点。相应的实施例中,编码ActA的序列SEQ ID NO:100中的三个酶切位点并不是天然存在的。

表达盒的构建简化了快速产生羊毛硫细菌素类抗菌肽衍生物的过程,下文中将会有更详细的讨论。

一方面,第一和第二,第一和第三,或者第二和第三酶切位点之间的区域可以被其他填充片段所替代。如果第一和第三酶切位点之间如果还有2个或2个以上的酶切位点存在的话,任何一对这些酶切位之间的区域都可以被填充片段所替换。填充片段比其替换的片段要大的DNA序列。其大小可以是从50到5000的核苷酸,例如可以是大小从500到2000之间的核苷酸。引入这些填充片段的价值在于当这个区域被一个编码羊毛硫细菌素类抗菌肽的寡聚核苷酸所取代之后,质粒的大小将会有一个显著性的下降。这样得到的质粒可以被很容易的从那些少量未被酶切的质粒中纯化出来,从而消除所有的背景污染。

本发明中的表达盒可以用于介导载体中的ActA序列的改变,然后再将其导入宿主细胞中表达羊毛硫细菌素类抗菌肽。为了完成这个过程,这个序列需要可操作的连接于LanA(如ActA或者LigA)的引导序列,该引导序列再可操作的连接于LanA启动子序列(如ActA或者LigA)。

另外,作为一种替代的方法,包含表达盒的载体也可以包括一个LanR基因。LanR基因与Latibiotic A编码序列串联,并位于其下游。

表达文库

本发明中的表达盒可以用于提供编码羊毛硫细菌素类抗菌肽的文库。这种文库可以通过导入多个序列到表达盒的第一和第二限制酶切位点之间,或者第一和第三限制酶切位点之间,或者第二和第三限制酶切位点之间的方式构建,其中所述的多个序列中的每一个都与相应的ActA或者LigA序列相对应,其可以是SEQ ID Nos:100或者200的前导肽部分有1-15个核苷酸变化,如1-10个核苷酸变化,如1到6个核苷酸变化,如1到3个核苷酸变化后得到的序列。优选的情况是这些改变的结果导致了其编码的蛋白序列的改变。当然并没有排除没有编码改变的情况。

关于本发明构建的文库的另一方面。这样的文库可以包含10到100,000,10到10,000,10到1,000不同的编码序列,它们都是表达盒中羊毛硫细菌素A类抗菌肽编码序列的变体。

编码羊毛硫细菌素A类抗菌肽衍生物的表达盒可以被导入到宿主细胞中去表达羊毛硫细菌素类抗菌肽。

在一个实施例中,所述表达文库被转化到宿主细胞中,然后筛选和分离出其中具有抗菌活性的菌落。如果一个含有羊毛硫细菌素类抗菌肽表达序列的单个菌落表现出抗菌活性,它就可以被检测到。本发明进一步提供了分离获得这个筛选到的有活性的抗菌肽的方法。

宿主细胞

本发明将宿主细胞分为2种主要的类型。一种是生产羊毛硫细菌素类抗菌肽宿主细胞。另一种是非生产羊毛硫细菌素类抗菌肽宿主细胞,即是指该宿主细胞不含LanA基因,或者不含有产生一个LanA多肽所必须的成簇基因。

在一个实施例中,本发明提供了一种转入了本发明中的一组表达构件的宿主细胞。这组表达构件可以是上文中定义的Set1-7中的任意一组,也可以是其它前体和编码核酸的成簇多肽的任意组合。在另一个实施例中,可以用本发明的表达盒去转化所述的宿主细胞。

在又一个实施例中,本发明提供了一个宿主细胞文库,其中的每一个文库都含有本发明中的不同的表达盒。

生产羊毛硫细菌素类抗菌肽的宿主细胞

在一个实施例中,宿主细胞是一种生产羊毛硫细菌素类抗菌肽的宿主细胞。生产羊毛硫细菌素类抗菌肽的宿主细胞是指具有如下特点的一类细胞:其表达构件包含了LanA基因,当将该宿主细胞转入到不含有其它任何成簇基因的细胞后,它能够被表达并产生LanA多肽。这样的细胞包括所有能生产B型羊毛硫细菌素类抗菌肽的细胞,例如任意一株能产生羊毛硫细菌素类抗菌肽的芽孢杆菌或者放线菌或者链霉菌(例如,S.lividans或者S.coelicolor)。这样的细胞范例包括生产肉桂霉素的宿主细胞(例如Streoptomyces cinnamoneus cinnamoneus DSM 40005),或者生产阿肽加定的宿主细胞产加尔巴丁游动放线菌或者利古里亚游动放线菌NCIMB41362。

当涉及本发明中具有通式(I)化合物,其中-X1-X2-代表-Leu-Val-时,其宿主细胞可为没有任何其他修饰的A.liguriae NCIMB 41362。

一方面,这种类型的宿主细胞内源的羊毛硫细菌素A基因可能发生了突变,导致该基因不表达或者基因表达产物是一个失活形式。这样的宿主细胞可通过靶向的同源重组去删除或者突变其内源的LanA基因而获得。在本领域中已知的可实现这个技术的方法可以查阅Altena等人2000年的报道,以及专利WO2005/093069,其内容列入此处以作参考。这种方法处理后得到的宿主细胞被称为ΔLanA宿主细胞。在一个特定的实施例中,宿主细胞是ΔLigA利古里亚游动放线菌NCIMB 41362宿主细胞其LigA基因已经失活,例如被突变或者删除,例如是通过同源重组的方法删除了LigA基因。在另一个实施例中,宿主细胞是一个ΔActA产加尔巴丁游动放线菌宿主细胞,其ActA基因已经失活,例如被突变或者删除,例如是通过同源重组的方法删除了ActA基因。

本专利还构想了用其他成簇基因转化这种类型的宿主细胞的情形,尽管这种类型的宿主细胞已经提供了生产表达LanA所必需的成簇基因,但是该成簇基因的提供不是必需的。

非生产羊毛硫细菌素类抗菌肽宿主细胞

在非生产羊毛硫细菌素类抗菌肽宿主细胞中表达编码前体多肽的LanA基因后,其产物可以转化为阿肽加定或者其变体形式或者转化为本发明中的化合物;在表了含有LanA基因的一组表达构件以后,其产物可以转化为阿肽加定或者其变体形式或者转化为本发明中的化合物。能够提供上述表达和转化环境的任意一种宿主细胞都是非产羊毛硫细菌素类抗菌肽宿主细胞。

非生产羊毛硫细菌素类抗菌肽宿主细胞可以是一种细菌宿主细胞。细菌宿主细胞包括放线菌,或者链霉菌,例如S.lividans,S.coelicolor或者S.cinnamoneus。

宿主细胞可以是那些LanO基因可能因突变或者删除导致失活(或者在非生产羊毛硫细菌素类抗菌肽宿主细胞的情况下,则LanO基因不存在)的类型,或者是宿主细胞中的LanO基因表达量增加的类型,例如,通过提供2个或者更多的拷贝数的LanO基因,或者将基因连结到一个在宿主细胞中可以增强基因表达量的启动子。用这种方式调控lanO基因,可以改变宿主细胞中本发明的化合物的氧化形式(Y=-S(O))和还原(Y=-S-)形式产量的相对比例。

生产本发明中的化合物

本发明的中的化合物可以通过表达相应核酸得到,例如,如果一个重组表达载体中其表达构件含有编码前体多肽的序列,在一个含有LanA基因的宿主细胞中,如有必要,加上那些能够转化前体多肽生成目的产物的成簇基因,则在该菌中就可以表达出本发明中的化合物。如上文所述,当涉及本发明通式(I)化合物,其中-X1-X2-代表-Leu-Val-的时候,其宿主细胞可为没有任何其他修饰的A.liguriae NCIMB 41362。

将表达盒,或者表达载体导入宿主细胞中的方法(特别是体外导入)一般是指转化,但并不局限与此方法。可以使用任何有效的技术。对于细菌细胞来说,合适的技术包括氯化钙转化作用,聚乙二醇辅助转染,电穿孔,接合和转染,或者使用噬菌体进行转导。

一方面,本发明提供了一种表达本发明中的核酸的方法,该方法包括宿主细胞(或者其他的表达系统)的选取和宿主细胞的培养,以表达目标核酸。目标核酸构建于一个表达盒中,这样只要培养宿主细胞就可以生产出本发明的产物。

优选的目标核酸开始表达的条件是当宿主细胞的培养基本上达到高细胞密度的时候,更优选的表达条件是当宿主细胞的生长达到或接近稳定期的时候。细胞培养达到或者接近稳定期的时候,其OD650的值在1-20之间。本领域中常见的细胞培养方法可以参阅例如,Sambrook等人1989年的报道,Ausubel等人2002年的报道,以及Kieser等人2000年的报道(特别针对链霉菌的培养)。表达系统的表达产物需要被收集和纯化。分离方法包括,使用溶剂萃取的技术从发酵培养基中获取产物,吸附树脂例如疏水性树脂,或者沉淀的方法,例如硫酸铵沉淀法。纯化方法包括色谱技术,例如离子交换,疏水作用,反相色谱,正相色谱,固相色谱提取,以及HPLC,例如,可参见专利US5112806中所描述的分离mersacidin的方法。

细胞培养完成之后,本发明的化合物可以从宿主细胞培养基中回收,回收的化合物可以配制成药物组合物,或者任意的药学上可接受的盐形式。

宿主细胞如果生产出的是本发明化合物的一个混合物形式,例如,化合物中的Y是-S-或者-S(O)-的混合物,或者其中Z是NH2或者Ala-的混合物,或者所有4种形态的混合物,该产物可以用如HPLC这样的标准分离技术分离,例如,专利US 6,022,851中生产阿肽加定和丙氨酰阿肽加定(Ala-Actagardine)所描述的分离方法。

其回收的化合物可以配制成药物组合物的形式,或者任意药学上可接受的盐形式。

药学上可接受的盐的形式

“药学上可接受的盐的形式”,是指所述碱基保持生物学功效和化合物特征并且为生理所接受的酸加盐。这种盐包括那些由无机酸如盐酸、氢溴酸、硫酸、硝酸、磷酸以及类似酸,形成的盐,以及有机酸如乙酸、丙酸、乙醇酸、丙酮酸、草酸、苹果酸、丙二酸、琥珀酸、马来酸、反丁烯二酸、酒石酸、柠檬酸、安息香酸、肉桂酸、苦杏仁酸、甲基黄酰氟酸、乙基黄酰氟酸、p-甲苯黄酰氟酸、水杨酸及类似的。

盐还包括碱式盐,像碱或碱土金属盐,如钠、钾、钙或镁盐。

药物组合物

本发明的羊毛硫细菌素可以同一或多个本领域技术人员熟知的药学上可接受的成分一起配制,这些成分包括但不限于,药学上可接受的载体、佐剂、赋形剂、稀释液、填充剂、缓冲液、防腐剂、抗氧化剂、润滑剂、稳定剂、助溶剂、表面活性剂(如润湿剂)、掩蔽剂、着色剂、调味剂以及甜味剂。所述配方还可以进一步包括其他活性成分,例如,其他治疗或预防成分。因此本发明进一步提供了如上文所定义的药物组合物,以及制备包含将至少一种上文所定义的活性化合物与一种或多种其他本领域技术人员熟知的药学上可接受的成分,如载体、佐剂、赋形剂等混合的方法。如果配制成离散的单元(例如,片剂等),那么每个单元将含有预订量(剂量)的活性化合物。

此处所用的术语“药学上可接受的”就是化合物、成分、材料、组合物、剂量形式等在健康医学判断的范围内适合用于同所述主题(如人)的组织接触而没有过度的毒性、刺激、过敏反应,或其他问题或并发症,并与合理的获益/风险对比值相称。每一种载体、佐剂、赋形剂等在与配方的其它成分相配伍的意思上也必须是“可接受的”的。

组合物可以被配成使用于任何合适的给药途径和方式的形式。药学上可接受的载体或稀释液包括那些用于配方中并适用于口服的、直肠给药的、经鼻的、局部的(包括含服和舌下的)、阴道的或非肠道的(包括皮下、肌肉、静脉、皮层内、肠内和脑膜)的给药的载体或稀释剂。所述配方可以便利的以单位剂量形式提供并可以通过任何本领域技术人员熟知的已有技术来制备。这样的方法包括把活性成分和由一或多种附属成分组成的载体结合到一起的步骤。一般来说所述制剂通过其活性成分被均一且密切地带入液体载体或完好分隔的固体载体或两者都有来制备,然后,如果需要的话,再加工产品。

对于固体组合物,常规的无毒性固体载体包括,例如药用级的甘露醇、乳糖、纤维素、纤维素衍生物、淀粉、硬脂酸镁、糖精钠、滑石粉、葡萄糖、蔗糖、碳酸镁以及可能用到的类似物。上文所定义的活性化合物可以使用例如,聚(亚烷基)二醇、乙酰化三甘油以及类似的物质配成栓剂,。药学上液体给药的组合物可以,例如通过溶解、分散等制备,由上文所定义的活性化合物和任意在载体中的药学上的佐剂,例如,像,水、盐水葡萄糖、甘油、乙醇以及类似物质混合,从而形成溶液或悬浮液。如果想得到,被注射的药物组合物也可以含有少量的无毒性辅料像细润或乳化剂、pH缓冲试剂和类似的,例如,醋酸钠、单十二酸酯山梨聚糖、三乙醇胺醋酸钠、单十二酸酯山梨聚糖、三乙醇胺油酸盐等。制备这些剂型的方法是对本领域技术人员来说是熟知的或是现而易见的;例如,参见“Remington:The Science and Practice of Pharmacy”,20th Edition,2000,pub.Lippincott,Williams & Wilkins。所述组合物或配方,无论如何,必须含有一些所述的活性化合物,其含量应达到足以减轻被治疗患者症状的有效量。

含有在0.25到95%范围内的活性成分余量是由无毒性载体组成的药物剂型和组合物将被制备。

对于口服给药,药学上可接受的无毒组合物是是通过结合任意常用的赋形剂加工而成,所述赋形剂例如,像,药用级的甘露醇、乳糖、纤维素、纤维素衍生物、sodium crosscarmellose、淀粉、硬脂酸镁、糖精钠、滑石粉、葡萄糖、蔗糖、镁、碳酸盐及类似物。这些组合物表现为溶液、悬浮液、片剂、丸剂、胶囊、粉剂以及缓释制剂的形式存在。这些组合物可以含有1%-95%的活性成分,优选2-50%,最优选5-8%。

肠胃外给药通常表现为注射,皮下、肌肉或者静脉注射。注射剂可以通过常规方式制备,可以是液体溶液或悬浮液,注射前可以做成液体溶液或悬浮液的固体形式,或乳状液。适用的赋形剂包括,例如,水、盐、葡萄糖、甘油、乙醇或类似的物质。此外,如果想得到,可使用的药物组合物也可以含有少量的无毒性辅料像细润或乳化剂、pH缓冲试剂和类似的,例如,醋酸钠、失水山梨醇单月桂酸酯、油酸三乙醇胺、三乙醇胺醋酸钠等。

对于局部使用,药学上可接受的组合物可以配成合适的软膏或活性化合物悬浮或溶解在一种或多种载体中的凝胶的形式。适用于本发明中化合物局部给药的载体包括,但不限于,矿物油、液体蜡膏、白凡士林、丙二醇、聚乙二醇、聚氧化丙稀化合物、酯类乳化剂和水。供选择的,药学上可接受的组合物可以被配成合适的洗剂或霜剂,其活性成分悬浮或者溶解于一种或多种药学上可接受的载体。合适的载体包括,但不限于,矿物油、山梨醇酐单硬脂酸酯、聚山梨醇酯60、十六烷基酯蜡、cetearyl alcohol、2—辛基十二烷醇(2-octyldodecanol)、苯甲醇和水。

活性化合物在该亲本组合物或局部组合物种的百分比很大程度上依赖于其特异的本性,还有化合物的活力和客体的需求。然而,活性成分的百分比在0.1%到10%w/w之间是合格的,如果该组合物是固体则活性成分的含量要高一些,随后可以稀释到上述百分比。优选,所述组合物在溶液中含有0.2-2%w/w的活性物质。

关于合适的载体、佐剂、赋形剂的进一步启示可以从制药标准参考书中找到,例如,Remington:The Science and Practice of Pharmacy”,20thEdition,2000,pub.Lippincott,Williams & Wilkins;and Handbook ofPharmaceutical Excipients,2nd edition,1994.

化合物的应用

本发明中的羊毛硫细菌素化合物和组合物可以以医学治疗或预防的方法使用于客体。客体可以是人或动物客体。动物客体可以是哺乳动物或其他脊椎动物。

因此本发明提供一个可用于客体治疗或预防的化合物。本发明还提供了利用本发明化合物来生产可用于客体治疗或预防的药物。

治疗方法可以是细菌感染,包括皮肤、黏膜、肠或全身性感染。

变体及其组合物可以用于菌血症(bacteraemia)(包括导尿管相关的菌血症)、肺炎、皮肤和皮肤结构感染(包括手术部位感染)、心内膜炎和骨髓炎的系统性治疗。这些或其他这样的治疗可以直接抗击致病物质如葡萄球菌、链球菌、肠道球菌。本发明的化合物及其组合物还可以用于皮肤感染的局部治疗,包括痤疮也就是痤疮丙酸杆菌(Propionibacteriumacnes)。所述变体及其组合物也可以用于眼部感染像结膜炎的治疗,且可用于肠的二重感染的口服治疗,如由艰难梭菌(Clostridium difficile)包括多重抵抗的C.difficile引起(假膜性结肠炎),或用于口服治疗与幽门螺杆菌(Helicobacter pylori)关联的肠感染的口服治疗。

所述变体还可以用于创伤或烧伤皮肤的治疗或感染预防。此外,变体及其组合物还可以用于预防疾病,如,清除鼻孔来预防MRSA的传播。这可以用于有感染危险的客体(如进入医院的病人)或用于健康的职业工作者或其它存在成为该感染携带者危险的看护人员。腹部手术前预防性的清除肠道菌群也是预期的。

根据本发明的化合物可以以经肠的(口服),肠胃外的(肌肉或静脉注射),直肠的或在本地(局部)的方式使用。它们可以以溶液、粉末(片剂、胶囊包括微胶囊)、软膏(霜剂或凝胶)或栓剂形式使用。这种配方可能的辅料是制药上惯用的液体或固体填充剂和添加剂、溶剂、乳化剂、润滑剂、调味剂、着色剂和/或缓冲液。一般以有利的剂量,给药剂量与身体体重的比为0.1-1000mg/kg,优选0.2-100mg/kg来使用。可以便利的按照包含至少根据本发明的每日有效量的化合物的剂量单位来使用,如30-3000,优选50-1000,mg。

本发明的实验原理,包括其最佳方式,现在将通过例子进一步具体讨论,附图作为参考。

实施例1-成簇基因的克隆

从产加尔巴丁游动放线菌和利古里亚游动放线菌中鉴定和克隆阿肽加定生物合成成簇基因。

O/SBDIG-1是一种地高辛(DIG)标记的由48个碱基组成的简并寡聚核苷酸。它是根据阿肽加定多肽中已知的氨基酸序列以及考虑到游动放线菌属的密码子偏好性设计出的。对从产加尔巴丁游动放线菌中提取的基因组DNA并使用限制性内切酶NcoI消化后的酶切片段做Southern杂交分析,鉴定出一个大约3kb的DNA片段可以与探针OSBDIG-1杂交。在富集NcoI消化的基因组DNA以后,分离出其中3kb左右的DNA片段,并克隆到载体pLITMUS28(NEB)的NcoI位点上。克隆得到的质粒转入大肠杆菌菌株E.coli DH10B中并使用探针O/SBDIG-1做Southern杂交分析。选取其中的一个杂交结果为阳性的质粒送交序列分析。测序结果表明这个命名为pLITAG01的质粒由编码负责阿肽加定生物合成的lanA结构基因的DNA(actA),以及一段上游区域,该序列被认为编码一部分的ABC糖转运体,以及一段下游区域,编码了部分的LanM(actM)。

引物O/ACT08F和O/ACT09R根据质粒pLITAG01的序列而设计。使用地高辛标记的dNTPs(Roche)以及pLITAG01为模板,使用这些引物进行PCR反应,得到了一个2296bp的地高辛标记的DNA片段,命名为SBDIG-2。

通过克隆Sau3AI酶切的产加尔巴丁游动放线菌ATCC 31049以及利古里亚游动放线菌NCIMB 41362基因组DNA片段至预先用BamHI酶切的粘粒SuperCosl(Stratagene)中,构建了2个粘粒文库。对每个粘粒文库都使用SBDIG-1为探针做Southern杂交分析。从中各选取25个和SBDIG-1杂交呈阳性的粘粒克隆,再使用O/SBDIG-1和SBDIG-2作为探针重新做Southern杂交分析。来源于A.garbadinensis基因组DNA中的9个粘粒以及来源于利古里亚游动放线菌基因组中的11个粘粒的插入片段与2个探针杂交呈阳性。使用T3和T7引物分离并测序这些质粒中的插入片段DNA。粘粒CosAL02和CosAG14随后被完整测序(剑桥大学生物化学系测序部门)。

材料与方法

菌株

本发明中用到的细菌菌株归结于表5

载体

粘粒SuperCosl从stratagene公司获得。

质粒pLITMUS从New England Biolabs公司获得。

引物

引物名称            SEQ.ID        Sequence 5’-3’

O/SBDIG-1           300           TGGGTSTGCACSCTSACSATCGARTGCGGNACSGT

                                  SATCTGCGCSTGC

O/ACT08F            301           TCCAGCACGCGCGGGG

O/ACT09R            302           GTTCGACCAGCCGCCC

Souther杂交

DNA探针的标记

DNA杂交探针的制备是使用Roche公司的地高辛(DIG)PCR DNA标记和检测试剂盒,并根据他们的说明书所制备。

转移DNA至尼龙膜。

目标DNA首先通过琼脂糖凝胶电泳分离,然后通过一个真空泵印迹装置(Q BIO gene)转移到尼龙膜上(Hybond-N,Amersham Int.,UK)。

使用0.5M HCl脱嘌呤DNA的处理时间根据溴酚蓝染料条带完全变黄的时间来决定(对于浓度为0.7%的琼脂糖凝胶来说一般是15-20分钟)。然后使用1.5M NaCl,1.5M NaOH进行系统性的变性,再使用0.5M Tris,1.5MNaCl,pH8.0的条件下进行中和,每一步大约15-20分钟。于20×SSC中浸润至少60分钟来完成完全的DNA印迹。将印迹膜从真空泵印迹装置中取出后,置于室温下风干。通过UV透照器(UVP)在波长365nm的紫外照射下照射5分钟实现DNA的交联(DNA面朝下)。

菌落转移和杂交

将要使用杂交方法筛选的菌落转移到一个尼龙膜上(Rochediagnostics)。通过放置带正电荷的尼龙膜于菌落上,然后紧压1分钟完成有效的转移。于膜上标记参照点,以标记出对应的菌落的位置。紧接着,移开尼龙膜,并参照Roche的用户手册(过滤杂交DIG应用手册)准备杂交。

杂交和膜的显影

预制好的探针和DNA在68℃的HB-1000型杂交炉(UVP)中杂交过夜(大约16个小时)。杂交之后的膜在室温下用含有0.1%十二烷基硫酸钠(SDS)和2×柠檬酸钠盐的溶液(SSC)洗两遍,每次5分钟。之后再在68℃下在SBDIG-1存在的条件下使用含有0.1% SDS和1×SSC的溶液洗杂交膜两遍,每次15分钟。再于68℃在SBDIG-2存在的条件下使用含有0.1% SDS和0.1×SSC的溶液洗筛选膜两遍,每次15分钟。然后膜使用Roche用户手册上推荐的方法显影(过滤杂交DIG应用手册)。

软件

共有序列使用如下软件分析:FramePlot版本号2.3.2,BioEdit sequencealignment editor,Clustal W(EMBL-EBI)以及Basic Local Alignment SearchTool(BLAST,NCBI)

结果与讨论

CosAG14

粘粒CosAG14,含有从产加尔巴丁游动放线菌中分离出的38168bp基因组DNA片段。通过序列分析,该DNA编码了阿肽加定前肽以及其前导序列,这个基因记为actA。分析表明,2个丙氨酸残基直紧接位于阿肽加定前肽的上游。这两个残基应该是蛋白酶切割阿肽加定前导肽的识别位点。该位点的不完全酶切会导致一个丙氨残基残留,最后生成丙氨酰阿肽加定(ala-actagardine),该化合物经常在产加尔巴丁游动放线菌的发酵液中检测到。actA基因下游的一个3162bp的DNA区域同一些lanM类蛋白相比,例如,mersacidin成簇基因中的mrsM(30%同一性)具有很强的序列相似性。这个推测的基因记为actM,它可能参与了阿肽加定前体多肽的修饰,催化了脱氢反应和硫醚键的生成。actM下游11bp处的一个编码了341个氨基酸残基的开放阅读框同一些荧光素酶类型的单加氧酶具有序列相似性(大约39%同一性),被记为actO。单加氧酶actO的功能可能是催化脱氧阿肽加定(deoxy-actagardine)结合氧原子,生成阿肽加定。与actO取向相反,位于下游62bp处的开放阅读框,记为actR。该开放阅读框的蛋白产物与一些二元响应调节因子表现出序列相似性(~37%同一性)。位于actR下游789bp并与其基因序列方向相同的是一个推测为编码了812个氨基酸的蛋白的基因,它与ABC转运系统的通透酶具有序列相似性(大约25%序列同一性)。这个推测的蛋白记为actT,可能负责修饰后的羊毛硫细菌素类抗菌肽的外运。actT下游的第二和第四个开放阅读框编码的氨基酸序列表现出分别与反应调节因子激酶(reponse regulator kinase)以及青霉素结合蛋白序列相似性(大约30%序列同一性)。对产单胞李斯特菌(Listeria monocytogenes)中的乳酸链球菌肽的生物合成成簇基因的研究工作(Gravesen等人2004年的工作)表明组氨酸激酶和一种青霉素结合蛋白,以及一个未知功能的蛋白参与了赋予乳酸链球菌肽抗菌性的反应过程。这些基因的相似序列位于actA基因的附近表明这些序列参与了赋予阿肽加定抗菌性的反应过程。

CosAL02

粘粒CosAL02,含有从Actinoplanes liguriae中分离出的40402bp基因组DNA片段。序列分析表明其中含有一个编码了64个氨基酸蛋白的lanA基因,它与粘粒CosAG14中的actA基因具有高度的序列同源性(50个一致的氨基酸残基)。这里把该种lanA基因记为ligA。该lanA基因前肽的氨基酸序列与阿肽加定的前体多肽的氨基酸有2个残基的差异,在如下的序列比对中指出(SEQ.ID 119和SEQ.ID 212):

AG actA MSALAIEKSWKDVDLRDGATSHPAGLGFGELTFEDLREDRTIYAASSGWVCTLTIECGTVICAC

64

AL lanA MSAITVETTWKNTDLREDLTAHPAGLGFGELSFEDLREDRTIYAASSGWVCTLTIECGTLVCAC

64

***:::*.:**:.***:.*:**********:***************************::***

其中的第15位的V突变成了L和16位的I突变成了V,突变后产生的蛋白和阿肽加定具有相同的的分子量,所以在质谱分析(lc-ms)中没有区分出来。CosAL02中鉴定出的lanA基因的潜在产物表明它是一种新的羊毛硫细菌素类抗菌肽。在ligA上游321bp处的开放阅读框编码了一个含有286个氨基酸的推定蛋白,,它与菌株Streptomyces glaucescens中的StrR蛋白有序列相似性(46%的序列同一性)。StrR蛋白是一个通路特异的DNA结合激活因子,它参与了链霉素基因的表达调控。LigA基因下游的开放阅读框的序列相似度(31%同一性)表明它编码了一个1046个氨基酸的lanM多肽(以下记为ligM),所述lanM多肽可能参与了ligA前肽的修饰。开放阅读框下游紧接着lanT(ligT)的起始密码子,它与ligM的终止密码子重叠。LigT是一个含有575氨基酸的蛋白,表现出与一些ABC转运体具有序列相似性。LanT蛋白的功能是负责分泌成熟的终产物以及仍含有前导序列的翻译后修饰产物。与粘粒CosAG14中观察到的一样,ligT下游紧接着的开放阅读框编码的347个氨基酸的蛋白,与荧光素酶类型的单加氧酶具有序列相似性(约38%序列同一性)。这个推测的单加氧酶(ligO)被认为参与了氧原子的结合和亚砜键的形成。LigO的下游与其基因序列反向的位置有一个推测为217个氨基酸的蛋白,表现出与一些二元反应调节因子具有序列相似性(约37%序列同一性)。这个推测的调节因子记为ligR。

表1 -CosAG14注解(从产加尔巴丁游动放线菌分离出的38168bp片段,SuperCosl载体的骨架序列被忽略)

基因名  描述              位置(DNA)    开放阅  氨基酸大  起始 - 终

称                                     读框位  小 (碱基  止 (3 个氨

                                       置      长度)     基酸)

orf1    推定蛋白          482-42       -1      146(441)  MPR-RCG

orf2    推定蛋白          2824-2375    -2      149(450)  VSV-ERA

orf3    参与细胞分裂的ATP 4432-2876    -2      518(1557) VER-TNR

        酶AAA

orf4    糖水解酶          6002-5391    -1      203(612)  VGE-NYS

orf5    内切葡聚糖酶      6484-5825    -2      219(660)  MRR-TVR

基因名  描述                 位置(DNA)    开放阅  氨基酸大   起始 - 终

称                                        读框位  小 (碱基   止(3 个氨

                                          置      长度)      基酸)

orf6    胞嘧啶/腺嘌呤脱氨酶  6627-7112    +3      161(486)   MTI-PAQ

orf7    未知                 7756-8997    +1      413(1242)  VTT-YDK

orf8    未知                 9586-8933    -2      217(654)   VGK-FRG

orf9    丙酮酸氧化酶         11886-10108  -3      592(1779)  VSD-DPS

orf10   水解酶或酰基转移酶   12066-12866  +3      266(801)   VSR-SGT

orf11   醛糖差向异构酶       13116-14306  +3      396(1191)  MTE-TAD

orf12   ABC糖转运周质成分    14385-15521  +3      378(1137)  MPR-AHG

orf13   ABC糖转运通透酶      15514-16572  +1      352(1059)  MDD-GRS

orf14   ATP结合相关的ABC     16569-17330  +3      253(762)   MTA-RGR

        转运蛋白

orf15   推定蛋白,甲基转移酶 18102-17335  -3      255(768)   MES-RKR

orf16   ABC转运通透酶        18962-18120  -1      280(843)   MPP-RKG

orf17   ABC转运通透酶        19896-18991  -3      301(906)   MSA-ESE

orf18   底物结合相关的ABC    21236-19899  -1      445(1338)  MFI-SGR

        转运蛋白

orf19   actA,结构基因       21572-21766  +2      64(195)    MSA-CAC

orf20   actM,修饰基因       21837-24998  +3      1053       MSP-PLT

                                                  (3162)

orf21   actO,单加氧酶       25009-26034  +1      341(1026)  MPE-PAA

orf22   actR,反应调节因子   26791-26096  -2      231(696)   MRS-CLS

orf23   actT,结合的通透酶的 29323-26885  -2      812        MLA-LTR

        ABC转运因子                               (2439bp)

orf24   推定蛋白             29462-30196  +2      244(735)   MIV-RNR

orf25   反应调节因子激酶     30235-31338  +1      367(1104)  VLR-ARA

orf26   反应调节因子感受器   31335-31997  +3      220(663)   MTR-AVG

orf27   青霉素结合蛋白       32138-34486  +2      782(2349)  MLI-PPR

orf28   甲基转移酶           35209-34448  -2      253(762)   MAP-DRR

基因名   描述             位置(DNA)   开放阅   氨基酸大  起始 - 终

称                                    读框位   小 (碱基  止(3 个氨

                                      置       长度)     基酸)

orf29    水解酶           36030-35245 -3       261(786)  VPR-PPP

orf30    反应调节因子     36086-36820 +2       244(735)  VSP-TGS

orf31    果糖二磷酸醛缩酶 36844-37689 +1       281(846)  MKD-

                                                         RAW

orf32    水解酶           37590-38168 +3       192(579)  MGS-DPA

表2-CosAL02注解(从利古里亚游动放线菌分离出的40402bp片段,SuperCosl载体的骨架序列被忽略)

基因名   描述                  位置(DNA)   开放阅读   氨基酸   起始 - 终止

称                                         框位置     大  小   (3 个氨基酸)

                                                      (碱基长

                                                      度)

orf1     分泌系统蛋白          1008-1      -2         335      VRL-VDI

                                                      (1008)

orf2     反应调节因子          2198-1122   -3         358      MSE-LFP

                                                      (1077)

orf3     推定蛋白              3088-2288   -1         266      MRR-VVR

                                                      (801)

orf4     推定蛋白              4410-3112   -2         432      MRR-RTG

                                                      (1299)

orf5     与ATP结合相关的反应   5205-4795   -2         136      MWK-SAR

         调节因子                                     (411)

orf6     ABC糖转运因子         5516-6607   +2         363      MFN-SAY

                                                      (1092)

orf7     ATP结合相关的ABC糖    6673-8178   +1         501      MLL-DEH

         转运因子                                     (1506)

基 因 名   描述                   位置(DNA)  开放阅读  氨 基 酸   起始 - 终止

称                                           框位置    大    小   (3 个氨基酸)

                                                       (碱基长

                                                       度)

orf8       ABC转运通透酶          8168-9127  +2        319        MST-RTR

                                                       (960)

orf9       ABC转运因子通透酶蛋    9130-10092 +1        320        MSI-RRS

           白                                          (963)

orf10      金属肽酶               12046    - -1        486        MRT-PGS

           (Metallopeptidase)     10586                (1461)

orf11      推测的StrR类似调节因   12460    - +1        286        MDS-DAA

           子                     13320                (861)

orf12      ligA                   13641    - +3        64(195)    MSA-CAC

                                  13835

orf13      ligM                   13907    - +2        1046       MSS-THV

                                  17047               (3141)

orf14      ligT,ABC转运因子      17040    - +3        575        MSE-LLT

                                  18767               (1728)

orf15      ligO,荧光素酶类型的单 18785    - +2        347        MLS-RRW

           加氧酶                 19828               (1044)

orf16      ligR,反应调节因子     20459    - -3        217        MAD-ELA

                                  19806               (654)

orf17      结合通透酶的ABC转运    23069    - -3        814        MIF-LVR

           因子                   20625               (2445)

orf18      ABC转运因子,ATP结     23788    - -1        240        MVS-VTS

           合蛋白                 23066               (723)

orf19      组氨酸激酶             23980    - +1        362        VIA-AVP

                                  25068               (1089)

orf20      反应调节因子           25065    - +3        218        MTE-GPS

                                  25721               (657)

基 因 名    描述                 位置(DNA)   开放阅读  氨 基 酸   起始 - 终止

称                                           框位置    大    小   (3 个氨基酸)

                                                       (碱基长

                                                       度)

orf21       推测的膜蛋白         26673    -  -2         301        MPI-RFP

                                 25768                 (906)

orf22       α-β水解酶            26697    -  +3         290        MRN-ASR

                                 27569                 (873)

orf23       转录调控因子         27574    -  +1         145        VRL-RLG

                                 28011                 (438)

orf24       丙酮酰依赖的精氨酸脱 28102    -  +1         175        MAD-GMN

            羧酶                 28629                 (528)

orf25       推测的二氨基庚二酸盐 30946    -  -2         406        MTL-LYA

            脱羧酶               29626                 (1221)

orf26       激酶                 31860    -  -2         309        VRS-PDL

                                 30931                 (930)

orf27       转     录调控因子    33248    -  -3         367        VVF-ANS

                                 32145                 (1104)

orf28       糖基转移酶           33600    -  +3         317        MPS-NAG

                                 34553                 (954)

orf29       糖基转移酶           34543    -  +1         369        MPA-ARV

                                 35652                 (1110)

orf30       二氢硫辛酰胺脱氢酶   36432    -  +3         459        MGE-INF

                                 37811                 (1380)

orf31       推测的膜蛋白         37973    -  +2         348        MTT-TPG

                                 39019                 (1047)

实施例2-表达盒

表达盒的构建

本实施例阐明了构建本发明中的表达盒的方法。该表达盒中的质粒pAGvarX可以高效构建本发明中的LanA基因的变体形式,随后转入一个宿主细胞中,例如一株不含野生型actA的产加尔巴丁游动放线菌中(A.garbadinenis Δ actA)。该质粒源于载体pSET152(Bierman等人1992年的工作),它可以通过attP附着位点整合到宿主细胞的染色体上。通过寄助物和其自有的阿肽加定生物合成成簇基因的野生型基因一起去表达actA基因突变型,从而产生阿肽加定的变体形式。

质粒pAGvarX的构建

除非另有说明,这里所有的引用的位置都是指序列SEQ ID NO:100上的位置。图3中展示了载体pAGvarX的构建图谱。以O/Agvar01bF和O/Agvar02bR(见引物表)为引物,以pLITAG01为模板PCR扩增从ActA基因上游读码框区域21237位碱基开始至actA编码区的21672位编码亮氨酸残基的碱基之间的一段序列。这对引物在5’末端通过设计引入一个端侧XbaI酶切位点,通过同义突变在亮氨酸编码actA的3’端引入一个BglII的酶切位点。该扩增片段与Smal酶切并脱磷后的pUC19连接,构建成的载体记为pAGvar1。

以O/Agvar05F和O/Agvar06R为引物,以pLITAG01为模板PCR扩增actA基因C末端与其下游紧接的开放阅读框(包括21758-21836)之间的DNA序列。引物设计时在5’端引入一个端侧AvrII酶切位点,3’末端引入一个EcoRI酶切位点。该PCR产物与SmalI酶切并脱磷后的pUC19连接,构建成的载体记为pAGvar2。质粒pAGvar1和pAGvar2均使用XbaI酶切,然后回收pAGvar1中的PCR产物片段,将其克隆到脱磷后的pAGvar2的XbaI位点,再通过酶切分析的方式鉴定连接片段方向的正确性。构建成的质粒记为pAGvar3,其随后使用BglII和AvrII双酶切,再与退火后的寡聚核苷酸O/AGvar03F和O/AGvar04R连接,构建成的质粒记为pAGvar4。质粒pAGvar4随后使用EcoRI和XbaI双酶切,得到一个包括退火寡聚核苷酸序列在内大约620bp的片段,随后与EcoRI和XbaI双酶切的质粒pSET152连接,构建成的载体记为pAGvarX。

这段通过退火相应的寡聚核苷酸序列构建的pAGvarX的区域,已通过同义突变的方式引入了一个BsrGI酶切位点,它位于阿肽加定多肽序列的6位和7位上(相应的氨基酸是C和T)。该位点可以用于与其上游的BglII或者下游的AvrII酶切位点联合使用导入任意一段含有氨基酸定点突变的actA多肽的DNA序列。

实施例3-宿主细胞

这个实施例公开了一个构建其LanA基因失活的生产羊毛硫细菌素类抗菌肽宿主细胞的方法。本实施例中,构建出的是一株删除了actA基因的产加尔巴丁游动放线菌。

菌株产加尔巴丁游动放线菌ΔactA的构建

菌株产加尔巴丁游动放线菌ΔactA可以用作表达阿肽加定结构基因actA的变体形式的宿主。该菌株是使用Gust等人2002年开发的Redirect技术从野生型产加尔巴丁游动放线菌改造而来。首先,使用表达盒SBdel-1替换粘粒CosAG14中编码actA的DNA区域。表达盒SBdel-1是由侧端连有FLP识别位点(FRT)的oriT,和安普霉素抗性基因(aac(3)IV)组成,且该表达盒可以用质粒pIJ773为模板,O/SB50F和O/SB51R为引物,PCR扩增得到,所述两个引物结合的位点分别位于序列SEQ ID NO:100的21536位和21802位。根据Redirect的步骤(见Gust等人2004年的报道),使用Sbdel-1替换掉CosAG14中的actA后生成粘粒记为CosAG14 Δ A。然后根据Redirect技术的第七步,使用FLP介导的删除方法删除了CosAG14Δ A中原Sbdel-1的中心序列,其产物粘粒记为CosAG14 Δ B。该区域删除后使用这个载体介导的删除可以实现无极性,无标记的框内删除,而且可以重复使用同样的抗性筛选标记(Gust等人2003年的报道)。

菌株构建的第二阶段是改造这个粘粒使其可以通过接合的方式导入产加尔巴丁游动放线菌中。其步骤首先是用转化的方法将CosAG14 Δ B导入大肠杆菌E.coli BW25113/pIJ790中。再根据Redirect的步骤将CosAG14Δ B中的氨苄青霉素基因使用SBdel-2替代掉,构建成的粘粒记为CosAG14 Δ C。该SBdel-2表达盒同SBdel-1一样,含有安普霉素抗性基因(aac(3)IV)和侧端连有FRT位点的oriT。该表达盒以O/SB52F和O/SB53R为引物,以pIJ773为模板通过PCR扩增得到。

在CosAG14ΔC被用于转化电转感受态细胞E.coli ET12567/pUZ8002后,再根据Redirect的步骤将其与产加尔巴丁游动放线菌接合转移,。(参见Gust等人2004年的报道以及下文)。如此构建之后的菌株中的actA基因已经从其基因组中删除,即为产加尔巴丁游动放线菌ΔactA菌株。

关于获得上述产加尔巴丁游动放线菌ΔactA菌株的进一步描述如下,在CosAG14 Δ C载体被用于转化电转感受态细胞E.coliET12567/pUZ8002之后,使用接合的方式转入到菌株产加尔巴丁游动放线菌中。将得到的具有安普霉素抗性的接合后体置于不含安普霉素培养基TSB中进行六轮连续的继代培养。第六轮培养后得到的克隆使用65号培养基于30℃。培养5天后,将菌落转移到一个大约1em2的65号培养基上并作菌种保存。于30℃培养3天后挑选的菌被转移到含有终浓度为50ug/ml的安普霉素的65号培养基上培养。于30℃培养72小时后,挑选出对安普霉素敏感的菌落,相应的菌种被接种到含有10ml TSB培养基的50ml的烧瓶中,于30℃,250rpm条件下培养4天。从每个培养物中提取相应的菌株的基因组DNA,并使用寡核苷酸O/Agvar01bF和O/Agvar06r做PCR分析。制备得到一种大小跟删除了的actA基因一样的PCR产物。于此同时,对发酵液做HPLC分析,证明前述样品确实不能产生阿肽加定多肽。

实施例4-异源表达

本实施例公开了在一个非生产羊毛硫细菌素类抗菌肽宿主细胞S.lividans中表达SEQ ID NO:100成簇基因中的阿肽加定的方法。这种类型的宿主细胞提供了另一种表达这两个多肽有活性的变体的方法。

粘粒CosAG14和CosAL02包含了生产阿肽加定和脱氧阿肽加定B(deoxy-actaggardine B)相关的生物合成成簇基因,但不含有一个用于异源宿主结合转染的起始位点(oriT)。使用Redirect技术(见Gust等人2002年的报道),可以将oriT和噬菌体附着位点attP和整合酶(int)导入到CosAG14和CosAL02中的SuperCos1骨架序列中,替换其新霉素抗性基因neo。

构建用于异源表达的载体

粘粒pMJCOS1(由JIC,Norwich提供)是SuperCos1(Stratagene)的一个衍生物,其中SuperCos1原有的编码新霉素抗性基因被一个包含了编码oriT,attP,整合酶(int)和安普霉素抗性基因(aac(3)IV)的表达盒(Heapra)所替换。Heapra表达盒可使用SspI酶切pMJCOS1并使用琼脂糖凝胶回收DNA分离得到。根据Gust et al 2004年描述的Redirect的步骤,利用这个表达盒与CosAG14和CosAL02分别构建出粘粒CosAG14Heapra和CosAL02Heapra。

粘粒CosAG14Heapra随后通过接合的方式导入到菌株S.lividans。并分离出菌株S.lividans/CosAG14Heapra的安普霉素抗性接合后体。从中挑取了3个接合后体接种到TSB种子培养基上培养。同时培养S.lividans,A.garbadinenis,利古里亚游动放线菌以作为平行组对照。经48小时培养后,将种子培养基培养物接种到4种不同的生产培养基中,分别是AAS1,GM1,GM3和TSB。将这些培养物于30℃培养9天,并从烧瓶中分装出其中第5,7和9天的培养物各1.5ml用于后续实验。分装的样品于14000rpm离心(IEC micromax benchtop离心机)10分钟,随后将上清转入新管,将未稀释的原液用于生物鉴定和HPLC-MS分析。

抑菌圈(晕圈)实验可以指示出生物活性的化合物存在,抑菌圈可以在所有用含有粘粒CosAG14Heapra的S.lividans(S.lividans/CosAG14HEapra)上清液上样的孔中观察到,但是没有在使用TSB培养基培养的发酵液上清的上样的孔中观察到。S.lividans生长的所有4种培养基的发酵液上清加入上样孔后,也没有观察到孔周围有显示生物活性的晕圈出现。同时A.liguriae和A.garbadinensis生长的所有培养基的发酵液上清加入上样孔后可观察到晕圈的出现。所有从5天到9天的取样点都产生了晕圈,同时也观察到相应晕圈直径上有明显缩小的现象。

使用HPLC-MS对S.lividans/CosAG14Heapra的发酵液上清进行分析,证实了其峰值的保留时间和分子量与0位丙氨酰阿肽加定(ala(0)actagardine)一致。仅在S.lividans的发酵上清液中没有检测到这些峰。表3总结了对S.lividans,S.lividans/CosAG14Heapra,产加尔巴丁游动放线菌和A.liguriae培养了五天后的发酵液上清的HPLC-MS分析。

表3

样品             发 酵   产物浓   保 留   分 子   检测到的多肽化合物

                 培 养   度       时间    离子

                 基      (μg/ml) (min)   (m/z)

S.lividans/      GM1     83       6.75    981     0 位 丙 氨 酰 阿 肽 加 定

CosAG14HEapra                                     (Ala(0)Actagardine)(M+2H)+2

                                          991     0 位 丙 氨 酰 阿 肽 加 定

                                                  (  Ala(0)Actagardine  )

                                                  (M+H+Na)+2

S.lividans/      GM3     33       6.75    981     0 位 丙 氨 酰 阿 肽 加 定

CosAG14HEapra                                     (Ala(0)Actagardine)(M+2H)+2

                                          991     0 位 丙 氨 酰 阿 肽 加 定

                                                  (  Ala(0)Actagardine  )

                                                  (M+H+Na)+2

S.lividans       GM1     未检测   未  检  未  检  未检测到

                         到       测到    测到

S.lividans       GM3     未检测   未  检  未  检  未检测到

                         到       测到    测到

产加尔巴丁游动   GM1     58       6.9     945     阿肽加定(M+2H)+2

放线菌

产加尔巴丁游动   GM3     24       6.8     981     0 位 丙 氨 酰 阿 肽 加 定

放线菌                                            (Ala(0)Actagardine)(M+2H)+2

                                          991     0 位 丙 氨 酰 阿 肽 加 定

                                                  (  Ala(0)Actagardine  )

                                                  (M+H+Na)+2

利古里亚游动放   GM1     未检测   7.06    937     脱 氧 阿 肽 加 定 B

线菌                     到                       (  Deoxy-actagardine  B  )

                                                  (M+2H)+2

利古里亚游动放   GM3     未检测   7.06    937     脱 氧 阿 肽 加 定 B

线菌                     到                       (  Deoxy-actagardineB  )

                                                  (M+2H)+2

实施例5-抗菌活性

MIC值的测定

进一步检测了入选的上文公开的已生成的一些变体形式的一系列菌种的抗菌能力。这里使用Mueller-Hinton肉汤(MHB)的抗生素两倍系列稀释法检测了针对除肺炎链球菌(Streptococcus pneumoniae)以外的所有菌种的最低抑菌浓度(MIC),该肉汤补充无水氯化钙,其钙的终浓度为400μg/ml。针对S.pneumoniae的最低抑菌浓度的MIC值使用脑心浸液(BHI)肉汤的抗生素两倍系列稀释法检测得到,该肉汤补充无水氯化钙,其钙的终浓度为400μg/ml。抗生素试剂储液的制备和储存均参照NCCLS标准M7-A6。

通过控制600nm的吸光率在0.2至0.3之间的标准来把活跃生长状态的发酵液培养物密度稀释到105至106CFU/ml之间,相当于0.5麦氏比浊标准。然后将它们进一步稀释到与发酵液的浓度为1:100,用于后续实验。在96孔微量滴定板(96-well microtitre plates)上进行2次重复的测定,,总反应体系为200μl(160μl肉汤,20μl抗生素,20μl接种菌液),其抗生素抗生素浓度范围从64μg/ml至0.06μg/ml。96孔微量滴定板的第12个孔不含抗生素试剂。使用万古霉素(Vancomycin)作为对照抗生素作质量监控。平板于37℃有氧摇动培养18到20个小时,以细菌无可见生长的最小药物浓度作为MIC值。

实施例6-核磁共振分析

对阿肽加定和脱氧阿肽加定(Deoxy-actagardine)的核磁共振进行分析

核磁共振光谱分析(COSY,TOCSY,HSQC和NOESY)从多肽产物角度证实了阿肽加定(产加尔巴丁游动放线菌)和脱氧阿肽加定(deoxy-actagardine B)(利古里亚游动放线菌)的测序结果。同时,获得了一个并不完全明确的所有氨基酸残基配置的信息,它与图4中所示结构一致,并足以证明利古里亚游动放线菌产生的脱氧脱氧阿肽加定B(deoxy-actagardine B)的15位和16位的氨基酸残基分别为Leu和Val。

实施例7-衍生物的合成

本例合成了下列脱氧阿肽加定B(deoxy-actagardine B)的衍生物,其基团Z和C末端的氨基化合物列表如下:

化合物结构

化合物             Z位        C末端氨基化合物

I                  H          

II                 H          

III                H          

IV                 D-Ala      H

V                  L-Ile      H

VI                 L-Val      H

VII                L-Phe      H

VIII               L-Lys      H

IX                 L-Tryp     H

化合物I至XI的合成均按以下步骤进行:

通用步骤1制备化合物1至3

在脱氧阿肽加定B(deoxy-actagardine B)(20mg,1 1nmol)的溶液中,加入对应的氨基化合物(11nmol)和溶解于干燥的二甲基甲酰胺(0.8ml)的二异丙基乙胺(7.2μl,70nmol)以及200μl溶解于干燥的二甲基甲酰胺(1.0ml)的六氟磷酸苯并三唑-1-基-氧-三-吡咯烷基-磷盐(benzotriazole-1-yl-oxy-tris-pyrrolidino-phosphoniumhexafluorophosphate)(PyBop)(70mg,134nmol)。在反应的过程中使用HPLC来监测混合物成分,并逐步加入Pybop溶液直到所有的起始反应物被消耗完全。在这个阶段,HPLC分析显示其中的二酰氨的量是变化的(5-20%)。反应结束以后,使用pH为7含有30%乙腈的20mM Kpi磷酸缓冲液(10ml)来稀释混合物。按照表4所描述的条件使用制备HPLC来纯化单酰胺类物质。适宜的收集管中的洗脱液并将其浓缩至其原体积的25%后使用一个预处理的C18 Bond Elut色谱柱(500mg)脱盐处理。上样后依次使用两个柱体积的30%,40%,70%和90%的甲醇水溶液洗脱C18 Bond Elut色谱柱(500mg),蒸发其中合适的收集管的洗脱液以获得白色固体形态的期望产物

化合物I:Deoxy-Actagardine B N-[3-dimethylaminopropyl]monocarboxamide

根据通用步骤1通过3-(dimethylamino)propylamine与脱氧阿肽加定B(deoxy-actagardine B)偶合可获得化合物I。其产量为18mg,产率为85%。[M+2H 2+]预计为979.0,实测为980.2。

化合物II:Deoxy-Actagardine B N-[1-(1-methyl-4-piperidinyl)piperazine]monocarboxamide

根据通用步骤1通过4-(piperidino)piperazine与脱氧阿肽加定B(deoxy-actagardine B)偶合可获得化合物II。其产量为8mg,产率为37%。[M+2H 2+]预计为1019.5,实测为1020.0;[M+3H 3+]预计为680.0,实测为680.0。

化合物III:Deoxy-Actagardine B[1-(3-dimethylaminopropyl)piperazine]monocarboxamide

根据通用步骤1通过1-(3-dimethylaminopropyl)piperazine与脱氧阿肽加定 B(deoxy-actagardine B)偶合可获得化合物III。其产量为10mg,产率为46%。[M+2H 2+]预计为1013.5,实测为1014.0。

通用步骤2制备化合物4至9

Fmoc保护的氨基酸(34nmol)溶于干燥的二甲基甲酰胺溶液得到的溶液使用含有六氟磷酸苯并三唑-1-基-氧三-吡咯烷基-磷盐(benzotriazole-1-yl-oxy-tris-pyrrolidino-phosphoniumhexafluorophosphate)(PyBop)(11.4mg,22nmol)和含有二异丙基乙胺(11μl,68nmol)的干燥二甲基甲酰胺(0.4ml)溶液处理。该混合物然后加入到含有脱氧阿肽加定 B(deoxy-Actagardine B)(2mg,11nmol)的干燥的二甲基甲酰胺溶液中(0.5ml)。在室温下反应1个小时后,使用HPLC(30-65%乙腈溶于20mM Kpi磷酸缓冲水溶液中,pH7)分析表明起始物质均完全转化。上述反应混合物用40%甲醇水溶液(20ml)稀释后,上样至已经依次使用两个柱体积的100%的甲醇和水预处理过的C18 Bond Elut色谱柱中(500mg)。随后依次用两个柱体积的40%,50%,60%,70%,80%,90%和100%的甲醇水溶液进行洗脱。收集管中的洗脱液使用HPLC分析后,将其中含有Fmoc保护的偶合产物蒸发干燥。残余物溶解于二甲基甲酰胺(1ml)中,然后加入哌啶(50μl)以反应去除Fmoc保护基团。使用HPLC监控反应的进程,当起始物被完全消耗后,用30%甲醇水溶液(20ml)稀释反应后的溶液。按照上文中描述的方法将混合物使用C18 Bond Elutcartridge(500mg)洗脱,合适的收集管中的洗脱物在挥发干燥获得产物后进一步地按照表4中所述条件使用制备型HPLC纯化。其中合适的收集管中的洗脱液浓缩至原体积的25%,然后上样至C18 Bond Elut色谱柱(500mg)脱盐,所述柱已经依次使用两个柱体积的30%,40%,70%和90%甲醇水溶液冲洗。最后蒸发其中合适的收集管的洗脱液以获得白色固体形态的期望产物。

化合物IV:D-0位丙氨酰脱氧阿肽加定 B(D-Ala(0)deoxy-actagardineB)

根据通用步骤2通过脱氧阿肽加定 B(deoxy-actagardine B)与Fmoc-D-alanine偶合可获得化合物IV,其产率为74%。[M+2H 2+]预计为972.5,实测为973.0。

化合物V:L-lle(0)deoxy-actagardine B

根据通用步骤2,通过脱氧阿肽加定 B(deoxy-actagardine B)与Fmoc-L-isoleucine偶合可获得化合物V,产率为27%。[M+2H 2+]预计为993.5,实测为993.8。

化合物VI:L-Val(0)deoxyactagardine B

根据通用步骤2,通过脱氧阿肽加定 B(deoxy-actagardine B)与Fmoc-L-valine偶合,可获得化合物VI,其产率为55%。[M+2H 2+]预计为986.5,实测985.9。

化合物VII:L-Phe(0)deoxyactagardine B

根据通用步骤2,通过脱氧阿肽加定 B(deoxy-actagardine B)与Fmoc-L-phenylalanine偶合,可获得化合物VII,其产率为22%。[M+2H 2+]预计为1010.5,实测为1010.9。

化合物VIII:L-Lys(0)deoxyactagardine B

根据通用步骤2,通过脱氧阿肽加定 B(deoxy-actagardine B)与Bis(Fmoc)-L-lysine偶合,可获得化合物VIII,其产率为45%。[M+2H 2+]预计为1001.0,实测为1001.6。

化合物IX:L-Tryp(0)deoxyactagardine B

根据通用步骤2,通过脱氧阿肽加定 B(deoxy-actagardine B)与Fmoc-L-tryptophan偶合,可获得化合物IX,其产率为55%。[M+2H 2+]预计为1030.0,实测为1029.9。

实施例8—进一步的抗菌数据

MIC测定

葡萄球菌(Staphylococcus),链球菌(Streptococcus),肠球菌(Enterococcus spp)

最低抑菌浓度(MICs)的检定和抗菌试剂原液的配制和储存均是按照NCCLS参考所描述的需氧菌微量肉汤稀释法进行的(M7-A6,2003)。MIC是在Mueller-Hinton发酵液(MHB)或脑心浸液(BHI)肉汤(S.pneumoniae)中对抗生素使用两倍系列稀释法测出的。处于活跃生长状态的肉汤培养物使用无菌肉汤或者直接菌落悬浮(S.pneumoniae)将其浊度调节至0.5麦氏比浊标准(McFarland 0.5 standard 1×108CFU/ml),然后在无菌肉汤中进一步稀释,至最终得到的接种物在无菌96孔微量滴定板中的浊度约5×105CFU/ml为止。用于接种。用Enterococcus faecalis ATCC29212作为对照菌并使用万古霉素(Vancomycin)作为对照抗生素作质量控制进行2次重复的分析测定。平板于37℃有氧摇动培养18到20个小时,以细菌无可见生长的最小药物浓度作为MIC值。

艰难梭菌(Clostridium difficile)

对C.difficile最低抑菌浓度(MICs)的检定和抗菌试剂原液的配制和储存均是参考NCCL所描述的厌氧菌琼脂稀释法进行的(M11-A5,2001)。抗生素的两倍系列稀释法中所用稀释培养基为Wilkens-Chalgren琼脂(WCA)。将测试菌从培养了48小时的Braziers(C.C.E.Y.)琼脂上挑出,在Schaedler发酵液中进行继代培养至密度等于0.5麦氏比浊标准(McFarland0.5 standard)(1×108CFU/ml),然后将其接种于WCA琼脂平板上培养至其密度为约105CFU/spot。使用Bacteroides fragilis ATCC 25285作为对照菌株并使用甲硝唑(Metronidazole)作为对照抗生素作质量控制。所有的操作均以2次重复进行,所有接触空气的操作于可短暂接触氧气的还原培养基中进行。平板于37℃无氧培养48个小时,以测试菌相对于无氧培养对照盘中细菌表现出显著的生长停滞时的最小药物浓度作为MIC值。

痤疮丙酸杆菌(Propionibacterium acnes)

生长了3到7天的测试菌从含有呋喃唑酮(1-2g/ml)的Wilkens-Chalgren琼脂(WCA)上挑出。P.aches的单克隆用直接菌落悬浮的方法接种至新鲜的Wilkens-Chalgren肉汤(WCB)培养基中,并调节密度到0.5麦氏比浊标准(McFarland 0.5 standard 1×108CFU/ml),然后在无菌WCB肉汤中进一步稀释,至无菌96孔微量滴定板中的最终接种物的密度为约5×105CFU/ml为止。抗生素的两倍系列稀释法中所用稀释液为无菌水,并根据NCCLS(M11-A5,2001)标准制备和储存原液。

分析均以2次重复进行并使用万古霉素(Vancomycin)和克林霉素(Clindamycin)作为对照抗生素作质量控制。平板于37℃无氧培养48—72个小时,以测试菌相对于无氧培养对照盘中细菌表现出显著的生长停滞时的最小药物浓度作为MIC值。所有的操作均以2次重复进行,所有接触空气的操作于可短暂接触氧气的还原培养基中进行。

这里所用培养基所含钙离子浓度(以氯化钙的形式)均为50ug/ml,如使用了更高浓度的钙离子将会特别指出。各物种中MIC值在下列的表格中列出,单位为μg/ml:

表6:针对Enterococci,Streptococci和Staphylococci的MIC值

                                0位丙氨酰脱氧阿肽加定B         脱氧阿肽加定B

菌株                            (Ala(O)-deoxyactagardine-B)   (Deoxyactagardine-B)

M.luteus 4698+200μg/ml Ca2+                   4                         8

E.faecalis 29212                             16                         16

E.faecalis 29212+200μg/ml Ca2+                4                          8

E.faecalis 29212+400μg/ml Ca2+                                           4

E.faecium 7131121(VRE)                       >64                        >64

E.faecium 7131121(VRE)+200μg/ml Ca2+          >64                        >64

E.faecium 7131121(VRE)+400μg/ml Ca2+                                     32

E.faecium 19579                              >64                        >64

E.faecium 19579+200μg/ml Ca2+                >64                         >64

E.faecium 19579+400μg/ml Ca2+                                            16

S.aureus R33(MRSA)                           32                         32

                             0位丙氨酰脱氧阿肽加定B        脱氧阿肽加定B

菌株                         (Ala(O)-deoxyactagardine-B)   (Deoxyactagardine-B)

S.aureus R33(MRSA)+200μg/ml Ca2+            16                         8

S.aureus R33(MRSA)+400μg/ml Ca2+                                       16

S.aureus SH1000                            16                         16

S.aureus SH1000+200μg/ml Ca2+               8                          8

S.aureus SH1000+400μg/ml Ca2+                                          16

S.epidermidis 11047                        16                         32

S.epidermidis 11047+200μg/ml Ca2+           8                          16

S.epidermidis 11047+400μg/ml Ca2+                                      16

S.pnuemoniae R6                            16                          16

S.pnuemoniae R6+200μg/ml Ca2+              32                           6

S.pnuemoniae R6+400μg/ml Ca2+                                           4

S.aureus 12232 MRSA                                                    16

S.aureus R36(MRSA)                                                     16

S.aureus R34(MRSA)                                                     16

S.aureus R39(MRSA)                                                     >32

S.aureus R40(MRSA)                                                     >32

S.aureus W71(MRSA)                                                     >32

S.aureus W74(MRSA)                                                     >32

S.aureus W96(MRSA)                                                     >32

S.aureus W97(MRSA)                                                     >32

S.aureus W98(MRSA)                                                     >32

S.aureus W99(MRSA)                                                     >32

S.epidermidis 7755298(MRSE)                                            >32

S.epidermidis 7865688(MRSE)                                            >32

S.epidermidis 7753921(MRSE)                                            >32

S.epidermidis GRL05011(MRSE)                                           >32

表7:针对梭链孢酸(fusidic acid)耐受型金黄色葡萄球菌(Staphylococcus aureus)的MIC值

                                                      脱氧阿肽加定B

菌株                                                  (Deoxy-Actagardine B)

Fusidic acid-res S.aureus 8325-4                                  8,8

Fusidic acid-res S.aureus CS1116                                  32,32

Fusidic acid-res S.aureus CS957                              32,32

Fusidic acid-res S.aureus CS767                              32,32

Fusidic acid-res S.aureus CS858                              32,32

Fusidic acid-res S.aureus CS741                              32,32

Fusidic acid-res S.aureus CS1145                             16,16

Fusidic acid-res S.aureus CS872                              16,16

Fusidic acid-res S.aureus CS866                              32,32

Fusidic acid-res S.aureus CS607                              64,64

Fusidic acid-res S.aureus CS22                               16,16

Fusidic acid-res S.aureus 8325-4+200μg/ml Ca2+               4,4

Fusidic acid-res S.aureus CS1116+200μg/ml Ca2+               16,16

Fusidic acid-res S.aureus CS957+200μg/ml Ca2+                16,16

Fusidic acid-res S.aureus CS767+200μg/ml Ca2+                16,16

Fusidic acid-res S.aureus CS858+200μg/ml Ca2+                16,16

Fusidic acid-res S.aureus CS741+200μg/ml Ca2+                16,16

Fusidic acid-res S.aureus CS1145+200μg/ml Ca2+               8,8

Fusidic acid-res S.aureus CS872+200μg/ml Ca2+                8,8

Fusidic acid-res S.aureus CS866200μg/ml Ca2+                 8,8

Fusidic acid-res S.aureus CS607+200μg/ml Ca2+                32,32

Fusidic acid-res S.aureus CS22+200μg/ml Ca2+                 4,4

表8:针对莫匹罗星耐受型金黄色葡萄球菌(Staphylococcus.Aureus)的MIC值

                                         脱氧阿肽加定B

                      菌株               (Deoxy-actagardine B)

                      8325-4             8,8

                      GISA-2             8,8

                      LZ6                16,16

                      LZ8                16,16

                      LZ9                16,16

                      LZ10               8,8

                      420                4,4

                      1205               16,16

                      1120               16,16

                      1454               16,16

                           1086            8,8

表9:针对痤疮丙酸杆菌(Propionibacterium acnes)的MIC值

                                         脱氧阿肽加定B

菌株                                    (Deoxy-Actagardine B)

Propionibacterium acnes P37(lab strain)             4,4

P.acnes AT1                                         4,4

P.acnes AT26                                        2,2

P.acnes 101897d                                     2,2

P.acnes PF284(tet res)                               2,2

P.acnes PF286(erythro & clin res)                    2,2

P.acnes PF289(clin和co-trimazole res)                4,8

表10:针对C.difficile的MIC值

                                  0位丙氨酰脱氧阿肽加定B         脱氧阿肽加定B

菌株                              (Ala(O)-deoxyactagardine-B)    (Deoxyactagardine-B)

C.difficile 37779                                4                          4

C.difficile 19126                                2                          4

MIC5010 C.difficile strains                                                  2

MIC9010 C.difficilestrains                                                   4

表11:抗C.difficile的MIC值:

菌株                  I    II    III    IV    V    VI    VII    VIII    IX

C.difficile 37779                >8     4     4    8     1      4       1

C.difficile 19126                >8     4     4    8     2      4       2

MIC50 C.difficle      2     2                             2

MIC90 C.difficile     4     4                             2

材料与方法

在实施例2到7中所使用的材料与方法如下:

培养基

所有的缓冲液,溶液和培养基均使用反渗透(RO)水配制,并且每升溶液含有如下组分:

AAS1                                      ABB13

可溶性淀粉                10g             Soytone peptone      5g

葡萄糖                    10g             可溶性淀粉           5g

蛋白胨                    5g              CaCO3                3g

玉米浆干粉                1g              MOPS                 2.1g

酵母抽提物                2g              琼脂                 20g

调节pH至6.0                               调节pH至7.0

GM1                                       BHI

Lablemco meat              4g             脑心浸液              37gextract

蛋白胨                    4g

NaCl                      2.5g            GM3

酵母抽提物                1g              Arkasoy soyflour      20g

大豆粉                    10g             甘露醇               20g

葡萄糖                    25g             调节pH至7.0

CaCO3                     5g

调节pH至7.6                               LA

                                          luria琼脂            40g

Mueller Hinton

Mueller Hinton             21g             LB发酵液

如为琼脂板使用                            Luria发酵液          25g

琼脂                      10g

SFM                                       SV2

大豆粉                    20g             葡萄糖               15g

D-甘露醇                  20g             甘油                 15g

琼脂                      16g             蛋白胨               15g

                                          NaCl                 3g

                                          CaCO3                1g

                                          调节pH至7.0

TAE buffer                                TSB

Tris                   48.44             胰蛋白酶大豆发酵     30g

                   g                  液

EDTA                   3.72g             调节pH至7.0

调节pH至8.3

2TY                                      ‘65’

胰蛋白胨               16g               葡萄糖               4g

酵母抽提物             10g               酵母抽提物           4g

NaCl                   5g                麦芽抽提物           10g

调节pH至                                 CaCO3                 2g6.5-7.0

                                         琼脂                 12g

                                         调节pH至7.2

生物测定

将藤黄微球菌(Micrococcus luteus)从冷冻原液中接种到10ml的Mueller-Hinton发酵液中于30℃,200rpm摇动的条件下培养过夜。再将1ml该培养物接种到300ml的Mueller-Hinton琼脂中,随后将琼脂铺于培养皿中。使用打孔器在上面等距离的钻出直径6mm的上样孔,并在其中加入50μl相应样品。将生物测定板置于空气层流室中直到加入的样品扩散,随后将这些检测板转移到30℃的培养箱中培养过夜。

限制性内切酶消化

用限制性内切酶消化DNA的反应是在生产商提供的缓冲液中并按照

使用手册来进行的。一个典型的反应中,为了制备DNA所进行的消化反应,5μg DNA需要使用12单位的酶在推荐温度下消化3小时。为了分析DNA所进行的消化反应,再使用2单位的酶在推荐温度下消化0.5μg DNA2到3个小时。然后进行琼脂糖凝胶电泳分析消化后的DNA。

接合后体的继代培养

将含有接合后体的琼脂栓塞接种到装有8ml TSB培养基和两个玻璃珠的50ml烧瓶中。在30℃,250rpm摇动的条件下培养10天后将100μl菌液接种到装有10ml TSB培养基和两个玻璃珠的50ml烧瓶中。在烧瓶中培养两天后将1ml菌液接种到一个装有10ml TSB培养基的50ml烧瓶中。在30℃,250rpm摇动下,每轮2天的条件下连续进行6轮连续的培养。将第六轮继代培养后的细胞于4000rpm离心(Heraeus Sepatech Megafuge)20分钟得到细胞沉淀。随后在TSB培养基中对这些细胞进行超声(MSE SanyoSoniprep 150,amplitude 10-15 microns)来破坏菌丝体。将这些超声处理过的细胞进行一系列稀释(用TSB进行10-1至10-5的稀释)后涂布于65号培养基并于30℃培养。

异源表达发酵

将琼脂栓塞或者250μl-80℃甘油原液接种到装有2个玻璃珠,以及含有萘啶酸和合适的选择性抗生素的8ml TSB或AAS1培养基的50ml锥形瓶中。在30℃,200rpm摇动的条件下培养2到4天后,将1.2ml(3%)的种子培养物接种到装有40ml相应产物培养基和2个玻璃珠的250ml锥形瓶中。在30℃,200rpm摇动的条件下培养9天,在培养的过程中,每隔一段时间从每个发酵液中取出1.5ml的完整发酵液用于生物测定和/或HPLC-MS分析。

用于分离脱氧阿肽加定B(deoxy-actagardine B)的利古里亚游动放线菌的发酵

将500ul(1%)取自甘油原液的利古里亚游动放线菌细脑接种到装有2个玻璃珠和50ml SV2培养基的250ml锥形瓶中。经过在30℃,250rpm摇动的条件下4天的培养后,将12ml(3%)种子培养物接种到装有400ml GM3培养基的2L锥形瓶中。将这些菌液在30℃,225rpm摇动的条件下培养9天。以4000rpm(Heraeus Sepatech Megafuge)离心30分钟收集发酵液中的细胞,并弃掉上清液。

用于分离阿肽加定和0位丙氨酰阿肽加定(Ala(0)-actagardine)的产加尔巴丁游动放线菌的发酵

将500μl(1%)取自甘油原液的A.garbadinensis细胞接种到装有2个玻璃珠和50ml AAS培养基的250ml锥形瓶中。经过在30℃,250rpm的条件下培养9天后,将12ml(3%)种子培养物接种到装有400ml AAS培养基的2L锥形瓶中。将这些菌液在30℃,200rpm的条件下培养8天。以4000rpm(Heraeus Sepatech Megafuge)离心30分钟收集发酵液中的细胞,并弃掉上清液。

为MIC分析分离脱氧阿肽加定B(deoxy-actagardine B)

将Diaion HP-20树脂(50g/L)加入到从A.liguriae发酵产物中分离出的上清液中,并混合,于4℃过夜放置。将悬液等分分装到Bond Elut色谱柱(60ml),然后依次使用4倍柱床体积的水和3倍柱床体积的25%,50%,75%和100%甲醇清洗树脂。HPLC分析确定脱氧阿肽加定(Deoxy-actagardine)存在于50%,75%和100%甲醇的洗脱组分中。合并这些组分并将其体积浓缩至起始体积的四分之一左右。将这些来自于1L发酵产物的浓缩液上样至两个预先已经用2个柱体积100%甲醇和2个柱体积的水依次清洗处理过的C18 Bond Elut色谱柱(5g)上。依次用2个柱体积的50%,60%,70%,80%,90%和100%的甲醇洗脱的色谱柱。HPLC分析确认在80%,90%和100%甲醇的洗脱液中存在脱氧阿肽加定(deoxy-actagardine),将这些组分合并并将体积浓缩至起始体积的三分之一左右。将相同体积pH值为2.5的含有40mM磷酸钾的50%甲醇溶液加入到浓缩液中,然后将得到的浓缩液平均上样至三个经过预平衡的SCXBond Elut色谱柱(1g)中。该柱先用pH值为2.5的含有40mM磷酸钾的50%甲醇溶液清洗,然后用1.5个柱体积的pH值为7的含有250mM磷酸钾的50%甲醇溶液进行洗脱。再将洗脱液上样至一个预先依次使用2个柱体积的甲醇和水处理过的C18 Bond Elut色谱柱(5g)中进行脱盐,该柱依次用2个柱体积的50%和60%甲醇清洗。然后通过依次加入2个柱体积的50%,60%,70%,80%,90%和100%的甲醇洗脱脱氧阿肽加定B(deoxy-actagardine B)。使用HPLC分析和LC-MS来确定含有纯化后的脱氧阿肽加定B(deoxy-actagardine B)的收集管。将这些收集管中洗脱液合并并蒸发干燥。

从A.liguriae发酵液中分离0位丙氨酰阿肽加定B(Ala(0)-Deoxyactagardine B)

将Diaion HP-20树脂(50g/L)与从4升A.liguriae发酵产物中分离出来的上清液混合,于4℃过夜放置。将悬液收集到一个烧结玻璃漏斗中,依次用4个柱床体积的水和4个柱床体积的50%甲醇清洗树脂。使用5个柱床体积的100%甲醇将脱氧阿肽加定B(Deoxy-actagardine B)和0位丙氨酰脱氧阿肽加定B(Ala(0)-deoxyactagardine B)洗脱下来。将100%甲醇的洗脱组分浓缩到起始体积的三分之一,然后加入水将甲醇浓度稀释至60%。首先用两个柱体积的50%甲醇清洗4个10g C18 Bond Elut色谱柱,将上步获得的溶液上样到这4个色谱柱中。使用2个柱体积的甲醇/0.5%甲酸溶液将脱氧阿肽加定B(deoxy-actagardine B)相关组分洗脱。所获得的洗脱液通过蒸发浓缩至40ml,随后按照下表所述条件使用制备HPLC分离其中的0位丙氨酰脱氧阿肽加定B(Ala(0)-deoxy-actagardine B)与脱氧阿肽加定B(Deoxy-actagardine B)。

 

色谱柱Capitol HPLC Ltd C18-BDS-HL5-26052 15cm x20mm溶剂A30%ACN溶解于20mM磷酸钾缓冲液pH5.0溶剂B65%ACN溶解于20mM磷酸钾缓冲液pH5.0检测210nm流速10ml/min时间(T)=0分钟100%AT=1分钟100%AT=29分钟T=29分钟35%BT=30分钟100%BT=33分钟100%BT=34分钟100%AT=35分钟100%A收集起始时间10min;终止时间30min;每收集管收集0.5分钟或0.25分钟。

按照上文中描述的方法将相应含有阿肽加定和0位丙氨酰阿肽加定(Ala(O)-actagardine)(通过使用HPLC和LC-MS分析来确定)的收集管中的洗脱组分使用C18 Bond Elut色谱柱进行脱盐,然后离心干燥。

0位丙氨酰脱氧阿肽加定B(Ala(0)-deoxy-actagardine B)从色谱柱洗脱的保留时间为5.04分钟,利用MS分析确认的特征为972.2 m/z (M+2H)+2

为MIC分析分离阿肽加定和0位丙氨酰阿肽加定(Ala(O)-actagardine)

按照上述从利古里亚游动放线菌中纯化脱氧阿肽加定B(deoxy-actagardine B)的方法来纯化阿肽加定和0位丙氨酰阿肽加定(Ala(O)-actagardine),其区别在于纯化Actagardine和Ala(O)-actagardine的时候,在使用SCX Bond Elut色谱柱后,使用制备HPLC来洗脱分离。将从SCX Bond Elut色谱柱上洗脱下的洗脱液通过旋转蒸发从70ml浓缩至18ml,随后按照表4中所描述的条件采用制备HPLC纯化该浓缩物。按照上文中描述的方法将相应含有阿肽加定和0位丙氨酰阿肽加定(Ala(O)-actagardine)(通过使用HPLC和LC-MS分析来确定)的收集管中的洗脱组分使用C18 Bond Elut色谱柱进行脱盐,然后离心干燥。

表4:分离阿肽加定和0位丙氨酰阿肽加定(Ala(0)actagardine)所用制备型HPLC的操作条件

 

色谱柱Capitol HPLC Ltd C18-BDS-HL5-26052 15cm x20mm溶剂A30%乙腈溶解于20mM磷酸钾缓冲液pH7.0溶剂B65%乙腈溶解于20mM磷酸钾缓冲液pH7.0检测268nm流速10ml/min时间(T)=0分钟100%AT=1分钟100%AT=19分钟25%BT=20分钟100%BT=25分钟100%B

 

T=26分钟100%AT=30分钟100%A收集起始时间8min;终止时间20min;每收集管收集1分钟

琼脂糖凝胶电泳

DNA电泳是根据Sambrook等人1989年发表的工作中描述的方法进行的。使用TAE缓冲液配制琼脂糖凝胶(浓度为0.7—1%),为了可以使用紫外光照射来检测DNA的存在,在配制凝胶的过程中加入终浓度为0.1μg/ml的溴乙啶。样品与0.1体积的10倍工作浓度的琼脂糖凝胶上样溶液混合,然后加样至凝胶中并且在旁边的的加样孔中加入100bp,1kb或者是lambda DNA-HindIII的分子量标记,在1—5V/cm的电场中进行电泳。在波长为300nm的紫外光下检测凝胶并采用UVP成像系统纪录结果。

从琼脂糖凝胶中回收DNA

将含有DNA的小块凝胶从整块琼脂糖凝胶中切下,然后使用Qiaquick凝胶回收试剂盒(Qiagen)进行回收,最后将DNA洗脱到灭菌的反渗透纯水或Tris-HCl(10mM,pH8.5)或TE缓冲液中。

末端补平

使用大肠杆菌E.coli DNA聚合酶的Klenow片断将限制性内切酶消化DNA生成的3’粘性末端补平。在一个典型的反应中,每μg DNA需加入1个单位的酶和250μM的各种dNTP。反应在25℃下进行15到30分钟,随后加入终浓度为10mM的EDTA终止反应。

DNA磷酸化

根据Sambrook等人1989年发表的工作中描述的方法,用T4多核酸激酶在37℃处理PCR产物30分钟。随后用65℃处理20分钟使酶失活。

线性化载体的脱磷酸反应

为了避免线性化载体的自连,根据操作手册使用虾类的碱性磷酸酶(SAP)来除去5’的磷酸盐基团。在一个典型的反应中,在DNA限制性内切反应的最后一个小时将1个单位的SAP加入反应混合物中。反应结束后将反应混合物在65℃处理20分钟使酶失活。

DNA连接反应

根据Sambrook等人1989年发表的工作中描述的方法进行DNA连接反应,在总体积为15ul的体系中加入1个单位的T4 DNA连接酶,在16℃反应12—16小时。

细菌培养物的保存

取0.5ml相应的培养基在—80℃下冷冻,得到含有10%终浓度甘油的活细胞甘油悬液。产加尔巴丁游动放线菌和利古里亚游动放线菌的单菌落,可通过将50ul发酵液或者甘油菌涂布于65号培养基或ABB13培养基上生长培养获得。

聚合酶链式反应

聚合酶链式反应(PCR)是在Stratagene Robocycler Gradient 96上进行的。在一个典型的反应中,将100—200ng模版DNA与20pmol各种寡聚核苷酸引物和浓度均为250mM的各种dNTP混合。在终体积为50ul或100ul的反应体系中含有生产商提供的嗜热DNA聚合酶缓冲液和10%(v/v)总体积的DMSO。在一个典型的反应中,加入5个单位的嗜热DNA聚合酶然后进行变性1分钟(94℃),Y℃(退火温度)下进行30秒—3分钟延伸(72℃)的初始循环。接下来按照94℃ 1分钟,Y℃(退火温度)1分钟,72℃延伸X分钟的程序进行30个循环,最后进行一个72℃延伸2X分钟的终末循环。关于延伸时间X的选取,是按照使用Taq多聚酶每分钟产生1kb产物和使用Pfu多聚酶每2分钟产生1kb产物计算的。关于退火温度Y的选取,在扩增pAGvar1时是55℃而扩增pAGvar2时是49℃。Redirect技术的实验步骤(Gust et al.,2004)中描述了扩增SBdel-1和SBdel-2的条件。

引物

 

引物名称SEQ IDNO:序列5’-3’O/AGvar01bF303TTCTAGACGTTGTTCTCCCATTTTCACO/AGvar02bR304AAGATCTTCGAAGGTGAGCTCGCCGAAO/AGvar03F305gatcttcgcgaggaccgcaccatctacgccgccagcagcggctgggtgtgtacactgacgatcgagtgcggcaccgtgatctgcgcctgctgacO/AGvar04R306CTAGGTCAGCAGGCGCAGATCACGGTGCCGCACTCGATCGTCAGTGTACACACCCAGCCGCTGCTGGCGGCGTAGATGGTGCGGTCCTCGCGAAO/AGvar05F307gcctgctgacctaggTCGACGATCGTO/AGvar06r308tgaattcGGCTGCTCCCCGCGCGAAATO/SB50F309ATTCGCCCGGGAAGTCCACCGAAAGGAAGACACACCATGATTCCGGGGATCCGTCGACCO/SB51R310GGGCGATGCCCGCCCCGGGCCGGAAACGATCGTCGATCATGTAGGCTGGAGCTGCTTCO/SB52F311AAGTATATATGAGTAAACTTGGTCTGACAGTTACCAATGATTCCGGGGATCCGTCGACCO/SB53R312GCTTCAATAATATTGAAAAAGGAAGAGTATGAGTATTCATGTAGGCTGGAGCTGCTTC

质粒DNA的制备

小规模的制备质粒(每次制备少于20ug)时,从2YT(或LA)平板培养基上挑出单菌落接种于已灭菌并加入了合适抗生素的3ml 2YT或LB培养基中。将接种好的培养基于37℃,250rpm摇动的条件下培养过夜(12到16小时)。于12000xg离心1分钟以收集细胞,随后按照说明书,使用Wizard(Promega)Miniprep试剂盒制备质粒DNA。在大规模,目的为100ug质粒DNA进行质粒制备时,则培养30ml 2YT培养基然后根据操作说明书使用Qiagen Midi-prep试剂盒制备质粒。所有质粒制备均以限制性内切酶反应分析和/或DNA测序来进行确认。

制备粘粒DNA

为了制备粘粒DNA,先从2YT(或LA)平板培养基上挑出单菌落接种于已灭菌并加入了合适抗生素的50ml 2YT或LB培养基中。将接种好的培养基于37℃,250rpm摇动的条件下培养过夜(12到16小时)。于4000rpm(Heraeus sepatech Megafuge 2.0R)离心分离20分钟以收集细胞,随后按照说明书,使用Qiagen Midi-prep试剂盒制备粘粒DNA。

电转感受态大肠杆菌细胞(electrocompetent E.coli cells)的制备和转化

根据Dower等人1998年发表的工作中描述的方法制备电转感受态大肠杆菌细胞。将60μl分装的感受态细胞于冰上解冻然后与1.8μl连接反应混合物或质粒DNA混合。将混合物注入电转化杯(Sigma 0.1cm)然后将电转杯放入电转化仪(Stratagene electroporator-1000)中。按照电位差1.8kV/mm(25μF,200Ω)的条件进行转化并随后加入0.5ml的2YT或LB培养基。与37℃培养45到60分钟使抗生素抗性基因得以表达再将转化后的细胞涂布于合适的选择性培养基上。

制备基因组DNA

根据Kieser等人2000年发表的工作中描述的方法制备基因组DNA模版。

游动放线菌(Actinoplanes sp.)的接合步骤

除了菌株E.coli ET12567/pUB307(Flett etal.,1997)被替换成菌株ET12567/pUB8002(Kieser et al.,2000)之外,大肠杆菌(E.coli)与游动放线菌(Actinoplanes sp.)之间的属间接合操作均是按照Heinzelmann等人2003年发表的工作中的描述进行的。接合后体被转移并涂布在含有相关的选择性抗生素和50ug/ml萘啶酸的65号培养基或ABB13培养基上,面积为一块大约1平方厘米的区域。这些平板于30℃培养4到7天,然后接种于肉汤培养基培养

链霉菌(Streptomyces sp.)的接合步骤

大肠杆菌(E.coli)与链霉菌(Streptomyces sp.)之间的属间接合操作是按照Kieser等人2000年发表的工作中的描述进行的。结合后体被转移并涂布在含有50ug/ml萘啶酸和相关的选择性抗生素的SFM培养基上,面积为一块大约1平方厘米的区域。这些平板于30℃培养4到7天,然后接种于肉汤培养基培养。

表5:菌株列表

 

名称描述/用途产加尔巴丁游动放线菌ATCC31049用於分离合成阿肽加定抗菌肽的生物合成成簇基因产加尔巴丁游动放线菌ΔactA产加尔巴丁游动放线菌ATCC31049菌株,其中的actA基因已被删除。用于表达actA基因变体。ActinoplanesliguriaeNCIMB 41362用于分离合成脱氧阿肽加定B(deoxy-actagardine B)的生物合成成簇基因。用于表达ligA基因变体形式。Escherichia coliXL1-Blue MR用于制备粘粒文库。Escherichia coliDH10B用于常规克隆。Escherichia coli ET12567用于分离非甲基化的DNA。EscherichiacoliET12567/pUZ8002用于通过接合方式实现DNA的基因间转移。EscherichiacoliBW25115/pIJ790该菌株含有lambda红色重组质粒pIJ790。促进侧链有FLP识别位点的表达盒的定向重组。EscherichiacoliDH5α/BT340该菌株含有BT340质粒。用于促进通过FLP介导方式切除中断盒。MicrococcusluteusATCC4698用于生物鉴定的菌株。

 

名称描述/用途Streptomyces lividans1326用于异源表达的宿主菌株。StreptomycescoelicolorB757用于异源表达的宿主菌株。Streptomycescinnamoneus DSM 40005用于异源表达的宿主菌株。

抗生素

如果无特别说明,抗生素原液在水中配制,并将配制后的溶液通过0.22um微孔滤器(Millipore filter)进行灭菌处理。用乙醇配制的溶液没有经过灭菌处理(Sambrook et al.,1989)。所有的抗生素储存于—20℃。在使用安普霉素的培养基中,加入终浓度为10mM的MgCl2(原液浓度为2.5M)。

                                原液                工作浓度

氨苄青霉素(amp)                 100mg/ml              100μg/ml

安普霉素(apra)                  100mg/ml              50μg/ml

羧苄青霉素(car)                 100mg/ml              100μg/ml

氯霉素(cm)                      25mg/ml溶于乙醇       25μg/ml

卡那霉素(kan)                   50mg/ml               50μg/ml

萘啶酸(na)                      25mg/ml               25μg/ml

表达盒

载体

 

名称长度(kb)抗性标记来源描述/用途pAGvar13.1氨苄青霉素(amp)本项研究以pLITAG01为模版用引物primers O/AGvar01bF和O/AGvar02bR扩增得到449bp的片断,然后将片断插入到预先用SmaI消化切开的pUC19质粒中。pAGvar22.8氨苄青霉素本项研究以pLITAG01为模版用引物O/AGvar05F和O/AGvar06R扩增得到91bp的片断,然后将片断插入到预先用SmaI消化切开的pUC19质粒中。pAGvar33.2氨苄青霉素本项研究将XbaI酶切的片断(~450bp)克隆至预先用XbaI酶切的pAGvar2质粒中。

 

名称长度(kb)抗性标记来源描述/用途pAGvar43.3氨苄青霉素本项研究将寡聚核苷酸O/AGvar03F,O/AGvar04R退火后连接到预先用BglII和AvrII酶切的pAGvar3质粒中。pAGvarX6.3安普霉素本项研究将来源于pAGvar4的XbaI-EcoRI片断(~650bp)连接到预先用EcoRI/XbaI酶切的pSET152质粒中。actagardien基因变体可组装后通过附着位点attP导入宿主染色体中。CosAL0247.2氨苄青霉素和新霉素本项研究将来源于利古里亚游动放线菌,长度为40402bp的Sau3AI酶切的DNA片断克隆到预先用BamHI酶切的SuperCos1粘粒中。CosAL02HE安普霉素49.1氨苄青霉素和安普霉素.本项研究CosAL02粘粒中编码新霉素的基因被HEapra表达盒替代。CosAG1445氨苄青霉素和新霉素本项研究将来源于产加尔巴丁游动放线菌,长度为38168bp的Sau3AI酶切的DNA片断克隆到预先用BamHI消化切开的SuperCos1粘粒中。

 

名称长度(kb)抗性标记来源描述/用途CosAG14ΔA46.3氨苄青霉素,新霉素和青霉素本项研究CosAG14粘粒中编码actA的基因被SBdel-1表达盒替换。CosAG14ΔB44.9氨苄青霉素和新霉素本项研究CosAG14ΔA粘粒中SBdel-1盒被FLP重组酶移去而剩下81bp的残余序列。CosAG14ΔC45.5新霉素和安普霉素本项研究CosAG14ΔB粘粒中氨苄青霉素抗性基因被SBdel-2表达盒替换。CosAG14HE安普霉素46.9氨苄青霉素和安普霉素本项研究CosAG14粘粒中编码新霉素的基因被HEapra表达盒替换。pIJ7734.3氨苄青霉素和安普霉素JohnInnesCentre(JIC),Norwich.重新导向模版(Gust etal.,2003)被用来制备SBdel-1和SBdel-2表达盒。pLITAG016.1氨苄青霉素.本项研究来源于产加尔巴丁游动放线菌(19955-23217位CosAG14rc)长度为3263bp的NcoI酶切片断被克隆到预先用NcoI酶切的pLITMUS28中pLITMUS282.8氨苄青霉素New Engl和Biolabs(NEB).常规克隆。

高效液相色谱

HPLC分析使用的是Hewlett Packard 1050 series HPLC系统,并且按照下列参数运行:

色谱柱:      Zorbax SB-C18,4.6 x 150mm,5μ

流动相A:     30%乙腈溶解于20mM磷酸钾缓冲液中pH7.0

流动相B:     65%乙腈溶解于20mM磷酸钾缓冲液中pH7.0

流速::      1ml/min

梯度:        时间0分钟     100% A    0%   B

              时间10分钟    0%   A    100% B

              时间11分钟    0%   A    100% B

              时间11.2分钟  100% A    0%   B

循环时间15分钟

注射体积:    10μl

检测:        210nm

高效液相色谱—质谱(HPLC-MS)

HPLC-MC分析使用的是一台Hewlett Packard 1050 series HPLC系统连接到一台Micromass Platform LC(使用MassLynx version 3.5软件)上,按照下列参数运行:

色谱柱:Agilent Zorbax SB-C18 150×4.6mm 5μ

流速:1ml/min

流动相:    A 10%乙腈,0.1%甲酸,90%水。

            B 90%乙腈,0.1%甲酸,90%水。

            A到B的线性梯度时间大于10分钟,保持1分钟,B-A

波长:200-400nm

注射体积:10μl

柱后分流:1:10

质谱检测仪:Micromass Platform LC

模式:正离子电喷雾(Electrospray positive)

氮气流速:380l/hr

毛细管电压:40V

分离透镜偏移:5V

菌种保藏

按照布达佩斯条约,菌种NCIMB 41362于2005年12月7日存于NCIMB公司,地址是Aberdeen,AB21 9YA,Scotland,UK由NovacataBiosystems公司代理。

参考资料

Altena,K.,Guder,A.,Cramer,C.and Bierbaum,G.(2000).Biosynthesis of thelantibiotic mersacidin:organization of a type B lantibiotic gene cluster.AppliedEnvironmental Microbiology 66(6):2565-71.’

Ausubel,F.M.,Brent,R.,Kingston,R.E.,Moore,D.D.,Seidman,J.G.,Smith,J.A.and Struhl,K.(2002).Current Protocols in Molecular Biology(5th edition).WileyInterscience Publishers.

Bierman,M.,Logan,R.,O′Brien,K.,Seno,E.T.,Nagaraja Rao,R.and Schoner,B.E.(1992).Plasmid cloning vectors for the conjugal transfer of DNA from Escherichia coli toStreptomyces spp.Gene 116(1):43-49.

Chatterjee,S.,Chatterjee,S.,Ganguli,B.N.,Chatterjee,D.K.,Jani,R.K.H.,Rupp,R.H.,Fehlhaber,H-W.,Kogler,H.,Siebert,G.and Teetz,V.(1992)Antibiotic,mersacidin,a process for the preparation thereof and the use thereof as a pharmaceutical.US Patent 5,112,806.

Dower,W.J.,Miller,J.F.and Ragsdale,C.W.(1988).High effiiciencytransformation of E.coliby high voltage electroporation.Nucleic Acids Research 16(13):6127-6145.

Flett,F.,Mersinias,V.and Smith,C.P.(1997).High effiiciency intergeneric conjugaltransfer of plasmid DNA from Escherichia coli to methyl DNA-restricting Streptomycetes.FEMS Microbiology Letters 155(2):223-229.

Gravesen,A.,Kallipolitis,B.,,K.,,P.E.,Ramnath,M.and,S.(2004)pbp2229-Mediated nisin resistance mechanism in Listeriamonocytogenes confers cross-protection to class IIa bacteriocins and affects virulence geneexpression.Applied and Environmental Microbiology 70(3):1669-1679.

Gust,B.,Challis,G.L.,FoWler,K.,Kieser,T.and Chater,K.F.(2003).PCR-targetedStreptomyces gene replacement identifies a protein domain needed for biosynthesis of thesesquiterpene soil odor geosmin.PNAS 100(4):1541-1546.

Gust,B.,Chandra,G.,Jakimowicz,D.,Yuqing,T.,Bruton,C.J.and Chater,K.F.(2004).λ Red-mediated genetic manipulation of antibiotic-producing Streptomyces.Advances in applied microbiology 54:107-128.

Gust,B.,Chater,K.F.and Kieser,T.E.(2002).Methods and materials for targetedgene disruption in actinomycete bacteria.Patent Application WO 02/103010A1.

Heinzelmann,E.,Berger,S.,Puk,O.,Reichenstein,B.,Wohlleben,W.and Schwartz,D.(2002).A glutamate mutase is involved in the biosynthesis of the lipopeptide antibioticfriulimicin in Actinoplanes friuliensis.Antimicrobial Agents and Chemotherapy 47(2):447-457.

Kieser,T.,Bibb,M.J.,Buttner,M.J.,Chater,K.F.and HopWood,D.A.(2000).

Practical Streptomyces Genetics.Norwich,John Innes Foundation.

Sambrook,J.,Fritsch,E.F.and Maniatis,T.(1989).Molecular Cloning:A laboratory

manual.New York,Cold Spring Harbor Laboratory Press.

Vertesy,L.,Herbert,K.,Schiell,M.and Wink,J.(2000).lantibiotic related toactagardine,and processes for the preparation and use thereof.US Patent 6,022,851.

序列列表:

SEQ ID NO:1阿肽加定B:SSGWVCTLTIECGTLVCAC

SEQ ID NO:2阿肽加定B变体VV:SSGWVCTLTIECGTVVCAC

SEQ ID NO:3阿肽加定B变体LISSGWVCTLTIECGTLICAC

SEQ ID NO:4阿肽加定:SSGWVCTLTIECGTVICAC

SEQ ID NO:5-SEQ ID NO:10(Null)

SEQ ID NO:11 Ala-阿肽加定B:ASSGWVCTLTIECGTLVCAC

SEQ ID NO:12 Ala-阿肽加定B变体VV:ASSGWVCTLTIECGTVVCAC

SEQ ID NO:13 Ala-阿肽加定B变体LIASSGWVCTLTIECGTLICAC

SEQ ID NO:14 Ala-阿肽加定:ASSGWVCTLTIECGTVICAC

SEQ ID NO:15-SEQ ID NO:21(Null)

SEQ ID NO:22 pre-pro-阿肽加定B变体VV:MSAITVETTWKNTDLREDLTAHPAGLGFGELSFEDLREDRTIYAASSGWVCTLTIECGTVVCAC

SEQ ID NO:23 pre-pro-阿肽加定B变体LIMSALAIEKSWKDVDLRDGATSHPAGLGFGELTFEDLREDRTIYAASSGWVCTLTIECGTLICAC

SEQ ID NO:24-SEQ ID NO:99(Null)

SEQ ID NO:100 CosAG14(38168bp)

GATCGGCCGCCGTCAGCTGGAGAAGCGCTGGCTGGCGCGGCTCACCCGCAACGGCCACCCGCATCCGACCCGGGCGCT

GGCGCTGCGGATGGGCGCGGTGGAGTTCGCGGGGCAGCTGGCGCTGCAGCTCGCCGACATGCGCAAGCCCGGCACGCC

GTCAGCGACCTGACCCGCTGCTCGACGCAGCTCGCTCGCCGGTCCCGCGCCGCGCCGATCAACTCCGGCAGCACGGCG

CGAGCTTCAATCAGCCGGCCCGGCGCACCCCCTACGCCGGTGCGACGAGGCATGCCCGAGACCAGCGCGGCCGCAGAG

GGCCGGTCGGCGCCGGACCGGTCAGCGCGCCCGCAATCAGGCCGGCAGGCCCGCCCGGAGCCGGACCGGTCGGCGCGC

CCGCAATCAGGCCGACAGGCCCGCCCGGGGTCAGGCTGGTCGGCTGCGCCGGGCCGGCAGGCCGGCGAGCAGCGCGTC

GAGCGTCTCGGCATCCGCCCAGCCGTTGACTGACACTGCGCCTGCCGCCGTGACCGTGACCTCAAGGCGGTCCGGTGT

CACCGCCACGTCGATCGGCGCGTCCTCGATGCGGTCGCTCAAGCGGATGAACTGCTGGTTCGTCGAGCCGACCCAGGG

CCGCTCGTGGTCCAGCAGGTCCTGCCGGAAGGGGCCGGCCACCAGCAGGTCCGTGGCGTCGAGCAGTGCGGCGACGTC

GGCCCGGCCGTCCGCGGCGAGAGCGCGCAGACGGGCGTACTCGTAGCCGGTGAACGTCATGACCGAGCGACCCGCCTG

CCGCACCCCGGCGGCCACCGCGGCGAGACCGGCCGCCTGCTCGAACGGCTCGCCGCCGAGCAGGGTGACACCCGTGGT

GCCCGTGGCGAGCACTCGGTCCACCAACTCGGCGGGTGCGGCCGGCACCCCACCGCGTACGCCGAACAAATGCGGATT

GAAGCATCCGGCGCACCGGATGGTGCAACCCTGCACCCAGATCGCGGTCCGCTCGCCCGGTCCTTCGGCGGTGGTCCG

GTCGAGGAACCGGGCCACCCGCACGAGCGGCGGCTCAGACATCGACTATCCGACCGAAAGGCGTCTGGTTCGCTTGCG

GCGGCGGCTCGCACGACAGCCGGTCCCGGACCGCGACGAACTCGTGTGGTGCGAGCCCGGCCACGGCCGCGAACTCGC

CGAGACTGGCGAATCCGCCCCGCGCCTGCCGCGCCGCCACGACGTCCGCCACCCGCTGCGGGGTGAGACCGGGCACGG

CGGCCAACTGTTGCGCGTCCGCGGTGTTGACATCGAGCCGCTCGGGCGCCGGCTCCAGCAGCGAGCCCGGCACACCCC

CAGCCGGCGAGCCCAGCGCGGGCTCCAGCGGGCCGGGCGCGGGCCCAGCGGGCCAGGCCGCTGTGGGCTCAGCCTGCC

GGCCGGCTGCGGGCTCAGCCTGCCAGCCCGCTGCCGGCTCAGCCTGCCAGCCCGCTGCCGGCTCAGCCTGCCAGCCCG

CTGCCGGCTCAGCGGGCCGGCCCGCCGCCGGCTCAGCCAGCGGGCCCCTCGCGGGCTCAGGCCCGGGAGTCCCTCCGT

AGAACTCTTGCGGCGAAGGAACGACACCCTGTAGTTGCGGCGGCAGCGGAGTCGCCACGGGAGCGGGCGCGTTCGCCC

ACGGCGCCTGCTGGGGCTGCGCATACCACGGCACGTGAGCGGCACGCCAGCGCAGCCAGGAGGCGTTGATGACGAACG

CGTGCGCGACGCTGATCGGCCACACCATGAACATGATCGAGAACGCGAGGTTCTGCTGGAGCGAGTCCTCGGCGCCCT

CACTGCCGAGAAAGAAGCAGAAGTTGGCCACGACGGTGTAGAGGATCCCGGCGATCCACCACACCGGCCGCCGGGCGC

GGATGCCGACGTAGAGGAACCCGACCGCGGAGAAACAGCTGAAGGGCACCATCGGCGCGATCACCCAGGCGCTGTGCG

CGAGGCGCCACGACAGCCGCGCCGGCCCGGTCCGCTTGCCCGGCTCGTGACCTGGATGCGGCGGATAGGACGGATACG

GCTGCTGGTGAGCAGGCGGGAACGGCGGCAGCGGCTGCTGACCGGAAGCAGGCGGGAACGGCGGCAGCGGCTGCTTGC

CGAACGACGGCGGGTACGCCGGCTGCGAGGCGGGATACGGGTCCTGGCCCGGGTTAGGCGGTGTCCACGTCACGGTTC

ACGATCCGTTCCCGCGCGGTGTGCGCCTGACGCGTGTAATCCGCGGTGTACGCACTGTGCCGCACCTGCCCGCCGACG

AGATCCTCCAGAACGGCCACGTAGTCCAGGCAGCGCTCGCCGAGAATGTCCACGGTCTCGGCACTGACCTGGCCGTCG

GGACCGACCGTGACGACGATCCGAGGATTCTCCGTCATGCCCGCTCCCTCTCCACCTCGAAGACCAGGCGCACACTGG

CGTCCTGGCCGACCGACTCCGACTCCAGCCGCAGCCCGGCCTCGGGCGCCTGCGCGCGCAGCCGCTCCAGGACGGCCT

GCTGGACCCGCCGCCCGTACGCGGTGTCGACGGTCGTCATCAACTCGACAGCCCCTGGCTGATCGACGCCGGTGACGT

GCGCGGCCCAGATGCCGTCCGCGCCGCGGGTGAACGTCGCGGCGCTCTGCGTCCAGGTCGCCGAGATCGTGTCGCCGG

CGGCCGTCACGGTGGCTCCGGTGTCGCGCAGCGCCGCATCGAGCAGGGTGACATCGCGCATGCGGGTCTGCACCTGGC

AGATCAGCCGGCCGTCGTCCATCCGGCCCGCGGCGGCCTGAACCGCGGCCGCGCCGGCCATCGCCAACGGCACCAGCA

GCAGTGAAACGCTCACCATGCCCCCCGTTCTCGCTGTGGCCACACCCTATCGGCAGGGTGCGACAAATCATCGGTTGG

TGAGGTCCCAGTCGTCGGTGCCGGTGGCCGACACGGCGCGATTGCGGGCCCAGCCGCGCAGGGCGTCGACCCGCTCGG

CCTGCGTCACGCTGAGCGGCACGATGCTCATCACCGCGCGTACGAGATCGTCGCGCCGCAGTGGGCGGCGTTCGGAGA

ACGCGTCGAACAGTCCCGCAATGACCGCCTGCTCTATCTCCGCGCCGGAGTAGCCCTCGGTCAGCCCGGCCAGCTCGG

TGAGCAGCTCGGCATCGACCCGCAGCTCGCCGGCGGCACGCCGGTGCCGCAGCGCCCGCCCGAGGTGCACCCGCCACA

CCGCGACCCGCTCGGACCGGCTCGGCAGATCCACGAAGAACGTCTCGTCGAAGCGTCCCTTGCGCAACAGCTCCGGCG

GCAGCCCGTCGAAGTCGTTGGCCGTCGCGATCACGAAGACCGGAGTCCGCTTCTCCTGCATCCAGGTGAGGAAGGTGC

CGAAGACCCGGGCACCGGTGCCGGAATCACCCCCGGTGCCGCCGGCGAAGCCCTTCTCGATCTCGTCGACCCACAGGA

CGCACGGGGCGACCGCCTCCGCCGTACGCAATGCGGTGCGCATGTTGTGCTCGCTGGAACCGACCAGGCCGGAGAAGA

CACGGCCGATGTCGAAGCGCAGCAGAGGCAGGTTCCAGGCGGTCGCGACCGCCTTGGCGGTCAGCGACTTGCCGCAGC

CCGGCACGCCGGTGATCAGTACGCCGCGCGGCGCGGGCAGGCCGTACCCGGCCGCCTCGTCCAGCCAGGATCCGTTGC

GTTTGACCAGCCAGGCCTTGAGGTTCTCCAGGCCGCCGACGTCGTCGAGCACGGTTCCGGCGGCCATGAACTCCAGCA

CGCCCGATTTGCGTACGGTCTGGCGCTTCTCCTCGTGCACGATCTCCAGGTCGGCCAGATCGAGCACGGCGTCGTTCA

CCATGGCCCGGGCGTACGCGTTCTCCGCCTCCTGCATGGTCAGGCCGGCCGCGGCCGTGACGAACCGCTCCCGGCTCT

GCTCGTCGAGCTCCACCCGCAGCCGCCCGGACGCGGTGTTCCCGCGCACCATGGCGTCGAGCAGAGCGCGCAACTCCA

GCTGGCCGGGCAGCGGGAAGTCGACGATCGTGACGTCCTTGCTCAGCTCGACCGGCAGGTCCAGTACCGGCGAGAGCA

GCACGAGTGTCCGCGGGCTGCGGCCGGCCCGGAACGCCTGGGCGATGTCGCGCACCAGCCGGACGACCTCCGGGCTCT

GCGCGAACAGCGGGTGCAGGTCGCGGAAGACGAAGACAGCCGGTTCGTCGATGCGCTGCACCGCCCTGAGCGCGTCGG

TGGCCCGCTGCGCGCCCGAGCGGGCCTCGCCGTTCGGCTGGACCAGACCGGCGGTCAGCGACCAGGTCCAGACGGCAC

GTGGCACGCGGACGAGGTCGGCGTCGCCGGCGATGCCGGCGAGGTGGTGCAGCGCCCGCTGCTCCTCGTACGTCTCGA

GGTGGAGCACCGGGAACCGGGCCTTCAACAGCTGCGCGAACGTCTCCGCGAACGACCTCTCCACCGGCGCATCCTACG

GCCGCGCCGGCCGGCGTGTCAGAGCCCGGACGGGGTGCCGGTGGCGTCGCGTGCCGTCCGGTCCTTCCCGCGCTCGAC

GGGTTCGTTGGGTTGATCGGTCATGGCATCCTCCTGCTCAGTCCGGGCGGTAGACGGCGGTGTCCCCGGACACGGCGC

CGGGGTCGTACCCCGAGCGGCCGGTTTCCTCCGTGGTGTCCTGCTCGTCAGCGCCGGCGCCTGTCGACTCGCCGGGTT

TGCGCAGTGACGCCGCGTATGCCGGGGTTCCGTCCGGCTCGTCCGTGGGATGCCGCTGGAGTTGTTCTCGGTCATCGG

TCATGAACGGCGGACTTCCCTGCAAGAGCGCGGACAAACGTGGTCGTTTATCCCGCAGCCGGGCGGGCAGTCGTCCAC

CATGGAACCCATCGGTGACCCTGACGAGCAGACCGGCGACTTCGCCGAAGAGCACGAACTGACCGAGGTGACAGCCGA

GGAGGACGACGACGGCGAGCCGGAGAGCCCGGATCGCTGGACCGGCGGCATGGACTCCGACGGTCCCCCGTGACCTGC

GGCTACGATCCCTCACAGGTGCCCGCCCCGCCGACGACCCGAGGTTCGTAGCCGTTGTCCTCCATCACCGAGCTGACC

GAGTCCGTGCGTGCCTTCGCGCGCGAGCGCAACTGGGAGCAGTTCCACACGCCGAAGAACCTCGCGATGGCCCTGGCC

GGCGAGGTCGGTGAGCTTCTGGCCGAGTTCCAGTGGCTGACGCCGGAACAATCAGCCGCGGTCATGCGCGATCCCGAT

CTCGGCCCGCGGGTCCGGGCCGAGATCGGAGACGTCACGATCTATCTCGTACGCCTGGCGGACGTGCTCGGCATCGAC

CTGGTCGAGGCGGCCACCGACAAGTTGGCGGAAGCCGGCCGCCGCTACACCGTCGAAGCCGCCCGCGACTCGGCCGCC

AAGATCGATCAGCTGTAGTTCAGCGAGAAGTTGTTGACCGTGAAGTTGGACTGACCGGCGGTGCCGCTGATCTCGAAG

CCGAACTGCGCCTCGCCGACCGTCACGTCACCCCACCAGCCGTTGGTGCGCAGCCAGTTCAGGATCGCCAGGATGTCG

ACGGTGCCGGAGTTCGTGTTGGTACGGATGAACGAGAAGACCGCGTTGGCGCCGTTCGACCCGCGGTAGACGTTCCAG

GTGTGCCCGCCGACGGACAGGTTGCGGACGTTCGGCACCGCGCCGTTGGCGTCGTACTGTTCGGCGATCGGCCCGACC

GCGCCCTGCTGGTTGGTCCAGATCATGACCTCGTAGGCGTGGTTGTTCGCCCAGATGTCGTAGGTCGTCGAGTAGTCG

CCGCTGGACGGCACCGACACGTTGAAGGAGCTCGTCAGAGAATTGAGCGAGCTCAGCGTACGGTTGAGGGTCTTTCCG

GTGTTGGGGTAGGACTTGACCCCGCTGGTGCGCGGGTGATTCGCGACGACGCCCCAGTTGGTGCCGCTGCGCGCCCAG

ATGGTCTGGGTGCCGGCGCCCGAGCCCCAGATGTTGTTGTGAGGATGTATCCGTTGTTGGTCCAGTTCGCCCACTGTC

CCGAGTCGACCCAGACGGCGTCGCTCGGTACGCCGTTGGTGGGCGGCTGCGAGCTCGGGCTGGTGGGGCCAGCCGATC

CGGTGCAGGCGGTCCCGTTGAGCGTGAACGTGCCCGGTGCCGGGGTGGCGGCGCCGGAGCCGTTGAATCCGAACGACA

CGGTCGCGTTGGTGCCGACGGATCCGTTGTAGCCGGCGTTGCGGGCGGTGACCTGCGATCCGCTCTGGGTCAGGCTGG

TGTTCCAGGCCTGGGTGACGGTCTGCCCGCCGGAGTAGGACCAGACCAACGTCCAGTTCGTGAGCGGATCACCCAGGT

TGGTGATGGTGACGTTGGCGCCGAAGCCGCCGGGCCACTGGCTGCTCACGGTGTAGGCGACGCGGCAGCCGGCCGCGG

CGGACGCCGGGAGCGCGGTGACGACGCCGGCACCGGCGATGAGGGCCGCCGAGGCGGCCAGGGAGAGCGCGAGAGTAC

GTCTGCGCATGCCGTTCCAATCTCGGAGGGGGAACACACGACGCTCGTCGAAGCGCTTCGATAATGAAGGCTGGGGAT

CTACGAGTGTCGATGCGGGATGAGGCCGATGTTACGACCCGCCGCCGCGGCGAGGCAACCGCTACCTTGGGCGCATGA

CGATCACCGAGACCGATCTCGCCCACCTGCGCCGATGCGTCGACCTGGCCCGCGAGGCCCTCGACGACGGCGACGAGC

CGTTCGGTTCCGTCCTGGTCTCCGCCGACGGCAAGGTGCTGTTCGAGGACCGCAACCGGGTGAGGCACGGCGACGCCA

CCCAGCACCCGGAGTTCGCGATCTCCCGCTGGGCGGCCGAGCACCTGACCCCGCGGGAGCGCGCCAGCGCGACGGTCT

ACACCTCGGGCGAGCACTGCCCGATGTGCTCAGCGAGCCACGGCTGGGTCCGCCTGGGCCGCATCGTGTACGCGGCGT

CGAGCGCCCAGCTGACCGCCTGGTACAAGGAGTGGGGAATCCCGGCGGGCCCGGTCGCCCCGCTACCGATCACCACAG

TGGTCCCCGGCGCCGTCGTGGAGGGCCCGGTCCCAGCCTTCGAGGCCGAGCTGCGGGAGCTACATCGCGCCCGCTTCA

CCCCAGCGCAGTAGCCGCCGGACGAAACCCGACCCTTCTCGCCAATGAACCGGACCTGCGAGCGTGTCTGGATTGACC

GCGGAGGCCCGCAACGCCACAGGCTCGATCTCCGTCACCGTCGGACCTCAGGGGCAGGTCGAGGATCTGCGCCTTGAC

GACCGAGTGCATGACCTCCCATCCCAGGAACTGAGCCAGCAGATCCTGACAGTGATGCGAAAGGCTCAGTACCAGCTC

ACCGAGTACGTCTCGGCGCACATCCGTGACACCGTGGGCATGGATTCGGAGACCGGTCGCAATGTGCTCGACGCGTTC

GCACAGCGCTTCCCGCTGCCGGAGATGACCGATGAGCGTTGAGCAGGTACAGCTGCCGATCGACGTAATCAACCGGCA

CACCACTACCATCGCCGCAACCGCCGATGCCGTACGGCAGGCCCGCGCCGCGGCAGGTCAGGCAGCCATGGACTCGCA

AGCGTACGGCCAGTTGTGTCAGTTCCTGCCGACCGCGTTCAGCGTCGTGTTCGAGAGTGCGATCGTCGCCATGACCGG

CAGCGCCGAAGCGTTGCAGGAAACCACCTTCAACCTGCAGGATGCCGTCACGACGTTCAGATACACCGACGAGTCGGC

CGCTCGCACCATCGCCTCCGCAGGTTCGCCGCCGTGACCACACCACTTGTCGCCCAAGCCGGGGACTCCACCACGGGA

TTGACCGGTCTGGGGCTCGTGGAGGACGCCCACCAGATCGCAGAAGCCATCCGCGGGAACAGTTGGGTCGACGGCGTC

CTCGGCGGAGTCGGGGCCAGCCTCGACGGTCTGGCGCTGGCGATCGACCCGCTCGGCACCCTTGCCGCCTGGGGCGTC

GCCTGGCTCATCGAGCACGTCCAACCGCTACAAGACGCCCTGGACTGGCTGGCCGGCGACGTCGACGAGATAGCCGCC

CAAGCCGCCACCTGGCGCAACGTCGCCGCCTTCACCGACAGCGCCCAGCAGGATTACGCCGATCGGCTCCGCACCGAG

GTCGCCGGCTGGTTCGGCGCCTCCGGCGACGCATACCGGGCCCATGCCAGCGAACACTTGGCCGCACTGAAAGGCATC

AGCACCGCAGCCGGCGGCATTTCGTCCGCCGTCGAAGGCGCCGGCCTGCTCGTCAGCCTGGTGCGCGGAATTGTCCGC

GACCTGATCGCCCAGTTCGTCGCCACTCTGGCCGTTCGGCTGCCACAATGGCTCGCCGCCGAAGGACTCACTCTGGGC

CTCGCCACCCCCGTTGTCGCGAGCCAAGTTGCCGCCCTCGTCGCCCGCGGGGTCAACAAGATCCAGCACTTCATACGG

GCGCTGCTCAACAGCCTTCGACGGCTGATGCCCATGATCGACCGGCTGGGTGAAGTCCTGGAGCGGCTCCGCATGCTC

ACCGACCGGCTCGCAAGGTCCAGCCCCTCCACCCGCCCGGAGCCGACACCCGGCCCCGCTACTCACGCCGGAACCGAG

AACGCATCGGGAAACAAGCCCGAGGGCGACCTCGAACCGAACGAACCGCGCCCGGCCGAGGCTGACGCCAGAGACAGT

ACGCCTCAGGCGTTCGTGGACGAGGTCGTCAGCAACCCCCGGTCAGTCGCGGGACACTCCGCGCAGTCCATCGCGGAC

CAGTTCAACGCCGCCGGATACTCTGCGGTCGTCGAGCAGAGCACCAGGAGCGGCACCTCGGGGAACGCCATCCAGGTA

CGCATTCACGGCCACCCGGATATCACCAACATCCAGGTGCATCCGGGAGGAGGACGGCACACGCCGGAGGGGTCCCCG

TATTGGAAAATTTCGACGAATACGGTCGGGAAGATCTGGATCATCCCCGAAAATTTCCGGGGCGCCGATGAACTGCGT

GGGAATGTGGTGCGCTATGACAAATAAGATCATCAAAGTGGATCGGGTGGGATCCGCGGGGGAAGCTGCCACGCTCGT

CGCCCTGGGCGTCGACATCGTCGGGGTCGATCTTCGTCCTGATCCGCGATTCGTTGATGATCGCACGCTGGACGCCGA

ACAGGTTCGCCACATCCGCGAAGCGCTGCCGCACACGACGCTGGCCGTCACCATGGACACCGGCACCGAGCCGGACCA

TGTCGTCGAACTCGCAAGGCGAATCGGCGCGGATCTGGTCCAGTCGATCAACGGTGTCATCCCGCCGCTCCCAGTACG

CGTCGCCCTGCGCAAGGCCGACATCGCGATTGTCTATGCGGGCACAGAGATCTCCCACGACGACGATCCCGGCTGGGT

CTTCAGCGCGTACGACGACACTCCGGACCTGAACGCCGCCCTGTTTCAAGTGGAGGTGCTTCCGGAGTACCTCGATTC

CTGGGAGTTTCTGCGTGACCGCTCCCCGGAATATGCCGACGAGTTCCAGATCGAAGATCTCGACGACCTCGGACGCGC

TCGCCCCTTGGTTGCCGGCCTGAATCTCACGGCTCAGAACCTCGACGAGATCAGGGCACGGCTTCCCCACGTCCGCGG

TCTGGCGCTCACCCTCGCGCACGAGGCCGCGAGGAGCGACGCGCGGTTCTTCATGTTTCCCCACGTAGTGGACATCCT

TTCGGGAGACTCGTCCGGGTGACCGGCATCGCGCGGGAGGGGGCTGGTGTCGCAGAGTCAGGCTGACGGCATTCCGGC

GGGCCTGACGGGAGGAACCTCATGACCGGGCTGTTCACCATGCGCAAGCACGAGGAGGGCGCCGGGGAGGTTCGGATC

GTCGTGAGCGGCGAGATCGACGGCGATGTCAGCGCGGCGCTCACCCTGTTCATCGCCAACGCCGCCGAGCAGGACGGT

GTCCGATCGGTGCTGGTGGATCTGGAGCCGGTGCTGCTGCTGGCCGCAGCCGGGATCCGGTGCCTGCTGAGCGGCCGT

GAGGCGGCTCTGCTGCAGGGCTGCTCCTACGAGCTGGTCAACGTCCGGCACGAGGTCGCGGATTCACTGCACGCCGCC

GGCGTGGCAGATCTGCTGCTCACCCTGCCGGTCCGCTGAGCCGGCTCAGCTCGGGTCGTCGAAGCCCTCGTCGGCGCG

TTCGCGGCGCAGGTGTGCCTCGGCCCGGCGCGCCTGGTCACCCTTCTCCGCTGCCAGCCCGGCGTACATGGCCTGCAC

CTTCTCGTACGGCTGGCCGGGCGGCAGCAGCGGGATCGCCGGATCGACCACGGCCTCGATCAGCGTCGGGCGGTCCGC

GGACAGCGCCGCCTCCCACGCGCCGGTCAGGTCGGACGGGTCGGTGATCCGCACTCCGCGCAGGCCGAGCAGCTCGGC

GTAGCGCGCGTACGGGACGTCGGGCAGTTCCTGCGACGTGACGAAGCGCGGCTCGCCCTCGGTCTCGCGCTGCTCCCA

GCTGACCTCGGCCAGGTCCCGGTTGTTCAGCACGCACACCACGAAGCGCGGGTCCGCCCAGTCGCGCCAGCGGGCGGC

CACCGTGATCAGTTCCGCCATGCCCGCCATCTGCATCGCGCCGTCGCCGGCCAGCACCACGACCGGGCGTTGCGGCGC

CGCCAGCTTGGCGGCGAGACCGTACGGCAACCCGCACCCCATCGACGCCAGCGTGCTGGACAGATGCGCCGGGACACC

GCGGGGCAGCCGCAGGTGCCGGGCGTACCAGTAGACGACCGAGCCGACGTCGACCGCGACCTGCGCGTCCGCGGGCAG

GTGGTCGGAGAGGGAGCGAATCACGTGCTGCGGGTTGACCGGTTCGGCGGGCGCCGCGGCCCGGGCCGCGCTGATCAG

GCGCCAGCGCTGCACCCATTCCTCCACGCGGGCGCCCCAGGCGCCGCTTGCCCGGCTGGGCAGCAGTCCGAGCAGCTC

ACGCAAGGTTTCCACGGCGTCGCCCAGGAGCGGGACCTCAACCGGATACCGTACGCCCAGACGGCGCCCGTCCACGTC

GATCTGTACGGCCCGCGCCTGCCCCGGCCGGGGATAGAACTCGGTCCACGGGTCGTTCGTGCCGATCAGCAGCAGCGT

GTCGCAGTGCCGCATCAGCTCGGCGCTGGCCGTGGTGCCCAGGTGCCCCATGACGCCGGTGTGGAACGGCAGGTTCTC

GTCGAGGACCGGCTTGCCGAGCAGCGAGGTGGTCACGCCGGCACCGAGCCGCTGCGCCAGCTCGACGATCTCGCGCTC

CGCGCCGTACGCTCCCTGCCCCACCATGATCGCCACCCGCTCGCCGGAGCGGAGCACCTCGGCCGCCTCGCGCAGGTC

TTCCGGGCGGGGCACCACCCGGGCGGGGCGCAGCCCCGCGCTCGTCGCCAGCACACCGTGCTCATGCGCCTGCGGGTC

GGGCGCCGGGGCCGTCTGTACGTCGTGCGGCAGGACCACGCAGGTCGGGCTGCGGGTCGCGAGCGCGGTGCGGAACGC

GCGGTCGAGGAGCATCGGCACCTGCTCGCTCGTGTGCGCGGCCTGCACGAACTGGGCGCACACGTCGCCGAAGAGCCG

CACCAGGTCGATCTCCTGCTGGTACGCGCTGCCGAGCACCGTCGAGACCTGCTGGCCGACGATCGCGACGACCGGTTT

GGAGTCGAGTTTCGCGTCGTAGAGGCCGTTGAGCAGGTGCACCGCGCCGGGACCCTGGGTGGCGAGGCAGACTCCGGC

ACCACCGGTGTACTTGGCGTGGCCGACGGCCATGAACGCCGCGCCCTCCTCGTGCCGGGCCTGCACGAAGGTGGGCCG

GCCGGCCCGGCGCAGCGCTCCGATCACGCCGTCGATGCCGTCCCCGGAGTACCCGAAGACCCGTTCCACGTCCCACGC

GGTCAGACGCTCCACGACCACGTCCGACACGGTCCGCTCCGTCACCGCTGCCTCCTCACGTCACACCGGGGGCTACCC

GCTCAGCCGCGCGGTACTCGCCTTGCGCGAAATGCGACTCGCGTGCACCTCACGGGCCGGGCGGACGCGGCACGGATC

TGAGCTGGTTCCCGCCCGGTTCTGATCCCCTGTGATCGGGGTACACACGTGCGGTGAGCAGGGACAAGACGTACCGGC

CGGTCCGTCCCGACGGGATCCGGACCACCTTCCACGACGGTGTACTCGGGCGCATGCGGATCCGGTGCCTGGGCGAGC

CGCGTCCGGGCGTACCGGAGATCGTGATGATCCAGGGTATGACCGTGAGTGACTATCTGCTGCCGGGTCTGGGCGCGC

TCAGCGCCTGGACCCGGGTGCACCTGGTGGAGCTGCCGGGAGGCAGCGGCAGCGGCCGGCCGCCGCACGATCTCACGG

TCGAGGAGTACGCGCGGGCCGCGGCCGACTGGCTGTGCGCCCAGCGCCTGGGCCGGATCGTGCTGGCCGGCCATTCGA

GCGGCACGCAGGTGGCGGCGGAGACCGCGCTGTTGTGCCCGGACGAGGTGGCCGGAGTGGTGCTGGCCGGCCCGGCGA

TCGACCCGGTGGCCCGCGGCGGCCTGCGGGTCTTCGCGCGCTGGTGGATCGACCGGCGCGGCGACCCGAAGAGCCTGG

ACGAGGTGCACAAACCCGAACGCGAGCAGGTCGGGTTCCGGCGGCTGTTCCAGGTGCTGCGCGCCCACCTGCGTCACG

ACCTGGAGAAGCCGGTGGTCGGGCTCTGCGTGCCGGTGCTGGTCATCCGCGGCAGCGAGGACCGGCTCGGCACCGCGC

GGTGGGCCCGGCGGCTCGCCGATCTGGCTGCCGTGGGCGGCCGGTACGTCGAGGTGCCGGGCACCCACTCGTTCTGCT

GGCGTTACCCGCAGGCCTGGTCCGCGCCGATCCGTGAATTCGCCGGATGGTCGGTATCGGTCTCCGGCACCTGAACGG

ACGTTTCGGTGGCATCGCCGCCACCGCGGGCCGGCGCATCCGCATCCACAGTCCGGGGTGAGGGTCAGCGCCGTTCGG

AGGCGGAGTGTCGATGATCGGTCAATTGACGTGCTTCCATGAGCCGCCCTACGGTCCGACAGAGAAATCGTTATCCGG

ACCACCATCGACATCCGAATCGGTGGCCCCGGAGCCGATCATCGACCGACCCCGGGCCACCCCCGCTCTTGCCAGAGG

GGGCGAGGCACATGACGGAAGCTGATCATCGTCCGACCGTTCTCAGGAGAATCCTACGGCTGTGCGCCGTGCTTCTCA

TGGTGCTCGGAGTGGGCCTGGTCGGCGCCCCGACGTCGCACGCCGGCGGCAAGCCGACCATCTCCAAGGAGGCGTTCG

GCAGCGTCGGCGGCAAGGCCGTCGACCGGTACACCCTCACCAACGGGCGCCTGCAGGTGCGGATCCTCACCTACGGAG

GCATCCTGCAGACCATCACGTTCCCCGACCACCGCGGCCGCAGGGCCAACGTGACGCTCGGATTCAGGACCCTCGACG

AGTACGTGACGACGAAGAACCCGGCGTACTTCGGCGCCATCATCGGCCGCTACGGCAACCGGATTGCCGACGGCCGGT

TCACCCTGGACGGCACGACCTACCAGCTGGCGACCAACAACGACCCGAACCACCTGCACGGCGGGGTCGTCGGCTTCG

ACAAGCGGGTGTGGGACGCCACGCCGATCCGCGACGGCGACAGCGTCGGGCTGCGCCTGACCTACACCAGCCCGCACG

GCGAGGAGAACTACCCCGGAACCCTGCGCGTGACGATGACCTACACCGTCACCCGGCAGATGGGTATCCGGATGGACT

ACCGGGCGACGACCGACAGACCGACGATCGTCAACCTGACCAACCACGCGTACTGGAACCTCGGCGGCGAGGGCACCG

GGACCATCGACGACCACCTGCTGAAGCTCAACGCCAACCGCTACACGCCGGTCGACGCCACGCTGATCCCGACGGGGG

CGATCGACGCGGTCGCCGGCACACCGATGGACTTCCGCCGGCCCACGCCGATCGGCGCGCGCAACCGCGACCCGTTCC

AGCAACTGGTGTACGGGCGCGGCTACGACCACAACTGGGTGCTGAACCGCGAGGACGGCCAGTTCCGGCGTCTCGAGT

TCGCGGCCCGGGCGGTCGACCCGGACAGCGGGCGGCAGCTCACCATCTACACCACCGAGCCGGGCATCCAGTTCTACG

GCGGCAACTTCCTCGACGGCACCCTGTACGGCACCAGCGGCCGGGCCTACCGTCAGGGAGACGGTTTCGCCCTGGAGA

CACAGCACTTCCCGGATTCTCCGAACCACGCGAACTTCCCGTCGACCGTCCTTCGACCGGGACAGACCTACAACTCGA

CGACCATCTACCAGTTCGGTACCGCCGACTGATCGCCTCAGGCCGGCCGCCGCGGGACGGCGCGCCGCGGCCGGCCGC

ACGGCAGTCAGCGGCGGCGACTGGAGGCACACATGCCACGCATCCATCCGAAAGTCGAGGAGGCCGTCTCTACGCTCG

ACCTGAACCGGACGACACGACGCCGGCTGTTGTCCGGAACCGGGTTGTTCAGCGCCTCGCTCGCCGCGGGCGCGCTGC

TGAGCGCATGCAGCGACCAGAACGACGGCCAGAACCAGACCGAGGGCGCCGGTAACTTCCCGGACACCCCCGAGTGGC

GGTTCACATTCGTCAACCACGTGACCACCAACCCGTTCTTCACCCCGACGCAGTACGGGATGGAGGACGCCGCGACGC

TGCTCGGCATCGCCAAGCCGCAGTGGACCGGCTCGCAGAACTCGATCGTGGCCGAAATGGTGAACGCGACGAACACCG

CGGTCAGCGCAAAGGTGGACGGAATCGCCATCGCCGTGGTCGACAAGGACGCGTTCCGGGGGCCGGTCGACCAGGCTC

TCAACGCGGGGATACCGGTGGTGTCGTACAACGCCGACGGAGCCCGGGGCGCGCCGGGCACGAACCGGCTGGCCTATA

TCGGACAGGGCCTGTACGAGTCCGGGTACGCGCTGGGCCAGCGGGCGTTGCAGGTGCTGGACTCCGGCGAGGTGGCCG

CCTTCATCGCCACCCCGGGCGCGCTGAACATCCAGCCGCGCATCGACGGCGCGCAACAGGCGTTCAAGGACTCCGGCA

AGCCGATCACGTTCACCGCGGTCGCCACGAACGCCGACGTGACACGCGGTCTGTCCATCATCGACGCGTACGCCCAGG

GGCACGCCAACCTGGCCGGCATGCTGGCGGTGGACGCCGGATCGACGTCGTCGGTGGGTCAGACCGTCAAGAAGTACA

ACATGCGCGGCAAGGGGCTCAAGGTGGCCGGCGGGTTCGACCTGATCCCGGAGACGCTGACCGGGATCCAGGAGGGCA

GCCTCGACTACACCATCGACCAGCAGCCTTATCTGCAGGGATTCCTGCCCGTGCTGGCGCTGTACTTCTACAAGGTGT

CCGGCGGGCTGATCGCGCCGAGTGAGACGAACACCGGGCTGTTGTTCGTCACCAAGGACAACGTCGCCCCGTACCAGA

GCACGAAGAGCCGGTACGAGGGCTCCACGACCGACAAGGTTCTCGTACCTCGCAGCGGGCCGATCGCCCATGGATGAC

CGGATCTCGCCTGCGCCCGCGCAGGCGCCTTCCCTCGAGGTCGAGCAACGCCGTGGCCGGTGGCAGCCGGTCACGGCG

GCCGGCCGGAAGGTCCTCGACGCCTTCCTGCGGCGGCGTGAGGCCAGCGTGCTGCTCGTCGCGATCGGCCTGATGATC

TACTTTCGGGCGTCCAGCCCGGTCTTCCTGAGCCGCGACAACCTGGTCAACATCGCCCAGGCGACCGCGCCCGTCGCG

ATCATCGCGGTCGGCATCGTGCTGCTGCTGGTCAGCGGCGAGATCGACCTGTCCGTCGGTATCGTGGCCGCGCTGGCG

CCGTTCCTGTTCCACTTCGGGATCAACTTCTACTCGCTGCCGGTGGTGCCCGCCTTCGTGGTGGCGCTGGCGATCGCG

GCCGGAATCGGCCTGGTGAACGGGCTGATCGTCACGCAGCTGCACGTGCCCTCGTTCGTGACGACGCTGGGCACGTTC

TTCGCCGTGCAGGGCATCCTGCTGATCACGTCGCACGCCTATCCGGTGCCGATCCCCGACGCGGCCAAGGGCACGTTC

CAAACCTGGCTCGGCGCCGGGCCGTGGGCCAGCATCACCTGGGCGCTGATCATCGTCGCGATCTTCCACACGGTGCTG

ACCCTGACCCGGTGGGGCCTGCACACCATCTCGGTCGGCGGCAACCCGGTCGGCGCCACCGAGGCCGGCATCCGCGCC

TCCCGCATCAAGATCGGCAACTTCGTGATCACCAGCACGCTGGGTGGGCTGGTCGGCATCATGGAGGCGTTCCGGATC

AACACCATCGACCCGAACATCGGCGGCGGCACGACGCTGACCTTCTACGCCATCTCGGCGGCGGTCATCGGCGGCACC

GCGCTCGCCGGCGGCTCCGGCACCATCGTCGGCGCCTTCCTGGGCGCCCTCGTGCTGGCCGAGCTGCAGAACGGGTTC

AACCTCATCGGCTACAGCGCCAACACCATCTTCCTCATCCTGGGCCTGGCCATCCTCGTCTCGATGATCGCCAACCAG

TACCTCTCCCGACTGCGCCGGGCAGGCCGATCATGACCGCGGAAACCGTGTCCGACGCGCTGCGCGTACAGAACATCG

CCAAGAGATTCGGCGCTCTCACCGCGCTGCAGGACGTGACCCTGCGCGTCGCCGAAGGCGAGGTGCTGGGCCTGATCG

GCGACAACGGCGCCGGCAAGTCGACCCTCATCAAAATCATCTGCGGGTACCACCGGCCGGACGCCGGGCGCATCTTCG

TCGGCGGCGAGGAGGTCACGCTGCGCAGCGTCGACCACGCCCGCTCGGTCGGCATCGACGCCGTCTATCAGGACCTGG

CCCTGGTCAACGAGCTGTCCGTCTACCACAACATGTTCCTCAACCGGGAGCTCGTACGGTGGCCGCTGCTGAACAACC

GGGCGATGCGCCGCCGTGCCGAGGAGCACCTGCGCGACATGGGAGTGAACCTGCCGGACGTCGGCGTCGAGGTGGCCA

AGCTCTCCGGCGGCCAGCGCCAGGCGATCGCGGTGGCCCGCTGCGTCTACTCCGACGCCCGCATCCTGCTGCTGGACG

AGCCGCTAGCCGCGATGGGCGCGAAGGAGGGCACGATGATCCTCGACCTGATCCGCGACCTGAAGGCGCGCGGCAACG

TGTCGATCATCATCATCGCGCACAACTACGCGCAGGTGCTCGACGTGTGCGACCGGGTGAACCTGCTGCAGCACGGCC

GGATCACCTTCGACAAGAGGTCGGCGGACACGTCGCTGGCCGAACTGACCGAGCTGGTGGTCGCCGAGTACCGCACCG

GCCGCGGGCGGTGACGCCTCAGCGCTTGCGGCCGACTCCGCTGTACTGGCTCGCGCCGGTCGTCTCGTCGCCGGGGTC

GGGATGCCACTGCGGGCTCGGCACGACGCCCGGCGGGACCAGGTCCAGTCCCTCGAAGAAGCCGGCGATCTCGTCGGG

CGTATGCATCAGGTAGGGCACCGCACCGGAGGAGTTGTAGGCGTCCTGGGCCTGGTTGAGCGCCTCCTCCCCGGCGAC

GCGCACACCGTCGTTGATCGACAGGTAGCTGCCGGGCGGCAGCCCGGCCATCAGCTGCCGGACGATGTCGCGGACCTC

CGCGGTGCTGGGGATGTGGCCGAGCACGCCGTTGAGGATCAGCGCCACCGGCCGGCCCATGTCGAGCTCGCGGGCGGC

GACCGCCAGGATGTCCGCCGGTTTCTGCAGGTCACCCTCGAGGTAGACGTCGGACGACCCGGCCAGCAGCTCACGGCC

GTGCTCCACCGCGTACGGGTCCTTGTCGACGTAGAGGACCCGGGCGTCAGGGGCGACCCGCTGCGCGATCTGGTGGGT

GTTGTCGACGGTGGGCAGGCCCGCGCCGACGTCGAGGAACTGGCGCACGCCGGCCTCGCCGGCGAGGTAGCGCACGGC

ACGCGACAGGTACCGCCGGGACTCGCGGGCGATCTCGTCGATGCCGGGGAACACGGCACGGTACTCGTCGCCGGCAGC

GCGGTCGACCGGGAGGTTGTCGGTGCCGCCGAGCCAGTAGTTCCAGATGCGGGCCGACTGGGGCACCGAGGCGCCGGA

CTCCATAGTCACGGATCGATAGCCTAGCCCTTGCGCGCCTGGGTGGCGACGCCCTCGACGAAGTAGCGCTGGCACAGG

AAGAACGCGATGATCATCGGCACCGTGGTGATCACCGCGCCGGCCAGGACGATCTCCCAGCGGGCCTCGCCCGCCTGG

CCGAACTGGTCGAGGATCGCCTTCATGCCGCGCGGCATGGTGAACAGCGCCGGATCCCGCAGATAGATCAGCGGCTTG

AGCAGGTCGGACCAGCTGGCCCGCAGCTCGAACACGAACGCCACGATCAGCGCCGGCCGGCACAGCGGCACCGCGATG

CGCCAGAACAGCCGCCAGTACCCGGCGCCGTCGACGCGGGCCGCCTCGAACAGCTCACGGGGCACGCCGAGGAAGAAC

TGCCGGATCAGGAAGATGTAGAAGGCGCTGCCGAACAGGTTGCCGGCCCAGAGCGGCACCTGCGTGGCGGCCAGGCCG

AGCTCGTTCCAGATCAGGTACGTGGGGATCATGGTGACCGCGCCGGGCAGCATCATCGTGCCGACGACCAGGGCGAAC

AACACGTTGCGCCCGGGGAAGCGGAAGTAGGCGAAGCCGAACGCCACGACCGCGCTGGAGATCGTGACCGCGGCCGCG

GCGGCGAGTGCCACCACGACGCTGTTGAACATCCAGGTCAGCACGGGCGCGGCGTCCCAGATGGCGGTGTAGTTCCCC

GGCGCCCACTCGGCGGGGAGCAGCCGGTTGTCGAAGACGTCGGGGCGGGGCTTGAGGGAGGCGCTGACCAGCCAGACG

AACGGGTACACGAAGATCACCGCGGCGGCGGCCAGGGCGGTCCAGAGCACCCAGGGATGCGGGCCGCGCGAGGTGCGC

GGTGGCATGGTCCTGTCCTCAGCCACAGCCACGGCCTCACTCGCTCTCGTAGTAGACGAATCGCCGGCTGAGCCGGAC

CTGCACGACCGTGATGATCACGATGATCAGGAACAGCAGCCAGGCCAGCGCCGAGGCGTACCCCATGTGCAGGAACTG

GAAGGCCTGCTGGAACAGGTAGACCACATAGAACAGGGCGGCGTCGTTGCCGTACGTCTGCTGGTTGGCACTGCCGTA

GAAGGCGGTGTAGACCTCGTCGAAGGTCTGCAGCGAGGCGATCGTGTTGATGATCAGCGTGAAGAAGAGCGCGCCGCT

GATCATCGGCACGGTGACCGCGCGGAACCGCGCCCACGCCGACGCGCCGTCCATCTCGGCGGCCTCGTAGAGGTCGCG

GGGCACGTTCTGCAGCGCCGCCAGGTAGATGATGACCGTGCTGCCGAGGCTCCAGGCGCCGATCAGCACCAGGCCGGG

CTTGATCCACGGGCCGTCGACGGTCCAGTTCGGCCCGTCGATGCCGACCGTGCCCAGCGCCTCGTTCACGATGCCGAC

CTGGCCGTTGAACAGCAGCAGGAACAGCACGCCCACGGCCACCTTGGGGGTGATCGTCGGCAGGTAGAAGATCGTGCG

GAAGAACCCGGCGGAGCGGCGCCCGACCCGGGCCAGCAGCATCGCCAGGGCCAGGGACACGATCATGGTGACCGGCAC

GTGCAGCGCCGTGTAGATCAGCGTGTTGGCGATGCTCGTACGCACCCGCGGGTCGGCGAGCATCTGCCGGTAGTTCTC

GCCGCCGACGAAGTCGGTGCTGGTGAGCACGTCGTAGTCGGTGAACGACAGGACGAGGCTGGCCACCATCGGCCCCGC

CATGAAGACCGTGAAGCCGATGAGCCACGGCGACAGGAAACCGAAGGCGGCCAGGGTCTCCCGCCGCCGCACGGCGGC

ACTCATCGTCAGCGTCCGCTGTTGGCCTTGTCCAGCGCGGCCTGAGCCTGCTGCTGGGCCTCGGCCATGGCCTGGGCG

GGTTTCTGCTTGCCTTCCAGGACCCGGTTGACCGCGTTCTGCCAGGCGGCCTTGAATTCCTCACCGGCGGCGAGCGCC

GGCTCCGAGAAGCCGGACTCCTGGGTCTGCAGGACGATCTGCACGTTGGCGTCGGGTTTCACGACGTCTCTGAAGATC

ACTTCGTCGGCCTTCTTGTTGCCGGTGTAGACGCCGGCGAAGGGTTTGTTCTCCTTCTTGCGCAGCTCGGCACGGGCC

CTCGCGGCGGCGATCCAGGTCTCGCTCGCGGTCATCGTCTTGATCCACTTACAGGCCTGCCCAGGGTGCGCGCTGTTC

GCCGGGATGGCCCAGGCGTTGCCCGTGATCCAGTCGATCGGCTGCCCGTCGACGCCGCGGAACGGCGCCACGGTCACC

TTGACCTTCGGCGAGTTGTCGGCGAGCACGTTGAGGTAGAAGTCCTCCATCGGGAAGGCGCCGAGCTGGTTGCTGGCG

AACTGGTTCTTGGCGCCGAAGAAGTCCCACGAGTCGCGGAACGACTTGAAGTTCGACCAGCCGCCCTGCGCGTTGATC

AGGCCGACGGCGTATTCGAGGGCCTCGACCACCTTCGGGTTGTTCAGCTGGGCGGTGCGACCGTCGTCGCTGACCAGG

GCGGCGCCGTTCGCGCGCGCCCAGACGGGCAGGAACTCGGGCAGCTTCGGGTCGAACCCGATCCGCTGGAGCTTGCCG

CCGCTCATCCTGGTGAGCCGGGCCGTGGCCGTCGACAGCGCCTGCCAGTCCCCCGTGTCGAACCCGGCGGGATCCAAG

TTGACCTCGGCGAACGCGGCGTCGTTGAGCATCAGGACGCGGTTGTTGTAGAAGTCCGGCAGGCCGTACAGCTGCCCG

TTCAGGGTCGCCTCGGTGACCGCGGCCTCGCGGAACTGGCTCATGTCGATCTTCTCCCGTTCGACGCAGTCGCCGAGC

GGAGTGAGCGCCTTCTTGGCCGCGTAGGTGCCGAGCAGCCGCCGTTCCATGTACACCAGGTCCGGCGGGGTCCTGGAG

GCCACCGCGGACAGGAACGCCTGGGCGTCGAAGCTGCCCTCGGACGCCTTCGCCAGGCTGGGCGCGATCACGGCGTTG

GCCGCGTCGAAGCGGGTCTTGGCGATCTCGTCGCCGGTGCCGAAACCCATCATGGTCAGCGTCACCGCGGCGTTGCTG

TCGGAGTCCGAATCGGATCCGCCCACGCCACCGCAGCCCGCCGCCAATGTCAGAACCAGGGCACCACCCACCACAAAC

CGGATCGATCGGATGAACATCGTTGTTCTCCCATTTTCACTTGTTCCCGTGGGCGAAGCATAAGTTCACTTCGATGCC

CGCGCACTCGGAGCGGCTGCTGTCAACCGCCGACCGGTTGGCGGATCACCACGATCGGGTGGTGCGGCCGCTGCCGGG

CCGCGCTCCTGCTCCCGCCGCCACGCGGGTGGGCAGATACCGATCGGCGTCGCTCTAATCGATGGCAGGGATACCGAC

GGTGACACCGTTTCCTCCCGCCGCTTCATCCCGACGTAATCGCGGGCATGGCGCCGTGGCCGCGTTTCGTCGAAATCG

CCGGGCTATTCGCCCGGGAAGTCCACCGAAAGGAAGACACACCATGTCTGCTCTCGCCATCGAGAAGTCCTGGAAGGA

CGTCGACCTCCGTGACGGGGCGACCAGCCACCCGGCCGGCCTCGGCTTCGGCGAGCTCACCTTCGAGGACCTTCGCGA

GGACCGCACCATCTACGCCGCCAGCAGCGGCTGGGTGTGCACCCTGACGATCGAGTGCGGCACCGTGATCTGCGCCTG

CTGATCGACGATCGTTTCCGGCCCGGGGCGGGCATCGCCCGCCCCGGGCCATCCATTTCGCGCGGGGAGCAGCCATGT

CACCGGTTCCTTCACTCAATTCCACCTCGGTACGCGACAGCGCGTATCTGCACGAACGAACGGTGACCGGAGAAGACC

AGCCGGCACCGGCCGCGCAGGCGCGGATAGCGTCCTGGCGCGATTCGGCGTTCCTCGACGACCGGGTTCTCGACATCC

GGCTACGTCAATGGGGAATCGACCGTGCCACCTTCGGCCGGCTGCTCACCGACGACGACTTCACCGTTCCCGGCCGGC

TGCTCGCCTGGGCGGACGAGCTGGCCACGGTGCTGGCCACCGACACGACACCGGTCACCGGACTCGAGTTGTCCACCA

AACTGTGGTCACAGGGATTCGACCGGCTGCTCTTCGCCGGCCTGCTTCACCCGTTCCTCGCCCACTACGAACAGCGGC

TGCACGAGCGCGTGCCCCGGCCGATCGCCGGCAGCCTGCGCCGGCCGCTGCTGGAGTCGCTGGCCAACCGGCTGCTCG

CCGTCGCGGCACGCACCCTGCTGCTGGAGCTCAACGTGGCCCGTGTGCACGGGCGGCTGACCGGCGACACCCCGCAGC

AGCGCTACGACGACTACGACCGGCGGCTGCTCACCGACCCCGCCTACCTGGCCGCCCTCTTCGAGGAATACCCGGTGC

TCGGCCGTTGCCTGGTCGAATGCGGCCGGCGTTGGGTGGACCACGCCGCCGAGCTGTTCAACCGGCTCCACGACGACG

AGCCCGAACTGCGCGCGGCCGGTCTGCTGCCGCCGTCGGCGGAAGCGCTGCGCAGCGTACGGCTGGACCTCGGGGACC

CGCACAACGGCGGCCGGTCGGTGGTGCAGCTGACCTTCGACGACGGCACCGACCTGGTCTACAAGCCGCGGCCGGTCG

GATCCGAACGCGCCTACGCCGAGACGATGGCCGCGCTGGCCCGCCACGGGCTGCCGGTGCCGGTGACCGCCCCGCGCG

TGCTGGACCGTGGCGGGCACGGCTGGTGCGAGTTCGTCCGGCCCGCGCCCTGCGCCGACGCCGCCGAGCTGTCCCGCT

TCTACCGGCGCGCCGGATCGGTGCTGGCGGCCATGCTGCTGCTCGGTGGCGTCGACATGCACATGGAGAACGTCATCG

CCGCGGGGTCGTCGTTCACCCCGATCGACCTGGAGACCGTGCTGCAGTCCGGAGAGCTCGGCGACGGCGCCACCGACG

CGTACGGGCGGGCCCTCGACCTGCTCAACCGCAGCGTGCTGGCGATCGGCATCCTGCCCGCCCGCGCGTTCGGTGGCC

GGCAGCGAAAGAGTGTCGACGTCAGCGCCCTCGGCGGCGGCGAACCGCAGACCGCGCCCCGGCCGGTGCCACGCATCG

TCGACGCGTACACCGACACGGCACGGCTGGAAGCGGTCGAGGCCACCATGGCCGGCGCCCAGAACCGGCCGAGCCTGC

CCGGCGCCGAGGTCCGCCCGTGGGAGCACACCGCTGACGTGGTCGCCGGGTTCACCGACGCCTACGACATCATGCTGG

CCCACCGCGCCGACTTCGACCGGCTGCTGCGCGGCTTCCACGACGTGGAGGTGCGCTACCTGCCCCGGCCCACCCGTC

GTTACAGCATCTTCCTGACCGAGAGCTACCACCCCGACTACCTGCGCGACGCCAGCGACCGGGACCGGCTGCTCGACA

AGCTGTGGACCGCCGCGGACGCCCGCCCCGAGCTGATTCCGATCATCGAGTCGGAGAAGCGACAACTGCTCGCCGGTG

ACATCCCGTGCTTCCGCAGCGTCGCGGGAAGCCGGCAGATCCGCACCGCCTCCGGCCCGCTGCACCCGGAGTTCTTCA

CCGCGCCGGCCGTCACCGTACTGACCCGCCGGCTCGGCGAGTTCGGACCGGTGCACCGCGCCGCCCAGGTACGCATCA

TCCGCGACTCGATGGCCACGATGCCCGGCCCCCGGCCCGCCGCCCAGCCGTCCCCCGACCGGGCGGCGGGCCCCCGGC

CCCGCGTCACCGGCGCCGACCCGGCCACGCTCGCCGACCGCATCGCCCGCAGGCTCGCCGACGAGGCGATCCTCGGCG

ACCGCGACGTGTCCTGGATCGGCGTCAGCATCGAAGGCGTCGCCCAGGAGACCTACAGCTACAAGCCGATGGCGACCG

GCCTGTACGACGGCGTGGCCGGCCTGGCGCTCACCTTCGCGTACGCGGCCCGCACCCTCGGCGACGACCGCTACCTGG

ACCTGGCACACCGAGCGGCCCGCCCCGTCGCCGGCTACCTGCGCTACCTCGCCGAGCACCGCATCGTCGAGACCGTCG

GCGCCTACAGCGGCACCGCCGGGCTGCTCTACGCCCTGGACCACGTGGCCCACGCCACCGGCGACGACTCCTACCTCG

ACGCGGTCTCGGAGGCGGTGCCGTGGCTGCGCGAATGCGCCACCCGCGAGGAGTGCCCCGACCTGATCGCCGGGCTGG

CCGGCTGCGCCCTGATCAGCCTGGACCTGCACGGGCGCCACCGGATCGACGGGCTGCGCGAGGTGGCGGCCATCTGCG

CCGAACGGCTCGCCGCCCTCGCCGTCGACGTCGACGGCGCCGCCGGATGGCCGGCCACTCCGGACGGACCGCTGCTCG

GCGGGTTCTCCCACGGCGCGGCCGGCATCGCCTGGCCGCTGCACCGGCTCGCCACCGAACTCGGCGACCCCTCGCTGC

GCGAGCTCGCCCGCCGCGCGGTCCAGTTCGACCGCGACCTGTACGTGCCCGCCGCGGGCGCCTGGCGTGACCTGCGCC

CGGAGATGGCCGGCACCGACTCCTACCCCGCGCTGTGGTGCCACGGGGCCGCCGGCATCGGCCTGTCCCGGCTGCTCA

TCGCGCAGCACGACCAGGACACGCGACTGGCCGCGGAGGCCACCGCCGCCCTCGACCTGGTCGGCGCGCACGGCTTCG

GCCACAACCACAGCATCTGCCACGGCGACTTCGGCGCCCTCGCCCTGTTCGACCTGGCGGCACGAACCGGCTTCGACC

CCGGGCGCCACGACGCGGCCGCCGCGGCCGTGACCGCCGACATCGCCGCCAACGGAGCCCGTTGTGGCCTGGTCGGCG

ACATCCACATGCCGGGACTCATGCTCGGCGCCGCCGGCATCTGCCTGAGCCTGCTGCGCATCGCCCACCCCGCGCAGG

TGCCCGCGGTGGCCTGGCTGCAGCCGCCGCTGACCTGAGGAGGAGCCCATGCCGGAAGAGATCGTGCTCAGCGTGCTG

GACCAGGTGCCGGTGTTCCGTGACGGCAGCCCGGCGGAGGCGGTGCGCGACGCGGTCGCGCTGGCCCGCAGCGCCGAA

CAGTACGGCTACCACCGCTTCTGGATCGCCGAGCACCACGGCAGCGCGGCCAACGCGTGCGCCGCCCCCGAGGTGGTG

ACGGCCGCGGTGGCCGCCGCCACGAGCCGGATCCGGGTGGGCAGCGGCGGCGTGCTGCTGCCGCACTACAGCCCGCTG

AAGGTGGCCGAGACGTTCCGGGTGCTGGCGGCGCTGTATCCGGGCCGCATCGACCTCGGTTTCGGCCGGGCTCCTGGT

GGGCCGCCGGCGATGGCCGAGCTGCTCAACCCGTACGCGGTCCGCACCGACGAGGCGTTCCTGGAGCAGATCGGCCGG

CTGCTGGGGTTCCTCGGCGACACCCGTACGGTCAGCCGCGTGTCGGTGACGCCGCAGGTGGAAGAGCCCCCGGTGCCG

TGGATGCTCGGCGCCGGGACCGGCAGCGCCCGGATGGCCGGCATGCTGGGGTTGCCGTTCTGTTTCGCCCAGTTCATC

GCGACCGAGGAGTGCCCGGAGGCGATCGAGGCGTACCGGGATGCGTTCCGGCCGTCGCCCTGGCTGGAGCGACCCCAG

CCGATGCTCGCCTTGCGGGTGCTGTGCGCCGACTCGGACGCGGAGGCCGAGGAACTGGCCACGTGTTTCTGGATGTCG

TGCACGACCGGCTGGCGTGCGCAGGTGCAGCTCACCGACGACTACCGTGGGGGCGCGCCCAATCTCGACGACGCACGC

CGGTACCGGCTGACCGCGGAGGACCTCGCGCTGCGGGAGAGCCGGCCGTTCCTGCAGATCTCCGGGACGCCGGCCGCG

GTGGGCAAGGAGATCCGCAGGTTGCAGGCGGTGTACGGGGTATCCGAGGTGGTGCTCACCACGAACTGCCCCGGCCTG

CCGGCGCGGCGCCGCTCCTACGAACTGCTCGCCGGCGAGTTCGCATCCCCGGCGGCCTGACGGCCTCAGGTCCGCGGT

AGCTCCGCGTAGGTCCCGCGCAATGCCGCGGACCTGACGGCCGTCAGGACAGGCAGACGTCGTCGCTGGACAGACCCG

ACGCATACGCCAGGACGGCGGCCTGCACGCGGTTGGCCACGCCGAGCTTGCTCAGGATCACGCTGACGTGCTCCTTCA

CCGTGGCGGCGCTGAGGAACAGCTGCCGGCTGATCTCCGCGTTCGTGAGGCCGGCGCCGAGCAGGCGCAGAATGCTCT

GCTCCCGGTCGGACAGCTGTTTGACCCGCTCGCAGGCCGGTGACCCGGCCCCCGCGGCAGATCCCCGTGAGCCCGCAC

GCACGACCACCGACGACGCCTCGGGCGCCAGCACGATGCTGCCCTCGGCCAGCGCCCGCACGGCGGCGACCAGCTGTT

CGGGCTGGCTGTCGCGCAACAGGAAGCCGCAGGCCCCACCCCGCAGCGAGTCGAGCACCAGCTCGGGTGGGGCGAGAG

TGGTCAGCATCGCGATCGCCGGCGGGCTGCTCAGAGCCCGCAGCTGATCGAGCACCTCCAGCCCGTCGCTCTGGGCAC

TGTGGCCGTCGAGCAGCACCACGGCAGGCCGGTGCTGCTCGACGGCCGATCTCAGGTTCTCCCGGTCCGTCGTGGCGA

CCGCGAAGCCGCCGGTGCTCTCCAGGATCATCTTGATGCCGATGCTGACCAGTGCTTCGCCGTCCACGACCAGTACGT

CCGTCACGATCGGTCCCCCGCGAGCCGCCGAACGCATGCAACTTGCATCCGCATTCGTGACATTACTTCACTTATATG

GTCGAATCAATCGATTTTTCGCGTATAGTCATTAACAACACACAGCGCGTCGTCAGCGGGTCAGACCCTCGGCCGGGG

CGACCCGCGCCGCCCGCCGCGCCGGCGCCAGACTGGCCACCACCCCGGTCAGCACCGCCACCACCAGCACGGCGGCCA

GCTGGCCCCACGGCAGGCGGATCACCGGATCGGCGGTACGCCCCACGGCCGCCGCCACCGCGGCCAGCCCCACCGGGA

CACCGACCACGAGGCCGGCCACCGTGCCGAGCAGCGTGATCACGACCGCCTCGACCGCGAGCATCGCCCGCAGCCGCG

CCCGGCGTGTGCCCAGCGCCCGCAACAGCGCCATCTCGCGTACCCGCTCGACGACCGACAGGCCCAGCAGATTCGCGA

TGCCGAGCAGTGCGATCACCACCGTGACCGCCAGCATCGCCAGCGACAGTCCCAACAGGATCGACAGCACGTTCGCGA

TGTCACCGCCCTCGGTGACCCCGCCACCGACCTGCACCAGCGCGTCGCGGGCGGCCACCGCGCCGACGGCGGCCGACA

GCGCCTCCCGGTCGAAGCCGGGGTCAGCGACGCCCCACACCGTTGTCGGCACCGCCTCGATCCGGTTCGCCGCCAGGG

TCCGCGCGCTCACCACGCCCAGCAGCTGCCCGGTGGTGTCCGCCAGCCGCGACGCCCGGGCGATCAGGTTCACCCGGC

GCTCGCCGACCTCGACGACGATCGGGGCGCTGTCCGGCAGGCCCAGCTCGGCCAGATAGGTCGCCGGCACCAGCACCA

CCGGCTCCCCGGCGAGCTCCGGTGCCACCCGGGCCGCCAGTTCGTCGCCGGGCGCGGCCAGCAGCCGCGGCGTCGCCT

TGCCGCCGTCCGGGAAACGGGCCGCGACCGTGCCGACCGTGCCACTGGCCGACAGCTGTGGCACCGCGGCGAAGGCCC

CGGCGGTGGCACCGCTGATCGGCTCGCCGTCGGTGCGCAGGCCCGCCGCCACCGGGTAGCGCGCCTCCAGGTCGGCGT

TCACCGTGGCCCGCCCGCTGGTCGCCGCCACCGCCAGGCAGGTGATCAGCGCCGCGCCGACCACCACCGCCATCGCCG

CCGAAGCCGTCCGGCGCGCGTTCTGGCTCAGGCTGGTCCCGGCCAGGCCGGCGGCCACGCCGAAACGCTCCAGCAGCC

GCGCCGCCGGCGCCAGGGACAACGCGATCAGCCGCGGCAACGCCGCCAGCAACCCCGCCGCCAGCAGAAGCCCGCCCA

GCAGCGCCAGGGGCAGCGACGCGCCGATCGCCGCCACCGCGAGCGCGGCGGCGCCCACCACGGTCACCACGGTGCCCA

CGACGAGCCGGCGACCGCCGCGGACCGTGCCGGCCGGCGGCTCGTCGGCCGCCTGCAACGCCCGCACCGGGGCGATCC

TGGTGGCACGCCGGGCCGGCGCCCAGGCGGCCACCAGCGTGGCCAGCACCCCGGCCAGCACACAGCCGGCCAGGGCGA

ACGGATTGACCCGCAGCCCGCCGCCGCTGATGTCGAGCAGGTCGGCGCCGAGATAACCCAGCCCCACACCCGCCGCCG

CGCCGACCAGGCCGCCGGCTGTTCCGGCGATCGCCGCCTCGGCCAGCACGACCCGGCTCACCTGGGCACGATGACCGC

CGACCAGCCGCAGCAGGGCGATCTGCCGGATCCGCTGGACGATCACCACGTGGAAGGTGTTCGCGATGACCAGCACCG

CCGCGAGCAGGGCGACAGCCGCGAACGCCAGCATGATCACGACCAGCTGGCCGTTGCCGCCGGCGAACCTCGCGGCGG

CCTGATCCGCAGCCGCCGAGGCGTCGGTCGCCGAGATGCCGGGGCCCATGCTGCGCCGCAACGCGTCAACGGTGCCGG

TCAGCGAGGCGTCGTCGGCGACAGTCAGCAGCGCGGCCGGCGGCACGTCACCGGCGAAGAACGACGCGTCGGCGTAGA

ACCGGAAGTCCGAGCCGGTCAGCGGCCGGAAACCCAGGTCGGCGGCACCGGTCACGGTGACCGGCTGCGGCGCCGCCT

CACCGTGGCGTACCGTCAGCGTGGCCCCGACGTCGATGCCGAGGTCGTCGAGGGTGCGCTGGTCGGCGACGAGCTGTC

CGGGCCCGGTGGGCCACGCGCCCCGGTCCAAGGTGAACCAGCGGACCTGCGGGGTGGCCGCGATGCTCTGCACGTTGG

CCGAGCCGCGCCGCGATCCGCCGAACACGCTGACCGTGCGCGCGTACTGCGCGTCCACCGAGCGCACCCCCGGCACCG

CGGCCGCGGCCTCGTACCAGGCCGGGTCGCGGACCGTGTCGTCGGCGTCGAGCACGATGTCGGCGGTGGTCAACGGCG

CGGCGGCGGTACGCCGCAGGCCCTCACCCGAGGTGGCCGCGAAGGTCGCGGTCGCGGCCAGGAAACCGGTCGCCAGCA

TCACCGCCGCGACGATCGCGAACAGCCGGGCCGGGTAGGCGCGCAGCTGGGACCAGGCAAGCGCGAAGATCATCGTCA

CACCGCCACCGACGCCATCGCCGCGAGGATCTGATCGCGGCCGGGACTGCGCAGTTCCTCACGGATCCGGCCGTCGGC

CATCACCAGGACCCGGTCGGCGTACGTCGCGGCGCCCGGATCGTGGGTGACCATGATGATCGTCTGGCCGGAGCGGCG

TGCCGCGTCGCGCAGCCCGCCCAGCAGCGCGCGGCCGGTGGCGATGTCCAGCGCGCCGGTCGGCTCGTCGGCGAAGAC

CACCGACGGCTTGGCCAGCAGCGCCCGCGCCACCGCCACCCGCTGCTGCTGGCCGCCGGACAGCTCGGACGGACGATG

CCCCAGCCGGTCGGTGATCTGCAGTGAATCGGTGATCTTCCGCAGCTCGCCCGGATCCACCCGGCGGCCGGCGAGCCG

TAGCGGCAGCACGATGTTCTGCTCCGCCGTCAGCGTCGGCAGCAGGTTGAACGCCTGGAAGACGAAGCCGATCCGGTC

GCGGCGCAGGTCGGTCAGGGCCCGGTCGTCCAGACCGGCCAATGACCGCCCGGCCAGGCTGACCGTGCCCGCCGTCGG

TGTGTCCAATCCGGCCAGCAGGTGCATCAGCGTCGTCTTCCCGGAACCGGACGGGCCCATGATCGCGGTGAACTGGCC

CGCGGAGAAGCCCGCGGACACCCCGTCGACGGCTGTCACGGCAGCCGGCCCTGTTCCGTACGTCTTGCTGACGTCCCG

GCAACTGACCATCTCGGCGTGTGTCGTCTGCGTTGTCACCGCACCCACGCTAGAAATCCGCGCGGACCGGCACATCCC

ACCACGGGATCCCGGTCGGGCGGTGGACCGATACCTTCGTATGACCCGCCGGTATCGACCTCGGGCGCCGTGTTCCCG

CAATCGATGATGTCTGCTTAGGCTGGGACCGTGGTGCGAGGGAACCGGGTGCTCAGGATCGACGCCCTCGTCGCCGCC

GCGGTGGTCATCGGCTGTCTGCTCCTCGGGCTCGCCGGGCTGTCCGAGTGGTACTGGTCGGCCGCGGTGGCCGTACCG

TTGCTTCTCCGGCGCAGCGCTCCGCGCTGCTTCCTGGCGCTGGTCGCCGGCGTCTCCGGCCTGCACCTGCTGGCCTCG

CACAGCTTCATGTTCCCCGGCGATCTGGTCGCTCTGGTCGCGGTGCACGCCGCCGCGGCGCACGCGCCGGGCCGTGCC

CGCCACGCCGGACTGCTGCTCGGCGCCGCCGGAGCTCTCGTGGTGGCCGCCCAGGCCCTGCAGGACCAGCGCCTCGGC

TCGGCGCTGCCCGCGGTGCTGATCGTCGCGAGCACGATGGCCGCCTGGTCGATCGGGCTGATGCAGCGCCAGCAGCGC

AGCGCCGTGCTCGACGCCGAGCACCGCCGCCGGCTGGCCGAACAGGACAGCGCCATGCGCGCGCAGCTGGCCGTGCAC

GAGGAGCGCACCCGGATCAGCCAGGAGATGCACGACATCATCGCCCACTCGCTGGCCTCGATCATCGCCCAGGCCGAA

GGCGGCCGGGTCGCCGCCCGCGCCGACGCGCGGATCGCCGGGCCGGTGTTCGACCGGATCGCGGGCCTCGGCCGTCAA

GCCCTCACCGACGTGAAACGGCTGCTCACCGTCGTGGACCACGACGACGAATGGCACGACGACGGACTGGAGCGGCTG

CCGGTGCTGCTCGCCGGAGTCACCGAGGCCGGGCTGGACGTGACCGTGGACAGCAGCGGGGCGCCGCAGCCGCTCGCC

GCCGGGATGGACCTCGCCGTGTACCGGGTGATCCAGGAGTCGCTGACCAACGTGCTCAAGCACGCGCCGGCGCGCCGG

GCCTGCCTGCGGATGCGGTGGACGCCCGCGCTGCTCACGGTCACGGTGAGCAGCCCGCTTCCCGGTGGCCGCGGCGCC

GGCCTGGTCGAGGGGCGCGGCCTGTCCGGGATCCGGCAGCGCTGCTCACTGTTCAACGGCGACTGCACCGTCACCGCG

ACCACGGAACTCACCGTCACCACCACCTGGCCCCTCACCCCGGAAGGAGCGCGCGCATGACGCGGCCACCGATCGCCG

TGCTGATCGCCGACGATCAGGAGCTGGTACGCACCGGTTTCGCGATGGTCGTCGACGCGGCGCCGGACATGCGGGTCG

TGGCCATCGCCGCGAGCGGCGCGGAGGCGATCGAGCTGGCCGCCGAACACCGGCCGGACGTCATCCTGATGGACATCC

GCATGCCGGGCACCGACGGGATCACCGCGACCAGCGCGATCCTGGCCGCCGGCGGCGAGCGGCCACCGAAGATCATCG

CGCTGACGACGTACGACAGCAGCGACTACGCGACGCGGATCCTCACCGCCGGGGCCAGCGGCTATCTGCTGAAGGACG

CGACCGCCGAGGGCCTGACGGCGGCGATCCGCAGCGCGTACCACGGCGGGTCGGTGATCGCCCCGACGACGACCCGGA

ACCTGGTCGCGGCCCGCGCCGAGCCACCGCCGCCGGCTCGCGACCCGGCGCCGCTGGACACGTTCACCGCCCGGGAAC

GCGACGTGTTCGACCTGATCGTGGCGGGCGCCAACAACGCGGAGATCGCGGCCCGGCTGCACCTGGCCGAGGTGACGG

TGAAGACGCACGTCGGCCGGGTGCTGGCCAAGCTCGGGGTACGCGACCGGCTCAACGTAGTCGTCTGGGCGTACCGCA

ACGGCGCTGTCGGCTGATCCGCACCCTCAGGCCCTTGACACGGTGCCACGGTGGCACGGTGTGATAGACCCGGGTCGT

TTCGCCTCACACTGGTGGTGGTGCGGTGAGTTCCTGGGTACGCCGGCGCGATCACAACGTCTTCGTCAACGCGTTCAA

CATGCTCATATGCGGCCTCATCGCCGGCGTCGTCGTGGCCGCTGCCGCGTTCCCGTTCGCCGCGATGTCCGGCCTGGC

CGCCAAGGCCGGCCAGCAGACGTTCGCGAGCCTGCCCAGCGAGCTGAAGGCGTTCCGGTCACCGCAGATCAGCCGGAT

CTACGCCGCCGACAACAGGACCCAGGTCGCCCAGTTCTACGACGAGTTCCGCAGTGACGTCCCGCTCAAGGAGATGTC

GCCGTTCATGCGCGACGCCATGGTCGCGGCCGAGGACCGGCAGTTCTACCAGCACCACGGCGTGGACCTGAAAGGCGC

GGCGCGTGCGCTGGTCAACAACCGCAACGGCGGGCAGAAACAGGGCGCGTCGACGATCACCATGCAGTGGGTACGGAT

CTCGCTGGCCTACTCGGCGACCAAGCCGCAGGACGTCATCGACGCCACCGAGGACGCCCCGAAGCGCAAGGTCGCCGA

GATGAAGTACGCGCTCGAGGTGGAGAAGCAGCTCAGCAAGGACCAGATCCTGGAGCGGTACCTGAACATCGTGCCGTT

CGGCAAGCAGACGTACGGCATCTACGCGGCCAGCCGGGTCTACTTCAACAAGAAGCCCAAGGACCTCACGATCGGCGA

GGCCGCGCTGCTGGCCGCCATCGTGAAGGCGCCGTCCGCGTACGACCCCACCGACCCGGACGGTTACGAGCTCATCCG

GCAGCGGCGCAACGCCTATGTCATCCCGGGCATGGTGGAGATGGGCGCCATCACCCGGGCGCAGGCCGACGCGGCGCT

CAAGGAGGCCATCCCGCGCAAGGTACGCCCGATGAGCAACGGCTGCGTGTCGGTGGCCAAGAACAACTGGGGCTTCTT

CTGCGACTACTTCTACCGCTGGTGGATGGAGCGCAAGGAGTTCGGGCCCACGCCGTACGACCGGGAGCGCCGGCTGAA

GAGCGGCGGCTACCGGATCACCACGACACTCGACGTCAAGGCGCAGAAGCAGGCCCGGGATCGGATCGGCGACCTGAT

CTCCGAGAAGAACAAGAACGCGCTGCTGCTGGCAGCCGTCGAGCCCGGCACCGGCAAGGTACGCATGCTCGCCGCCAA

CCGCCGGTACAAGCTGGACGATCCGGATGATCCGCAGAACGCGATCTCCTCCGACCCGAGAAAGGCGCGCAAGGGCAT

CCGTGGCTCGTACCCGAACACGACGAATCCCCTGCTGACCGGCGGCGGCGACATCACCGGCTACCAGGCCGGCTCGGT

GATGAAGATGTTCACCATCGTCGCCGCGCTGGAGCAGGGCTACCCGCTCGCCTACACGATCAGGACGCAGAGCCGGTA

CCGCTCCCGCTACATCATCGAGAGCAGCAACGACGCGGCCTGCCCCGGAACGCACTTCTGGTGTCCCAGCAACGCCGG

TGGCGGCGGCGAGGGTGTCTTCAACATGTGGACCGGCCTGGGCAGGTCGATCAACACGTACTTCGTGCCGCTGGAGGA

ACGCGTCGGCGCGGAGAAGGTGGTCAGCGCCGCGAAACGCTTCGGCATCCAGTTCCGGGAGCCGGACGACGCACTGCT

GGCCGAACCGGGCAACGCACACCAGTGGGGCGCCTTCACCCTGGGCGTCTCGGCCACCACCCCGCTGGACATGGCCAA

CGCCTACGCCACCCTGGCCGCCGACGGGATGTACTGCCCGCCGACCCCGATCGAGCGGATCGCCACCCGTGACGGCGA

CCAGCTGGACGTCGGCCGGTCCCCGTGCGTACGGGCGACCGCCAAGGACGTCGCCCGCGCCGCCCTCGACGCGGCCCG

CTGCCCGGTGGGCGACTCCGCGCAGCTCGGCCGGTGCGGGGGAAGCACCGCCGGCATCACCCGGTCGGTGGTCGGGCA

TCCGGTGTTCGGCAAGACCGGCACCACCGACCGCGACCGGACCGCCTCGCTGATCGCCGGCACCACCGCGCTGGTGGT

CGCCGGTTACCTGGTCAACCCCGACTACCAGAACCACCGCGACCGGCTCGACCACGACCAGGTCAACCCGGCCGTCTA

CCGCACGCTCGCCGACTACATGGAGGGCAGGCCACGGGAGTCGTTCAAGCGGCCGTCGAGCGGGCGGATCGCGTTCGG

TGACCAGCGCTCGATCCCGGACGTCGAGTGCGACCCGATGCCCCGCGCCCGCGACCGTCTGGAGGATGCCGGCTTCGA

CGTCTGGCGAGGCCAGGAAGTGGAGTCGGACTGTCCCGCGGGCACCGCGGCCGGCACCGAGCCGAGCGGCCGGACCGT

CAAGAACGGCGTGGTGGTGATCCAGGTGAGCAAGGGCCGCCGGGGCGCGTCACCGCCGATCTTCCCGCCGATCGGGCC

ACCCCGCTGACCGGCTGACGGCGTAGACGTCGCCGGCGTTCGCCTCGTGCGGCAGCCCGGCCAGGTGCGCGAGCATCT

CGTCGCGGGCGGCCCACCGGCCGAAGGTGCGGGCCATGGTCTCGCCCAGGGAGACGTCGAAGCCGTCGAAGCCCAGCT

CGCCGGCACGGTCGAGGCAGCGCCGGGCCACGTCCCGGGCGATCGTCGTGAACTCGAACGACAACGCCCGGACACCGC

GGCTCAGACCGGCGAGCACCGCGTCCTCGTACCCTTCGACGTCGATCTTGATGAAGGCCGGCAGGCCGAATCGCTGGA

CGAGCGTGTCCAGGGTGACCGCAGGGACGGTGATCTGCTGGTCCCAGACCTCGTTCTCCCAGCCGCGCGAGCCGGTCG

CCGCGGTCAGGAAGCGCACCGAGTTCGTGGAGACCGTCGGGTTCGCCGAGTTGATGTAGAGCGGCACGCTCCCGCCGG

CGGGCCCGCACGCGGCCTCGACGAGCGCCACCCGGTCGTCGTGGGCGTAGAGCGCGCGCAGCGCCCGCATGCACAGCG

GCTGCGGTTCGACGGCGACCACGCGGGCGCCGAGCCGCCGGAAGCAGGCGACCCGGTCACCGACGTGCGCGCCGATGT

CGAAGACGACGTCACCCGGCCGGACGAAACGCCGGTACATCGCGTCCATCGCGGCCTCCCGGCCGGCGTCACCGTAGT

AGTAACGCAGCGACCGGGTCAGCGGCGCCATGGCCGGGTCGACTCTCAGTTTGCGCAGGTCATCGGTCACGGCGGGGG

CATTCCCCCGATCAGGCGATCCATGCATCGCCGGCGCGTGCGCAGGTAGGCGGCGATCGCCCGGGCGGAACGCACGCC

CGAGGTGGTCATGACGTTGTGCGCGGCGGCCGGGACGGTCACCGACACGCCGCCGGTCATCGCCGCCACCTCGGCACG

CCAGCGCAGCGGCGCCACCGGATCAAGCGACCCGCCGAGCACCAGCGGGGGTACGGGCAACCGGCGCAGATCCTCCTC

GATCGCGTTGCGTACCGAGTGGCCGACCGTGGCCAGAACCCGCCACGGCTTGGCGTCGGCGATGTCGCGGACCAGCAC

CGGCGCCTGCCACGGCGCCTCGATCCACAGGTCCACCGCCCACCGGCCGATCAGCGCCCGCCGGGACCGGGCCGCCGG

GTCGGTGGTCGGGCTGGCCAGCACGACGGCGGCGACCAGGTCCGGCCGCAGCACCGCGAGACGGGCCGCCACCTCGGC

GCCGAACGAGTGCCCGGCGATGCAGGCCCGGGGCACGCCGAGCACGTCCAGCCAGGCCGCGAGGTGTTCGGCGTGCCG

GCCCACGTCGTACGCGCGGCGCGGCTTGTCGCTGAACCCGAACCCGGGAAGGTCCGGAACGAGGACCGGATGGCGGCC

CGCCAGCGCGTGGGCGGTGGGCATCAGGTAGCGGTGCGAGACGGCGAGCCCGTGTACCAGCACCACCGGAAGGCCGCC

GGCGTGGCACGCGTGCCGGTCGTGCGTACGCACTCCACCGACCGTCACCAGGCGGCTGTCGAATCGGGGCACCGCGGA

GATGTACCCCGTCCTTCCGCAATCTTTCCCGCGCGGTTAGTTTCGAGTTGTGTCGCCGCCCTTCCGGCTCGACGAGGC

GGTCGCCGACGTCTACGGCGACCTGCGCCTGGCGCCCGTGCTGCGGCGGCTGCTGCGGCACAGCGGCCGCCTGACCGG

CTCGGTGGCCGGCAGCGTGTCGCTGATCGACGCGGACCGCGGCTGCTACGTCAAGGCCGCCGAGTACGGCGCGAACTG

CCAGCTCGGACGCTCTTTCCCGCTCGACGAGGGCGCCACCGGCCGCGCCTTCGGCAGCCGCCGGCCCGTGGTGATCCC

GGACTACGGTCAGCTGCGGGCCGGTCATCTCGCGGCGGCGCATCCGGCACGGAAGGGCCCGGCCGTCGCTGTGCCGAT

CTGGTGGCGCGGCGACGTGATCGCGGTGAACGTCGCCTTCGCGCCGGCCTTCTCCCTGGGTGGTGTCGACGAACTGGA

GGCGCTGACCCAGTCCGCGGCCGCCGCGATCGTCCGCAGCCGGGGTGTGCGGGTCCGCGCCGACCCGCCGTACGCGGC

TCCGGCCGCACCGTTCACCCCGCGCGAGGCCGAGGTCCTCGATCTGCTCCGGCAGGGTCTGACCGACCGCGAGATGGC

CCGCCGGCTCGGCCTGTCCGCGAAGACCGTGGAGAAGCACGTCGGCGCGATCAGGCGCAAGACCGGGACCTCCAACCG

TACGGCGGCGGTCGTCACGGCCCTGGACAACGACTGGGTGGGGAATCTTCCCCATACCGCGGAGCACACCACCGGGTC

TTGACTGGCGGCATGCCCGTCGTCTCCATGAAGGACATCCTCGACCGTGCGCTGGCCGAGCGGTACGGTGTGGCCGCC

TTCAACATCGTCAACGACCTGACCGTCGAGGCCGTGCTCGCCGCCGCGGCGGAGGAACGCGCCCCGGTCATCCTGCAG

ACCTCGGTCAAGACGGTCCGGATGTACGGCCGCCCCCGGCTGTACGAGATCGTCCACGCCTTCGCCCACGACGCGCCC

GTCCCGGTGACCCTGCACCTGGACCACTGCCCCGAGCGGTCGGTCATCTCCGACTGCCTCGCCGGCGGCTGGAACTCC

GTGCTCTTCGACGCGCACGAGCTCGACGTGGCCGACAACCTGCGCCAGACCACCGAGGTGGTGGCCGAGGCCCGTCGC

GCCGGCGCCCACGTCGAGGGCGAGATCGAGGGCATCCAGGGTGTCGAGGACGACGTCGGCAACGACTACGCCCCGATG

GTGCAGAGCCTGGAGGTGGCGGTCGACTTCATCAAACGCACCGGCGTCGACTGTTTCGCGCCGGCCATCGGCAACGCG

CACGGCCAGTACAAGCAGGCGCCCGTGCTCAACACCCGCCGGGTCAGCGACCTCGTTGCGGCCACCGGCATCCCGATG

GCCCTGCACGGCGGCACCGGCCTCTCCGACGAGCAGTTCACCGACCTCATCGCCCGTGGCTGCGCGAAGGTCAACATC

TCCACGGCGCTCAAGGAGTCGTTCATGAAATCCGGCCTGGAGTTCCTGCGCGAGGCCGATGAGCGCGGCAAATGGGAT

CCGCCGTCGCTGTTCCGGCATCAGCGGGCGGCGGTCGTAGAGATGGCCCGGCAGCACATCCGGCTCTTCGGCGGATCG

GGGCGCGCGTGGTGAACGCCCTGGTCTTCGACTGCGACGGCGTGCTGGCCGACACCGAACGGCACGGCCACCTGCCCG

CGTTCAACGCCACGTTCGAGCAGTTCGGGCTGCCCGTGCGGTGGAGCGAGGAGGAATACGGCGAGAAGCTGCGCATCG

GCGGCGGCAAGGAGCGGATGGCGTCGCTGTTCGCCGATCCCGCCTTCGCCGCGGCGGCCGGCGACACCGACCGTACGG

AACTGCTGCGAACCTGGCACCGCGCCAAGACCGCGGCTTTCACGAAGCTGGTCGCCGAGGGCCGGATTCCGGCCCGTC

CGGGCACAGCCCGGATCATCAGCGAGGCACTCCGGGCAGGATGGACGGTCGCGGTCGCTTCCACGTCGGCCGAGGATT

CGGTACGCGCAGTGCTCGTCAACGCCGTGGGAGCGACGACTGCCGAGCGGATCCCGGTGTTCGCCGGAGACGTCGTGC

CCGCGAAGAAACCCGACCCGGCGATC

SEQ ID NO:101 orf1  推定蛋白  146aa

MPRRSTRCSPACRPGAADQPDPGRACRPDCGRADRSGSGRACRPDCGRAD

RSGADRPSAAALVSGMPRRTGVGGAPGRLIEARAVLPELIGAARDRRASC

VEQRVRSLTACRACACRRAAAPAAPRTPPRPSAAPAPGSDAGGRCG

SEQ ID NO:102 orf2  推定蛋白  149aa

VSVSLLLVPLAMAGAAAVQAAAGRMDDGRLICQVQTRMRDVTLLDAALRD

TGATVTAAGDTISATWTQSAATFTRGADGIWAAHVTGVDQPGAVELMTTV

DTAYGRRVQQAVLERLRAQAPEAGLRLESESVGQDASVRLVFEVERERA

SEQ ID NO:103 orf3 ATPase AAA 参与细胞分裂  518aa

VERSFAETFAQLLKARFPVLHLETYEEQRALHHLAGIAGDADLVRVPRAV

WTWSLTAGLVQPNGEARSGAQRATDALRAVQRIDEPAVFVFRDLHPLFAQ

SPEVVRLVRDIAQAFRAGRSPRTLVLLSPVLDLPVELSKDVTIVDFPLPG

QLELRALLDAMVRGNTASGRLRVELDEQSRERFVTAAAGLTMQEAENAYA

RAMVNDAVLDLADLEIVHEEKRQTVRKSGVLEFMAAGTVLDDVGGLENLK

AWLVKRNGSWLDEAAGYGLPAPRGVLITGVPGCGKSLTAKAVATAWNLPL

LRFDIGRVFSGLVGSSEHNMRTALRTAEAVAPCVLWVDEIEKGFAGGTGG

DSGTGARVFGTFLTWMQEKRTPVFVIATANDFDGLPPELLRKGRFDETFF

VDLPSRSERVAVWRVHLGRALRHRRAAGELRVDAELLTELAGLTEGYSGA

EIEQAVIAGLFDAFSERRPLRRDDLVRAVMSIVPLSVTQAERVDALRGWA

RNRAVSATGTDDWDLTNR

SEQ ID NO:104 orf4  糖水解酶  203aa

VGELDQQRIHPHNNIWGSGAGTQTIWARSGTNWGVVANHPRTSGVKSYPN

TGKTLNRTLSSLNSLTSSFNVSVPSSGDYSTTYDIWANNHAYEVMIWTNQ

QGAVGPIAEQYDANGAVPNVRNLSVGGHTWNVYRGSNGANAVFSFIRTNT

NSGTVDILAILNWLRTNGWWGDVTVGEAQFGFEISGTAGQSNFTVNNFSL

NYS

SEQ ID NO:105 orf5  内切葡聚糖酶  219aa

MRRRTLALSLAASAALIAGAGVVTALPASAAAGCRVAYTVSSQWPGGFGA

NVTITNLGDPLTNWTLVWSYSGGQTVTQAWNTSLTQSGSQVTARNAGYNG

SVGTNATVSFGFNGSGAATPAPGTFTLNGTACTGSAGPTSPSSQPPTNGV

PSDAVWVDSGQWANWTNNGYILTTTSGARAPAPRPSGRAAAPTGASSRIT

RAPAGSSPTPTPERPSTVR

SEQ ID NO:106 orf6  胞嘧啶/腺嘌啉 脱氨酶  161aa

MTITETDLAHLRRCVDLAREALDDGDEPFGSVLVSADGKVLFEDRNRVRH

GDATQHPEFAISRWAAEHLTPRERASATVYTSGEHCPMCSASHGWVRLGR

IVYAASSAQLTAWYKEWGIPAGPVAPLPITTVVPGAVVEGPVPAFEAELR

ELHRARFTPAQ

SEQ ID NO:107 orf7  未知  413aa

VTTPLVAQAGDSTTGLTGLGLVEDAHQIAEAIRGNSWVDGVLGGVGASLD

GLALAIDPLGTLAAWGVAWLIEHVQPLQDALDWLAGDVDEIAAQAATWRN

VAAFTDSAQQDYADRLRTEVAGWFGASGDAYRAHASEHLAALKGISTAAG

GISSAVEGAGLLVSLVRGIVRDLIAQFVATLAVRLPQWLAAEGLTLGLAT

PVVASQVAALVARGVNKIQHFIRALLNSLRRLMPMIDRLGEVLERLRMLT

DRLARSSPSTRPEPTPGPATHAGTENASGNKPEGDLEPNEPRPAEADARD

STPQAFVDEVVSNPRSVAGHSAQSIADQFNAAGYSAVVEQSTRSGTSGNA

IQVRIHGHPDITNIQVHPGGGRHTPEGSPYWKISTNTVGKIWIIPENFRG

ADELRGNVVRYDK

SEQ ID NO:108 orf8  未知  217aa

VGKPCPDLVEVLSREIQAGNQGASASEVVEIFDLELVGIFRGAVTQKLPG

IEVLRKHLHLKQGGVQVRSVVVRAEDPAGIVVVGDLCARIDNRDVGLAQG

DAYWERRDDTVDRLDQIRADSPCEFDDMVRLGAGVHGDGQRRVRQRFADV

ANLFGVQRAIINESRIRTKIDPDDVDAQGDERGSFPRGSHPIHFDDLICH

SAPHSHAVHRRPGNFRG

SEQ ID NO:109 orf9  丙酮酸氧化酶  592aa

VSDVVVERLTAWDVERVFGYSGDGIDGVIGALRRAGRPTFVQARHEEGAA

FMAVGHAKYTGGAGVCLATQGPGAVHLLNGLYDAKLDSKPVVAIVGQQVS

TVLGSAYQQEIDLVRLFGDVCAQFVQAAHTSEQVPMLLDRAFRTALATRS

PTCVVLPHDVQTAPAPDPQAHEHGVLATSAGLRPARVVPRPEDLREAAEV

LRSGERVAIMVGQGAYGAEREIVELAQRLGAGVTTSLLGKPVLDENLPFH

TGVMGHLGTTASAELMRHCDTLLLIGTNDPWTEFYPRPGQARAVQIDVDG

RRLGVRYPVEVPLLGDAVETLRELLGLLPSRASGAWGARVEEWVQRWRLI

SAARAAAPAEPVNPQHVIRSLSDHLPADAQVAVDVGSVVYWYARHLRLPR

GVPAHLSSTLASMGCGLPYGLAAKLAAPQRPVVVLAGDGAMQMAGMAELI

TVAARWRDWADPRFVVCVLNNRDLAEVSWEQRETEGEPRFVTSQELPDVP

YARYAELLGLRGVRITDPSDLTGAWEAALSADRPTLIEAVVDPAIPLLPP

GQPYEKVQAMYAGLAAEKGDQARRAEAHLRRERADEGFDDPS

SEQ ID NO:110 orf10 水解酶 或 酰基转移酶  266aa

VSRDKTYRPVRPDGIRTTFHDGVLGRMRIRCLGEPRPGVPEIVMIQGMTV

SDYLLPGLGALSAWTRVHLVELPGGSGSGRPPHDLTVEEYARAAADWLCA

QRLGRIVLAGHSSGTQVAAETALLCPDEVAGVVLAGPAIDPVARGGLRVF

ARWWIDRRGDPKSLDEVHKPEREQVGFRRLFQVLRAHLRHDLEKPVVGLC

VPVLVIRGSEDRLGTARWARRLADLAAVGGRYVEVPGTHSFCWRYPQAWS

APIREFAGWSVSVSGT

SEQ ID NO:111 orf11  醛糖差向异构酶  396aa

MTEADHRPTVLRRILRLCAVLLMVLGVGLVGAPTSHAGGKPTISKEAFGS

VGGKAVDRYTLTNGRLQVRILTYGGILQTITFPDHRGRRANVTLGFRTLD

EYVTTKNPAYFGAIIGRYGNRIADGRFTLDGTTYQLATNNDPNHLHGGVV

GFDKRVWDATPIRDGDSVGLRLTYTS PHGEENYPGTLRVTMTYTVTRQMG

IRMDYRATTDRPTIVNLTNHAYWNLGGEGTGTIDDHLLKLNANRYTPVDA

TLIPTGAIDAVAGTPMDFRRPTPIGARNRDPFQQLVYGRGYDHNWVLNRE

DGQFRRLEFAARAVDPDSGRQLTIYTTEPGIQFYGGNFLDGTLYGTSGRA

YRQGDGFALETQHFPDSPNHANFPSTVLRPGQTYNSTTIYQFGTAD

SEQ ID NO:112 orf12 ABC 糖转运周质成分(sugar transport periplasmiccomponent)378aa

MPRIHPKVEEAVSTLDLNRTTRRRLLSGTGLFSASLAAGALLSACSDQND

GQNQTEGAGNFPDTPEWRFTFVNHVTTNPFFTPTQYGMEDAATLLGIAKP

QWTGSQNSIVAEMVNATNTAVSAKVDGIAIAVVDKDAFRGPVDQALNAGI

PVVSYNADGARGAPGTNRLAYIGQGLYESGYALGQRALQVLDSGEVAAFI

ATPGALNIQPRIDGAQQAFKDSGKPITFTAVATNADVTRGLSIIDAYAQG

HANLAGMLAVDAGSTSSVGQTVKKYNMRGKGLKVAGGFDLIPETLTGIQE

GSLDYTIDQQPYLQGFLPVLALYFYKVSGGLIAPSETNTGLLFVTKDNVA

PYQSTKSRYEGSTTDKVLVPRSGPIAHG

SEQ ID NO:113 orf13 ABC 糖转运通透酶  352aa

MDDRISPAPAQAPSLEVEQRRGRWQPVTAAGRKVLDAFLRRREASVLLVA

IGLMIYFRASSPVFLSRDNLVNIAQATAPVAIIAVGIVLLLVSGEIDLSV

GIVAALAPFLFHFGINFYSLPVVPAFVVALAIAAGIGLVNGLIVTQLHVP

SFVTTLGTFFAVQGILLITSHAYPVPIPDAAKGTFQTWLGAGPWASITWA

LIIVAIFHTVLTLTRWGLHTISVGGNPVGATEAGIRASRIKIGNFVITST

LGGLVGIMEAFRINTIDPNIGGGTTLTFYAISAAVIGGTALAGGSGTIVG

AFLGALVLAELQNGFNLIGYSANTIFLILGLAILVSMIANQYLSRLRRAG

RS

SEQ ID NO:114 orf14 具有ATP结合功能,还有253个氨基酸的ABC转运蛋白

MTAETVSDALRVQNIAKRFGALTALQDVTLRVAEGEVLGLIGDNGAGKST

LIKIICGYHRPDAGRIFVGGEEVTLRSVDHARSVGIDAVYQDLALVNELS

VYHNMFLNRELVRWPLLNNRAMRRRAEEHLRDMGVNLPDVGVEVAKLSGG

QRQAIAVARCVYSDARILLLDEPLAAMGAKEGTMILDLIRDLKARGNVSI

IIIAHNYAQVLDVCDRVNLLQHGRITFDKRSADTSLAELTELVVAEYRTG

RGR

SEQ ID NO:115 orf15 推定蛋白.转甲基酶 255aa

MESGASVPQSARIWNYWLGGTDNLPVDRAAGDEYRAVFPGIDEIARESRR

YLSRAVRYLAGEAGVRQFLDVGAGLPTVDNTHQIAQRVAPDARVLYVDKD

PYAVEHGRELLAGSSDVYLEGDLQKPADILAVAARELDMGRPVALILNGV

LGHIPSTAEVRDIVRQLMAGLPPGSYLSINDGVRVAGEEALNQAQDAYNS

SGAVPYLMHTPDEIAGFFEGLDLVPPGVVPSPQWHPDPGDETTGASQYSG

VGRKR

SEQ ID NO:116 orf16 ABC 转运通透酶  280aa

MPPRTSRGPHPWVLWTALAAAAVIFVYPFVWLVSASLKPRPDVFDNRLLP

AEWAPGNYTAIWDAAPVLTWMFNSVVVALAAAAAVTISSAVVAFGFAYFR

FPGRNVLFALVVGTMMLPGAVTMIPTYLIWNELGLAATQVPLWAGNLFGS

AFYIFLIRQFFLGVPRELFEAARVDGAGYWRLFWRIAVPLCRPALIVAFV

FELRASWSDLLKPLIYLRDPALFTMPRGMKAILDQFGQAGEARWEIVLAG

AVITTVPMIIAFFLCQRYFVEGVATQARKG

SEQ ID NO:117 orf17 ABC 转运通透酶  301aa

MSAAVRRRETLAAFGFLSPWLIGFTVFMAGPMVASLVLSFTDYDVLTSTD

FVGGENYRQMLADPRVRTSIANTLIYTALHVPVTMIVSLALAMLLARVGR

RSAGFFRTIFYLPTITPKVAVGVLFLLLFNGQVGIVNEALGTVGIDGPNW

TVDGPWIKPGLVLIGAWSLGSTVIIYLAALQNVPRDLYEAAEMDGASAWA

RFRAVTVPMISGALFFTLIINTIASLQTFDEVYTAFYGSANQQTYGNDAA

LFYVVYLFQQAFQFLHMGYASALAWLLFLIIVIITVVQVRLSRRFVYYES

E

SEQ ID NO:118 orf18 ABC transport substrate binding 445aa

MFIRSIRFVVGGALVLTLAAGCGGVGGSDSDSDSNAAVTLTMMGFGTGDE

IAKTRFDAANAVIAPSLAKASEGSFDAQAFLSAVASRTPPDLVYMERRLL

GTYAAKKALTPLGDCVEREKIDMSQFREAAVTEATLNGQLYGLPDFYNNR

VLMLNDAAFAEVNLDPAGFDTGDWQALSTATARLTRMSGGKLQRIGFDPK

LPEFLPVWARANGAALVSDDGRTAQLNNPKVVEALEYAVGLINAQGGWSN

FKSFRDSWDFFGAKNQFASNQLGAFPMEDFYLNVLADNSPKVKVTVAPFR

GVDGQPIDWITGNAWAIPANSAHPGQACKWIKTMTASETWIAAARARAEL

RKKENKPFAGVYTGNKKADEVIFRDVVKPDANVQIVLQTQESGFSEPALA

AGEEFKAAWQNAVNRVLEGKQKPAQAMAEAQQQAQAALDKANSGR

SEQ ID NO:119 orf19 actA 1anA结构基因 64aa

MSALAIEKSWKDVDLRDGATSHPAGLGFGELTFEDLREDRTIYAASSGWV

CTLTIECGTVICAC

SEQ ID NO:120 orf20 actM 1anM 修饰基因 1053aa

MSPVPSLNSTSVRDSAYLHERTVTGEDQPAPAAQARIASWRDSAFLDDRV

LDIRLRQWGIDRATFGRLLTDDDFTVPGRLLAWADELATVLATDTTPVTG

LELSTKLWSQGFDRLLFAGLLHPFLAHYEQRLHERVPRPIAGSLRRPLLE

SLANRLLAVAARTLLLELNVARVHGRLTGDTPQQRYDDYDRRLLTDPAYL

AALFEEYPVLGRCLVECGRRWVDHAAELFNRLHDDEPELRAAGLLPPSAE

ALRSVRLDLGDPHNGGRSVVQLTFDDGTDLVYKPRPVGSERAYAETMAAL

ARHGLPVPVTAPRVLDRGGHGWCEFVRPAPCADAAELSRFYRRAGSVLAA

MLLLGGVDMHMENVIAAGSSFTPIDLETVLQSGELGDGATDAYGRALDLL

NRSVLAIGILPARAFGGRQRKSVDVSALGGGEPQTAPRPVPRIVDAYTDT

ARLEAVEATMAGAQNRPSLPGAEVRPWEHTADVVAGFTDAYDIMLAHRAD

FDRLLRGFHDVEVRYLPRPTRRYSIFLTESYHPDYLRDASDRDRLLDKLW

TAADARPELIPIIESEKRQLLAGDIPCFRSVAGSRQIRTASGPLHPEFFT

APAVTVLTRRLGEFGPVHRAAQVRIIRDSMATMPGPRPAAQPSPDRAAGP

RPRVTGADPATLADRIARRLADEAILGDRDVSWIGVSIEGVAQETYSYKP

MATGLYDGVAGLALTFAYAARTLGDDRYLDLAHRAARPVAGYLRYLAEHR

IVETVGAYSGTAGLLYALDHVAHATGDDSYLDAVSEAVPWLRECATREEC

PDLIAGLAGCALISLDLHGRHRIDGLREVAAICAERLAALAVDVDGAAGW

PATPDGPLLGGFSHGAAGIAWPLHRLATELGDPSLRELARRAVQFDRDLY

VPAAGAWRDLRPEMAGTDSYPALWCHGAAGIGLSRLLIAQHDQDTRLAAE

ATAALDLVGAHGFGHNHSICHGDFGALALFDLAARTGFDPGRHDAAAAAV

TADIAANGARCGLVGDIHMPGLMLGAAGICLSLLRIAHPAQVPAVAWLQP

PLT

SEQ ID NO:121 orf21 acto 单加氧酶 341aa

MPEEIVLSVLDQVPVFRDGSPAEAVRDAVALARSAEQYGYHRFWIAEHHG

SAANACAAPEVVTAAVAAATSRIRVGSGGVLLPHYSPLKVAETFRVLAAL

YPGRIDLGFGRAPGGPPAMAELLNPYAVRTDEAFLEQIGRLLGFLGDTRT

VSRVSVTPQVEEPPVPWMLGAGTGSARMAGMLGLPFCFAQFIATEECPEA

IEAYRDAFRPSPWLERPQPMLALRVLCADSDAEAEELATCFWMSCTTGWR

AQVQLTDDYRGGAPNLDDARRYRLTAEDLALRESRPFLQISGTPAAVGKE

IRRLQAVYGVSEVVLTTNCPGLPARRRSYELLAGEFASPAA

SEQ ID NO:122 orf22 actR 反应调节子  231aa

MRSAARGGPIVTDVLVVDGEALVSIGIKMILESTGGFAVATTDRENLRSA

VEQHRPAVVLLDGHSAQSDGLEVLDQLRALSSPPAIAMLTTLAPPELVLD

SLRGGACGFLLRDSQPEQLVAAVRALAEGSIVLAPEASSVVVRAGSRGSA

AGAGSPACERVKQLSDREQSILRLLGAGLTNAEISRQLFLSAATVKEHVS

VILSKLGVANRVQAAVLAYASGLSSDDVCLS

SEQ ID NO:123 orf23 actT ABC transporter associated permease812aa

MIFALAWSQLRAYPARLFAIVAAVMLATGFLAATATFAATSGEGLRRTAA

APLTTADIVLDADDTVRDPAWYEAAAAVPGVRSVDAQYARTVSVFGGSRR

GSANVQSIAATPQVRWFTLDRGAWPTGPGQLVADQRTLDDLGIDVGATLT

VRHGEAAPQPVTVTGAADLGFRPLTGSDFRFYADASFFAGDVPPAALLTV

ADDASLTGTVDALRRSMGPGISATDASAAADQAAARFAGGNGQLVVIMLA

FAAVALLAAVLVIANTFHVVIVQRIRQIALLRLVGGHRAQVSRVVLAEAA

IAGTAGGLVGAAAGVGLGYLGADLLDISGGGLRVNPFALAGCVLAGVLAT

LVAAWAPARRATRIAPVRALQAADEPPAGTVRGGRRLVVGTVVTVVGAAA

LAVAAIGASLPLALLGGLLLAAGLLAALPRLIALSLAPAARLLERFGVAA

GLAGTSLSQNARRTASAAMAVVVGAALITCLAVAATSGRATVNADLEARY

PVAAGLRTDGEPISGATAGAFAAVPQLSASGTVGTVAARFPDGGKATPRL

LAAPGDELAARVAPELAGEPVVLVPATYLAELGLPDSAPIVVEVGERRVN

LIARASRLADTTGQLLGVVSARTLAANRIEAVPTTVWGVADPGFDREALS

AAVGAVAARDALVQVGGGVTEGGDIANVLSILLGLSLAMLAVTVVIALLG

IANLLGLSVVERVREMALLRALGTRRARLRAMLAVEAVVITLLGTVAGLV

VGVPVGLAAVAAAVGRTADPVIRLPWGQLAAVLVVAVLTGVVASLAPARR

AARVAPAEGLTR

SEQ ID NO:124 orf24 推定蛋白 244aa

MIVWPERRAASRSPPSSARPVAMSSAPVGSSAKTTDGLASSARATATRCC

WPPDSSDGRCPSRSVICSESVIFRSSPGSTRRPASRSGSTMFCSAVSVGS

RLNAWKTKPIRSRRRSVRARSSRPANDRPARLTVPAVGVSNPASRCISVV

FPEPDGPMIAVNWPAEKPADTPSTAVTAAGPVPYVLLTSRQLTISACVVC

VVTAPTLEIRADRHIPPRDPGRAVDRYLRMTRRYRPRAPCSRNR

SEQ ID NO:125 orf25 反应调节子激酶 367aa

VLRIDALVAAAVVIGCLLLGLAGLSEWYWSAAVAVPLLLRRSAPRCFLAL

VAGVSGLHLLASHSFMFPGDLVALVAVHAAAAHAPGRARHAGLLLGAAGA

LVVAAQALQDQRLGSALPAVLIVASTMAAWSIGLMQRQQRSAVLDAEHRR

RLAEQDSAMRAQLAVHEERTRISQEMHDIIAHSLASIIAQAEGGRVAARA

DARIAGPVFDRIAGLGRQALTDVKRLLTVVDHDDEWHDDGLERLPVLLAG

VTEAGLDVTVDSSGAPQPLAAGMDLAVYRVIQESLTNVLKHAPARRACLR

MRWTPALLTVTVSSPLPGGRGAGLVEGRGLSGIRQRCSLFNGDCTVTATT

ELTVTTTWPLTPEGARA

SEQ ID NO:126 orf26 反应调节子传感器 220aa

MTRPPIAVLIADDQELVRTGFAMVVDAAPDMRVVAIAASGAEAIELAAEH

RPDVILMDIRMPGTDGITATSAILAAGGERPPKIIALTTYDSSDYATRIL

TAGASGYLLKDATAEGLTAAIRSAYHGGSVIAPTTTRNLVAARAEPPPPA

RDPAPLDTFTARERDVFDLIVAGANNAEIAARLHLAEVTVKTHVGRVLAK

LGVRDRLNVVVWAYRNGAVG

SEQ ID NO:127 orf27 青霉素结合蛋白 782aa

MLICGLIAGVVVAAAAFPFAAMSGLAAKAGQQTFASLPSELKAFRSPQIS

RIYAADNRTQVAQFYDEFRSDVPLKEMSPFMRDAMVAAEDRQFYQHHGVD

LKGAARALVNNRNGGQKQGASTITMQWVRISLAYSATKPQDVIDATEDAP

KRKVAEMKYALEVEKQLSKDQILERYLNIVPFGKQTYGIYAASRVYFNKK

PKDLTIGEAALLAAIVKAPSAYDPTDPDGYELIRQRRNAYVIPGMVEMGA

ITRAQADAALKEAIPRKVRPMSNGCVSVAKNNWGFFCDYFYRWWMERKEF

GPTPYDRERRLKSGGYRITTTLDVKAQKQARDRIGDLISEKNKNALLLAA

VEPGTGKVRMLAANRRYKLDDPDDPQNAISSDPRKARKGIRGSYPNTTNP

LLTGGGDITGYQAGSVMKMFTIVAALEQGYPLAYTIRTQSRYRSRYIIES

SNDAACPGTHFWCPSNAGGGGEGVFNMWTGLGRSINTYFVPLEERVGAEK

VVSAAKRFGIQFREPDDALLAEPGNAHQWGAFTLGVSATTPLDMANAYAT

LAADGMYCPPTPIERIATRDGDQLDVGRSPCVRATAKDVARAALDAARCP

VGDSAQLGRCGGSTAGITRSVVGHPVFGKTGTTDRDRTASLIAGTTALVV

AGYLVNPDYQNHRDRLDHDQVNPAVYRTLADYMEGRPRESFKRPSSGRIA

FGDQRSIPDVECDPMPRARDRLEDAGFDVWRGQEVESDCPAGTAAGTEPS

GRTVKNGVVVIQVSKGRRGASPPIFPPIGPPR

SEQ ID NO:128 orf28 甲基转移酶 253aa

MAPLTRSLRYYYGDAGREAAMDAMYRRFVRPGDVVFDIGAHVGDRVACFR

RLGARVVAVEPQPLCMRALRALYAHDDRVALVEAACGPAGGSVPLYINSA

NPTVSTNSVRFLTAATGSRGWENEVWDQQITVPAVTLDTLVQRFGLPAFI

KIDVEGYEDAVLAGLSRGVRALSFEFTTIARDVARRCLDRAGELGFDGFD

VSLGETMARTFGRWAARDEMLAHLAGLPHEANAGDVYAVSRSAGWPDRRE

DRR

SEQ ID NO:129 orf29 水解酶 261aa

VPRFDSRLVTVGGVRTHDRHACHAGGLPVVLVHGLAVSHRYLMPTAHALA

GRHPVLVPDLPGFGFSDKPRRAYDVGRHAEHLAAWLDVLGVPRACIAGHS

FGAEVAARLAVLRPDLVAAVVLASPTTDPAARSRRALIGRWAVDLWIEAP

WQAPVLVRDIADAKPWRVLATVGHSVRNAIEEDLRRLPVPPLVLGGSLDP

VAPLRWRAEVAAMTGGVSVTVPAAAHNVMTTSGVRSARAIAAYLRTRRRC

MDRLIGGMPPP

SEQ ID NO:130 orf30 反应调节子 244aa

VSPPFRLDEAVADVYGDLRLAPVLRRLLRHSGRLTGSVAGSVSLIDADRG

CYVKAAEYGANCQLGRSFPLDEGATGRAFGSRRPVVIPDYGQLRAGHLAA

AHPARKGPAVAVPIWWRGDVIAVNVAFAPAFSLGGVDELEALTQSAAAAI

VRSRGVRVRADPPYAAPAAPFTPREAEVLDLLRQGLTDREMARRLGLSAK

TVEKHVGAIRRKTGTSNRTAAVVTALDNDWVGNLPHTAEHTTGS

SEQ ID NO:131 orf31 果糖二磷酸醛缩酶 281aa

MKDILDRALAERYGVAAFNIVNDLTVEAVLAAAAEERAPVILQTSVKTVR

MYGRPRLYEIVHAFAHDAPVPVTLHLDHCPERSVISDCLAGGWNSVLFDA

HELDVADNLRQTTEVVAEARRAGAHVEGEIEGIQGVEDDVGNDYAPMVQS

LEVAVDFIKRTGVDCFAPAIGNAHGQYKQAPVLNTRRVSDLVAATGIPMA

LHGGTGLSDEQFTDLIARGCAKVNISTALKESFMKSGLEFLREADERGKW

DPPSLFRHQRAAVVEMARQHIRLFGGSGRAW

SEQ ID NO:132 orf32 水解酶 192aa

MGSAVAVPASAGGGRRDGPAAHPALRRIGARVVNALVFDCDGVLADTERH

GHLPAFNATFEQFGLPVRWSEEEYGEKLRIGGGKERMASLFADPAFAAAA

GDTDRTELLRTWHRAKTAAFTKLVAEGRIPARPGTARIISEALRAGWTVA

VASTSAEDSVRAVLVNAVGATTAERIPVFAGDVVPAKKPDPA

SEQ ID NO:133-SEQ ID NO:199

(Null)

SEQ ID NO:200: CosAL02(40402bp)

GATCAGGTCGACCGCGGAGCTGATCTGGTCACGGATCGCGCGGATCGGCAGGTCCATGCCGGCCATCAGCA

CCATCGTCTCCAGCCGGGACAGCGCGTCCCGCGGCGTGTTCGCGTGCAGGGTGGTCAGCGAGCCGTCGTGG

CCGGTGTTCATCGCCTGCAGCATGTCGAGCGCGGCGGCGTCACGGACCTCGCCGACGACGATCCGGTCCGG

GCGCATCCGCAGCGCGTTGCGGACCAGGTCGCGGGTGGTGATCGTGCCCCGGCCCTCGGAGTTCGGCGGCC

GGGACTCCAGGCGCACCACGTGGTCCTGGACCAGTTGCAGCTCGGCGGCGTCCTCGATGGTCACGATGCGC

TCGTCGGCCGGGACGAAGCTGGAGAGGACGTTCAGGATCGTGGTCTTGCCGGAGCCGGTGCCGCCGCTGAC

CAGGATGGTGCGCCGGCCGCGCACGCACGCGTCCAGGAACTCGGCGGCCTGCCGGGTGAGCGTGCCGTACT

GCAGCAGGTCACCGACGGTGAGCGGGACCGCGGCGAACTTGCGGATGGTCAGCGTCGAGCCGTCCAGCGCG

ATCGGCGGGACCACGGCGTTGACCCGGCTCCCGTCCGGCAGCCGGGCGTCGACGGTCGGGCTGGCCTCGTC

CACGCGGCGGCCGACCCGCGAGCAGATCCGGTCGATGATCCGGCGCAGGTGCTGCTCGTCGTCGAACTCGG

CGGCGACCTTCTCGAGGCGGCCGAACCGCTCGACGTAGACCGAGTACGGCCCGTTCACCATCACCTCGGTC

ACCGACGGGTCGCGCAGCAGCGACTCGATCGGTCCGTGGCCGAGCACCTCGTCGGTCACCTCGCGGGTGAT

CCGGGCCCGGTCCGCGCCGGAGAGCGGGGTCTCCTCCCGGGCGAGCAGGTCGTGGAGCGCGTCCCGGACCC

GGGCGTCCAGGTCCTCGCTCTGGCCGGTGGTGTAGAGCGTCGGCCCGAGCTCGTCGGCGAGCCGCCGCTGG

ATCCGCAGCCGCACCTCGCCGACCTGGTCCTGCGGCGGGCGGCCGGCGGCCCGGTAGCGGTCGCCGCCGCG

TGGCTCGGTGGGCGGTGGTGGGGGCGTGCCGGCGCCGCTCAGGCGGCTGGAGAGGCTCACGGGAACAACCT

CCCGAGGAACCCGCGGCGCCGCTGGGGTGTGGTGCCGACGCCGGCGATCCGGTCACCGAGCTCCCGGATCG

CCCGGCTGACCGGGTGCAGCGGGTCGGTGACGGCGATCGGCTCGCCGTGGTTGACCGAGACCGTCACGTCC

CGGCTGGCCGGCACCTGCACCGCGAACGGCATGCCGGCCGCGACCTCCACCTCGGACGGGCTCAGGCCGAC

CTGGGCGCCGGCCCGGTTGAAGACCAGCAGCCGCTTGTCCTTGGGGTAGTCGAGCAGGTCGAACATCTCCG

CGGTGAGCCGGACCGACTTGAGCGCCGGAAGATCCGGGGTGACGATCGGGATGAACCAGTCGGACATGTCC

AGCGCGGCCAGCACCTGGTCGGTGACCACGGACGGGGTGTCCACCACGATGAAGTCGTAGAGCGGGCGGGC

CACGTCCAGCAGCTCGACGACGAACTCCCGGCGGACCTGCTCGCCCTCGGCCGGGCTGGCCGGCGCCAGGA

GGGCGTCGAGACTTTGCCGGTACGTCGTGACGATCGACCGCAGCCCGGGCTCGTCCAGCCGACCGGCCATC

TGCAGGCCCCCGGCGATGTTGCGTTCCGGGGACAGCTTCATCATGATCGCCACGTCGCCGAACTGCAGGTC

CAGGTCCATCAGCAGCACCCGGCGTCCGGCACCGGCCAGCGCGACGGCCAGGTTCACCGCCACCACGCTGC

GCCCGCAGCCGCCCTTGCCGGCGAAGACCGTGACCACACTGGCGTACGGGGCGTTGTCGCCGGTCCCGCGC

ATGGTGGTGCTCAGCGCCTTGGACAGGTCGACCGACCGGACCGTCGCGCTGCGGATGCCCTCCTCGTCCTC

CTCGGCGACCAGGTCCCGGATGCCGGACTGCAGGCAGCGCAGCACCACGCCGGCCTCGATCGCGTGGCGGA

TCAGCACCACCCCGATCACCGGGCGCTGCAACCGCTGGTACGCCGTGAACATCAGCGCCTCGTCCAGGTCC

ACGACCGCGCCGATCACCACGAGCAGCGTCTCCGGGTAGCGGGGGAGATACGACTCCAGCTCGCTCATGCT

CTTGAGCATCGTGCCGCCGATCGCCCGGAAGTCGTTGCCCCAGTGCGTGCGGCGCTCGTCGTCGGGCTCGA

CGTACACATAGAGGCTCATCGCACGACCCAGCTCGTGTCGATCGCCGGGCCGGTGCTCGCGGTGGCGTTCG

GGCCGAGCAGCGCCAGGTAGAGCGATCCGCTCTGGGCGGCGTGCACGAGTCGCAGGGCGTCGGTGTCGCCG

ACGGCCAGGGTCACGACGTACCGCTGGATCTCCTTGACCGCGGCGGTGCTGTCGCCGGCCGAGGCGGACGG

ACCGGGGGTGGGCGAGGGCGACGGCGTCACGGGGGCCTGACCCGGTTCCGCCTCCCCGATGGTGATCACCC

GTGCCTTCGGCAGCAGGAGCTCGGTCATCGGGATGGTCTCGTGGTCCTCCGCCATCAGGACCTTCGCCTGG

TACGTGTAATAGACCGCGACCTGGTCGCCGGGCGTGATGTTGCCGGCTACCTGCGGGGCGACGTTGAGCGC

CACCGAGACCGCGAGCGACCTACGGGGCACCGGGATCCGCCCGGTGTGCGACGGCGCCGGTGACGCCGGGA

CGAACAGCGTCCGCATGAGGAGCTGCCGGGGCTGCAGGTCCCCGCCGAGCCGGAGCGGGTCGAGCGCGCTG

TCCCAGGTGGTCAGCGCCCCGGCGGGCACGGTGACGGTGGGGACCAGGAGCCGCTCGGTCAGGCCCCGGGC

GCGGATCTCGGCGCCGCTGGTCCCGGACGGGATGTGCTGCCCGGCGACCAGGATCCAGGTGCCCTCCCGGC

CGCTGAGCGCGCGCCGGTCGGCCGACCGGGCGTAGGACAGGACGGCCGCCCCGCTGATCCCGGCCAGCACC

AGCGCGGCCAGCAGGATCAGGATGCGGCGGCGCATGACTTCACCTTCTCAGGCACCGGTCATCCCGTACGG

CCGATCACCATCGCGCCGTAATACCGCGAGGTGGCGAACCGCGTCGGTACGTGGTCCGTGACCAGCGCTCT

GGTGAAGTAGCCGTAGAGGCAGGACTGCGCCGCGCACAGCGCTCTCTGCGCCCCCGGCACGAGCGAGGGGA

CCGCGGATCCGGGTGACACCGGGCCGCTGACCGGGCTCTCGTAGCCGGTGAGGACGAGCGGCGCGAAGCCG

GCGATCCGGTAGTACGACGGCAGCGTGCCGATCACCGCCACCTGCCTGTCGAAGATCGGCACCAGCACCGG

CTGCCCCGAGGTGATCAGGACGTTCAGCCGGTCGAGGCAGGCCGTGGCGGCGGAGGCGTTGCCGGGGCCGA

TGGTGAATCCGCCGACCCAGCTGTCCGCCGGCCCGTCGGTCGCCGGGATGCCGGTCAGCTCGCAGGAGGCG

TCCGGTGCGCTGACCGGCAGCAGGCCCGGCAGCGCCGGCGGGCCGTCCGGCTGCCCGAGCCACGTGTAACC

GGCGACGGTCTCGCCGGCGTCGGCCGGGCAGGACGTGGCGAGGATGCCGTCGCTGATCGGGATGTAGCCGG

CCGTCGGGTCGGAGAGGCCGAGCAGCGGGTGGACGCCGGTCTGCGGGTTCGGGCCGGTGGGCGGCGGCGGG

GCGAAGAACCTCGTGTAGTCGCCGGTCAGCCGCAGGAAGTCGCACCGGGAGACGCCGAGCGCGAGGACGTC

GGTGACCGCCGGAGCTCCCCAGGCGACCCGGCCGCAGGCGCCCATCTTCGCCCCGTGGTACGCCGACCCGG

CCAGACCGCGCCCGAACAGCGGCGGCACCACCGAGGTGTTGTCGCTGTTGCGGGTGGACGTCCGGACCTCG

ACGTACCGGTACGGCCCGGAGGCGCTCGGCGGCGCGGGGCACGTGACCGGGGTGTTCCAGGAGCTCGGGCA

GCCGGCGTCGGCGGTGGTGACGCCGGCGGCGGAGACGGTGGTGATGCAGAACTGGACGTCCGAGACGAGGT

CCTTGGCGTTCCGGTCGGCGTACCGCTGCGCGTTGTCCCGCTGCGCGGCGACGGTGCAGGTGGCGGACGTC

AGGTCCCGGCCGGCCGTGCCGGCGCAGGCCTGCGCGACCTTCCACGACGCCGCGTCGGCCCCGCTCTGCAA

CTGCTCCCGCTCGGCGTAGAGCGCGCCGATGTCGATCACCAGCGCCGCCATCCCGAGCAGGACGCCGGCGC

CGGCCAGGACGGCGACCAGCGCGGTGATCACGCCGTGCTCGCCGCGGGGCGGGAACAGGGCGTGGATCAGC

CGACGCATGACATCACGCCGGTCGCGCTCATCGTGATCGTGCCCATGGTCTGCCCGCCGACCAGCCTGACC

AGCGCCACCATCGGCGTGATCGGCTGGTACCGGCGGGTCAGCACGACCTCGGCGTCGGCGCCGGCGAGCGA

GGTGGCCGAACAGGTCGTGACGGTCTGGGTCACCGACGGCGCCCCGGTGGCGCCGACGATGCCGTTGACCT

TGGCGTGCACCGCCGCGGCCGTGCCGTTCAGGGCGCCGAGCCGGGCGCCCTCCCGGGCCGCCTCGGTGAGC

TGGATGTACTGCTGGAGCAGCCGGCCCATGTCGATGATCCCGAACAGGATCAGCAGCAGCACCGGCATCAC

GATGGCGGTCTCCAGCGCCGCGGCGCCCCGGTCCCGGTTATCGTGCGGAGCTCTCCGCTCCCTGGGCGAGA

ACCGTACGCAACATCCCGGCCAGCCGGTCCGCCGTATACGGCTTCGCCACGAATGGCGACCCGGCACGGAT

CAGCCCTTTCTTGATGGCGATCTCCTCCGGGACCCCGGAGACGTAGACGATCTTCATGCCCGGCCGGACCT

CGGAGGCCGAGCGGGCCAGCTCCCCGCCGGAGACTCCCGGCAGGCCCAGGTCGGTGAGCAGCACGTCGATC

GCTCCGCTGTGCACCCGGCACGTCATGATGGCGCTGACCGGGTCTTTCGCCACGAGGACGACGAACCCGCG

CATCTCCAGCATCTGTGCGGCGAGCTCACGCAGGTCCTCGTCGTCCTCCACCAGGAGAACGACCGGCCCCT

GCCGCTCGGTTGCTTTCCACATCATTCCTCTCCCGGTGCACGAGGAATCCGGCGACGACTCTTCCCGTCGC

TGCCTCTGCTCACGCTATCCACCGGCCTGCCTGGCCCGGTGGCATTCGCGGAAATGTCGATGCCCTCAAAT

CAGCATTTGTCCGGCGGCACTGTCCGTGTTAACGCTCACTACGTTGCGCTGACGTCACGTTTCGTCCCGGT

AACAGTTCGGGGTCTTGACAGATCACGAGCGTCGATGGGTGAATGTGTTCAATCCTGATCGGACGAGTGCA

GGATAAACAACGTTTGCGTGTGAAGCCGTTTGGCTTTGAGGGGGCTCCATGTTCAATTACGTCAGTTTCGT

GCGCCCTAAAACCTTTGCCGCCACCTTCGCGGCAGCCGCCCTGCTGCTCGGCTCGGGCGCCTGCGCGAAGA

GCGAGGACTCCGGGGACACCGTGGCGGCGGGTCCCGCCCCGTCGGCGGCGCAGGTGGTCCAGTCCGCCTCG

GCCGGCTCCGCGACCTGTGCCTTGGATCAGTACGGCGCGTCCAAGCTCGACCTGAAGACCGCCTCCGTCGG

CTTCTCCCAGTCGGAGAAGGAGGCGAACCCGTTCCGGATCGCCGAGACGAAGTCCATCAAGGACGAGGCCG

CGAAGCTGGGCATCACCAACCTCAAGACCTCGAACGCGAACTCACAATTCAACAAGCAGATCGCCGACGTC

GAGCAGATGATCGATGCGGGCGTGCAGCTGCTGGTGATCGCGCCGCTCAACTCGGACGGCTGGGACTCGGT

GTTCGCCAAGGCGACGGCGAAGCACATCCCGATCATCACGATCGACCGGAAGATCAACGCGACCGCCTGCA

AGGACTACCTGACCTTCATCGGCTCCGACTTCGCCGAGCAGGGCAAGCGGGCCGCCGACGCGCTGGCCAAG

TCGCTGGGCAACAAGGGCGAGGTGGCGATCCTGCTGGGCGCTCCCGGCAACAACGTCACCACGCTGCGGAC

CAGCGGCTTCAAGGACGAGATCGCCAAGGTCGCGCCGGACATCAAGATCACGTTCGAGCAGACCGGCAACT

TCTCCCGGGAGGACGGGCAGAAGGTCGCCGAGCAGCTGCTGCAGTCCAAGCCGAACATCAACGGCATCTAC

GGCGAGAACGACGAGATGGCGCTCGGCGCGATCACCGCGCTCAAGGGCGCCGGCAAGAAGGCCGGCGACGT

CAAGATCGTCTCGATCGACGGCACCAAGGGCGCGGTGCAGGGCATCGTGGACGGCTGGGTCTCCGCGGTGA

TCGAGTCCAACCCGCGCTTCGGGCCGCTGGCCTTCGACACCGCGACGAAGTTCTTCGGCGGCGAGCCGGTC

GGCCAGGACATCGTCATCCAGGACCGTGCCTACGACGAGTCGAACGCCAAGACCGACATCGGCAGCGCGTA

CTAGAGAGCGCTCCCAATCGGGTGTCCGGGGATGAACCGGGCACCCGCCGGCACGGAGGAGGGCGGCTCAT

GCTGCTGGAAGTCTCCGGCGTCTCCAAGACCTTCCCCGGCGTACGCGCCCTGGACGGGGTGTCCTTCACCC

TGAACCCGGGCGAGGTGCACGCGCTGGTGGGGGAGAACGGCGCCGGCAAGTCGACGTTGATCAAAGTGCTC

ACCGGGGTCTACCAGCCGGACAGTGGCGAGCTGCGCTACCGCGGCGAGCCGGCCCGGTTCGCCACCCCGCT

GGACGCCCAGCGGGCCGGTATCTCGACCATCTATCAGGAGGTCAACCTCGTCCCGCTGATGAGCGTGGCGC

ACAACCTGTTCCTCGGCCGGGAGCCGCGCAACCGGTTCGGGCTGCTGGACGAGGCCCGGATGGTCGCCGAG

GCCACCGAGATCCTGGCCGGTTACGGCGTACGCACCGATGTCCGCCGCCGCCTCGGCACCCTGGCCCTGGG

CGCGCAGCAGATGGTCGCGCTCGCCCGGGCCGTCATGGTCGACGCCCGGGTCGTGGTGATGGACGAGCCCA

CCTCGTCGCTGGAGCCGCGCGAGGTGGAGACCCTGTTCGGGGTGATCCGCGAGCTGCACACCGCGGGCATC

GGCATCGTCTACGTCTCGCACCGGCTGGACGAGCTCTACCGGGTGTGCGACGCGGTCACGATCCTGCGCGA

CGGCAAGCTCGTGCACACCGGCCGGATGGCCGATCTCGACCGGCGCACGCTGGTCTCGCTGATGCTCGGCC

GCGAGTTCGGGGCGGACTTCACCAGCTTCTCCGAGTCACCGCAGAGCACCCCGGAGGGCGAGCCGGTCCTG

CGGGTGTCCGGCCTGACCAGCCGCCCCCGGCTCGACGACATCAGCTTCGACGTGCGCCCCGGCGAGGTGGT

CGGCCTGGGCGGCCTGCTCGGCGCCGGCCGCAGCGAGACGATCAAGGCGATCGGCGGGGCGTACCCGATCG

ACTCCGGCGTGATCGAGGTCGGCGGCGTCCGGCTCGGCAGGCCCAGCACGGTACGGGCGGTCCGCGCGGGC

GTGGCCACCCAGCCGGAGGACCGCAAGGCCGAGGGGATCGTCCCCGGCCTGTCGATCCGGGACAACATCGC

GCTCGCGATCCTGCCGCGGATGGCCCGTTTCGGACTGGTCAGCGACAAGCGGATCGACAGCATCGTCGCCA

CGTACATGAGCCGGCTGCGGATCAAGGCGTCCGGTCCGGACCAGGCGGTCGGCGATCTCTCCGGTGGCAAC

CAGCAGAAGGTGCTGCTCGCGCGGCTGCTCGCCACCGGCCCGAAGGTGCTGCTGCTCGACGAGCCGACCCG

GGGCATCGATGTCGGCGCCAAGGCCGAGGTGCAGGCGCTGATCGACGAGCTGGCGAAGGAGGGGCTCGGTG

TCGTGCTGGTCTCCTCGGACGCCGAGGAACTGGTCGAGGGCGCGGACCGGGTGGTGGTGCTGCGCGACGGC

GCGGTCGTCGGCACCCTCACCGGCGACCGGGTGACCACCGAGGCCCTGATGGCCACGATCGCGGAGGCCGC

GGATGAGCACTGAGACCCTGACCCGCCCGCGGATGACGTTCAACCCGGCGTGGGCGGCACGCTACGGCGTC

TACGCGGCGATCGTTCTGCTGATCGTCGTCAACATCGCCTTCACGCCGTACTTCCTGACCCTGAGCAATCT

GCGGATCCAGCTGATCCAGGCGGCGCCGGTGGTGATCGTCGCGCTCGGCATGGCCCTGGTCATCGGCACCG

AGGGGATCGACCTCTCGGTGGGTTCGGTCATGGCGCTCGCCGCGGCCTTCATACCCCTCTATCTGGGGTAC

GGCGTGACAGCCGCGATCCTCGTCTCGCTCCTCGCGGGTGTGGCGGTCGGGCTGATCAACGGTGTCCTGGT

CGCGAAGGCCGGCCTGCAGCCGATCGTGGCGACGCTGGCCCTGTTCGTCGGCGGTCGCGGGCTGGCCGTGG

TGATCTCCGGTGGACAGCTCAAGGACGTGCGCAACGCCGACCTGCTCTACCTGGGCTCCGGTGACCTGCTC

GGCGTGCCGGTCCTGGTCTGGATCGCGGCGCTGCTGGTGCTCGTGGTGGCGTTCGTGGTCCGGCGTACCGT

CTTCGGCCGGCGCCTGCTGGCCGTCGGCGGCAACCGGCCCGCCGCCGAGCTCGCCGGCCTCCCGGTCAAGC

GGGTGCTGATCGGCGTCTACGTCTTCTGCGCGGTGCTCGCCTCGATCGCCGGCCTGCTCTCGGTCGCGCGC

ATCCAGTCCAGCGACGCGTCCGCGGTCGGCCTGCTGATCGAGCTCTCCGCGATCACCGCGGTGGTCGTCGG

CGGCACCCCGCTCACCGGCGGCCGGGTCCGGGTGCTCGGCACCGTGGCCGGGGCCCTGCTCATGCAACTGG

TGGTCGCCACCATGATCAAACACGATCTCCCGCCGTCCACCACCGAGATGGTGCAGGCCGTGATCATCCTG

GTCGCGGTCTACGTGGCCCGGGAGAGGAGGACCCGGTGACCATGTCGATCCCCGTGCCCGCTTTCCGGAAC

CCCCGGCTTCCGCAGCGCGGACAACGCCGGCACGATCCTGGTCGCCGCGGCGCCACCGATGCTGATCGCGC

TCGGCATGACCTTCGTGATCATCACGGGCGGGATCGACCTCTCGGTCGGCTCGCTCTACGTGCTCGGCGGG

GTGGTCGCCGCCTGGGCGTCGCAGTGGGGAGTCGTCGCGGCGCTGGCCGCGCCGTTGCTCCTGTGCGGGGC

CATCGGCGTACTGAACGGGATCCTGATCTCGAGAACCGGGATGGCGCCCTTCATCGTCACCCTCGCCGCGC

TGCTCGGCGCCCGTGGCCTCATGCGCAGCATCAGCGATGAGGGCTCGACGACGTACCTGGTCAGGAGCGAC

GTCTTCCACGAGCTGGGCACGGGATCCCTGCTCGGCGTCGGTCTGCCGGTCTGGCTGGCCGCGGTTCTGGT

CGGCGCCGGGATCCTGGTGCTGAACCGGACCCGGTTCGGGCACGCCGTGCACGCCATCGGCGGGAGCGAGG

ACGCCGCCGCGCTGATGGGGCTGCCCGTACGGCGAATAAAGGTCTGGGTCTATCTCCTCTCCGGGCTGCTC

GCGGGACTCGCCGGTGCGATCAACGCGGCCAAGCTCGGCTCCGGGGTCACCGTGCTCGGCAGTGGCATGGA

GCTCGACGCCATCGCCGCCGTCGTGATCGGTGGCACGCTGCTCACCGGCGGCTCCGGGTCGATCGCCGGCA

CGGTCGCGGGGGTGCTGCTGCTCGGCGTGATCCAGAACCTGATCAACCAGGTCGGCAACGTCAACAGCAAC

TGGCAGCAGGTGATCAGCGGTGGGTTCCTCGCCGCTGTGGTCGTGGCGCAGACAACTCTCGTACGCGCAAG

AAGATCTTGACGTGGAGGCCCGCCCGGGGACCCTGCCGCGGGCGGGCAGGCGTAGGTTGCCCGCATGACGG

AGCATCGGGTCTCCCCGGCCGGGCGGGCGCTCGCGTGGCTGATGCTGGTCTCCGGGTTCGCCGCGGTCGTC

GGGTCGTTCCTGCCGTGGGCCTGGGTCGACTTCCCGGAGCAGGGCAGCAGCCAGGTGTCCGGGAGCCTCGT

GTCCGACCTGTTCACCGCGTTCTTCGGGGTCGTGCTCGCCGGGTACGCGGTGCCCGCCGTGCGCGGCGAGC

GCCTGCCCGGCCTCGAGACGTTCTTCTCGGTCGGCGCCGGGCTGGTGCTGTTCACGCTCGGGGCCTGGGAC

AGCCGGCACCTGACCTCGATGACCGCCGCCCTGGTCGCGGCCGACACCGGCACGACCATCGGGCCCGGTCT

CTGGCTGTGCATGATCGGCGGCCTGCTGGGCGCGCTCGCGGCGGCGGCCCTCGCCGTCCGGGGACGCCGGC

CGGTCGTCAGCTCCCGGGTGTGACCACCCAGTCCGGGTGGTTCGGCATCGGAGGGGTCGTGACGCCGAGGA

GCCAGGAGGTCAGGAACGGCCGCAGATCCTGGCGGGCGACCCGCGAGGCGAGCGTGATGAAGTCACCGGTC

GAGGCGGAGCGGCCGCGGTACGTCGTCAGCCAGGCGCGTTCGACCCGCTGGAACGTCGCCGCGCCGATCTT

CTGCCGGAGCGCGTAGAGGACCAGCGCGCCGCCGGCGTAGACGTTCGGGTTGAAGACGTCCCACGTGGTCG

CCGCGTCGAGCGGGGCGGCGACCGGACCGTACCTGGCGCGGAAGATGTCGCCGGCGGCGTAGACGGCCTTG

AAGAACGCCTCGCGGTCGGCCAGGCCGGTGTACTGCGGGAACCCGCCGGTCTCCTCCGACCAGAGCATCTC

GTACCAGGTGGCGTGGCCCTCGTTGAGCCAGACGTCGCTCCACGAGAACGGCGAGACGCTGTCGCCGAACC

ACTGGTGGGCCAGCTCGTGGGTCATCGACGGGCCGCGGGTGGTCTCGGGGCCGGTGAACAGGGCGGCGCCG

TACAGCGAAAGGGTCTGGGTCTCCAGGGCGTAGCCCAGGTCGTCGTCGATCACCAGGGAGCCGTAGTCCTC

GAACGGATAGGGCCCGGCCTGCTTCTCCATCCAGGCGAGCTGCTCGCGTTCCCCGGCGATCGCGGGCAGCA

GCGTGCCGGCGAGGCGTCGCGGCACCACGTCGCGGATCGGGGTGCCGCCGGCCGCCGGGCGGCGCTCGACC

ACGAAGTCGCCGACGGCCGTCTGCACCAGCTCGGTGGCCATCGGGGCGGACTCGCGGTAGACCGAGCTGAC

GTGGCCGTCGTGCTCGGTCGTGCTCACCAGCGTGCCGTTGGCCGTCCCGGTCCAGCCGGCCGGCACGGTGA

GCGTGATCGTGAAGGTCGCCTTGTCCCGTGGATGGTCGTTGCCGGGGAACAGCAGGTGCGCCGAGCCGGGC

TGGGCAGCGAGCACCGTCCCGTCCGGCGTCGCCACGAGAGCGGCCGGGGCGGCGGTGAAGTTCGCGACCGT

GACCCGGAACAGCCGCCCCCGGGGAAGGGGGCGCCGCGGGATGACGGTCAGCTCGTCGCCGTCCCGGGCGG

CCCGCGCGGGCTGCCCGTCGACCGAGACGCGCCCGATCGAGGCGCCGCCGAAGTCGAGGTCGAAGCGGGAC

AGGCTCTGCCCGGCGACGGCGGTGATCGTCACATCGCCGGATACGACCTGCTTCGGGTCCTTCTCCGGGTA

GCGCAGGCGGAGGTCGTAGTCGAGCACGTCGTAGCCGCCGTTGCCGAGCAGCGGGTAGAGGCGGTCGCCGA

GGCCGGCGGACCCGGGTGACGGCGAGGGCCCGGCCTGCGCCGGTGCGGCGGCTGCGGCCAGGGCGAGGACG

ACGGTGGCGCCGACGGTGAGGACGCGGGTGCCCGCGGACGTTCGCATGGCTTCCGACGCTAGGCGACACCA

CCGGAAGCCATCGACCCATGGGCATGTATGAAATCCCACAATCTCCGATGTGGACGGACGGATGGTGCGCA

GTATGCAACTTGCAGATTTCGGGACATTCCCTAGCCCGGCGGTTGCCGTGTGCACCCGTTCGACCACTGTC

CGGAACCGCGTGGTGAGCAGGGTGAACGTTCATGCGGCCCGGGCCGCCGGAGGTCCCGTGACCGTTCGCAT

TGCCGTGCGCCGGTGAATCACTCCGCTTTACGACTTCGCGACAAGTGGTTAATGTCGGCGAAGCGATATAT

CGTCCAGTTATTCGGGGGACTGCGGTGCATGAGCAAAAAATCACTCCGGCGATTGCCAGCGGATCACCGCA

AATTGAATTGCTGCCCGTCAATTCCCTGCGAGTGATGGATTCGCCGCGACTGAACGGTGAGGACCCGCGGC

ACACCGAGGTGCTCGCCGGCTTCGGGGCGGAGCTCCCGCCGATCGTCGTGCACCGGGCGACCATGCGGGTC

ATCGACGGCGCGCACCGGCTGAGCGCGGCCCGGCTGCGCGGCGACGACCGGATCAGGGCGGTGCTGTTCGA

CGGCACCGAGCAGGAGGCCTACGTGCTGAGCGTCAAGGCCAACGTGACGCACGGGCTGCCGCTGTCCGCCG

CCGAGCGCACCCGTGCGGCGGAGCGCATCATCACGATGCATCCTGACTGGTCGGACCGGATGATCGCGGCG

TCCAGCGGGCTGGGCGCGCGGACCGTCGGCGGCCTCCGCCGGCGGCGCGCGGCCTCCGGCGAGAGCCCGGC

GGGCCTCCGCTCGCGCGCCGGCCGGGACAGCCGCGTCCGGCCGGCCGGCAGCACCGCGGGCCGGCTGAAAG

CGGTCGACTACCTCCAGGACCGGCCGGACGCCTCACTGCGGGAGATCGCCCGGCACGCCGGCGTCTCTCCG

TCGACCGCCCGTGACGTCCGGGACCGGCTGCACCGCGGCGAGGACCCGATCCCCGCCACGCAACGCGCGGC

GGCACGCCCCGGAAACGATTCCCCGCCGCTGCGGTCGCTGGTCCAGGGCTTGGCGAGCGACCCGTCGTTGC

GATTCAGCGAGTCCGGGCGCGATCTGCTGCGCTGGTTGATTGCCCACGCCGTTCAGGACGGCGAATGGAAA

GGGCTGGTCGACACTATTCCGGCGCATTCCGCGCAGGCGCTGGCGAAAATCGCGCGCCATTGTTCGCGGGA

ATGGCGTGAGTTCGCGGACATCCTGGAGAAGGACGCCGCGTAGGCCACCGGCATTTCTTCCGGCACCCGGT

CCGCCCTCCGTCACGCACAGGTCAGAGTACTGATGGCGGCTGTCAACCCGCCGATCTGCGGGTAGGTGCCG

ACGTCCTTCCGCCGACCGTCTGCCGAACGCATCCGGTCGGTGCCCGATGTGCGGGTAGGCATTCACCGATC

AGGGTTGCTCCAATGTCTCTCGTCGATACCGCGGCTGATACCTCCGCGGTACTCGGCAGAACACTCCGTGG

CTATGGCGCCGTGGTCCCGGAGCCTTTCCTGAAGTACTTCGGACGTACCTGTCCGGAGTCCCCCACAGAAG

GAGACATCATGTCGGCCATCACCGTGGAAACCACCTGGAAGAACACCGACCTCCGGGAGGACCTCACCGCT

CACCCGGCCGGCCTCGGCTTCGGCGAGCTGAGCTTCGAGGACCTGCGTGAGGACCGCACCATCTACGCGGC

CAGCAGCGGCTGGGTCTGCACCCTGACCATCGAGTGCGGCACGCTCGTCTGCGCCTGCTGACCAACGGTCA

TCGCACTGCCGGGACCGGGGCTGACCCCGGTCCCGGCACCCTCTCCCCGGCAGGAGCCTGCATGTCATCCT

TTGCGATCGCCGCTTCGCCGGCCAGCGCGTACCTGCACGAGCGCTCCGCCGGCCCCGGCGGCGACCCCGTG

GCGGAGCACGAGCGGGTCGAGTCGTGGCGCGAGTCCGCGTTCCTGGACGACCCGGTCCTGGACATCCGCCT

GCGCGAGCTCGGACTCAGCCGGGCCGAGTTCGGCCGGCTGCTGACCGACGGCGCGTACGACGCCGGGAGCA

CGGCCCTCGACTGGGCCGGCGAGCTGGCCGCCGTGCTGGCGACCGGGACCGGCGCGGTCACCGGACTCGCC

CGGTCGACCAAGCTGTGGGCGCAGGGCTTCGACCGGCTGCCGTTCGCCGGGCTGATCGAGAGGTTCCTCGC

GTACTACGAGCCGCGGGTGCCGCGCACCGCCGGGACCGTCCGGGTGTCCCTGCTGGAGAGCCTCGCGAACC

GCCTGCTCACGGTCGCGACCCGGACCCTGCTGCTGGAACTGAACGTGGCCCGGGTGCACGGCCGCCTGACC

GGCGCCACCCCCGGGGAACGCTACGACCACTACGACCGGGTCCTGCTGACCGACCCGGACTACCTGCGCTC

GCTCTTCGGCGAGTACCCGGTGCTCGGCCGGGCCATGGTCGAGTGCGGCCGCCGCTGGGCGTCGGCGATGG

CCGAGCTGTTCCAGCGCCTGGACGCCGACCGTCCCGCCCTGCACGCCGCCGGGCTGCTGCCGGCCGGCGCG

GGCGAGGTCACCGCGCTCCGGCCCGACCTCGGAGACCCGCACAACAGCGGCCGCGCGGTCGCGATCCTGAC

CTTCCGGTCCGGTGCCCAGCTGGTGTACAAGCCCCGGCCGGTCGGGCCGGAGCGCGCGTACGCCGAGACCG

CCGCGGCCCTGAACCGGCACGGCCTGAGCCTGCCGCTGACCGCCGTGGACGTGCTCGACCGCGGCGCCTAC

GGCTGGTGCGAGCTGGTCCGGCACGAGCCGTGCGCCGACCGCGCCGACCTGGACCGCTTCTACCGGCGTAC

CGGCGCGGTCCTGGCCACCACTCTGCTGCTCGGCGCCGTCGACGTGCACATGGAGAACGTCATCGCGGCCG

GCTCGTCCTGCATGCCCATCGACCTGGAGACGCTGCTGCAGCCCGGGGTCCCGTCCGGTGACGCGACGGAC

GCCTACACCCGGGCGCTCGACCTGCTCAACCAGAGCGTGCTGGCGATCGGGATCCTGCCCGCCCGGGCGTT

CGGCGGCCGGGAGCGCAAGAGCGTCGACGTCAGCGCGATCGGCGGCGGCGAGGCACAGACCGCGCCCCGGC

CGGTGCCGATGGTCGTGGAGCCGTTCACCGACGTGGCCCGGATCGAGGCGGTGGAAGCGACCATGCTGGGC

GCGCAGAACCGGCCGGTGCTGGTCGGCGCCGAGGTGCGGCCCGAGGAGCACACCGAGGCGGTGGTGGCCGG

CTTCACCGAGGCGTACGACCTGATCGTCCGGCACCGCGAGGACTTCGCCGACCTGCTGGCCGGCTTCGGTG

ACGTCGAGGTGCGCTACCTGCCCCGCCCGACCCGCCGGTACAGCATGTTCCTGACCGAGAGCTACCACCCG

GACTACCTGCGCGACGCGCGTGACCGCGACCGGCTGCTCGACAAGCTGTGGACCGCCGCGGGCGCCCGTCC

CGACCTGATCCCCATCATCGAGTCGGAGAAGCGCCAGCTGCTGGCCGGCGACATCCCGTGCTTCCGCGCGC

TGGCCGGCGACCGGGCGATCCGCACCGCGTCCGCCCCGGTGGCGCCGGACTTCTTCGACGCCCCCGGCATC

GAGGTGCTGGCCGGCCGCCTGCGGCAGTTCGGGCCGGTGCACCGGGCTGCCCAGCTGCGGATCATCCGCGA

GTCGATGGGAACCATGCCCGCGCCCGGCCCGATCGCCGGGACACCCGCGCCATCCTCCGAGCGGCGTGGCG

GCCTCGACCCCCGTGAGGCCGCCACGCTCGGGGACCGGCTCGTGCGGGAGCTCGCGGACGAGGCGATCCTC

GGGGCCGACGACGCCGGCTGGATCGGAGTCAGCATCGAGGGCCTCGACCAGGAGACGTTCAGCTACAAGCC

GATGGCGACCGGGCTGTACGACGGCATCGCGGGAATGGCGCTGACGTACGCGTACGCCGCCCGCACGCTCG

GCGACGAGCGCTACCTCGACCTGACCCGCCGTACCGTCAAGCTGGTCTCCGGCTATCTGCGGTACCTCGCC

GAGCACCGGATCGTGGAGACGGTCGGGGCGTACAGCGGGATGGCCGGCCTGCTCTACACGCTGGATCACGT

CGCCCATGCCACCGGCGACGCGTCGCTGCTGGGCGAGATCGAGGCCGCGCTGCCCTGGCTGCGGGAGTGCG

CTACCCGCGAGGAGTGCCCGGACCTGATCGCCGGCCTGGCCGGTTGCGCCGTCGTCGCGCTGTCGCTGTAC

CGGCGGCACGGCATCGCCGGTTACCGCGAGGTCGCGGAGATCTGCGGCCGGCGACTGGCCGGCACCGCGGT

CGACGTCGAGGGCGCCGCGGGCTGGGCCGCGACCCGGACCGGCGTGATCCTCGGCGGTTTCTCGCACGGCT

CGGCCGGGATCGCCTGGGCCCTGCACGAGCTCGCCGCCGAGTTCGGTGACCGGGACCTGCGCGAGCTGGCC

GACCGGGCGGTCGAGTTCGACCGGCGGCTGTACGTTCCGGCCGCCGGCGCCTGGCGCGACCTGCGGCCCGA

GATGGCCGGCACCGACGGTTACCCGGCGCTCTGGTGTCACGGCGCCGCCGGCATCGGCCTGTCCCGGCTGC

TGATCCACCGGATCCGGCCGGACGAGCGGCTCGCCGAGGAGGCCCGCGCCGCGGTGGCGCTGGTCCGGCGG

CACGGCTTCGGCCACAATCACAGCCTCTGCCACGGCGACTTCGGCGCGCTGGCCCTGCTCGGCCTGGCCGA

CCGCGCGTGGCCCGGGTCGGGCGGCCACGACGAGCGTGCCGGCGCGGTCGTGCGGGACATCGGCGAGACCG

GTCTGCGCTGCGGGCTGGGCAACGGCATCCGGATGCCGGGTCTGATGCTCGGCGCCGCGGGCGCCGGACTG

AGCCTGCTCCGGCTGGCCGCGCCCGCCGACGTGCCCGCGGTCACCTGGCTGGAACCGCCGCGGGGCACGCA

TGTCTGAGACGGCCGGGCTGCTGCGGCGGAGCCTGCTCGATCACCGGGGCAAGCTCGCCGCCGTGGCCGGT

CTCGCCGTCGCCGGGGTCGGCTGCCAGCTGGGCCAGCCGTTCCTCATCCGGCGCGTGCTCACGGCGGTGCA

GTCCGCACAGCCGTACCGCCAATTGGCTCTCGCCGTTCTGGCGGTCATGGTCGTCGGCGCGGCGCTGGGCG

CCGTCCAGCAGTTCCTGCTGCAGCGCACCGGGGAGGCGATGGTCTTCACGGTGCGCCGCACGCTCGTCGCG

CACCTGCTGCGGCTGCCGGTCGCGGCCTACGACGAGCGGCAGTCCGGCGATCTGGTGTCCCGGGTCGGCGC

CGACACCGCCCAGGTGCGCTCGGTGATCACGTCCGGGGTGGTCGACCTGGCCGGGGGCGTCCTGCTCGTCG

GCGGCTCGATCGCCGGCATGATCATCATTGATCCGGTCCTGCTCGGCGTCAGCCTGGCGCCGGTGCTGTGC

GGCGCCGCCGGGGTCCGGCTGGTCGGCCGTCGGCTGCGCCCGCTCAGCTCGGCGGTCCAGGAGTCGATCGG

CGCGCTCACCGCCTCGACCACCCGGGCCCTCGGCGCGATCCGCACGATCCGGGTCGCCGGCGCCACCGAGC

GCGAGACCGCCCTGATCGTCGCCGAGGCCGACCGCGCCCGGGCGGCGGGCGTCCGGCTCGCCCTGGTCGCG

GCCCAGGCCGGCCCGATCGTCCGGCTCGCCCTGCAGGGCGCGTTCGTCGCGGTGATCGGCTTCGGCGGCTA

CCGGGTCGCGAACGGCGCGGTGTCGGTCGGCGACCTGGTCGCGTTCACGCTGCTGCTGTTCACGCTGGCGC

TGCCCCTGGCCCAGCTCGCCGAGGCGGCCACCCGGATCCAGACCGGGCTGGGCGCGCTGACCCGGATCGAG

GAGATCCTGGCCCTGCCGGACGAGGACAGCGCGCTCGGCGTCCGTGCGAGGACGCCCGCCACGGTCCGGCA

CGATCCGGTGCTGCTGGAGTTCGATCACGTGTCGTTCCGCTATCCCACCGGCGGGGAGATCCTGCGCGACG

TCAGCTTCCGGGTGCCGGCCGGCAGCACCACCGCGCTCGTCGGGCCGTCCGGGGCCGGCAAGTCGACGATC

CTGGCACTGATCGCCCGGCTCTACGAGGTCCACGGTGGCCGGATCCTGCTGCACGGCCGCGACATCCGCGA

CTACCCGCTCGCCGAGCTGCGGGCCGCCCTCGGCTACGTCGAGCAGGAGGCCCCGGTGCTGGCCGGCACCG

TCCGGGACAACCTGACACTGGCCGCGCCGGACGTCGCGGAACACGCGATCCGCCACGTCACCGCATCGGTC

AACCTCGACGACCTGCTCGCCCGTGACCCGGCCGGCCTGGACGCGCCGGTCGGGGACGGCGGCGTGCTGTT

CTCCGGCGGTGAACGGCAACGGCTCGCCGTCGCCCGGACCCTGCTCGCCCCGGGCGAACTGCTGCTCTTCG

ACGAGCCGACCGCCCACCTGGACGCCCGCAACGAGCAGGCGCTGCAGCACGGCCTGACCGCGCACGCCGCC

GGCCGGACGCTGGTGGTGGTCGCGCACCGCCTGGCGACCGTCGCGCACGCCGACCAGATCCTGGTGATCGA

CGACGGTCGTTCGGTCGCCGCCGGGCGGCACGAGGAGCTGCTCGTCCGCGACCCGACCTACCGCGAGTTCG

CCACCCGTCAACTGCTGACCTGAATCCCGAGGTGTACGCCATGCTCAGTGTCCTGGACCAGGTGCCCGTGT

TCCGTGGCGACGACCCCGCCGAGGCGGTCCGCGAGGCCGTCGGGCTCGCCCGGGCCGCCGAGTCGCTCGGC

TATCACCGGTTCTGGATCGCCGAGCATCACGGCAGCGCCGCCAACGCGTGCGCGGCGCCGGAGATCGTGGC

GGCGGCCGTCGCCGGAGCCACCGAACGGATCCGGGTGGGCACCGGGGGAGTGCTGCTGCCGTACTACAGCC

CGCTCAAGGTGGCGGAGGCCTTCCGGGTGCTGGCGGCGCTGTATCCGGGGCGGATCGACCTCGGGTTCGGG

CGGGGCAGGGGCGGGCCGGCGGTGATGGCCGAGCTGCTCAACCCGTACGCGATCGCGACCGAGGAGGCGTA

CGCCGAGCAGGTCGGCCGGCTTCTCGCGTTCCTGGGCGACGCGCGGACCGTCAGCCGGGTGTCGGTCACGC

CGGCGGTGCAGGACCCGCCGTTGCCGTGGCTGCTCGGCTCCGGCGTCGGCAGCGCCCGCCTCGCCGGGATG

CTCGGCGTGCCGTTCTGCTTCGCGCAGTTCATCGCGACCGAGGAGTGCCCGGAGGCGATCGCGGCGTACCA

GGAGTCGTTCCGGAGCTCGCCGTGGCTGGACGAGCCGCAGGCGATGCTGGCGTTGCGGGTGCTCGCGGCCG

GCACCGCCGAGGACGCCGAGGAGCTGGCCACCGGCTTCTGGATGTCGTGCACCACCGGATGGCGGGCCCAG

GTCCGGCCGGACGACGACTACCGGGGTGGCGTGCCGAACCTGGCGGACGCCCAGCGGTACACGCTGACCGA

GGAGGACCTGGCGATGCGCGCGAGCCGGCCGTACCTGCAGATCTCCGGCACGGCGGAGACGGTCGGCGAGG

AGATCCGGCGACTGCGCAAGGTGTACGACGTGGCCGAGGTCATGCTCACCACGAACTGTCCCGGGGCGGCC

GCCCCGGCGCCGGTCCTACGAGCTGCTGGCCGCCGAGCTCGGGCTGACCGCGCCGGCGTGACCCGGGTCAG

GCCAGCTCGTCGGTGGTGAGGCCGGCGGCGTACGCCAGCACGGCGGCCTGCACCCGGTTGGCCACACCGAG

CTTGCGCAGGATGACGCTGACGTACTCCTTGACCGTGGAGTCGCTGATGAACAGGCGCCCGGCGATCTCCG

CGTTGGTCAGCCCCTGCCCGATCAACCCCAGAACGGCCTGTTCCCGGTCGGAGAGCTGTTTGACCTCGTCG

ACCGCGTTCTCGGCGGCCGGAGTGCCCCGGCAGGCCGCGCCCAGCATGATCGACGAGGCCTCCGGCGCCAG

CACGGTCACCCCGGACGCCAGCGCGCGGACCGCCGCGACCAGTTGCTCCGGCTGACTGTCCTTGAGCAGGA

AGCCGCAGGCGCCACCGCGCAGCGACTCCAGCACGGTGCTGGACGCCGCCAGCGTGGCCAGCACCGCCAGC

GCCGGCCCGGACTCCAGGTCGCGCAGCCGGGTCAGCAGCGGCACGCTCTCCGGCAGGGTCGCGTGCGCGTC

CAGCAGGACGACCGCGGGCCGGTGCTCGCTGACCGCGGCGAGCGCGCTGTCGCGGTCAGCGGCGACGACGG

AGAAGCCACCCATCGTCTCCAGGATCATCTTGATGCCGATCGAGACCAGGGCCTCCTCGGCCACCACCAGT

ACGTCCGCCATGCCTCCCCCGGGCAATGTAGCCGTACGAGATTTGATAGTGCACAAAAACCATCGAATTAC

TGCTCTTTCGAATCATACATGTATTTATGCAAATTTCTGGTCAGGAAACGGGGACGATCCGAGACGCCCGG

GCCGGCGTCTCGGATCGTCCTTCACCGCGCACGGCTATCGCACGAGCCCTTCCGCGGGGGCGATCCGCGTG

GCTCGCCGAGCCGGCGCCAGGCTGGCCAGCACACCGGTGACCGCGGCGGCCACCAGCACGAGACCCAGCTG

CGGCCACGCCAGCATGATCACCGGTTCGGCCTGCCGGCCCACGGCCGCGATCACGCCGACCAGCCCGACCG

GCACCCCGATGACGATGCCGGCCACCGTGCCGACCAGCGTGATCGTGACCGCCTCGACGGCGACCATCGCG

CGCAGCCGGCTCCGGCGGGTGCCGAGCGCCCGCAGCAGGGCCATCTCCCGGGTTCGTTCGATCACCGAGAG

GCCGAGCAGGTTGGCGATGCCGAGCAGCGCGATCACCACGGTGACCGCCAGCATGCCCAGCGACAGTCCGA

GCAGGATGGACAGGACGTTCATGATGTCGCCGCCCTCGGTGACACCGCCGCCGACCTCCACACCGGCGTCG

CGTGCCGCCACCGCGTTGACGTCGGCGGCCAGCGTCTCCCGGTCGAAGCCGCCCGGCGCGGTGCCCCAGAC

CGTGGTCGGCACGGTCCGGACCCCGGCGGCGGTCAGGACGTCACCGGTGGTGACGCCGAGCAGCTGCCCGG

TCGTGTCGGCCAGCCGCGAGCCCCGGGCGGTGAACCGCAGGTCCCGCCCGCCGGCCGTGACCGTGAGCGGA

GCACCGTCCGTCAGCCCGCGCGCCGTCAGGTAGGAGGCCGGCACCAGCAGCACCGGGTCCCCGGTGGACGC

GCTCAGCTCCGGCGCGAGGCGCCCGGCCACGTCGGTGGGGAGCGCCGCGATCCGGGCCGGCGTGGGTTTGC

CCGCGGCCGGGAACGTCGCCGCGCTCGTCGCCACGGTGGCCGTGGTCAGCCCGGTGATCCCGGACAGCGCC

CGGACCGTGCGGTCGTCGATCGCCGCGCCGTCGGTGTGCACGCTGACCGCCACCGGATAGCGCGCCTCCAG

GTCGGCCTCCACCGTGGCCCGCCCGCTCGCCGAGGCCACGGCCAGGCCGGTGATCAGCGCGGCCCCGACGA

CCACGGCCATCGTCGCCGACGCCGTCCGGCGCGCGTTCTGCCGGAGGTTGCTGCCGGCCAGGCTCGCCGCC

ACCCCGAACCGTTCCAGGCCGCGCGCCGCCGGCGGCAACAGCAGGGCGATGCCCAGCGGCAGCGCGGTCAG

CAGCCCGGCGGCGAGCAGCACCCCGCCGACCAGCGCGAGCGGCAGGGAGGTGCCGATCGCGGCGAGACCCA

GCACGCCCACGGCCAGGCCGATCAGGATCAGCCCGGCGACCAGGCGGCGCCCGCCGCGGACCTGTGCGGGA

AGAGCGTCCGGCACCTCCTGCAGCGCGCGCACCGGGGGAACCCGGGTCGCACGGCGGGCCGGCGCCCAGGC

CGCGACGACCGTGGCGCCCACCCCGGTGAGCACACACAGCGCCAGCACGATCGGGTTGACCGCCAGGCCGC

CGCCGTTGATGTCGAGCAGGCCGGCCCCGAGATAGCCGAGCCCGACACCGGCGACCGCGCCGATCACCGCG

CCGATGCTCCCGGCGATCGCCGCCTCCGCCAGCACCACCCGGCTCACCTGGCGGCGGTGCCCGCCGACCAG

CCGCAGCAACGCGACCTGGCGGACCCGCTGGGAGACGATCACCTGGAAGGTGTTCGCGATGACCAGGATCG

ACGCGAGCAGCGCCACCGCGGCGAACGCCAGCATCAGCACGACCAGCTGGGTGTTGCCACCGGCGAACCGG

CCGGCGGCCGCGTCGGCGGCCGCCGACGCGTCGGTCGCGGTCGCCCCCGGCGGCAGGGCCCGGCCGACCGC

GTCGACGGTCTCGGCCAGCCGGTCCCGGTCCGTGACGGTGAGCAGCGCGGCCGGCGGCGTGTCCCCGGCGA

AGAACGACGCGGCGGCGTAGAACCGGTAGTCCGAGCCGGTCAGCGGGCGGAAGCCGAGATCGGCCGAGCCG

ACCACGGTCACCGGCACCGGGGCGGCCGTGCCCTGCCGGAAGTCGAGGTGGGCGCCGACCCCGACGCCGAG

GTCGGTGAGGGTCCGCCGGTCGGCGACGACCTGCCCGGCCGCGCTCGGCCAGGTGCCCTCGTCGACGGTGA

ACCAGCGCACCGACGCGGTCGCCGGGATGCTCTGCACGTTGGCCGAGCCGCGCCGGTCGCCGCCGAAGACG

CTGACCGTCCGTGCGTACTGCGGGTCGACGCTCCGCACGCCCCGCACCCCGGCGGCCGCCTGGTACCACTG

CGGGTCGTGCACCGTGTCGTCGGCGTCGAGCACGATGTCCGCCGTGGTCAACGGGGCCGCGGCGGTGAGCC

GCAGACCCTCGTCCGAGGTGCTCGCGAACGTGGCCGTGGCGGCCAGGAAGCCGGTGGCCAGCACGACCGCG

GCGACGATCGCGAGCAGCCGGCCGGGGTGCGACCGGACCTGCGACCAGGCCAGCGTGAAGATCATGACGTC

ACCGTCACCGACGCCATGACCGACATGATCGACTCCAGTGTGGGCGCTCGGAGCTCGTCCCAGAGCCGCCC

GTCGGCCATGATCAAGACCCGATCGGCGTACGTCGCGGCGGCAGCGTCATGCGTCACCATGATGATCGTCT

GGCTGGCCTGCCGGGCGGCGTTCTGCAGCCCGGCGAGCAGCGCCCGGCCGGTGGCGATGTCCAGCGCGCCG

GTCGGCTCGTCGGCGAACACCACCGACGGCTCGGTGAGCAGCGCGCGTGCCACCGCGACCCGCTGCTGCTG

GCCACCGGACAGCTCGGCGGGCCGATGGCCGAGCCGGTCGCCGATCTGCAGCGACGCGGCGATGCGCTGCA

GCCGGTCGCGGTCCACCGGACGGCCGGCCAGCCGCAGCGGCAGCACGATGTTCTGCTCGGCGGTCAGCGTG

GGCAGCAGGTTGAACGCCTGGAAGATGAAGCCGACCCGGTCCCGGCGCAGGTCGGTGAGCGCGCGGTCGTC

CAGCCCGGCGAGCGCGGTGCCGGCCAGGCTGACCTCGCCCTCGGTCGGTGTGTCCAGCCCGGCGAGCAGGT

GCATCAGCGTGGTCTTGCCGGAGCCGGAGGGGCCCATGATCGCGGTGAACTCGCCGGCCGCGAAGGAGGTC

GACACCCCGTCGACGGCGACCACCGCGGCGTCCCCGGTTCCGTACCGTTTACGCAGGTTGCGGCAACTGAC

CATGGAGCTGCTCTTCGTCTGCATCATCACGGTTGCGACGTTAGGGAAGTGGCGGGCCGCCCACATCCGTC

CGGGGCATCGCCGCGACCGATACCAAGGTATCGACCTGGCGTGCGGATGGTGCCGCGAGCGCTCGCGGTCC

CTACTCTGAGAGCGTGGGAAGCTGGGACAGGAGAACGCTGACGGTCGATACGGTGATCGCCGGCGCCGCGG

TCATGGTGTGCCTGCTGCTCGGGTTGGCCGGTCTGGACGAGTGGTACTGGTCGGCCGCGCTCTGCGTCCCC

CTGGTGATCCGGCGCTCGGCTCCGGTGGTCTTCCTCGCGCTGGTCGCGGTGCTCTCCGGCATCCACATGAT

CTACTCCGGCAGCTTCGCGTTCCCCGGTGACCTGGTCGATCTGGTCGCCGTGCACGCCGTCGCCGGTTACG

GCCCGGCCCGGGTCCGGCACCTGGGCCTGCTGCTCGGCGTGGCCGGCAGCCTGGTGGTGACCGCCCGGGCG

CTGCACGACGGGCTGCCGTCGTCCGCGACGCTGCCCGCCGCGCTGATCGTCGCCGCGACCCTGGCCGCCTG

GTCGACCGGCCTGATGCAACGCCGGCAGCGGGCCGACGTGATCGAGGCCGATCACCGCCGCCGGCTCGCCG

AGCAGGACAGCGCGATGCGTGCCCGGCTCGCGGCGATCGAGGAGCGCACCCGGATCAGTCAGGAGATGCAC

GACATCATCGCCCACTCGCTGGCCTCGGTGATCGCCCAGGCCGAGGGCGGCCGGGTCGCCGCGCGCGCCGA

CGCGGTCGTCGCCGGCCCGCTGTTCGACCGCATCGCGCAGATCGGCCGGGAGGCCCTCAACGACGTGAAGC

GGCTGCTGAACTCGATCGACGGCGACACGCCGGACGACTTCGCGCAGGGCCTGCCCGACCTGCCGGGCCTG

CTGGCCGGGGTCTCCGCCGCCGGCCTCGACGTGACGTTCGAGGTGGCCGGCCCGGAGCAGCCGCTCGCGTC

CGGCATGGACCTGGCGGTGTACCGGGTGATCCAGGAGTCACTGACCAACGTGCTCAAACACGCCACGCAGC

GGCAGGCCCGGCTCAGCCTGGTGTGGACGCCGGCGTGGCTCGAGGTCAGCGTGACCAGCCCGCTGACCTTC

GCCGGCGCGCTCCGCGAGGGTCGCGGGCTGTCCGGCATCCGGCAGCGGTGCTCGTTGTTCAACGGCGACTG

CGAGATCGTGGCCGGGCAGACCTTCAGCGTGATCACCCGCTGGCCGCTCGCCCGTCCGGAGGTTGCCGTCC

CATGACCGAGCCGCAGATCGACGTGGTGATCGCCGACGATCAGGACCTCGTCCGGACGGGCTTCGCCCTGG

TCGTCGACTCGGCCCCGGACATGCGGGTGGTCGCGACCGCGGCGGACGGCGCCGAGGTGGTGCGGCTGGCC

GCGGAGTTCCGCCCCGACGTGGTGCTGATGGACATCCGGATGCCCCGGGTCGACGGCATCACCGCGGCCCG

GGCGATCCTGGAGGGCAACGCTCAGCCGCCGAAGATCGTCGCGCTGACCACCTACGACAACGATGAGTACG

CCAGCCGGATCCTGGCCGCCGGCGCCAGTGGGTACCTGTTGAAGGACACCACCGCCGAGGGCCTGACCGCG

GCGATCCGGACGGTGCACCGCGGCGGCTCGGTGCTGGCCCCGTCCACCACCCACCGCCTGGTGACCGCGCA

CCGTCAGCATCCGGCACGCCCGTCCGCGCTGCTGGATTCCTTCACCACCCGGGAGCGCGAGGTCTTCGACC

TGATCGTGGCCGGCGCCAGCAACGCGGAGATCGCCGACCGCCTGAACCTGGCGGAGGTCACGATCAAGACC

CACGTCGGCCGGGTGCTGGCCAAGATCGGCGTCCGCGACCGGGTGAACGTCGTGATCTGGGCCTACCGGAA

CGGCGCCGGGCCGAGCTGAGCAGGGGCCAGGCCGCGCTCGCACTCGGCCGAATCCCGAAAAGCGGCTAGGG

GAAGCGGATCTCGGCGGCCAGCGGCAGGTGGTCACTGCCGGTCCGGGGGAGGGCCGTCAGCCGCGTGACCG

TCATCGATCGCGCCAGCACCTGGTCGATCCGGGCGACCGGCGTCCGCGCCGGCCAGGTGAACGCGAAGTCC

GCGGGCGAATCGATCATCACTTGCCGGATCGGCCGCAGCCCGCGGTCGTCCACCGACGTGTTCAGGTCCCC

GATCACGACCAGCCGCGGAACCGGGTCGGCGGCGAGCAGCGCGCCGAGCTTCCGGGCGCTCTCGTCCCGCC

GTGCCGAGGTGAGTCCCGCCGCGGTGACCCGCACCGACGGCAGATGCGCGACGTACACCGCGGTGTCCCCG

CCCGGCGTCCGGGCCACCGCCCGCAGCCCCCGGTTCCAGTCCTCGCCCAGGTCATGCGGCCGGATGTCGAT

CGCCTCCGCGCCGGTCAGCGGATAGCGCGACCACAGCGCCACGGTCCCCTGCACGGTGTGGAACGGAAGCT

CCGCGTCGAGCACACCCCGGTAGGCGGCCACCGCCTCCGGCAGCACCTCCTCCAGCCCGACCAGGTCCGGA

TGTGCCGCGAGCAGCGCCCGGGCGGTCCCCGCCGGGTCCGGGTTCTCGTCGCTCACGTTGTGCTGCACGAC

GATCAGATCCGGCGTGCCGGTGTCCCGGTCGACCACGTAGCCGCCGAAATGGATCAGCCACGCGCCCAGCG

GCAGCAGCACCGCGGCGAGGCCGGTCAGCGATCGCCGCATCAGCGCCAGCAGGAGCAGGACCGGCACGGCC

AGCCCGAACCACGGCAAAAACGCCTCGATCAGGCTGCCCGCGTTGCCGACCGCGTTGGGGACCAGACGGTG

ACCGAGAATGACCGCCCCGGCCAGAACAGCGGTCCACAAGATCGGCATCGGGAGATGTTATCTTATTTCGC

ATGCGAAATAATGAGACGGTACGGATCCCGGTAGCGACCGGCGGCGCCGTCACGGCCACGCTGTTCGCGCC

CGAGTCCGCGCGTGCCGTGCTGGTCGTGCACCCGGCGACCGCGACTCCGCAGGGCTTCTACGCGTCGTTCG

CCACCTACCTGGCGGAGAACGGGATCGCCACGGTCACCTACGACTACCGTGGCACCGGCCGTTCCGGCTCC

CCGCGCGACCACCGTGACCTGGGCATGCGCGACTGGATCGGCGCCGACGCCCCGGCCGTCGCGGCGTGGGC

CGCCGACCGCTTCCCGGGCCTGCCCCGGCTCGCCGCCGGTCACAGCCTCGGCGGGCACGTGATCGCGCTCG

GCGCGGCCGGCCCGGATCTGGCCGCCTCGGTGATCGTCGCCTCGCACATCGCCGCGCTGCGCACCATCCCG

AGCCGGCTGGAGCGGTTCCGCGTGCGAATCATGCTTCACATCCTGGGTCCGGCCCTCGGGCGGCTGCTGGG

CTACGTGCCGGCCAGAAGTCTGGGCCTCGGCGAGGACCTGCCGGCCGCCGCGATGTTGGAGTGGGGCGGCT

GGGCGCGCAGGGACAACTACTTCTTCGACGACCCGTCGATGCGCGCCGCCGAGCGCGCCGCCACCCTGACC

GGCCCGGTCCTGGCCGTCGGCACCACGGACGACCCGTGGTCCACGCCGCGCCAGATGGACGCCCTCACCGT

GCACCTGACCAGCGCATCCGTGGAGCGGCGAACCTACTCACCGGCCGCCGCCGGGGTCCCGGTGATCGGGC

ACCACGGCCTGTTCCGGCGCGCCGTGCGCGACACCGTCTGGCCGGAACTGCTGGCCTGGTTGCACGCCCAC

TCGGAGAAGGCGTCAAGATGACCGCGTGCGCCTGCCTCGCCTGATCTTCCTGCTCTTCAACGCCGACCGCG

CGGTCCGGCGCTGGATCGACGCCCGTTCCGGTGACACCGGGATCGGCGCGTCCGGCGCCGGCGTGCTGTTC

TACCTCGCCGGTCACGAGAACGCCCTCATCGGCGACGTGACCGCGGCCCTGGGTGCGTCACCATCCGGCAT

GAGCGGCCTGGTGAACCGCCTGGAGCGTGGCGGTTGCCTGACCCGCTCGCAGGACCCGGCCGACGCCCGCG

CGGTGCGGCTCGCCCTGACCCCGCGCGGACACCAGGTGGTGATCCACGCCCGCGGGCTGGTCGACGACCTG

AACGAGCAGCTCACGGCCGGTTTCGACGACGCCGAGATAGCGGTCGTCCAACGCTGGCTGGAGCACGTGAC

CCGGGTGTCCGTGCAACGTGAGGAGCGACTCGGTTAGCGTCCGGTGATCAGCTAAACCTCCGGGACGGGCC

GCCGAAGTGAGGTGTCGCAAGGCACCACCGCTTCCGATCCGCCCTTGAGGAGACCCATGGCTGACTCCGTC

GTCTTCGACCAGATCCCCGTCGTCCGCGCCATCGGCCGAGGCACCACCTCGCTGAGCGCCTTCCACGACGC

GCTGGTGACCATGGAGTGCGGTTTCTACAACCTTGTCCGGCTCTCCAGCGTCATCCCGCCGGGCACCGCCG

TCGACCCCAGCGGCAAGGCTCCGGTCCCGGTCGGGGCGTGGGGCGACAAGCTGTACTGCGTCTACGCCGAG

CAGCACGCCAGCCAGCCGGGCGAGGAGGCGTGGGCCGGCATCGGCTGGGTGCAGCGCCGCGACGGCCAGGG

CGGCCTGTTCGTCGAGCACGAGGGCACCAGCGAGTCGTTCGTCCGCGAGGCGATCAAGGCCAGCCTCCGCG

ACCTGGTCAAGGGCCACGAGGACGACTTCGACGGCCCGGACTTCGTCGTCCACGGCGTGGTCTCCGACGGC

GAGCCGGTCTGCGCGATGGTGCTCGCCCCCTACGAGACCGCCCCGTGGCGCGGCGTCCGTGCCACCGACCC

GCCCGGCATGAACTGACCTGTCACCACGAGAGCCTCGCCTCGCACGTCGGGGCGAGGCTTTCGGCATTCGC

TTTTCACTTCGACAACCCCCTCCGTACCGAAGAAATCGAAGATCAAATTCTTCATTGCCTATCTCCGCTGT

GGTCCAGATCGTCGCTCCCGCGGGGACCCTTCCGGTCTGAGCAGGGCCGTAACCGGCCCAGAACGCTCAGC

CCGAAAGGGCGACCTCCGTGGCGGGGCACGGTCAGGGCAAAATTCCGTCGCCGGTCGCCAGGGATTCGCCG

CCGGTTGCTGCGGGTGGGGTGCGGCGGTCCGCCGGAGGTATGGGTTGCCGCTACGCTCGGCTAGCTTTCGA

CCACCGGTAACGTGTAATTCCCCTTCGGTCCACCTACGCCCGTTGTGATCTCCTTATGGTGGGCTCGCTTA

TCCTCGTCCTGTGCATCTGGGCCGCATCGGCCGCGATGTTCTTCCGGCTGTCCTCTCCGGCCCGGACGCCG

GGCACCCGTGCCTGGCGTTTCGCCCCGATCCTGACCGCCGGTTTCGCGATTCCGCTCGCCGCCGCCTACGG

TCGGCAGGACTGGTCCACCTTCGGGTCGCTGCTGGTCGCCGGCCTGGCCGCCTTCGCGGTCCTGCTCTACC

TGCTCCGTCCCGTCCGCCTCTGATCCATACTCGGTCGTTGTGACGACCCGGATGCCCCGCCTCGAGATCGA

ATACTGCACACAGTGCCGCTGGCTGCTCCGCGCCGCGTGGCTGGCGCAGGAGCTGCTCACCACATTCCCCC

GCGATCTCGGCGAGGTTGCCCTGGTCCCCGGGATCGGCGGCGTCTTCGAGGTCCGCCTCGACGGCGAGATC

CTCTGGAACCGCAAGCCGGACGGCTTCCCCGACCTCGCCCAGCTCAAGCGCCTGGTCCGCGACCGGGTCGC

CCCGGGCCGCGACCTCGGCCACTCCGACCGCGCCGCCACCGACTCCTAGCCCACACGTCCTCCTCCACCGC

TCCGGCCGCGGGACGCGTCTACGCGTACAGGATCCGGTCGATCGTCTCGCGGGGGAGCAGCGTGCGGGCCC

GCCCACCGCAGACGGCGACCACCGCCGGCCGCCCGACATAGACATCGCGCCGCTGGTGGTACGCCCCGGTA

CCGGACAGCGCCACCAGATCACCGGCCGCCATGTCACCCGGCAGCTCCGCCACCGCCACCGTCGCGTCCCC

GCAGCGAACCGTGATCGACCGGCCCGGCGCCGGCGACGCCCGGCCGATCAGCGCTGCCGTGTGCAGGCCGG

CGCAGTCCGCCCCGGGCAGGCAGTCCGGGACGTCCCCGTCCAGCTCGATCACGCCGTCCCCGGCGGCCACC

ACTCGGTGCACCGTGATCCCGGCACGACCCAGCAGCGCACGCCCGGGCGACACGTGCACCTCGGGCGGCTC

AATGCCGTACCCCTCGGAAGTGACCTGCGCGACCGCCCGCAACCTGGCAGCGAAAATGCCCACCGGGAGAT

CGGCGGCATGGCCGCCGCCGAGGTTGAGCACGGGCACCGTCGTCCGCAGTCGCGCGACGAACCCGATCGCC

TCACGCAGGCAACTCTCGTAGGTGCCGAAGCGGTTCAGCCGGTGCCCGAGCGAGCAGTCCAGCCCGGCCAG

CACCAGCCTCCGCGACCGGGTCACCGTGGCGACGGCGGCGAGCGCGGCCGAGCTGTTCAGCCGCACCCCGT

AGCCGCGCTGTGCGCTGCCCGGCCGGACCCTCAGCAGGACGCGCTGCCCCGGCCGGGACCGCGCCGCGACC

ACTTCCGCCTCGGAGGCCGAGCCGATCACGACGGCGGCGCCGCAGGACAGTGCCGCCTCCAGATCCGCCAC

GGACTTCCCGCTCCCGAACAGCGCCAGCGACTCCGGGCGGATCCCCGCGTCGAGCGCCGTCCGCAGTTCGG

CGGCCGAGCGGCAGTAGCAGCCCAGCCCGTCCCGCGCGATCCACCGCGCGGCACCCCTGAGCAGGCCGCCC

TTGGCGCTGCAGCACACCGCGCCCGGCCCGAACGCCGCGACGTACTCCGCGCAGCGACTGTGCACATCGGT

CTCGTCGATCACGTGCACCGGAGTGCCGTGGGCCGCGGCGATCCGGGTCACCGGCACCCCGCCGACGGTGA

GGTCACCGGGCTCGGTCCAGCGTGCGGTGAGCGGCCAGTTCGCGGGGTCGAGGCGCGGGCGGAGCGACGCG

CCCAGTGAGGGCAGAATCTCGGACAACGTCATACCGCGAGCCTGCTCGCCGGCCCGTGCCCGAGAAGATCC

GGATACGCCACGTTGACGATCGACGTGCCGTTGTTGACGTGTCGCCTACAGGTCGGGGCTGTCGGCGGGAG

CCATGATCCGCAGCGCGTTCGGGTCGATCGCGATCCGCATCGGCGTCGTGCCCCGAGGCTCGCCGTCGACC

TCGACGGCCACCGGCCGATCCGTCTCCAGCCAGAGTTCCCGGACCGCGATGAAAGGGCGTTCATGCAGGGT

ACGGCGATGCCCGGTGGCCGCGTTCCGGGCCGTCTCGCGCAGCAGCTCCCGCCGGCTCGCCCCGCCCACCG

GATAGGCGACCAGCAGCCGGTCGTCGGCGTGCGCGTCCGCGGTGATCGGCCGGCCGGCGTGGAAACCGCCG

TTCGCGACGTACACCTGATGGGTGTGGAACCGCAGCTCCCGCCCCTCGGCCCGGATCACCGCGCGGACCGG

CCGGTGCCGGGCGAGCAGCCCGAGCGCGGTCATCGGATACGCCAGCCGCCCCACGGCCCGTTTCAACCGCG

GCGGCGCGCTGATCATCACCTCGCCGGAGAGCCCGATCCCGACGTGGTTGGTGAACGGCACGTCCCCGGCG

ACGCCCAGGTCCACGTCGATGACTTTGCCGTCCACCAGGGTCGCGATGGCGGCTTCGAGGTCCGGCTCGAT

CCGCACGGTCCGGGCGAAGTTGTTGGTGGTGCCGAGCGGCAGCACCCCGAGCGCCACGTCCCGGTGTGCCA

GCATCCGCCCCGCGGTGCTGATCGTCCCGTCCCCGCCCCCGGCGATCAGCAGGTCGGGCTCTTTCCTGAGC

GCTTCGGAGATCAGCCCGTCCAGCCCGCCGGACTGCTCCAGCGCATACGTCCCGAGCAGCTCGAACCCGGC

CTCGACAAGCCGCCGCCGCGCCTCTTCGTAGAGGAGCCGCCCCCGCCGGGACCGCGTGTTGACAACAAGAA

CCGCCCGCCGCCCTCGCCGGATGTCAGCACTGTGCTCCCGCTTACTACGCACCCGCCGACCCTATCCGCCC

CAACCCACCCAACGCCCACGCCTCGTTCCCGCCCGCCCGGTCCCGAGCCGTGATCACCAGCCGCAAGGCCT

CAGCTGGCGTTGACGGCTGATTTCGGCCCGGTTTTGCGCCGTAGGCGCCAGCCGCGAGGTGTCGGCTGGCG

TTCAGGGCTGGATTCGGCTCGGTTTTGAGCCGTGGGTGCCAGCTGGGGGCTGCGGCCGGAAGGGGGTGGAT

GTGGGGATGCCCCGGGGCCGTAGGCCTCGGGGCACCGAAAAAGCGAACCAGCTCAGCTGTTGGCGATGAAC

GCCGGATGCGACAGCAGGAACGTGTCGATCTGGTCCTTCTTGATCGACTTCAGCAGGTCCATGCTGTCGTC

GCTCAGGAGCTCGACGCTGCCGGAGCCCGGCACGTTCTCCGAGTTCAGCTTGCCGGCGTTGGTCTTGATGG

TGAGGAGCTTGTCCGGCTTGAGGCTGCGCATCGCGAGCGCCCAGTCGGCCAGGTCGATGCCACCGTCGTCG

ACCGTCATCGCCTTGCCGAACGCGCTGAGCAGCTTCGGCAGCTTGGTCGGCGAGTCGAGGCCGTCCTTCAG

CGCCTGGTTGATGATCGCCTTGAAGAACTGCTGCTGGTGCCGCTGGCGACCGTAGTCGAGCGAGTTGTCGG

CGAGCAGGTCACGCTGGCGGACGAAGTCGAGCGCCTGGCCGGGGGTGAAGCAGTGGTCGCCCTTGGTGTAC

GTGTTCGGCGTCACGCCCGAGATCTTGCTCTTCAGCGTGCCGTCCGGGTTGATCACGAACGGCTTGGCGGT

CTTGCCGTTCTGGTCCTTGCCCAGGTGGATCGACTTGGTCGTGGTGTCCACGTACATGCAGACCTTGCCGA

GCACGTTCACCACGTCGCGGAAGCCCTGGAAGTCGATGATCGCCCCGGCGTCCGGCGTGATGCCGGTCAGT

TCCTTGACGGTCATGGTGAGCAACTCGAAGCCGTGCTGCAGCGCCTCGTTGCCCTTGAGCCCGCGGGTGCC

GAACGCGAACGCGGCGTTGATCTTCGTCTTGCCGCCGGCCCACTTCTGCTTCCCGTTGTCGTACGCCGGGA

TGTAGACGTAGCTGTCCCGGGGGAGCGAGATCATGTAACCGCTGCTGTGGTCCTTGTTGATGTGCAGCAGG

ATGATCGAGTCCGACCGGAGGGGCTCGCCGTTGGTCTGCGTGGGCCGCTGGTCGATGCCGACGAGCAGGAG

ATTCTTCGCCCCGTCGAGGTTCGCGTTCTTCTTCTCCTCGGCGGGTTTCGCCGAGCCGAGCAGCGACTCCT

GCCCGACCGAGGAGGTGGCCGCGGCCACCGTCGCGTTCAGCCCGATCGCGCCACCGCCACCGCCGACCAGC

AGCAGTGAGCCGAAGACCACGGTCCAGAAAGCCCAGCGGGGTGTGCGGCGTCGGCGCTTGCTGGTCCTACG

CAAGGGGTCTCCTCTAATCGGGGCGGTCGTTCCGCCCCAGGACAATCTAGGACGGTCGTTCCACCCATGAA

GACGGGCGCCGCGAGCGAAAAGATTGCCTGCGGAACATTGAATTTTCCTGAGCGTCAGGTAGCTACAAGCT

GTTAACCATCGCACCACCAAGGCGACCTAGGTTCTGCACGGCCCCGGGCCCCCGAGGTTCCGACAAAGTTG

CCCAAAGCGAGTCGCCATGCCCTCAGAGCCGGATGTCAGTGTCGTCATTCCGACGTGTAACCGGCCGGAGT

TGGCCGTCCGCGCGGTGCGCAGCGCCCTCGGGCAGACGCACCGGAACCTCGAGGTGATCGTCGTCGTCGAC

GGTCCCGACGAGGCGACCGTGACGGCGCTGGGCGAGGTCGGTGACCCGCGACTCAGCGTGATCGTGCTGCC

GGAGCGTGGCAAGGCCCCGAACGCGCGGAACACTGGCGCCCGGGCCGCCCGCGGCCGCTGGACGGCGATGC

TCGACGACGACGACGAGTGGCTGCCCACCAAGATCGAACGGCAGCTGGAGACGGCCGCGGCGGCGACCGTG

GAGCGCCCGGTGGTGGCCTGCCGGATGATCAGCCGGACGCCGCGGGCCGACACGATCATGCCGCGCCGGCT

GCCCGAGCCGGGTGAGCCGATCAGTGAATACCTGCTGGTCCGCCGCGGTCTGTTCTACGGCGACGGCTTCG

TGCAGACGTCCTGCATCATGGCGCCGACCGAGCTGTGGCGGAAGGTGCCGTTCACCGTCGGCCTGCGCCGC

GCGCAGGAGCTGGACTGGACGCTGCGGGCGATGCGCGAGCCGGGCACCGCGCTGATCTACGCCGAGGAGCC

GCTGGTCCTCTGGCACCAGGACGAGAACCGTGACCGGATCAGCCTGCAGAACCCGTGGCGCGAGCAACTGG

AGTGGCTGCGCGGCAACCGGGAGCTGTTCACGCCGCGTGCCTACGCCGCGTTCACGCTGAGTGTGCTGAGC

TCGATGGCCGCGCCGACCCGGGACACCGGGCTCTTCCGTGAGCTGCTCGCCGAGGCCCGCACGCACGGCGA

CCCGGGCACCGTCGACTACCTTACGCACATGCAGATCTGGGCCCTCCCGCCGAGCGTCCGGCACCGCCTGC

GTGACGTCGTGGTGGGCCGCGGCAAGACGAGCAGCAATGCCGGCTGAGCGCCGGGTCGCGATCTGGCGCAG

TTCGATGCTGCCCGGCTCCGAGACGTTCGTCCGCAATCAGGCCGACGCGCTGACCCGCTGGACCCCGGCCT

ATGTCGGCGCGGTCCGGCACGAGTCGGTGCTGTCCCGCCCCGACGACGTGATCGCCTTCCCGGGCGGCAAG

GGGTTCCTGCGACTGCGGCTGACCGGGGCGTCTCCCCAGCTGCAGAAGACGATTTCCGCCGTACGGCCGAA

TCTGGTTCATGCCCATTTCGGTGGTGACGGATGGCTGGTGAGCCACTCCGCCCAGCAGCTGGGGGTGCCGC

TGGCCGTCACCGTGCACGGGCACGACGTGACCCGTCAGCCGTCCAGCCCGGGCGCGAAGGGCGTGCGCTAC

CGCCGCAACCTGCAGACCGTTTTCACGCGGGCGTCGCTGGTCATCGCGGTCTCGGAGGTGATCCGCGGCCA

GGCGATCAGGTGGGGCGCCGACCCGGCGAAGGTGAAGGTGCACTACACCGGCATCGCGGTTCCCCCGGAGC

AGCCGGAGGAGGTGCCGAAGCGGTGGGACGTGGTGTTCATCGGCCGTTTCGTCGCCAAGAAGGGCGTCGAC

GACCTGCTCACCGCGCTCGCCGCGGTCGAGTCGCGCCCGCGCGCGCTGCTCATCGGCGACGGCGAGCTGAT

GACGGCGATGCGTGCCCGTGCCGAGCAGCTGGGCGTGGACGTCACGTTCGCCGGCAGCCGGACCCCCGAGC

AGGTGCGGCGCCACCTGCTGGAGTCGCGGCTGCTGGCCTGCCCGTCGAAGACCGCGCCGGACGGGGACACC

GAGGGCCTGCCGACCACGATCCTGGAGGCGGCCGCGCTCGGCCTGCCGGTGGTCGCAACCCGGCACAGCGG

CATCCCGGAGGCCGTGATCGACGGTGAGACCGGCCTGCTCAGCCCGGAGGCGGACCCGGCGGCGCTGGCGG

TGTCGCTGACCCGGCTGCTCGGTGACGAGGATCTCCAGCGCCGGCTCGGTGCGCGGGCGCGGCGGCACGTC

ACGGCACACTTCGATCTCGTGGAGCAGACCAGGCGGCTGGAGGACCTGTATGACGAGGTCGTGGCGGGCGC

TAGGGTCTAGGCCTGCCTGTCCGGCTTCCTGGGGGAAATCATGATCTGCACGCACTGCGGCTCACCGGCGG

CGCCGACCGTCGGCCCGTGCCCGGGCTGCGGCCGTCCGGTCTCCGCCCCGGCCGGGGTGTTCCCGGACCCG

CTGGCCGCGCCGGCCGAGCGGTCGCTCCCCACGTCGGCGTACAGCGTGCCGGTCGATCCGTACACCGGCCC

GACCACCGGTGACCCGTTCGCCGGCGACTCGTTCCACACCCCGCCGCCGGCGTCCCCGATGCCGCCGCCGG

TGACCGAGCCGATCACGCCGACGCCGCCCCCGCCGGCCTACGCCCCGCCCCCGCAGTACAGCCCGCCGCCG

TATGCGGGGGCGCCCGGTCAGCCCTATCCGGGTCAGCCTTACCCAGGTCAGCCCTACCCGGGACAGCCCTA

CCCCGGGCAGCAGCCGTATCCCGGCCAGCAGCCCTACCCCGGATACGGCCAGTCGAACAGCCAGGCCCTGA

CCATCGTCGCCTACGTCCTCGGCGGCTTCGGTCTCCTGACCATGACCCCGCTCATCGGCGTCGTCGGCCTG

GTCCTGGCGAACTTCGCGAAGCGCCGTCACGAGCGCAATGCCTCGATCGCGGTCAAGATCGTCGCCGGCCT

GGTGATCGCCGCTTTGGTGCTGAGCATCGTGGACCGCATCGTTTAAGGCCTGCCCTGCCGATCACTCAGGG

CGGCGACTTCTGGGCGGCGGGGGTGCTCCCCTCGCCGGAAAGGATGTCCGGTTCCCGGGATGGTCAGTACT

GTCGGCTCATGGGCGAACATTTCGATCTTGTCGTGCTGGGCGCCGGTCCGGGTGGATATGTCGCGGCGATC

CGCGGCGCTCAACTGGGCCTGACCACCGCGATCGTCGAGGACAAGTACTGGGGCGGCGTCTGCCTCAACGT

CGGCTGCATCCCGTCGAAAGCGCTGCTGCGCAACGCGGAGCTGGCGCACATCTTCCACCACCAGGCGCAGA

CCTTCGGCATCGAGGGGAAGGTCACCTTCGACTTCGCCGTCGCCCACCAGCGCAGCCGCAGCGTCGCCGAC

GGCCGCGTCAAGGGCGTGCACTTCCTGATGAAGAAGAACGGGATCACCGAGATCCAGGGGCGTGGCGAGTT

CACCGACGCGCACACGCTGCGGGTCGGCGACCGGACGGTCACGTTCGACAACTGCATCCTGGCGACCGGCG

CGAGCACCCGGATGATTCCCGGCACGAGCGTCTCGAAGCGGGTCGTGACGTACGAGGAGCAGATCCTCGAC

CCCGACCTGCCGGACAGCATCGTGATCGTCGGCGCCGGCGCGATCGGCGTCGAGTTCGCGTATGTGCTGCG

CAACTACGGCGTCGACGTGACCATCGTGGAGTTCCTCGACCGGATGCTGCCGCTGGAGGACGAGGAGGTCT

CCAAGGAGCTGCTCCGGCAGTACCGCAAGCTCGGCGTCGACGTGCGGGTCGGCACCCGGGTGGAGGGCATC

GAGGAGGGCGCCGACTCGGTCCGCGTCACCGTCTCCAAGAACGGGAAGACCGAGGTCCTCGAGGCCGACAA

GGTGATGCAGGCGATCGGCTTCAAGCCCAACGTGGAGGGCTACGGGCTGGAGACCACCGGCGTCACGGTGT

CCGACCGCGGCGCGGTCGAGATCGACGACTTCTGCCGTACGAACGTGCCCGGCATCTACGCCATCGGCGAC

GTCACCGCGAAGCTGATGCTGGCGCACGCCGCCGAGGCGATGGGCATCGTGGCGGCCGAGACGATCGCCGG

CGCCGAGACGATGGCCCTCGACTACCGGATGATCCCGCGCGCGACTTTCTGCCAGCCGCAGGTCGCCAGCT

TCGGGTGGACCGAGGCGCAGGCCCGCGAGCAGGGCTTCGACGTCAAGGTGGCCAAGTTCCCGTTCACCGCG

AACGGCAAGGCGCACGGCCTCGGCGACGCGACCGGGTTCGTGAAGATCCTCAGTGACGCGAAGTACGGGGA

GCTGCTCGGCGCGCACCTGATCGGGCCGGACGTGACCGAGCTGCTACCCGAGCTGACCCTGGCCCAGCAGT

GGGACCTGACCGTCCACGAGGTCGGGCGCAACGTGCACGCGCATCCGACGCTCGCCGAGGCGGTCAAGGAG

GCGATCCACGGCCTGGCCGGCCACATGATCAACTTCTGAGTCCGCCGCTCGGCCGACGGGTCCGCCGCTCG

GCCGACGGGTCCGCCGCTCGGCCGACGGGTCCGCTGTCCGGCCGACGAGTCCGCCGCCCGGCTGACGCCCG

GGGGAGTAGCCGGAGCCGCCCGTACCGCGCCTGCGGTAGCCCGAATACCTACGCGGGGATGACGACTCCGC

CCCGCCGGTCGGGAACGCTGAGCCTTGTGACCCTGACCGTCGAGCCTCCGATCGCCCCGGCGCCGCCCGCC

GCCCCGGGGCGATCCCGGCGGCGCAGGCTGGGCTATCTGGCGTTCGTGCTGGTCGCGGTGGTGGCGGTGGT

GACGCTGCGCGACCGGCTGCCGGATCCGGGGGAGTTCCTCGACGCGCTGCGAGCGGCCGACTGGCGGTGGG

CGGCGCTCGCGGTGGGGGCCGGGGTGCTGTCCCAGATCGCGTACGCCGAGCAGCAGCGCCGGCTTCTCGCC

GCGTTCGGAGTGCGCGTGCCGGCCCGGCGGGCGATCGCGATGACGTACGTCCGGTCGGCGCTGAGCATGGC

GCTGCCGGCCGGGTCGGCGGCCTCCGCGGCGTACGCCTTCCAGGTCTATCGTCGCCACGGCGCCACCGCGG

CGATCTCCGCGACGGCGACCCTGATCTCGACGGTCGTGACCGTGATGTCGCTGGGCCTGCTCTACGCCGCG

ACCTGGTCGCTGACCGCCACCGTCGTGGCCGGCCTGGCCGTTCTCCTGCTGTGGATCTACCGGACCGTGCG

GGGCCCGGTCCCCGCGCGTGCCGGCGTGCCGCGCCGTCTGAGGGTCGCCCCGATCGCCCGCCTGCTCCAGC

GGCCCGCCGTGGCCCAGGCGCTCCGGGGTGCACGGTCCGTCCCGGCCCGGACGTGGCTCACGGTGACCCTG

GCCGGCGTGATCAACTGGCTGCTGGACATGGCCTGCCTGCTCCTCGCGGCCGACGCGCTGCACGCCGGGCT

CGGCTGGAGCCGGCTCGCGCTGATCTACCTGGCCGTCCAGGTGGTCCGGCAGATCCCGCTCACCCCCGGCG

GCATCGGCCTGATCGAGACCAGCATGCTCGCCGGCCTGATCGCCGCGGGCGCCCCGCAGGTCACCGCCGCC

GGGATCGTCCTGATCTACCGGCTGATCTCGTTCTGGCTGATCCTGCCCAGCGGGCTGGCCGCCCACCTGAC

CCTGCGCCGGGGGACCGTGCCGCCGGTGACTCCGGGCTGACCGCCGGGGCTCAGGCGCGGTCGAACTGCTG

GAGGACGGCGCCGAGGCCGAGCGTCAGGGCCGGGCCGGGCAGTCGTGAGTCCAGCCCGTACCGCCGGCCGG

GGTTCTCCCGATCGACCAGGTCCTGCCAGAGCCCGGTCACCGGATCGCCCAGCCCCGGCAGGTCGTGCCCG

GCCGCCCGGAGCAGCTCGGCCAGGTCGTTCTGCTGGCGCAGCCGCTGCTCCTCGAAGATCTGGCTCCACTG

CATCAGCGAGATCGACGCCTCCAGTGTGTCCGGCACCGTCTCGTCCAGCATCGGCAGCGGTCGCGCCGCGG

CCCACGCCGCGAGCTGCGCCCCGGTCACCGTGCCGGGATCGTCGTCGCGGCTGCGCGCCAGCGCGTACGAC

AGCAGCGCCGTGGTCTCCACCAGCAGGTGCTGCACCGGGACGCGCGCCGGCGGGTCCAGCCACCAGTGGTC

CGCCTCGAGCAGGGCCGCGGCGTGCCGGGTCGCCGCCCGCCACCAGCCGTCGTCGCCGCCGGCCAGGGCGT

CGGTGTAGGACCACAGGAAGGTCACCCTTCCGTGCCTACCAGCGGCACTTGACACGAGTCAATCACGCGAA

CGCGTGGCGACGACCGCGATCGCTTCGACGGAGATCAGCAGCCCGTGCGGGAGAACCACGCCGGCGGGCGC

GGACCGGGCCGGCGGCGGGTCGGGCATGTGCCGCGCCAGCACCTGGTTGATCACCGGGAAGTCCTCGACGT

GCGTGTAGAAGACGGTCAGCTTCACCAGCCCGTCCAGCCCGTCCAGCCCGGAGCCGGCCGCCGCCAGCACC

GCCCCGAGGTTGCACAGCGCCTGCTCGGTCTGCGCCTCGATGCCGTCCACCGGCTTCCCGGTCGCGGGGTC

GATCCCGGGCATCCCGGAGCAGAACACGAACCCGCCGGCGACGATCGCCTGGCTGTAGGGCCCCAGCGCCG

TGGGGGCCCGCTCACTCGTCACCGCGATGCGATCCATCGGGCGAGTCTCCCGCACCGGGCATCGATGGTCT

TTCGGCTTTATGACACGGGTGGGAGCTTGACAGCCGTACATCGTTTATCGATTATCAATATATCGAAAAAC

GATAAGGGGGTACGTCGTGAAGACCGACTGGTTGACGGAGTTCCACCAGGTGCTGCTGGTCGCCGCGCTGG

GCGCCGGGGCCGCCGCCGTCCTCGGGACCGTCGGGCTCGTGGTGCAGGACGAGGTCGTCGTCCCGGGCGGC

ACGTCGGCTCCGGCGAGCGTGGTCAGCGACCCGAGCGTCACCCAGCTCCTGCTCGCCGTGGCGGCCGCCGT

GCCGACGTACCTGCTGGCGACCGCCATGCTGGTGCTGCTGTACCGGTTGGTCGGCGCCGCGCGTCGCGGGG

ATC

SEQ ID NO:201 orf1 分泌系统蛋白 334aa

VRLRIQRRLADELGPTLYTTGQSEDLDARVRDALHDLLAREETPLSGADR

ARITREVTDEVLGHGPIESLLRDPSVTEVMVNGPYSVYVERFGRLEKVAA

EFDDEQHLRRIIDRICSRVGRRVDEASPTVDARLPDGSRVNAVVPPIALD

GSTLTIRKFAAVPLTVGDLLQYGTLTRQAAEFLDACVRGRRTILVSGGTG

SGKTTILNVLSSFVPADERIVTIEDAAELQLVQDHVVRLESRPPNSEGRG

TITTRDLVRNALRMRPDRIVVGEVRDAAALDMLQAMNTGHDGSLTTLHAN

SEQ ID NO:202 orf2 反应调节子 358aa

MSELESYLPRYPETLLVVIGAVVDLDEALMFTAYQRLQRPVIGVVLIRHA

IEAGVVLRCLQSGIRDLVAEEDEEGIRSATVRSVDLSKALSTTMRGTGDN

APYASVVTVFAGKGGCGRSVVAVNLAVALAGAGRRVLLMDLDLQFGDVAI

MMKLSPERNIAGGLQMAGRLDEPGLRSIVTTYRQSLDALLAPASPAEGEQ

VRREFVVELLDVARPLYDFIVVDTPSVVTDQVLAALDMSDWFIPIVTPDL

PALKSVRLTAEMFDLLDYPKDKRLLVFNRAGAQVGLSPSEVEVAAGMPFA

VQVPASRDVTVSVNHGEPIAVTDPLHPVSRAIRELGDRIAGVGTTPQRRR

GFLGRLFP

SEQ ID NO:203 orf3 推定蛋白 266aa

MRRRILILLAALVLAGISGAAVLSYARSADRRALSGREGTWILVAGQHIP

SGTSGAEIRARGLTERLLVPTVTVPAGALTTWDSALDPLRLGGDLQPRQL

LMRTLFVPASPAPSHTGRIPVPRRSLAVSVALNVAPQVAGNITPGDQVAV

YYTYQAKVLMAEDHETIPMTELLLPKARVITIGEAEPGQAPVTPSPSPTP

GPSASAGDSTAAVKEIQRYVVTLAVGDTDALRLVHAAQSGSLYLALLGPN

ATASTGPAIDTSWVVR

SEQ ID NO:204 orf4 推定蛋白 432aa

MRRLIHALFPPRGEHGVITALVAVLAGAGVLLGMAALVIDIGALYAEREQ

LQSGADAASWKVAQACAGTAGRDLTSATCTVAAQRDNAQRYADRNAKDLV

SDVQFCITTVSAAGVTTADAGCPSSWNTPVTCPAPPSASGPYRYVEVRTS

TRNSDNTSVVPPLFGRGLAGSAYHGAKMGACGRVAWGAPAVTDVLALGVS

RCDFLRLTGDYTRFFAPPPPTGPNPQTGVHPLLGLSDPTAGYIPISDGIL

ATSCPADAGETVAGYTWLGQPDGPPALPGLLPVSAPDASCELTGIPATDG

PADSWVGGFTIGPGNASAATACLDRLNVLITSGQPVLVPIFDRQVAVIGT

LPSYYRIAGFAPLVLTGYESPVSGPVSPGSAVPSLVPGAQRALCAAQSCL

YGYFTRALVTDHVPTRFATSRYYGAMVIGRTG

SEQ ID NO:205 orf5 Response regulator ATP-binding 136aa

MWKATERQGPVVLLVEDDEDLRELAAQMLEMRGFVVLVAKDPVSAIMTCR

VHSGAIDVLLTDLGLPGVSGGELARSASEVRPGMKIVYVSGVPEEIAIKK

GLIRAGSPFVAKPYTADRLAGMLRTVLAQGAESSAR

SEQ ID NO:206 orf6 ABC 糖转运子 363aa

MFNYVSFVRPKTFAATFAAAALLLGSGACAKSEDSGDTVAAGPAPSAAQV

VQSASAGSATCALDQYGASKLDLKTASVGFSQSEKEANPFRIAETKSIKD

EAAKLGITNLKTSNANSQFNKQIADVEQMIDAGVQLLVIAPLNSDGWDSV

FAKATAKHIPIITIDRKINATACKDYLTFIGSDFAEQGKRAADALAKSLG

NKGEVAILLGAPGNNVTTLRTSGFKDEIAKVAPDIKITFEQTGNFSREDG

QKVAEQLLQSKPNINGIYGENDEMALGAITALKGAGKKAGDVKIVSIDGT

KGAVQGIVDGWVSAVIESNPRFGPLAFDTATKFFGGEPVGQDIVIQDRAY

DESNAKTDIGSAY

SEQ ID NO:207 orf7 ABC sugar transporter ATP-binding

501aa

MLLEVSGVSKTFPGVRALDGVSFTLNPGEVHALVGENGAGKSTLIKVLTG

VYQPDSGELRYRGEPARFATPLDAQRAGISTIYQEVNLVPLMSVAHNLFL

GREPRNRFGLLDEARMVAEATEILAGYGVRTDVRRRLGTLALGAQQMVAL

ARAVMVDARVVVMDEPTSSLEPREVETLFGVIRELHTAGIGIVYVSHRLD

ELYRVCDAVTILRDGKLVHTGRMADLDRRTLVSLMLGREFGADFTSFSES

PQSTPEGEPVLRVSGLTSRPRLDDISFDVRPGEVVGLGGLLGAGRSETIK

AIGGAYPIDSGVIEVGGVRLGRPSTVRAVRAGVATQPEDRKAEGIVPGLS

IRDNIALAILPRMARFGLVSDKRIDSIVATYMSRLRIKASGPDQAVGDLS

GGNQQKVLLARLLATGPKVLLLDEPTRGIDVGAKAEVQALIDELAKEGLG

VVLVSSDAEELVEGADRVVVLRDGAVVGTLTGDRVTTEALMATIAEAADE

H

SEQ ID NO:208 orf8 ABC 转运通透酶 319aa

MSTETLTRPRMTFNPAWAARYGVYAAIVLLIVVNIAFTPYFLTLSNLRIQ

LIQAAPVVIVALGMALVIGTEGIDLSVGSVMALAAAFIPLYLGYGVTAAI

LVSLLAGVAVGLINGVLVAKAGLQPIVATLALFVGGRGLAVVISGGQLKD

VRNADLLYLGSGDLLGVPVLVWIAALLVLVVAFVVRRTVFGRRLLAVGGN

RPAAELAGLPVKRVLIGVYVFCAVLASIAGLLSVARIQSSDASAVGLLIE

LSAITAVVVGGTPLTGGRVRVLGTVAGALLMQLVVATMIKHDLPPSTTEM

VQAVIILVAVYVARERRTR

SEQ ID NO:209 orf9 ABC 转运通透酶蛋白 320aa

MSIPVPAFRNGGFVQRQGALAVLVTVVAISLAAFPGFRSADNAGTILVAA

APPMLIALGMTFVIITGGIDLSVGSLYVLGGVVAAWASQWGVVAALAAPL

LLCGAIGVLNGILISRTGMAPFIVTLAALLGARGLMRSISDEGSTTYLVR

SDVFHELGTGSLLGVGLPVWLAAVLVGAGILVLNRTRFGHAVHAIGGSED

AAALMGLPVRRIKVWVYLLSGLLAGLAGAINAAKLGSGVTVLGSGMELDA

IAAVVIGGTLLTGGSGSIAGTVAGVLLLGVIQNLINQVGNVNSNWQQVIS

GGFLAAVVVAQTTLVRARRS

SEQ ID NO:210 orf10 metallopeptidase 486aa

MRTSAGTRVLTVGATVVLALAAAAAPAQAGPSPSPGSAGLGDRLYPLLGN

GGYDVLDYDLRLRYPEKDPKQVVSGDVTITAVAGQSLSRFDLDFGGASIG

RVSVDGQPARAARDGDELTVIPRRPLPRGRLFRVTVANFTAAPAALVATP

DGTVLAAQPGSAHLLFPGNDHPRDKATFTITLTVPAGWTGTANGTLVSTT

EHDGHVSSVYRESAPMATELVQTAVGDFVVERRPAAGGTPIRDVVPRRLA

GTLLPAIAGEREQLAWMEKQAGPYPFEDYGSLVIDDDLGYALETQTLSLY

GAALFTGPETTRGPSMTHELAHQWFGDSVSPFSWSDVWLNEGHATWYEML

WSEETGGFPQYTGLADREAFFKAVYAAGDIFRARYGPVAAPLDAATTWDV

FNPNVYAGGALVLYALRQKIGAATFQRVERAWLTTYRGRSASTGDFITLA

SRVARQDLRPFLTSWLLGVTTPPMPNHPDWVVTPGS

SEQ ID NO:211 orf11 putative StrR-like regulator 286aa

MDSPRLNGEDPRHTEVLAGFGAELPPIVVHRATMRVIDGAHRLSAARLRG

DDRIRAVLFDGTEQEAYVLSVKANVTHGLPLSAAERTRAAERIITMHPDW

SDRMIAASSGLGARTVGGLRRRRAASGESPAGLRSRAGRDSRVRPAGSTA

GRLKAVDYLQDRPDASLREIARHAGVSPSTARDVRDRLHRGEDPIPATQR

AAARPGNDSPPLRSLVQGLASDPSLRFSESGRDLLRWLIAHAVQDGEWKG

LVDTIPAHSAQALAKIARHCSREWREFADILEKDAA

SEQ ID NO:212 orf12 1anA 64aa

MSAITVETTWKNTDLREDLTAHPAGLGFGELSFEDLREDRTIYAASSGWV

CTLTIECGTLVCAC

SEQ ID NO:213 orf13 1anM 1046aa

MSSFAIAASPASAYLHERSAGPGGDPVAEHERVESWRESAFLDDPVLDIR

LRELGLSRAEFGRLLTDGAYDAGSTALDWAGELAAVLATGTGAVTGLARS

TKLWAQGFDRLPFAGLIERFLAYYEPRVPRTAGTVRVSLLESLANRLLTV

ATRTLLLELNVARVHGRLTGATPGERYDHYDRVLLTDPDYLRSLFGEYPV

LGRAMVECGRRWASAMAELFQRLDADRPALHAAGLLPAGAGEVTALRPDL

GDPHNSGRAVAILTFRSGAQLVYKPRPVGPERAYAETAAALNRHGLSLPL

TAVDVLDRGAYGWCELVRHEPCADRADLDRFYRRTGAVLATTLLLGAVDV

HMENVIAAGSSCMPIDLETLLQPGVPSGDATDAYTRALDLLNQSVLAIGI

LPARAFGGRERKSVDVSAIGGGEAQTAPRPVPMVVEPFTDVARIEAVEAT

MLGAQNRPVLVGAEVRPEEHTEAVVAGFTEAYDLIVRHREDFADLLAGFG

DVEVRYLPRPTRRYSMFLTESYHPDYLRDARDRDRLLDKLWTAAGARPDL

IPIIESEKRQLLAGDIPCFRALAGDRAIRTASAPVAPDFFDAPGIEVLAG

RLRQFGPVHRAAQLRIIRESMGTMPAPGPIAGTPAPSSERRGGLDPREAA

TLGDRLVRELADEAILGADDAGWIGVSIEGLDQETFSYKPMATGLYDGIA

GMALTYAYAARTLGDERYLDLTRRTVKLVSGYLRYLAEHRIVETVGAYSG

MAGLLYTLDHVAHATGDASLLGEIEAALPWLRECATREECPDLIAGLAGC

AVVALSLYRRHGIAGYREVAEICGRRLAGTAVDVEGAAGWAATRTGVILG

GFSHGSAGIAWALHELAAEFGDRDLRELADRAVEFDRRLYVPAAGAWRDL

RPEMAGTDGYPALWCHGAAGIGLSRLLIHRIRPDERLAEEARAAVALVRR

HGFGHNHSLCHGDFGALALLGLADRAWPGSGGHDERAGAVVRDIGETGLR

CGLGNGIRMPGLMLGAAGAGLSLLRLAAPADVPAVTWLEPPRGTHV

SEQ ID NO:214 orf14 1anT 575aa

MSETAGLLRRSLLDHRGKLAAVAGLAVAGVGCQLGQPFLIRRVLTAVQSA

QPYRQLALAVLAVMVVGAALGAVQQFLLQRTGEAMVFTVRRTLVAHLLRL

PVAAYDERQSGDLVSRVGADTAQVRSVITSGVVDLAGGVLLVGGSIAGMI

IIDPVLLGVSLAPVLCGAAGVRLVGRRLRPLSSAVQESIGALTASTTRAL

GAIRTIRVAGATERETALIVAEADRARAAGVRLALVAAQAGPIVRLALQG

AFVAVIGFGGYRVANGAVSVGDLVAFTLLLFTLALPLAQLAEAATRIQTG

LGALTRIEEILALPDEDSALGVRARTPATVRHDPVLLEFDHVSFRYPTGG

EILRDVSFRVPAGSTTALVGPSGAGKSTILALIARLYEVHGGRILLHGRD

IRDYPLAELRAALGYVEQEAPVLAGTVRDNLTLAAPDVAEHAIRHVTASV

NLDDLLARDPAGLDAPVGDGGVLFSGGERQRLAVARTLLAPGELLLFDEP

TAHLDARNEQALQHGLTAHAAGRTLVVVAHRLATVAHADQILVIDDGRSV

AAGRHEELLVRDPTYREFATRQLLT

SEQ ID NO:215 orf15 1ano(Lucifrase 型单氧酶)347aa

MLSVLDQVPVFRGDDPAEAVREAVGLARAAESLGYHRFWIAEHHGSAANA

CAAPEIVAAAVAGATERIRVGTGGVLLPYYSPLKVAEAFRVLAALYPGRI

DLGFGRGRGGPAVMAELLNPYAIATEEAYAEQVGRLLAFLGDARTVSRVS

VTPAVQDPPLPWLLGSGVGSARLAGMLGVPFCFAQFIATEECPEAIAAYQ

ESFRSSPWLDEPQAMLALRVLAAGTAEDAEELATGFWMSCTTGWRAQVRP

DDDYRGGVPNLADAQRYTLTEEDLAMRASRPYLQISGTAETVGEEIRRLR

KVYDVAEVMLTTNCPGAAAPAPVLRAAGRRARADRAGVTRVRPARRW

SEQ ID NO:216 orf16 1anR(反应调节子)217aa

MADVLVVAEEALVSIGIKMILETMGGFSVVAADRDSALAAVSEHRPAVVL

LDAHATLPESVPLLTRLRDLESGPALAVLATLAASSTVLESLRGGACGFL

LKDSQPEQLVAAVRALASGVTVLAPEASSIMLGAACRGTPAAENAVDEVK

QLSDREQAVLGLIGQGLTNAEIAGRLFISDSTVKEYVSVILRKLGVANRV

QAAVLAYAAGLTTDELA

SEQ ID NO:217 orf17 ABC-transporter associated permease 814aa

MIFTLAWSQVRSHPGRLLAIVAAVVLATGFLAATATFASTSDEGLRLTAA

APLTTADIVLDADDTVHDPQWYQAAAGVRGVRSVDPQYARTVSVFGGDRR

GSANVQSIPATASVRWFTVDEGTWPSAAGQVVADRRTLTDLGVGVGAHLD

FRQGTAAPVPVTVVGSADLGFRPLTGSDYRFYAAASFFAGDTPPAALLTV

TDRDRLAETVDAVGRALPPGATATDASAAADAAAGRFAGGNTQLVVLMLA

FAAVALLASILVIANTFQVIVSQRVRQVALLRLVGGHRRQVSRVVLAEAA

IAGSIGAVIGAVAGVGLGYLGAGLLDINGGGLAVNPIVLALCVLTGVGAT

VVAAWAPARRATRVPPVRALQEVPDALPAQVRGGRRLVAGLILIGLAVGV

LGLAAIGTSLPLALVGGVLLAAGLLTALPLGIALLLPPAARGLERFGVAA

SLAGSNLRQNARRTASATMAVVVGAALITGLAVASASGRATVEADLEARY

PVAVSVHTDGAAIDDRTVRALSGITGLTTATVATSAATFPAAGKPTPARI

AALPTDVAGRLAPELSASTGDPVLLVPASYLTARGLTDGAPLTVTAGGRD

LRFTARGSRLADTTGQLLGVTTGDVLTAAGVRTVPTTVWGTAPGGFDRET

LAADVNAVAARDAGVEVGGGVTEGGDIMNVLSILLGLSLGMLAVTVVIAL

LGIANLLGLSVIERTREMALLRALGTRRSRLRAMVAVEAVTITLVGTVAG

IVIGVPVGLVGVIAAVGRQAEPVIMLAWPQLGLVLVAAAVTGVLASLAPA

RRATRIAPAEGLVR

SEQ ID NO:218 orf18 ABC-transporter ATP-binding protein 240aa

MVSCRNLRKRYGTGDAAVVAVDGVSTSFAAGEFTAIMGPSGSGKTTLMHL

LAGLDTPTEGEVSLAGTALAGLDDRALTDLRRDRVGFIFQAFNLLPTLTA

EQNIVLPLRLAGRPVDRDRLQRIAASLQIGDRLGHRPAELSGGQQQRVAV

ARALLTEPSVVFADEPTGALDIATGRALLAGLQNAARQASQTIIMVTHDA

AAATYADRVLIMADGRLWDELRAPTLESIMSVMASVTVTS

SEQ ID NO:219 orf19 组氨酸激酶 362aa

VIAGAAVMVCLLLGLAGLDEWYWSAALCVPLVIRRSAPVVFLALVAVLSG

IHMIYSGSFAFPGDLVDLVAVHAVAGYGPARVRHLGLLLGVAGSLVVTAR

ALHDGLPSSATLPAALIVAATLAAWSTGLMQRRQRADVIEADHRRRLAEQ

DSAMRARLAAIEERTRISQEMHDIIAHSLASVIAQAEGGRVAARADAVVA

GPLFDRIAQIGREALNDVKRLLNSIDGDTPDDFAQGLPDLPGLLAGVSAA

GLDVTFEVAGPEQPLASGMDLAVYRVIQESLTNVLKHATQRQARLSLVWT

PAWLEVSVTSPLTFAGALREGRGLSGIRQRCSLFNGDCEIVAGQTFSVIT

RWPLARPEVAVP

SEQ ID NO:220 orf20 反应调节子 218aa

MTEPQIDVVIADDQDLVRTGFALVVDSAPDMRVVATAADGAEVVRLAAEF

RPDVVLMDIRMPRVDGITAARAILEGNAQPPKIVALTTYDNDEYASRILA

AGASGYLLKDTTAEGLTAAIRTVHRGGSVLAPSTTHRLVTAHRQHPARPS

ALLDSFTTREREVFDLIVAGASNAEIADRLNLAEVTIKTHVGRVLAKIGV

RDRVNVVIWAYRNGAGPS

SEQ ID NO:221 orf21 假定膜蛋白301aa

MPILWTAVLAGAVILGHRLVPNAVGNAGSLIEAFLPWFGLAVPVLLLLAL

MRRSLTGLAAVLLPLGAWLIHFGGYVVDRDTGTPDLIVVQHNVSDENPDP

AGTARALLAAHPDLVGLEEVLPEAVAAYRGVLDAELPFHTVQGTVALWSR

YPLTGAEAIDIRPHDLGEDWNRGLRAVARTPGGDTAVYVAHLPSVRVTAA

GLTSARRDESARKLGALLAADPVPRLVVIGDLNTSVDDRGLRPIRQVMID

SPADFAFTWPARTPVARIDQVLARSMTVTRLTALPRTGSDHLPLAAEIRF

P

SEQ ID NO:222 orf22 alpha-beta 水解酶 290aa

MRNNETVRIPVATGGAVTATLFAPESARAVLVVHPATATPQGFYASFATY

LAENGIATVTYDYRGTGRSGSPRDHRDLGMRDWIGADAPAVAAWAADRFP

GLPRLAAGHSLGGHVIALGAAGPDLAASVIVASHIAALRTI PSRLERFRV

RIMLHILGPALGRLLGYVPARSLGLGEDLPAAAMLEWGGWARRDNYFFDD

PSMRAAERAATLTGPVLAVGTTDDPWSTPRQMDALTVHLTSASVERRTYS

PAAAGVPVIGHHGLFRRAVRDTVWPELLAWLHAHSEKASR

SEQ ID NO:223 orf23 转录调控因子 145aa

VRLPRLIFLLFNADRAVRRWIDARSGDTGIGASGAGVLFYLAGHENALIG

DVTAALGASPSGMSGLVNRLERGGCLTRSQDPADARAVRLALTPRGHQVV

IHARGLVDDLNEQLTAGFDDAEIAVVQRWLEHVTRVSVQREERLG

SEQ ID NO:224 orf24 丙酮酰依赖的精氨酸脱羧酶 175aa

MADSVVFDQIPVVRAIGRGTTSLSAFHDALVTMECGFYNLVRLSSVIPPG

TAVDPSGKAPVPVGAWGDKLYCVYAEQHASQPGEEAWAGIGWVQRRDGQG

GLFVEHEGTSESFVREAIKASLRDLVKGHEDDFDGPDFVVHGVVSDGEPV

CAMVLAPYETAPWRGVRATDPPGMN

SEQ ID NO:225 orf25 假定的二氨基庚二酸脱羧酶 406aa

MTLSEILPSLGASLRPRLDPANWPLTARWTEPGDLTVGGVPVTRIAAAHG

TPVHVIDETDVHSRCAEYVAAFGPGAVCCSAKGGLLRGAARWIARDGLGC

YCRSAAELRTALDAGIRPESLALFGSGKSVADLEAALSCGAAVVIGSASE

AEVVAARSRPGQRVLLRVRPGSAQRGYGVRLNSSAALAAVATVTRSRRLV

LAGLDCSLGHRLNRFGTYESCLREAIGFVARLRTTVPVLNLGGGHAADLP

VGIFAARLRAVAQVTSEGYGIEPPEVHVSPGRALLGRAGITVHRVVAAGD

GVIELDGDVPDCLPGADCAGLHTAALIGRASPAPGRSITVRCGDATVAVA

ELPGDMAAGDLVALSGTGAYHQRRDVYVGRPAVVAVCGGRARTLLPRETI

DRILYA

SEQ ID NO:226 orf26 激酶 309aa

VRSKREHSADIRRGRRAVLVVNTRSRRGRLLYEEARRRLVEAGFELLGTY

ALEQSGGLDGLISEALRKEPDLLIAGGGDGTISTAGRMLAHRDVALGVLP

LGTTNNFARTVRIEPDLEAAIATLVDGKVIDVDLGVAGDVPFTNHVGIGL

SGEVMISAPPRLKRAVGRLAYPMTALGLLARHRPVRAVIRAEGRELRFHT

HQVYVANGGFHAGRPITADAHADDRLLVAYPVGGASRRELLRETARNAAT

GHRRTLHERPFIAVRELWLETDRPVAVEVDGEPRGTTPMRIAIDPNALRI

MAPADSPDL

SEQ ID NO:227 orf27 转录调控因子 367aa

VVFGSLLLVGGGGGAIGLNATVAAATSSVGQESLLGSAKPAEEKKNANLD

GAKNLLLVGIDQRPTQTNGEPLRSDSIILLHINKDHSSGYMISLPRDSYV

YIPAYDNGKQKWAGGKTKINAAFAFGTRGLKGNEALQHGFELLTMTVKEL

TGITPDAGAIIDFQGFRDVVNVLGKVCMYVDTTTKSIHLGKDQNGKTAKP

FVINPDGTLKSKISGVTPNTYTKGDHCFTPGQALDFVRQRDLLADNSLDY

GRQRHQQQFFKAIINQALKDGLDSPTKLPKLLSAFGKAMTVDDGGIDLAD

WALAMRSLKPDKLLTIKTNAGKLNSENVPGSGSVELLSDDSMDLLKSIKK

DQIDTFLLSHPAFIANS

SEQ ID NO:228 orf28 糖基转移酶 317aa

MPSEPDVSVVIPTCNRPELAVRAVRSALGQTHRNLEVIVVVDGPDEATVT

ALGEVGDPRLSVIVLPERGKAPNARNTGARAARGRWTAMLDDDDEWLPTK

IERQLETAAATVERPVVACRMISRTPRADTIMPRRLPEPGEPISEYLLV

RRGLFYGDGFVQTSCIMAPTELWRKVPFTVGLRRAQELDWTLRAMREPGT

ALIYAEEPLVLWHQDENRDRISLQNPWREQLEWLRGNRELFTPRAYAAFT

LSVLSSMAAPTRDTGLFRELLAEARTHGDPGTVDYLTHMQIWALPPSVRH

RLRDVVVGRGKTSSNAG

SEQ ID NO:229 orf29 糖基转移酶 369aa

MPAERRVAIWRSSMLPGSETFVRNQADALTRWTPAYVGAVRHESVLSRPD

DVIAFPGGKGFLRLRLTGASPQLQKTISAVRPNLVHAHFGGDGWLVSHSA

QQLGVPLAVTVHGHDVTRQPSSPGAKGVRYRRNLQTVFTRASLVIAVSEV

IRGQAIRWGADPAKVKVHYTGIAVPPEQPEEVPKRWDVVFIGRFVAKKGV

DDLLTALAAVESRPRALLIGDGELMTAMRARAEQLGVDVTFAGSRTPEQV

RRHLLESRLLACPSKTAPDGDTEGLPTTILEAAALGLPVVATRHSGIPEA

VIDGETGLLSPEADPAALAVSLTRLLGDEDLQRRLGARARRHVTAHFDLV

EQTRRLEDLYDEVVAGARV

SEQ ID NO:230 orf30 二氢硫辛酰胺脱氢酶 459aa

MGEHFDLVVLGAGPGGYVAAIRGAQLGLTTAIVEDKYWGGVCLNVGCIPS

KALLRNAELAHIFHHQAQTFGIEGKVTFDFAVAHQRSRSVADGRVKGVHF

LMKKNGITEIQGRGEFTDAHTLRVGDRTVTFDNCILATGASTRMIPGTSV

SKRVVTYEEQILDPDLPDSIVIVGAGAIGVEFAYVLRNYGVDVTIVEFLD

RMLPLEDEEVSKELLRQYRKLGVDVRVGTRVEGIEEGADSVRVTVSKNGK

TEVLEADKVMQAIGFKPNVEGYGLETTGVTVSDRGAVEIDDFCRTNVPGI

YAIGDVTAKLMLAHAAEAMGIVAAETIAGAETMALDYRMIPRATFCQPQV

ASFGWTEAQAREQGFDVKVAKFPFTANGKAHGLGDATGFVKILSDAKYGE

LLGAHLIGPDVTELLPELTLAQQWDLTVHEVGRNVHAHPTLAEAVKEAIH

GLAGHMINF

SEQ ID NO:231 orf31 假定膜蛋白 348aa

MTTPPRRSGTLSLVTLTVEPPIAPAPPAAPGRSRRRRLGYLAFVLVAVVA

VVTLRDRLPDPGEFLDALRAADWRWAALAVGAGVLSQIAYAEQQRRLLAA

FGVRVPARRAIAMTYVRSALSMALPAGSAASAAYAFQVYRRHGATAAISA

TATLISTVVTVMSLGLLYAATWSLTATVVAGLAVLLLWIYRTVRGPVPAR

AGVPRRLRVAPIARLLQRPAVAQALRGARSVPARTWLTVTLAGVINWLLD

MACLLLAADALHAGLGWSRLALIYLAVQVVRQIPLTPGGIGLIETSMLAG

LIAAGAPQVTAAGIVLIYRLISFWLILPSGLAAHLTLRRGTVPPVTPG

SEQ ID NO:232-SEQ ID NO:299

(Null)

SEQ ID NO:300  O/SBDIG-1

TGGGTSTGCACSCTSACSATCGARTGCGGNACSGTSATCTGCGCSTGC

SEQ ID NO:301  O/ACT08F

TCCAGCACGCGCGGGG

SEQ ID NO:302  O/ACT09R

GTTCGACCAGCCGCCC

SEQ ID NO:303  O/AGvar01bF

TTCTAGACGTTGTTCTCCCATTTTCAC

SEQ ID NO:304  O/AGvar02bR

AAGATCTTCGAAGGTGAGCTCGCCGAA

SEQ ID NO:305  O/AGvar03F

GATCTTCGCGAGGACCGCACCATCTACGCCGCCAGCAGCGGCTGGGTGTGTACACTGACGATCGAGTGCGG

CACCGTGATCTGCGCCTGCTGAC

SEQ ID NO:306  O/AGvar04R

CTAGGTCAGCAGGCGCAGATCACGGTGCCGCACTCGATCGTCAGTGTACACACCCAGCCGCTGCTGGCGGC

GTAGATGGTGCGGTCCTCGCGAA

SEQ ID NO:307 O/AGvar05F

GCCTGCTGACCTAGGTCGACGATCGT

SEQ ID NO:308 O/AGvar06r

TGAATTCGGCTGCTCCCCGCGCGAAAT

SEQ ID NO:309 O/SB50F

ATTCGCCCGGGAAGTCCACCGAAAGGAAGACACACCATGATTCCGGGGATCCGTCGACC

SEQ ID NO:310 O/SB51R

GGGCGATGCCCGCCCCGGGCCGGAAACGATCGTCGATCATGTAGGCTGGAGCTGCTTC

SEQ ID NO:311 O/SB52F

AAGTATATATGAGTAAACTTGGTCTGACAGTTACCAATGATTCCGGGGATCCGTCGACC

SEQ ID NO:312 O/SB53R

GCTTCAATAATATTGAAAAAGGAAGAGTATGAGTATTCATGTAGGCTGGAGCTGCTTC

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号