首页> 中国专利> 参与外遗传基因沉默的基因

参与外遗传基因沉默的基因

摘要

本发明涉及编码参与基因沉默的蛋白的DNA。相关基因可从不同来源如哺乳动物或植物的细胞中分离,其编码蛋白的特征为氨基酸序列含有与SEQ ID NO:3的对比成分序列有40%或更多一致性的、至少有150个氨基酸残基的成分序列。进一步公开的是一种分离根据本发明的DNA的方法。

著录项

  • 公开/公告号CN1364194A

    专利类型发明专利

  • 公开/公告日2002-08-14

    原文格式PDF

  • 申请/专利权人 辛根塔参与股份公司;

    申请/专利号CN00809325.3

  • 申请日2000-06-21

  • 分类号C12N15/29;C07K14/415;C12Q1/68;C12N15/82;

  • 代理机构中国国际贸易促进委员会专利商标事务所;

  • 代理人唐伟杰

  • 地址 瑞士巴塞尔

  • 入库时间 2023-12-17 14:19:27

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2007-08-29

    专利权的终止未缴年费专利权终止

    专利权的终止未缴年费专利权终止

  • 2006-04-12

    授权

    授权

  • 2002-08-14

    公开

    公开

  • 2002-07-24

    实质审查的生效

    实质审查的生效

说明书

本发明涉及编码调控基因沉默、特别是植物基因沉默的蛋白质的DNA。

在对发育、环境或未知信号的反应中可以观察到植物中先前活跃的基因表达的丧失,也称为基因沉默。虽然其发生的频率比突变高,但在体细胞传递过程中显著稳定。基因沉默,最初被认为是转基因表达不稳定的有害起因,现在则被看作是有目的地调控基因表达的分子工具。

看来,受影响座位的染色体位置或结构可能是决定沉默频率和强度的因素。失活似乎偏向于影响存在多拷贝的基因,并被认为是序列冗余的结果。同源依赖性的基因沉默的许多实例已有报道。进一步分析可根据受影响座位的相对位置(顺式、反式、等位、异位)、受影响基因的来源(内源的或转基因的)和相互作用的水平(转录或转录后)对沉默事件进行分类。尽管转录后沉默看起来主要包括形成异常RNA分子和偶然而非必然地伴随DNA甲基化,但干扰转录起始的沉默与DNA的高度甲基化、而且可能与沉默座位的染色质结构改变紧密关联。然而,不清楚这些分子事件是基因沉默的前提还是沉默状态的结果。

就转录沉默而言,沉默基因的失活状态通过有丝分裂和减数分裂稳定传递。同在其它生物中一样,反式作用修饰基因座位(modifier locus)可能负责沉默基因失活状态的稳定性。料想导致突变蛋白的这些座位的突变可能通过干扰沉默状态的维持或不能识别序列冗余而导致减少的基因沉默以及先前沉默座位的再活化。已经报道拟南芥(Arabidopsisthaliana)DDM1基因中的突变使基因沉默解除,并且该基因编码参与染色质重塑(remodeling)的SWI2/SNF2样的蛋白。但是,DDM1基因的突变引起严重的多效性效应。因此,为了能够使用基因技术改变这种效应,有必要鉴定更多的特异性修饰基因座位并表征相应的野生型和突变型蛋白。本发明的主要目的是提供包含编码这种蛋白的可读框的DNA。

对于带有可遗传地失活的、甲基化的潮霉素抗性基因的鼠耳芥属(Arabidopsis)株系,可通过实施例1描述的T-DNA插入诱变来鉴定根据本发明的反式作用修饰基因座位。沉默修饰基因座位的突变导致潮霉素抗性基因沉默的解除并恢复潮霉素抗性。用不同于潮霉素抗性基因的选择标记基因转化沉默的抗性基因纯合的植物,该选择标记基因受T-DNA1′-2′二元启动子的控制。选择转化体并筛选其后代的潮霉素抗性。筛选与特定T-DNA插入片段遗传共分离的突变表型(潮霉素抗性)。使用重组DNA技术的常规方法克隆标签化基因,可表征沉默修饰基因座位的突变型和野生型DNA序列及编码的蛋白。

在本发明中,提到基因应理解为是指与调控序列相连的DNA编码序列,该调控序列可使编码序列转录成RNA如mRNA、rRNA、tRNA、snRNA、正义RNA或反义RNA。调控序列的实例为启动子序列、5′和3′非翻译序列、内含子和终止序列。

启动子理解为启始相关DNA序列转录的DNA序列,也可包括作为基因表达调控器的元件如激活子、增强子或阻遏子。

基因的表达指在活细胞内基因转录成RNA或基因转录及随后翻译成蛋白质。就反义结构而言,表达仅指反义DNA的转录。

术语转化细胞指将核酸导入宿主细胞,特别是DNA分子稳定整合到所述细胞的基因组中。

特定核苷酸或氨基酸序列的任一部分或片段称为成分序列。

根据本发明的DNA含有编码蛋白质的可读框,该蛋白质的特征为氨基酸序列含有与SEQ ID NO:3有40%或更多一致性的、至少有150个氨基酸残基的成分序列。具体地,该可读框编码的蛋白可用式R1-R2-R3来描述,其中--R1、R2和R3构成由从氨基酸残基组Gly、Ala、Val、Leu、Ile、Phe、Pro、Ser、Thr、Cys、Met、Trp、Tyr、Asn、Gln、Asp、Glu、Lys、Arg和His中独立选择的氨基酸残基组成的成分序列,--R1和R3由0-3000个氨基酸残基独立组成;--R2由至少150个氨基酸残基组成;且--R2与SEQ ID NO:3的对比成分序列至少有40%相同。

大多数情况下该蛋白的总长在1000-3000氨基酸残基的范围内。在本发明优选的实施方案中成分序列R2由至少200个氨基酸残基组成。成分序列R2的具体实例为下列氨基酸范围所代表的SEQ ID NO:3的成分序列:

1-416(相应于外显子2);  418-583(相应于外显子3-5);  584-890(相应于外显子6);  892-1472(相应于外显子7-9);  1007-1472(相应于外显子9);  1473-1631(相应于外显子10-12);  1632-1827(相应于外显子13-15);和  1829-2001(相应于外显子16)。

在本发明优选的实施方案中,成分序列R1和R3中至少有一个含有一个或多个长度至少为50个氨基酸、并与SEQ ID NO:3的对比成分序列至少60%一致的额外成分序列。这类额外成分序列的具体实例为下列氨基酸范围所代表的SEQ ID NO:3的成分序列:420-525(相应于外显子3和4);444-525(相应于外显子4);526-583(相应于外显子5);892-971(相应于外显子7);892-1006(相应于外显子7和8);1473-1524(相应于外显子10);1525-1576(相应于外显子11);1577-1631(相应于外显子12);1632-1690(相应于外显子13);1692-1757(相应于外显子14);和1758-1827(相应于外显子15)。

根据本发明DNA的特别优选的实施方案编码具有由SEQ ID NO:3的氨基酸478-490、584-600、617-630、654-668、676-690、718-734、776-788、1222-1233、1738-1749或1761-1770限定的成分序列的蛋白。优选地,该编码蛋白含有至少两个、三个或更多所述成分序列的不同代表。所述实施方案的具体实例编码可用SEQ ID NO:3的氨基酸序列、用氨基酸残基K替代SEQ ID NO:3的705位的M或用氨基酸残基D替代SEQID NO:3的1219位的E的等位氨基酸序列表征的蛋白。

动态程序设计算法产生不同种类的对比。序列对比通常有两种方法。Needleman和Wunsch及Sellers提出的算法对比两个序列的全长,提供序列的总体对比。另一方面Smith-Waterman算法产生局部对比。选择计分矩阵和空位罚分后,局部对比序列中最相似的区域对。这使得数据库的搜索集中在序列的最高保守区。它也可对比待鉴定序列中的相似区域。为了提高使用Smith-Waterman算法对比的速度,BLAST(局部对比搜索基础工具)和FASTA在对比时都加了额外的限制。

在本发明中使用BLAST方便地进行对比,BLAST是一套相似性搜索的程序,设计用来探测所有提供的序列数据库,无论查询的是蛋白还是DNA。该搜索工具的BLAST 2.0版(Gapped BLAST)已在互联网(目前的http://www.ncbi.nlm.nih.gov/BLAST/)向公众发布。它使用寻求局部对比而非总体对比的启发式算法,因此能够检查仅共享隔离区域的序列间的关系。BLAST搜索中的对比得分有明确的统计学解释。在本发明范围内特别有用的是可在局部序列对比中导入空位的blastp程序和PSI-BLAST程序(这两种程序将查询的氨基酸序列与蛋白序列数据库比较),以及只能对两个序列进行局部对比的blastp变异程序。优选将任选参数设定为默认值来运行所述程序。

使用BLAST的序列对比也可考虑一种氨基酸被另一种氨基酸所替代是可能保留维持蛋白结构和功能所必需的物理化学特性,还是更可能破坏蛋白的基本结构和功能特征。与相同氨基酸的百分率比较,这种序列相似性按照“阳性”氨基酸的百分率来定量,并且在两可的情况中有助于将蛋白归属于正确的蛋白家族。

使用这些计算机程序的序列对比揭示了ATP/GTP结合基元A(SEQ IDNO:3中的460-467位氨基酸)的存在,其共有序列为(Ala/Gly)XaaXaaXaaXaaGlyLys(Ser/Thr),其中(Ala/Gly)指Ala或Gly,Xaa指任意天然存在的氨基酸,(Ser/Thr)指Ser或Thr。对比还揭示了一个区域(SEQ ID NO:3中的479-719位氨基酸),其与参与染色质重塑的SWI2/SNF2家族蛋白的部分ATP酶/解旋酶结构域相似,但与已知蛋白没有显著的全序列一致性。

根据本发明的具体DNA实例在SEQ ID NO:1和SEQ ID NO:2中有描述,其编码SEQ ID NO:3描述的鼠耳芥属蛋白。对比后,长50-500个氨基酸的SEQ ID NO:3的序列片段显示与已知蛋白序列的片段有20-50%的序列一致性。然而,SEQ ID NO:3的总体对比导致低于30%的序列一致性。因此,本发明定义了一个新的蛋白家族,其成员的特征为其氨基酸序列含有与SEQ ID NO:3的对比成分序列有40%或更多一致性的、至少150个氨基酸残基的成分序列。优选该氨基酸序列一致性高于50%或甚至高于55%。

编码属于本发明新蛋白质家族的蛋白的DNA可从单子叶和双子叶植物分离。优选来源为谷物、甜菜、向日葵、冬油菜、大豆、棉花、小麦、稻、马铃薯、嫩茎花椰菜、花椰菜、甘蓝、黄瓜、甜玉米、日本萝卜(daikon)、蚕豆、莴苣、甜瓜、胡椒、南瓜、番茄或西瓜。但它们也可由哺乳动物来源如小鼠或人的组织中分离。本领域技术人员知晓,可使用以下普通方法来适应特定的任务。由至少15个,优选20-30个或甚至多于100个连续核苷酸组成的SEQ ID NO:1或SEQ ID NO:2的单链片段可用作探针来筛选DNA文库中与所述片段杂交的克隆。杂交要注意的要素在Sambrook等在(分子克隆:实验室手册》(Molecular cloning:Alaboratory manual),冷泉港实验室出版社,9.47-9.57和11.45-11.49章,1989)中有描述。测定杂交克隆的序列并纯化含有如下完整编码区的克隆的DNA,该编码区编码蛋白的特征为其氨基酸序列含有与SEQ ID NO:3有40%或更多一致性的至少有150个氨基酸残基的成分序列。然后,所述DNA可用许多常规重组DNA技术如限制酶消化、连接或聚合酶链式反应分析进一步处理。

SEQ ID NO:1和SEQ ID NO:2的公开使本领域技术人员能够设计用于如下聚合酶链式反应的寡核苷酸,该反应试图从包含核苷酸序列的模板扩增DNA片段,其中核苷酸序列的特征为SEQ ID NO:1或SEQ ID NO:2中的15个、优选20-30个或更多碱基对的任意连续序列。所述核苷酸含有代表SEQ ID NO:1或SEQ ID NO:2的15个并且优选20-30个或更多碱基对的核苷酸序列。使用至少一个这种核苷酸进行的聚合酶链式反应以及其扩增产物构成本发明的另一个实施方案。

实施例:

实施例1:T-DNA插入

在Mittelsten Scheid等,Mol Gen Genet 228:104-112,1991和Mittelsten Scheid等,Proc Natl Acad Sci USA 93:7114-7119,1996中描述了携带含有多拷贝嵌合潮霉素磷酸转移酶基因(hpt)的转录沉默座位的拟南芥苏黎世生态型(ecotype Zürich)转基因株系A。通过植物真空浸入(in planta vacuum infiltration)(Bechtold等,C R Acad SciParis Life Science 316:1194-1199,1993)对所述株系纯合二倍体基因型进行农杆菌介导的基因转移,产生4000个以上的独立T-DNA转化体。Mengiste等(Plant J 12:945-948,1997)描述了带有由转录融合到1′启动子的bar基因编码区组成的T-DNA的二元载体(p1′barbi)、农杆菌株(C58CIRifR)和转化方案。通过用Basta溶液(150mg/l)反复喷洒萌发的幼苗来选择转化体(T1植物)并使其生长成熟。

实施例2:突变体选择

从各转化体收获自交种子(T2家族)。在筛选沉默表型的回复突变体之前,种子在室温下干燥1周并在4℃冷处理最少1周。大约1000粒种子的混合等分试样(由来自20个T2家族的50粒种子组成)表面灭菌7分钟两次(用含有0.1%Tween 80的5%次氯酸钠),并用灭菌双蒸水冼涤。每一等分试样放入含有75ml用0.8%琼脂固化并含有10mg/l潮霉素B(Calbiochem)的萌发培养基(按照Masson等,Plant J 2:829-933,1992)的14-cm培养皿中用于选择。为了确保在播种时平均分配,将种子与30ml含有0.4%琼脂的相同培养基混合。作为阳性对照,来自潮霉素抗性株系的两粒种子播种在每个培养皿的标记位置。平板在4℃冷处理2天,随后让其接受21℃光照16小时和16℃黑暗8小时的交替周期。播种后每天估计潮霉素抗性,共8-15天。

实施例3:突变体的分子和遗传分析

鉴定了其中一份混合试样的11株潮霉素抗性幼苗之后,对形成该混合库的家族重新进行个别筛选。一个家族含有大约25%的潮霉素抗性幼苗。将该家族的6株抗性幼苗转移到更大的含有无潮霉素的萌发培养基的容器中。在花结形成和根系发育之后,将植物转移到土壤中进一步生长并形成种子。在盆栽之前,从每株植物中取出组织外植体,使其在含有或不含10mg/l潮霉素B的RCA培养基(表1)上产生愈伤组织培养物。愈伤组织培养物用作DNA和RNA分析的材料来源并用于进一步证实该组织中的潮霉素抗性。

使用Mittelsten Scheid等描述的(Mol Gen Genet 224:325-330,1994)基于CTAB的方法分离基因组DNA,并与限制酶BamhI,HpaII,MspII,DraI,EcoRV,RcaI或HindIII一起孵育。使用RNAeasy试剂盒(Qiagen)根据厂商的说明获得总RNA。使用通过随机引发标记用32P标记的DNA片段,在Church和Gilbert(Proc Natl Acad Sci USA 81:1991-1995,1984)描述的条件下进行Southern和Northern杂交分析。hpt基因的编码区、或由P35S启动子、hpt编码区和终止子区组成的DNA、或bar基因的编码区和1′启动子用作探针。

4个潮霉素抗性姊妹株的Northern杂交分析显示了hpt基因转录的恢复。所述姊妹株的Southern杂交分析表明在复合的hpt插入片段内部没有可检测的重排。通过用甲基化敏感限制酶HpaII和MspI的Southern杂交分析以及用硫酸氢盐处理后对启动子区进行基因组测序,可以叛定突变体中hpt转基因复合体象原始株系A中一样仍为高度甲基化的。与som突变中观察到的相反,该突变对重复基因组DNA的甲基化也没有影响。

潮霉素抗性植株和来自同一家族非选择的姊妹株生长产生种子,在下一代中检查Basta抗性,并通过Southern分析记录T-DNA插入片段的数目和大小。结果证明初始T-DNA转化体一定含有2个在姊妹株中独立分离的T-DNA插入片段。一个插入片段与潮霉素抗性突变体表型共分离。用该插入片段纯合并缺少另一个T-DNA插入片段的植株来克隆相应的T-DNA插入位点。

对突变表型的植株与含有携带多拷贝嵌合β-葡糖醛酸糖苷酶(gus)基因的转录沉默座位的拟南芥哥伦比亚生态型(ecotype Colombia)转基因植物株系GUS-TS(可获自Dr.H.Vauccheret,INRA,Versailles Cedex,法国)之间的杂种进行组织化学GUS染色,揭示了在mom等位基因纯合的F2代中沉默GUS基因的再活化。

moml突变表型的植株近交即使在近交第9代中也不导致任何形态学上的异常。这与som突变体相反。

由于在F1杂种中导入野生型MOM等位基因,mom1突变表型与株系A(见实施例1)的回交导致重新活化的hpt基因的立即再沉默。这也与som突变体相反。

表1:RCA培养基的组成

     RCA培养基

MS macro 10×                               100ml

B5 micro 1000×                           1ml

柠檬酸铁                    5ml

NT维生素100×                               10ml

蔗糖                        10g

MES                         5ml

琼脂                        10g

NAA                         0.1mg

BAP                         1mg

pH5.8(KOH)

加至1升

MS macro 10×

硝酸钾                      19g硝酸铵                         16.5g氯化钙(×2H2O)              4.4g硫酸镁(×7H2O)              3.7g磷酸二氢钾                     1.7g加至1升B5 micro 1000×硫酸镁(×H2O)               1000mg硼酸                           300mg硫酸锌(×7H2O)              200mg碘化钾                         75mg钼酸钠(×2H2O)              25mg硫酸铜(×5H2O)              2.5mg氯化钴(×6H2O)              2.5mg加至100ml柠檬酸铁柠檬酸铁铵                     10g加至1升NT维生素100×肌醇                           1000mg盐酸硫胺素                     10mg加至1升MESMES                            14gpH6(NaOH)加至100ml

实施例4:“沉默基因”的克隆

从仅含有与潮霉素抗性突变表型共分离的T-DNA的植株中分离基因组DNA。使用靠近T-DNA右边界指向外侧的3个特异性巢式引物(5′-CAT CTACGG CAA TGT ACC AGC-3′(SEQ ID NO:4),5′-GAT GGG AAT TGG CTG AGTGGC-3′(SEQ ID NO:5),5′-CAG TTC CAA ACG TAA AAC GGC-3′(SEQ ID NO:6)),和可能与旁侧植物DNA结合的几个简并性引物中的一个,对该DNA进行根据Liu等(Plant J 8:457-463,1995)的TAIL(热不对称交织)PCR。实际上下面7个简并性引物中的2个可导致特异性片段的扩增。  AD1    5′-NTC GAS TWT SGW GTT-3′(Liu等,同上;SEQ ID NO:7)  AD2    5′-NGT CGA SWG ANA WGA A-3′(Liu等,同上;SEQ ID NO:8)  AD3    5′-WGT GNA GWA NCA NAG A-3′(Liu等,同上;SEQ ID NO:9)  AD4    5′-WGG WAN CWG AWA NGC A-3′(SEQ ID NO:10)  AD5    5′-WCG WWG AWC ANG NCG A-3′(SEQ ID NO:11)  AD6    5′-WGC NAG TNA GWA NAA G-3′(SEQ ID NO:12)  AD7    5′-AWG CAN GNC WGA NAT A-3′(SEQ ID NO:13)使用AD7获得的较大的片段被克隆和测序。它含有50bp的T-DNA和275bp的旁侧植物DNA。Southern杂交分析显示该PCR片段含有位于T-DNA旁侧的植物DNA。用该PCR片段筛选野生型拟南芥哥伦比亚生态型的基因组文库(Stratagene)。鉴定了三个与此PCR片段杂交的基因组克隆。这些基因组克隆进一步用限制酶作图,与PCR片段杂交并互相对比。在获得的其中一个基因组克隆(p4A-11)中,插入突变的T-DNA的旁侧序列大约位于基因组序列的中部。使用pA4-11的大约800bp的EcoRI-SalI片段来获得重叠的基因组克隆p5-6,并且使用p5-6的大约700bp的EcoRI片段来获得与p5-6重叠的基因组克隆p30-1。使用p30-1的大约700bp的HindIII片段来获得与p30-1重叠的基因组克隆p33-19。对所述克隆进行测序用来设计RT-PCR的引物。进一步使用p5-6的大约700bp的EcoRI片段来筛选根据Elledge等(Proc Natl Acad Sci USA 88:1737-1735,1991)的野生型拟南芥苏黎世生态型cDNA文库。得到了9个cDNA克隆,并测定了长度为2.6kb的最长克隆p17-8的序列。实施例5:序列分析和对比

考虑到上述克隆的鼠耳芥属沉默基因很大,由于克隆步骤产生的突变或由于测序反应的不确定性,不能完全排除该基因和蛋白真实的核苷酸和氨基酸序列可能与SEQ ID NO:1、SEQ ID NO:2和SEQ ID NO:3给出的序列在几个位置有偏差。另外,来自不同生态型的DNA序列可显示等位基因的不同。因此,SEQ ID NO:1、SEQ ID NO:2和SEQ ID NO:3代表了拟南芥苏黎世生态型的相应基因和蛋白,而从拟南芥哥伦比亚生态型获得的基因组序列显示在SEQ ID NO:1第4338位(A替代T)和6721位(T替代G)核苷酸的两处错配,其导致氨基酸残基K替代了SEQ ID NO:3第705位的M以及氨基酸残基D替代了SEQ ID NO:3第1219位的E。

顺序地从两端对2.6kb的cDNA克隆进行序列分析,结果显示其含有一个大的ORF和3′非翻译序列。

对基因组克隆的分析表明,克隆p4A-11和p5-6含有比cDNA序列的同源序列和7个内含子序列。比较基因组序列与T-DNA插入片段的旁侧DNA序列,表明T-DNA的插入引起大约2kb的基因组DNA的缺失。缺失的5′端位于一个内含子(内含子12)中,缺失的3′端位于cDNA 3′端的下游。此cDNA克隆的5′端序列在基因组克隆p5-6的中部终止。进行三个独立的巢式RT-PCR来获得更上游的另外的cDNA序列。这些RT-PCR使用的引物序列如下:

RT1-1    5′-CTGTACATACTGAGTACAATCGGA-3′    (SEQ ID NO:14)

RT1-2    5′-GCTTCAATTCCTGCCTCAGTTGAAC-3′   (SEQ ID NO:15)

RT1-3    5′-CTCTACGTGCTTAACATCATGCGA-3′    (SEQ ID NO:16)

RT1-4    5′-CCAGCTTCTGCTACTAGAAAGTCAG-3′   (SEQ ID NO:17)

RT2/3-1  5′-CTGGAGTTGCATGAAATCCTGGATG-3′   (SEQ ID NO:18)

RT2/3-2  5′-GCTCTTTGTAAGCTGTTCACGAGAC-3′   (SEQ ID NO:19)

RT2-3    5′-TCGCATGATGTTAAGCACGTAGAG-3′    (SEQ ID NO:20)

RT2-4    5′-GAGTACTGGTCCGTGAACAGGTAAT-3′   (SEQ ID NO:21)

RT3-3    5′-ATGCTTGCACAAGCATGGTCGGAAA-3′(SEQ ID NO:22)

RT3-4    5′-TGCAACATCGTGCATTTGCTCCAGA-3′(SEQ ID NO:23)

RT4-1    5′-CACAAGCATGAGTTTTTCCTTCCGG-3′(SEQ ID NO:24)

RT4-2    5′-CTGACTTTCTAGTAGCAGAAGCTGG-3′(SEQ ID NO:25)发现这些基因组克隆的几部分序列存放在鼠耳芥属数据库中(登录号B67281,B62563,B20434,B20425,B21274,B08967,B11993,B20116,B12496和B10852为BAC的末端序列,Z18494和AA597930为部分cDNA序列,1999年4月13日)。该编码蛋白序列与Swiss Protein数据库的比较揭示了其与SWI2/SNF2家族的ATP酶/解旋酶的部分相似性(SEQ IDNO:3的第479-719位的氨基酸)。该编码的蛋白由2001个氨基酸组成,并且计算的分子量为219kD,等电点为5.1。在该编码蛋白上发现了一个ATP/GTP-结合基元(SEQ ID NO:3的第460-467位的氨基酸)和三个核定位基元(SEQ ID NO:3的第362-367、832-838和858-862位氨基酸)。对HA-标签化的MOM蛋白的亚细胞免疫检测证实了其核定位。也检测到了与鸡张力蛋白的肌动蛋白结合域的相似性(SEQ ID NO:3的第1899-1941位的氨基酸)和预测的跨膜结构域(SEQ ID NO:3的第995-1015位的氨基酸)。另外,该编码蛋白含有基本由SEQ ID NO:3的第177-350、1462-1672和1848-1894位氨基酸限定的三种类型的重复区域或内部重复。实施例6:其它种属的同源基因

推定的显示与MOM蛋白有部分相似性的拟南芥富含脯氨酸/羟脯氨酸的糖蛋白公开为GenBank登录号AAD29829。基于该区域的相似性为34-47%,并且只能在MOM蛋白的后一半看到(即氨基酸1368-1944)。

使用MOM cDNA克隆通过Southern杂交分析来探测来自芜菁、番茄、烟草、玉米、小鼠、果蝇和人的基因组DNA中同源基因的存在。所有情况下都发现低严紧性条件下的杂交。可对来自文库的交叉杂交克隆进行鉴定和测序。

用MOM cDNA在严紧条件下筛选羽衣甘蓝(Brassica oleracea var.acephala)的基因组文库(获自Dr.Mark Cock,INRA,CNRS,里昂,法国)。得到两个阳性克隆,对其进行亚克隆并部分测序。克隆1的部分序列显示了与MOM基因中编码MOM蛋白的N端、ATP酶和C末端部分的不同区域的相似性(DNA水平为80-86%,氨基酸水平为62-80%)。克隆1中MOM的三个推定的核定位序列完全保守。克隆2的部分序列也显示了MOM基因的相似性区域(DNA水平为64-76%,氨基酸水平为55-64%),其编码MOM蛋白的ATP酶、推定的跨膜区、和C末端部分。克隆1和2的序列不相同,提示在甘蓝(Brassia oleracea)中至少存在两个同源基因。获自克隆1和2的部分序列的实例在SEQ ID Nos:26-33中给出。

用MOM cDNA在严紧条件下又筛选了Brassia rapa的基因组文库(获自Dr.Kinya Toriyama,Tohoku University,Sendai,日本)。得到了与MOM cDNA的5′部分和3′部分杂交的阳性信号。

此外,用MOM cDNA在不太严紧的条件下筛选了碧冬茄(Petuniahybrida)的基因组文库(获逢Dr.Jan Kooter,Vrije Universiteit,Amsterdam,荷兰)。得到了与MOM cDNA的5′部分和3′部分杂交的阳性信号。

实施例7:通过反义结构操纵标记基因表达

2.6kb的cDNA片段以及第一次PCR使用引物RT1-1和RT1-2、第二次PCR使用引物RT1-3和RT1-4进行巢式RT-PCR扩增的1.8kb的RT-PCR片段都反向克隆到二元载体pbarbi53的多克隆位点以产生反义RNA。pbarbi53是p1′barbi的修饰载体,带有一个由花椰菜花叶病毒35S启动子、含有Xho I、SnaBI、Hpa I和Cla I限制位点的多克隆位点以及在pl′barbi HindIII位点的花椰菜花叶病毒35S终止子组成的表达盒。如实施例1所描述的将产生的重组质粒导入农杆菌属。拟南芥哥伦比亚生态型的转基因植株系GUS-TS(获自Dr.H.Vaucheret,INRA,Versailles,Cedex,法国)含有携带多拷贝嵌合β-葡糖醛酸糖苷酶(gus)基因的转录沉默座位,按实施例1的描述用此重组质粒转化该株系并按照Mengiste等(Plant J 12:945-948,1997)描述的方法选择转化体。在对照转化中使用pbarbi53载体DNA。通过组织化学染色来检查转化体gus基因的再活化。将一片子叶在gus染色溶液(100mM磷酸钠缓冲液(pH 7.0),0.05%5-溴-4-氯-3-吲哚-β-D-葡糖醛酸糖苷酶,0.1%叠氮钠)中真空浸泡10分钟,然后在37℃孵育过夜。用带有2.6kb cDNA的重组质粒转化的植物可观察到强的gus活性,而用带有1.8kb RT-PCR片段的重组质粒或pbarbi53转化的植物没有显示高于背景的任何gus活性。因此,2.6kb cDNA的反义RNA的表达模拟了突变表型,并且证实SEQ ID NO:1、SEQ ID NO:2和SEQ ID NO:3中显示的序列代表了转录基因沉默系统成分的遗传信息。

                        序列表<110>Novartis AGNovartis Research Foundation<120>参与外遗传基因沉默的基因<130>S-31005A<140><141><150>GB 9914623.5<151>1999-06-23<160>33<170>PatentIn Ver.2.1<210>1<211>10329<212>DNA<213>拟南芥<220><221>内含子<222>(1009)..(1295)<220><221>内含子<222>(2551)..(2673)<220><221>内含子<222>(2753)..(2867)<220><221>内含子<222>(3114)..(3506)<220><221>内含子<222>(3681)..(3973)<220><221>内含子<222>(4896)..(4975)<220><221>内含子<222>(5218)..(5777)<220><221>内含子  <222>(5883)..(6082)  <220>  <221>内含子  <222>(7481)..(7615)  <220>  <221>内含子  <222>(7772)..(7914)  <220>  <221>内含子  <222>(8071)..(8153)  <220>  <221>内含子  <222>(8319)..(8451)  <220>  <221>内含子  <222>(8630)..(8718)  <220>  <221>内含子  <222>(8919)..(9000)  <220>  <221>内含子  <222>(9212)..(9284)  <400>1aatatttaag tttggtttat attctttcta gtaatctttg aaatattgta agagataatg 60cttctaataa ataacattgg atttattgga attaatgtat tgaaaaaact atgcaaatac 120tacagtgtat tttggaacga ccaaaatgat atatgtaaac tttcgttcta gtcttctaca 180tagtgtaata ggatagcgga caaggttgat cgactctaaa cattatgggt acgtaattcc 240gcagtggtta cagtctactg tcgaggccaa actggtaatt aaacgtttga agtttagaga 300aatattttga tgatgagtac cacaatcaaa gatgataggt gttaatcact gtaaaaatgt 360tgattgaata ctacgaatgc agaacatata catattttta atctctttgg aatttttgtt 420tttgttttta tcatttttga atacacgaag agctcagtta tatttcatat tgtatatgaa 480tttgttctat ttaatcttca attctagcaa catactctta tgctaattcg tttcatattt 540tagtatagta taaaaattac aaatttcaaa acaaactata agtaatatac taacatagtc 600ggtgtaacat ttcgttaatt tcacataaca tatgttaatt acatatgtac actatttttg 660aagtatttta taacttaaaa tatataaatt taaatctaag aaatcacaag catgagtttt 720tccttccggt aatcgtaaaa tcaaaaatcg ctcgctcgag aaacgccggt gctagaagag 780gaaagtaccg tacataatcc tgcgaaccca attctcgtct tcttcaaact cagttttccg 840aaaccccaaa caccgcgagg attgcatggc ctgaagaacc acttaatcga gaattgtgct 900ggaattctca aattttccct cgcgtttttc tttcacactc tcggaatcgg aaatttccac 960caagctccgt caagcgatag attctgacaa ttacacactt tcgcgcaggt atgcttcctt 1020ccctgtttta ggttggtgtt aatctatcgg tgaatcgaag gttttgggcc tcgggctttg 1080cgttttaggt ttttcagaga atcttatcta cttggggatg gatcttaggc gtttgttaga 1140tgtaactcat tagttttgca tataggaatt ttgatttgaa agttaggtcg ccggatttgt 1200agacattttg tttgatggtc ttcttcggtg ctcacattct ttgtttttaa gtgcttgatt 1260tggttgctaa ggtcctttcc gttgcgtgct ctcagtgaat atgaagaaag atgaaaagat 1320tggtttgacg gggagaacca tttacaccag atccctagca gcttcaattc ctgcctcagt 1380tgaacaagaa acccctggtt tgaggaggtc aagccggggg acaccatcta cgaaggtaat 1440aactccagct tctgctacta gaaagtcaga gagactggct ccctcacctg cttcagtttc 1500aaaaaagtcc ggtggaatcg tcaagaattc cacaccaagt tctttgcgaa ggtccaatag 1560ggggaagact gaagtatcct tgcagagttc caaaggatca gataattcta tcaggaaagg 1620agatacttca ccggatattg agcagagaaa ggatagtgtt gaagagtcga cagataagat 1680caagcctata atgtcagccc gaagttacag ggcattgttt agagggaagc tcaaggaatc 1740tgaggcatta gttgatgctt ccccaaatga agaggaacta gtagttgttg gttgttctcg 1800ccgcatacct gcaggcaatg atgatgttca aggtaaaaca gattgtccac cacctgcaga 1860tgcaggatca aaaaggctgc cagttgacga aactagtttg gacaagggca ctgattttcc 1920tttgaaatca gttacggaga ccgagaagat agtgcttgat gcatccccca tagttgaaac 1980tggggatgac agtgttatag gttcaccatc tgagaattta gagacacaaa agcttcaaga 2040tggtaagaca gattgttcac cacctgcaaa tgcagaatcg aaaacgctgc cagttggtga 2100aactagttta gaaaaagaat atccacaaaa gtttcaagat gataacacag attgtctacc 2160acctgcaaat gcagaatcaa aaaggctgcc agttggcgaa actagtttag aaaaggacac 2220tgattttcct ttgaaatcaa ctacggagac tggaaagatg gttctttatg catcccccat 2280agttgaaact agggatgaca gcgttatatg ttcaccatct acaaatttag aaacccaaaa 2340gcttcttgtc agtaaaactg gcttagaaac cgacatagtt ttgcctttga aaagaaaaag 2400agacactgca gaaattgagc tggatgcatg tgctacagtt gcaaatggag atgatcacgt 2460tatgagttct gatggggtca ttccatctcc atctgggtgc aaaaatgata atcgacctga 2520aatgtgcaac acgtgtaaaa aacggcaaaa gtaagagttt ttttagtgtt gtctgtctat 2580tgaaacgatc tgccaatgtt gaatgttggg cagatgggtt tgattcttag gatatatgtt 2640ctgtattgta atgagttgtt caaaattttg aagggtcaac ggtgattgtc aaaataggag 2700tgtttgctcc tgcattgtcc agccagttga agaatctgat aacgtgacac aggttggttt 2760ctaattactt tcggagaccc gttaatcagt ggactcttaa atagttagat actagattta 2820cttatccttt tacttgtaat ctgcaattct attttgcatt tgattaggat atgaaagaaa 2880ctggaccagt tacgagcaga gaatatgagg agaacgggca aatacaacat ggtaaatcaa 2940gtgatcccaa attctattct tcggtgtacc cagagtattg ggttcctgtg cagctatcag 3000atgtacagct ggagcaatac tgtcagactc tcttctccaa atccttatct ctttcttcac 3060tttcgaagat tgatcttgga gctctagaag aaactctcaa ttctgtaaga aaagtaagtt 3120acttgatttt aaaaacactt attcttcaat gcacttgtga gttaagtacc cagttattac 3180tggtgataag ataaagaaag caatagaaaa attgataagg tgttcaccgc attgcagcca 3240aaaaaacaat tctgtgttcc atgctttcaa gaggttgtca cataggtgtt atgcctttct 3300gtttgatgtt tggtagagca aaggttttgg gtctatttgt tttatgcttt tttgaaacac 3360atagaacctg gcaaacttga cagttttggg gttgcttaga tatacgacta ttgtcggtca 3420gcatcacatt ttctcaaggc ctctttctgc atgttaatgt gtgaatatat taaaatcttc 3480tttatgtgtt tgcaacttgt tgacagacct gtgaccatcc atacgttatg gatgcatctt 3540tgaaacaact gctcaccaag aatctggagt tgcatgaaat cctggatgta gaaattaaag 3600cgagcgggaa acttcacctc cttgataaaa tgcttactca tataaaaaag aatggtttaa 3660aagcagttgt cttctaccag gtgcattttc tattacttgc gaatgtgaat agctctatgt 3720ttgtcatgaa tacgtcactt tgtgcattct caatatatgt gcattttctt tttgacaatg 3780gaattctgtc ttgtattgaa atttgagtgg gatgaaagta tgctttttat cgtgcaatta 3840tgaagtgtaa gttagccttc agcagtcagc tagcattatg agatatgctg aactaaaatg 3900tttcttttct cttctttctt tttcgttata tgtgcctcat gtatgtttga attacagttt 3960ttattttcag caggcaacac aaacccctga agggcttctg cttggtaata ttctcgaaga 4020ttttgtgggt caaagatttg gtccaaaatc ttatgagcat gggatatatt cctcaaagaa 4080gaactccgct ataaacaatt tcaacaagga gagtcaatgc tgtgttctgc tgttggaaac 4140acgtgcctgc agtcaaacca ttaaactctt gcgagctgat gcgtttattc tttttggaag 4200cagcttgaat ccatcgcatg atgttaagca cgtagagaag ataaaaatcg agtcatgttc 4260tgaaagaact aagatattcc gattgtactc agtatgtaca gttgaagaaa aagccctgat 4320tctggctagg caaaatatgc ggcaaaataa agctgtagag aacctaaacc gctctctcac 4380gcacgcactg ctcatgtggg gggcgtcata cttatttgat aaactggatc attttcacag 4440cagtgaaact ccagattcag gagtttcatt tgaacaatct attatggacg gcgtgattca 4500tgaattctcg tccatacttt cttccaaagg tggagaagaa aatgaagtca agctgtgtct 4560acttttggag gccaagcatg ctcagggaac ttacagcagt gattctactc tatttggtga 4620agaccatatt aagttgtcag atgaagagag tccaaatata ttttggtcaa agctgttggg 4680gggaaaaaat cctatgtgga aatacccttc agatactccc caaaggaatc gaaaacgagt 4740tcagtatttt gagggttctg aagcgagtcc caaaactggc gatggtggaa atgcaaagaa 4800gcgaaagaag gcttctgatg atgtcactga tccccgggtc actgatccgc cagtagatga 4860tgatgaaaga aaggcctctg ggaaggatca catgggtaaa atagtttaat ttctgctccg 4920atacctctag tgttcattga ttatgcaact actttgctga ctatctttcc tacaggggct 4980ttggagtcac caaaagtcat aacactccag tcatcatgta aatcttctgg tacagatggt 5040acattggatg gaaatgatgc ttttggcttg tattctatgg gcagccatat ctctggaatc 5100ccagaggata tgttagctag tcaagattgg gggaaaatac cggatgaatc acagaggagg 5160ctccacactg ttttaaagcc gaagatggca aaactttgcc aagttttgca tctttcagta 5220agtggccttt ttcacctcca caacttattt tagccttgca tatgcttata tatagctgat 5280tgcaactgta gttgttacct gatttcctgt tacagccaaa tgtgagagtt ttattcttca 5340actatatcca tccgtttaag catattttat ttcttatatc tggcttcgtt accaatgcac 5400tgttaaaatg agcaactgct gcacaaaaca gtaggtagtt atgtgcctca tgtcattcat 5460tgtttattga agcaaagaaa tttctgtcta ctttacatga tccatctgtg ggagtatata 5520actatatata accttaggcc tttgtacctg gctgatcaaa gacatgtcaa aagtttatct 5580gttcgctgtt ggtatagaaa ctaatacagt gtctgatgct attttaaggt agtcttatgt 5640cttcacatat tggctaatag atgtttccgc tgtcgtgtcc atatacttct gtgattatca 5700cggtgctccg tctatcaaaa ttgtactaaa aggtattttg caatgtgtga ttggttaaca 5760gattattttg ttttcaggat gcttgcacaa gcatggtcgg aaattttctc gaatatgtta 5820ttgaaaatca ccgaatctac gaagagccag ccactacttt tcaggcattc cagatagccc 5880tggtatgaca gcatttactt tgataattta tgcattgttt ccttcatcat ctgcctttgt 5940ttagaatgtc ctcagaaggc agcactcctt tagttttaac tttccaatca taggattcaa 6000atatccatta actggccttt gatcgctgca taatatatga atagttgaca tactgaatac 6060gttgttaata atgcattttc agagttggat tgcagccttg ttggtaaagc aaattcttag 6120ccacaaagaa tctctggtcc gtgcaaattc tgaattagct ttcaaatgct ctagagtaga 6180ggtggattat atttattcga tattgtcctg catgaagagt ctgttcctgg agcatacaca 6240aggtttgcag ttcgattgct ttggtactaa ttctaaacag tcagtggtta gcacaaaact 6300agtaaatgaa agtctctcag gggctacagt gcgtgacgaa aagattaata cgaagtcgat 6360gcgaaatagc tcagaggatg aagagtgcat gactgagaag agatgtagcc attatagcac 6420agcaacaaga gatatcgaaa agactattag tggcataaaa aagaaataca agaagcaagt 6480gcaaaagctt gtacaagagc atgaggaaaa gaaaatggag ctgttaaata tgtatgcaga 6540caagaagcag aaacttgaaa ctagtaaaag tgtggaagca gcagtaattc gtattacctg 6600ttcacggacc agtactcaag tgggtgatct caaactgctg gatcataatt atgaaagaaa 6660gtttgatgaa atcaaaagtg agaaaaatga atgcctcaaa agtctggagc aaatgcacga 6720ggttgcaaag aagaagttgg ctgaggatga agcctgttgg attaatcgga taaagagctg 6780ggcagctaaa ttaaaagttt gtgttcccat tcaaagtggc aataacaagc attttagtgg 6840ttcatcaaac atttcccaaa atgctcctga tgtacaaatt tgcaataatg ctaacgttga 6900agctacttac gctgatacga attgcatggc ttccaaggtt aatcaagtgc cagaagcaga 6960aaacacatta ggaaccatgt cgggtggcag cactcaacaa gttcatgaaa tggtggatgt 7020aagaaatgac gagacaatgg atgtctcagc tttgtctcgt gaacagctta caaagagcca 7080gtccaatgag cacgcttcta tcactgtgcc tgagattttg attcctgctg actgtcaaga 7140ggaatttgcg gccttgaacg tgcatttgtc agaagaccag aattgtgaca gaataacatc 7200tgcggcatca gatgaagatg tttcatcaag ggtgccagag gtatcccagt cactcgaaaa 7260tctttctgcc tcccccgagt tttctctaaa tagagaggag gctttggtta caacagaaaa 7320tagaagaaca agtcatgtgg gttttgatac tgataacatt ttggaccagc agaatagaga 7380agattgttct cttgaccaag agattcctga cgagttagcg atgcctgtgc aacatcttgc 7440gtctgtggta gagactaggg gtgctgctga atctgatcag gtacttactg gccctgtaga 7500atagttgatg ccttgttcat ttaatctttt ctaatgttca ttcttgcttt cttgaaaata 7560acgggtagtg atcagatgtc tttttttctc ttattaaatt cacttttctg gacagtatgg 7620tcaagatata tgtcctatgc cttcttcact ggctggaaag caacctgacc cagcagcaaa 7680cactgagagc gaaaatcttg aagaagcaat tgagcctcag tctgctggtt cagaaacagt 7740agagactact gattttgctg catcacatca ggtccctatt gaagactttc cttttttact 7800agtttaaagt tatcaatctg tgttatgttc attctaagtt tccgtgagaa aaaggtgggg 7860aaatgtggtt actgatcaag tctcgttgtt gttttaaatc gactcttttg acagggtgat 7920caagttacat gtcctttgct atcttcaccg actggaaatc agcctgcgcc agaagcaaat 7980attgaaggcc aaaatatcaa cacatcagct gagccccatg tagcgggtcc agatgcagta 8040gagagtggtg attatgcagt aatagatcag gttattgcct taactaaaga caaatgtctt 8100ttgttgttta aaagtcttac atctttgtaa tgctcgttct ggatatcctg caggaaacaa 8160tgggtgctca ggatgcatgc tctctgccat ctggatcggt tggaactcag tctgacctag 8220gagcaaacat tgagggtcaa aatgtcacaa cagtggctca acttcccaca gatggatcag 8280atgcagttgt aaccggtgga tctcctgtat cagatcaggt acctgcctct gctcaaggac 8340tttcttatgt gttggtttaa aggtctagtc cttagtaatg ttgaaactaa gcaaacagtg 8400gatagtgatc atatggttat ttttgcttgt gaatttaata tttctggaca gtgtgcccag 8460gatgcatctc ctatgccatt atcttcgcct ggaaatcacc ctgatacagc agttaatatc 8520gagggtttag ataacacatc agtagctgag cctcatataa gtggatcaga tgcatgtgaa 8580atggaaattt cagaacctgg tccccaagta gagcggtcaa cctttgcaag tcagtaactg 8640ccttgggcat ttttaagtat cacctaggtc gacatatgtg attgccaaac agctaacaag 8700gagatgcctt ttgtgcagat cttttccatg aaggtggcgt ggagcattca gcaggtgtaa 8760cagctcttgt tccatcactt cttaacaatg gtacggaaca gattgccgtt caacctgttc 8820ctcaaatacc tttccctgtg ttcaacgacc cgtttctgca tgaactggag aagttgcgga 8880gagaatcaga gaactcaaag aagacttttg aagaaaaagt cagtttccct cattacccag 8940ttacctcttg ttttggttta ttttctagct gcccattgac tctcagttgc ttgtgagcag 9000aaatcaatct tgaaagctga actcgagagg aagatggctg aagtacaagc agagtttcga 9060agaaaatttc atgaggtaga agccgagcat aacaccagaa cgacaaagat agagaaggat 9120aagaatcttg ttataatgaa caaactgttg gcgaatgcgt tcttgtccaa atgtactgac 9180aagaaggtat ctccctcagg agctccaagg ggtaagtgtc gaataatata gcaaattggt 9240tttaaaaata aggcgacgaa gtcataatag cactttttct ccaggtaaaa ttcagcagct 9300agcacagaga gcagcacaag tgagtgcact gagaaattac attgctcctc agcagcttca 9360ggcatcttct tttcctgctc ctgctctggt ttcggctcct ctgcaacttc agcaatcatc 9420atttcctgct cctggtccgg ctcctctgca gcctcaggca tcttcgtttc cttcttcagt 9480ctctcgtcca tcagcccttc ttctgaattt tgcggtctgt ccaatgcctc agcccagaca 9540gcctctcata tccaacatag ctccaactcc atcagttact cctgcaacaa atccaggtct 9600gcgttctcct gcaccacacc taaactcata tagaccatcc tcttcaactc ccgtcgccac 9660agctactcca acctcgtcag tgcctcctca agctttgaca tattcagctg tgtcaattca 9720gcagcagcaa gaacaacaac cgcaacagag cttgagcagt ggattgcaga gcaacaatga 9780agtggtttgt ctttctgacg acgagtgacc taagaggaga gatggttagg gtcttagtta 9840ttgattttta gagagttaat aatagtatat atatatatgt ataagtaggt tacctaatct 9900ctgtcgttaa tctaatttag tgagtcagga accgactcgt tggctaaggt ctctcctttt 9960gaaacgcaac gttctacttt catgtatata aatacagtct gatcacacaa cacaaattga 10020tgattgaaaa tactactgat ttaactttat agaaaaccca aattatagag cgacaacttt 10080ataaacatgt caaacttcga agttaaaatt taagacccca taattttaca attatagatt 10140ttaatactcc aactattttg tgatgttaaa agaagtatcc gagtcttttc tttccagttt 10200ccccaccgtc ccatgactcc cccagccagt agaaaaagcc aaaaaagtaa acaaaaagtc 10260gttaaaaaag ttaaattaaa aaaaaaatag atagttgacg tttactaaag tgatttgaat 10320tgaacaatt                                                         10329<210>2<211>6571<212>DNA<213>拟南芥<220><221>CDS<222>(310)..(6312)<400>2cacaagcatg agtttttcct tccggtaatc gtaaaatcaa aaatcgctcg ctcgagaaac  60gccggtgcta gaagaggaaa gtaccgtaca taatcctgcg aacccaattc tcgtcttctt  120caaactcagt tttccgaaac cccaaacacc gcgaggattg catggcctga agaaccactt 180aatcgagaat tgtgctggaa ttctcaaatt ttccctcgcg tttttctttc acactctcgg 240aatcggaaat ttccaccaag ctccgtcaag cgatagattc tgacaattac acactttcgc 300gcagtgaat atg aag aaa gat gaa aag att ggt ttg acg ggg aga acc att 351

      Met Lys Lys Asp Glu Lys Ile Gly Leu Thr Gly Arg Thr Ile

        1               5                  10tac acc aga tcc cta gca gct tca att cct gcc tca gtt gaa caa gaa   399Tyr Thr Arg Ser Leu Ala Ala Ser Ile Pro Ala Ser Val Glu Gln Glu 15                  20                  25                  30acc cct ggt ttg agg agg tca agc cgg ggg aca cca tct acg aag gta   447Thr Pro Gly Leu Arg Arg Ser Ser Arg Gly Thr Pro Ser Thr Lys Val

             35                  40                  45ata act cca gct tct gct act aga aag tca gag aga ctg gct ccc tca   495Ile Thr Pro Ala Ser Ala Thr Arg Lys Ser Glu Arg Leu Ala Pro Ser

         50                  55                  60cct gct tca gtt tca aaa aag tcc ggt gga atc gtc aag aat tcc aca   543Pro Ala Ser Val Ser Lys Lys Ser Gly Gly Ile Val Lys Asn Ser Thr

     65                  70                  75cca agt tct ttg cga agg tcc aat agg ggg aag act gaa gta tcc ttg   591Pro Ser Ser Leu Arg Arg Ser Asn Arg Gly Lys Thr Glu Val Ser Leu

 80                  85                  90cag agt tcc aaa gga tca gat aat tct atc agg aaa gga gat act tca   639Gln Ser Ser Lys Gly Ser Asp Asn Ser Ile Arg Lys Gly Asp Thr Ser 95                 100                 105                 110ccg gat att gag cag aga aag gat agt gtt gaa gag tcg aca gat aag   687Pro Asp Ile Glu Gln Arg Lys Asp Ser Val Glu Glu Ser Thr Asp Lys

            115                 120                 125atc aag cct ata atg tca gcc cga agt tac agg gca ttg ttt aga ggg   735Ile Lys Pro Ile Met Ser Ala Arg Ser Tyr Arg Ala Leu Phe Arg Gly

        130                 135                 140aag ctc aag gaa tct gag gca tta gtt gat gct tcc cca aat gaa gag   783Lys Leu Lys Glu Ser Glu Ala Leu Val Asp Ala Ser Pro Asn Glu Glu

    145                 150                 155gaa cta gta gtt gtt ggt tgt tct cgc cgc ata cct gca ggc aat gat   831Glu Leu Val Val Val Gly Cys Ser Arg Arg Ile Pro Ala Gly Asn Asp

160                 165                 170gat gtt caa ggt aaa aca gat tgt cca cca cct gca gat gca gga tca   879Asp Val Gln Gly Lys Thr Asp Cys Pro Pro Pro Ala Asp Ala Gly Ser175                 180                 185                 190aaa agg ctg cca gtt gac gaa act agt ttg gac aag ggc act gat ttt   927Lys Arg Leu Pro Val Asp Glu Thr Ser Leu Asp Lys Gly Thr Asp Phe

            195                 200                 205cct ttg aaa tca gtt acg gag acc gag aag ata gtg ctt gat gca tcc   975Pro Leu Lys Ser Val Thr Glu Thr Glu Lys Ile Val Leu Asp Ala Ser

        210                 215                 220ccc ata gtt gaa act ggg gat gac agt gtt ata ggt tca cca tct gag   1023Pro Ile Val Glu Thr Gly Asp Asp Ser Val Ile Gly Ser Pro Ser Glu

    225                 230                 235aat tta gag aca caa aag ctt caa gat ggt aag aca gat tgt tca cca   1071Asn Leu Glu Thr Gln Lys Leu Gln Asp Gly Lys Thr Asp Cys Ser Pro

240                 245                 250cct gca aat gca gaa tcg aaa acg ctg cca gtt ggt gaa act agt tta   1119Pro Ala Asn Ala Glu Ser Lys Thr Leu Pro Val Gly Glu Thr Ser Leu255                 260                  265                270gaa aaa gaa tat cca caa aag ttt caa gat gat aac aca gat tgt cta   1167Glu Lys Glu Tyr Pro Gln Lys Phe Gln Asp Asp Asn Thr Asp Cys Leu

            275                 280                 285cca cct gca aat gca gaa tca aaa agg ctg cca gtt ggc gaa act agt   1215Pro Pro Ala Asn Ala Glu Ser Lys Arg Leu Pro Val Gly Glu Thr Ser

        290                 295                 300tta gaa aag gac act gat ttt cct ttg aaa tca act acg gag act gga   1263Leu Glu Lys Asp Thr Asp Phe Pro Leu Lys Ser Thr Thr Glu Thr Gly

    305                 310                 315aag atg gtt ctt tat gca tcc ccc ata gtt gaa act agg gat gac agc   1311Lys Met Val Leu Tyr Ala Ser Pro Ile Val Glu Thr Arg Asp Asp Ser

320                 325                 330gtt ata tgt tca cca tct aca aat tta gaa acc caa aag ctt ctt gtc   1359Val Ile Cys Ser Pro Ser Thr Asn Leu Glu Thr Gln Lys Leu Leu Val335                 340                 345                 350agt aaa act ggc tta gaa acc gac ata gtt ttg cct ttg aaa aga aaa   1407Ser Lys Thr Gly Leu Glu Thr Asp Ile Val Leu Pro Leu Lys Arg Lys

            355                  360                365aga gac act gca gaa att gag ctg gat gca tgt gct aca gtt gca aat   1455Arg Asp Thr Ala Glu Ile Glu Leu Asp Ala Cys Ala Thr Val Ala Asn

        370                 375                 380gga gat gat cac gtt atg agt tct gat ggg gtc att cca tct cca tct   1503Gly Asp Asp His Val Met Ser Ser Asp Gly Val Ile Pro Ser Pro Ser

    385             390                     395ggg tgc aaa aat gat aat cga cct gaa atg tgc aac acg tgt aaa aaa   1551Gly Cys Lys Asn Asp Asn Arg Pro Glu Met Cys Asn Thr Cys Lys Lys

400                 405                 410cgg caa aag gtc aac ggt gat tgt caa aat agg agt gtt tgc tcc tgc   1599Arg Gln Lys Val Asn Gly Asp Cys Gln Asn Arg Ser Val Cys Ser Cys415                 420                 425                 430att gtc cag cca gtt gaa gaa tct gat aac gtg aca cag gat atg aaa   1647Ile Val Gln Pro Val Glu Glu Ser Asp Asn Val Thr Gln Asp Met Lys

            435                 440                 445gaa act gga cca gtt acg agc aga gaa tat gag gag aac ggg caa ata   1695Glu Thr Gly Pro Val Thr Ser Arg Glu Tyr Glu Glu Asn Gly Gln Ile

        450                 455                 460caa cat ggt aaa tca agt gat ccc aaa ttc tat tct tcg gtg tac cca   1743Gln His Gly Lys Ser Ser Asp Pro Lys Phe Tyr Ser Ser Val Tyr Pro

    465                 470                 475gag tat tgg gtt cct gtg cag cta tca gat gta cag ctg gag caa tac   1791Glu Tyr Trp Val Pro Val Gln Leu Ser Asp Val Gln Leu Glu Gln Tyr

480                 485                 490tgt cag act ctc ttc tcc aaa tcc tta tct ctt tct tca ctt tcg aag   1839Cys Gln Thr Leu Phe Ser Lys Ser Leu Ser Leu Ser Ser Leu Ser Lys495                 500                 505                 510att gat ctt gga gct cta gaa gaa act ctc aat tct gta aga aaa acc   1887Ile Asp Leu Gly Ala Leu Glu Glu Thr Leu Asn Ser Val Arg Lys Thr

            515                 520                 525tgt gac cat cca tac gtt atg gat gca tct ttg aaa caa ctg ctc acc   1935Cys Asp His Pro Tyr Val Met Asp Ala Ser Leu Lys Gln Leu Leu Thr

        530                 535                 540aag aat ctg gag ttg cat gaa atc ctg gat gta gaa att aaa gcg agc    1983Lys Asn Leu Glu Leu His Glu Ile Leu Asp Val Glu Ile Lys Ala Ser

    545                 550                 555ggg aaa ctt cac ctc ctt gat aaa atg ctt act cat ata aaa aag aat   2031Gly Lys Leu His Leu Leu Asp Lys Met Leu Thr His Ile Lys Lys Asn

560                 565                 570ggt tta aaa gca gtt gtc ttc tac cag gca aca caa acc cct gaa ggg   2079Gly Leu Lys Ala Val Val Phe Tyr Gln Ala Thr Gln Thr Pro Glu Gly575                 580                 585                 590ctt ctg ctt ggt aat att ctc gaa gat ttt gtg ggt caa aga ttt ggt   2127Leu Leu Leu Gly Asn Ile Leu Glu Asp Phe Val Gly Gln Arg Phe Gly

            595                 600                 605cca aaa tct tat gag cat ggg ata tat tcc tca aag aag aac tcc gct   2175Pro Lys Ser Tyr Glu His Gly Ile Tyr Ser Ser Lys Lys Asn Ser Ala

        610                 615                 620ata aac aat ttc aac aag gag agt caa tgc tgt gtt ctg ctg ttg gaa   2223Ile Asn Asn Phe Asn Lys Glu Ser Gln Cys Cys Val Leu Leu Leu Glu

    625                 630                 635aca cgt gcc tgc agt caa acc att aaa ctc ttg cga gct gat gcg ttt   2271Thr Arg Ala Cys Ser Gln Thr Ile Lys Leu Leu Arg Ala Asp Ala Phe

640                 645                 650att ctt ttt gga agc agc ttg aat cca tcg cat gat gtt aag cac gta   2319Ile Leu Phe Gly Ser Ser Leu Asn Pro Ser His Asp Val Lys His Val655                 660                 665                 670gag aag ata aaa atc gag tca tgt tct gaa aga act aag ata ttc cga   2367Glu Lys Ile Lys Ile Glu Ser Cys Ser Glu Arg Thr Lys Ile Phe Arg

            675                 680                 685ttg tac tca gta tgt aca gtt gaa gaa aaa gcc ctg att ctg gct agg   2415Leu Tyr Ser Val Cys Thr Val Glu Glu Lys Ala Leu Ile Leu Ala Arg

        690                 695                 700caa aat atg cgg caa aat aaa gct gta gag aac cta aac cgc tct ctc   2463Gln Asn Met Arg Gln Asn Lys Ala Val Glu Asn Leu Asn Arg Ser Leu

    705                 710                 715acg cac gca ctg ctc atg tgg ggg gcg tca tac tta ttt gat aaa ctg   2511Thr His Ala Leu Leu Met Trp Gly Ala Ser Tyr Leu Phe Asp Lys Leu

720                 725                 730gat cat ttt cac agc agt gaa act cca gat tca gga gtt tca ttt gaa   2559Asp His Phe His Ser Ser Glu Thr Pro Asp Ser Gly Val Ser Phe Glu735                 740                 745                 750caa tct att atg gac ggc gtg att cat gaa ttc tcg tcc ata ctt tct   2607Gln Ser Ile Met Asp Gly Val Ile His Glu Phe Ser Ser Ile Leu Ser

            755                 760                 765tcc aaa ggt gga gaa gaa aat gaa gtc aag ctg tgt cta ctt ttg gag   2655Ser Lys Gly Gly Glu Glu Asn Glu Val Lys Leu Cys Leu Leu Leu Glu

    770                     775                 780gcc aag cat gct cag gga act tac agc agt gat tct act cta ttt ggt   2703Ala Lys His Ala Gln Gly Thr Tyr Ser Ser Asp Ser Thr Leu Phe Gly

    785                 790                 795gaa gac cat att aag ttg tca gat gaa gag agt cca aat ata ttt tgg   2751Glu Asp His Ile Lys Leu Ser Asp Glu Glu Ser Pro Asn Ile Phe Trp

800                 805                 810tca aag ctg ttg ggg gga aaa aat cct atg tgg aaa tac cct tca gat   2799Ser Lys Leu Leu Gly Gly Lys Asn Pro Met Trp Lys Tyr Pro Ser Asp815                 820                 825                 830act ccc caa agg aat cga aaa cga gtt cag tat ttt gag ggt tct gaa   2847Thr Pro Gln Arg Asn Arg Lys Arg Val Gln Tyr Phe Glu Gly Ser Glu

            835                 840                 845gcg agt ccc aaa act ggc gat ggt gga aat gca aag aag cga aag aag   2895Ala Ser Pro Lys Thr Gly Asp Gly Gly Asn Ala Lys Lys Arg Lys Lys

        850                 855                 860gct tct gat gat gtc act gat ccc cgg gtc act gat ccg cca gta gat   2943Ala Ser Asp Asp Val Thr Asp Pro Arg Val Thr Asp Pro Pro Val Asp

    865                 870                 875gat gat gaa aga aag gcc tct ggg aag gat cac atg ggg gct ttg gag   2991Asp Asp Glu Arg Lys Ala Ser Gly Lys Asp His Met Gly Ala Leu Glu

880                 885                 890tca cca aaa gtc ata aca ctc cag tca tca tgt aaa tct tct ggt aca   3039Ser Pro Lys Val Ile Thr Leu Gln Ser Ser Cys Lys Ser Ser Gly Thr895                 900                 905                 910gat ggt aca ttg gat gga aat gat gct ttt ggc ttg tat tct atg ggc   3087Asp Gly Thr Leu Asp Gly Asn Asp Ala Phe Gly Leu Tyr Ser Met Gly

            915                 920                 925agc cat atc tct gga atc cca gag gat atg tta gct agt caa gat tgg   3135Ser His Ile Ser Gly Ile Pro Glu Asp Met Leu Ala Ser Gln Asp Trp

        930                 935                 940ggg aaa ata ccg gat gaa tca cag agg agg ctc cac act gtt tta aag   3183Gly Lys Ile Pro Asp Glu Ser Gln Arg Arg Leu His Thr Val Leu Lys

    945                 950                 955ccg aag atg gca aaa ctt tgc caa gtt ttg cat ctt tca gat gct tgc   3231Pro Lys Met Ala Lys Leu Cys Gln Val Leu His Leu Ser Asp Ala Cys

960                 965                 970aca agc atg gtc gga aat ttt ctc gaa tat gtt att gaa aat cac cga   3279Thr Ser Met Val Gly Asn Phe Leu Glu Tyr Val Ile Glu Asn His Arg975                 980                 985                 990atc tac gaa gag cca gcc act act ttt cag gca ttc cag ata gcc ctg   3327Ile Tyr Glu Glu Pro Ala Thr Thr Phe Gln Ala Phe Gln Ile Ala Leu

            995                1000                1005agt tgg att gca gcc ttg ttg gta aag caa att ctt agc cac aaa gaa   3375Ser Trp Ile Ala Ala Leu Leu Val Lys Gln Ile Leu Ser His Lys Glu

       1010                1015                1020tct ctg gtc cgt gca aat tct gaa tta gct ttc aaa tgc tct aga gta   3423Ser Leu Val Arg Ala Asn Ser Glu Leu Ala Phe Lys Cys Ser Arg Val

   1025                1030                1035gag gtg gat tat att tat tcg ata ttg tcc tgc atg aag agt ctg ttc   3471Glu Val Asp Tyr Ile Tyr Ser Ile Leu Ser Cys Met Lys Ser Leu Phe   1040                1045                1050ctg gag cat aca caa ggt ttg cag ttc gat tgc ttt ggt act aat tct   3519Leu Glu His Thr Gln Gly Leu Gln Phe Asp Cys Phe Gly Thr Asn Ser1055               1060                1065                1070aaa cag tca gtg gtt agc aca aaa cta gta aat gaa agt ctc tca ggg   3567Lys Gln Ser Val Val Ser Thr Lys Leu Val Asn Glu Ser Leu Ser Gly

           1075                1080                1085gct aca gtg cgt gac gaa aag att aat acg aag tcg atg cga aat agc   3615Ala Thr Val Arg Asp Glu Lys Ile Asn Thr Lys Ser Met Arg Asn Ser

       1090                1095                1100tca gag gat gaa gag tgc atg act gag aag aga tgt agc cat tat agc   3663Ser Glu Asp Glu Glu Cys Met Thr Glu Lys Arg Cys Ser His Tyr Ser

   1105                1110                1115aca gca aca aga gat atc gaa aag act att agt ggc ata aaa aag aaa   3711Thr Ala Thr Arg Asp Ile Glu Lys Thr Ile Ser Gly Ile Lys Lys Lys   1120                1125                1130tac aag aag caa gtg caa aag ctt gta caa gag cat gag gaa aag aaa   3759Tyr Lys Lys Gln Val Gln Lys Leu Val Gln Glu His Glu Glu Lys Lys1135               1140                1145                1150atg gag ctg tta aat atg tat gca gac aag aag cag aaa ctt gaa act   3807Met Glu Leu Leu Asn Met Tyr Ala Asp Lys Lys Gln Lys Leu Glu Thr

           1155                1160                1165agt aaa agt gtg gaa gca gca gta att cgt att acc tgt tca cgg acc   3855Ser Lys Ser Val Glu Ala Ala Val Ile Arg Ile Thr Cys Ser Arg Thr

       1170                1175                1180agt act caa gtg ggt gat ctc aaa ctg ctg gat cat aat tat gaa aga   3903Ser Thr Gln Val Gly Asp Leu Lys Leu Leu Asp His Asn Tyr Glu Arg

   1185                1190                1195aag ttt gat gaa atc aaa agt gag aaa aat gaa tgc ctc aaa agt ctg   3951Lys Phe Asp Glu Ile Lys Ser Glu Lys Asn Glu Cys Leu Lys Ser Leu   1200                1205                1210gag caa atg cac gag gtt gca aag aag aag ttg gct gag gat gaa gcc   3999Glu Gln Met His Glu Val Ala Lys Lys Lys Leu Ala Glu Asp Glu Ala1215               1220                1225                1230tgt tgg att aat cgg ata aag agc tgg gca gct aaa tta aaa gtt tgt   4047Cys Trp Ile Asn Arg Ile Lys Ser Trp Ala Ala Lys Leu Lys Val Cys

           1235                1240                1245gtt ccc att caa agt ggc aat aac aag cat ttt agt ggt tca tca aac   4095Val Pro Ile Gln Ser Gly Asn Asn Lys His Phe Ser Gly Ser Ser Asn

       1250                1255                1260att tcc caa aat gct cct gat gta caa att tgc aat aat gct aac gtt   4143Ile Ser Gln Asn Ala Pro Asp Val Gln Ile Cys Asn Asn Ala Asn Val

   1265                1270                1275gaa gct act tac gct gat acg aat tgc atg gct tcc aag gtt aat caa   4191Glu Ala Thr Tyr Ala Asp Thr Asn Cys Met Ala Ser Lys Val Asn Gln   1280                1285                1290gtg cca gaa gca gaa aac aca tta gga acc atg tcg ggt ggc agc act   4239Val Pro Glu Ala Glu Asn Thr Leu Gly Thr Met Ser Gly Gly Ser Thr1295               1300                1305                1310caa caa gtt cat gaa atg gtg gat gta aga aat gac gag aca atg gat   4287Gln Gln Val His Glu Met Val Asp Val Arg Asn Asp Glu Thr Met Asp

           1315                1320                1325gtc tca gct ttg tct cgt gaa cag ctt aca aag agc cag tcc aat gag   4335Val Ser Ala Leu Ser Arg Glu Gln Leu Thr Lys Ser Gln Ser Asn Glu

       1330                1335                1340cac gct tct atc act gtg cct gag att ttg att cct gct gac tgt caa   4383His Ala Ser Ile Thr Val Pro Glu Ile Leu Ile Pro Ala Asp Cys Gln

   1345                1350                1355gag gaa ttt gcg gcc ttg aac gtg cat ttg tca gaa gac cag aat tgt   4431Glu Glu Phe Ala Ala Leu Asn Val His Leu Ser Glu Asp Gln Asn Cys   1360                1365                1370gac aga ata aca tct gcg gca tca gat gaa gat gtt tca tca agg gtg   4479Asp Arg Ile Thr Ser Ala Ala Ser Asp Glu Asp Val Ser Ser Arg Val1375               1380                1385                1390cca gag gta tcc cag tca ctc gaa aat ctt tct gcc tcc ccc gag ttt   4527Pro Glu Val Ser Gln Ser Leu Glu Asn Leu Ser Ala Ser Pro Glu Phe

           1395                1400                1405tct cta aat aga gag gag gct ttg gtt aca aca gaa aat aga aga aca   4575Ser Leu Asn Arg Glu Glu Ala Leu Val Thr Thr Glu Asn Arg Arg Thr

       1410                1415                1420agt cat gtg ggt ttt gat act gat aac att ttg gac cag cag aat aga   4623Ser His Val Gly Phe Asp Thr Asp Asn Ile Leu Asp Gln Gln Asn Arg

   1425                1430                1435gaa gat tgt tct ctt gac caa gag att cct gac gag tta gcg atg cct   4671Glu Asp Cys Ser Leu Asp Gln Glu Ile Pro Asp Glu Leu Ala Met Pro   1440                1445                1450gtg caa cat ctt gcg tct gtg gta gag act agg ggt gct gct gaa tct   4719Val Gln His Leu Ala Ser Val Val Glu Thr Arg Gly Ala Ala Glu Ser1455               1460                1465                1470gat cag tat ggt caa gat ata tgt cct atg cct tct tca ctg gct gga   4767Asp Gln Tyr Gly Gln Asp Ile Cys Pro Met Pro Ser Ser Leu Ala Gly

           1475                1480                1485aag caa cct gac cca gca gca aac act gag agc gaa aat ctt gaa gaa   4815Lys Gln Pro Asp Pro Ala Ala Asn Thr Glu Ser Glu Asn Leu Glu Glu

       1490                1495                1500gca att gag cct cag tct gct ggt tca gaa aca gta gag act act gat   4863Ala Ile Glu Pro Gln Ser Ala Gly Ser Glu Thr Val Glu Thr Thr Asp

   1505                1510                1515ttt gct gca tca cat cag ggt gat caa gtt aca tgt cct ttg cta tct   4911Phe Ala Ala Ser His Gln Gly Asp Gln Val Thr Cys Pro Leu Leu Ser   1520                1525                1530tca ccg act gga aat cag cct gcg cca gaa gca aat att gaa ggc caa   4959Ser Pro Thr Gly Asn Gln Pro Ala Pro Glu Ala Asn Ile Glu Gly Gln1535               1540                1545                1550aat atc aac aca tca gct gag ccc cat gta gcg ggt cca gat gca gta   5007Asn Ile Asn Thr Ser Ala Glu Pro His Val Ala Gly Pro Asp Ala Val

           1555                1560                1565gag agt ggt gat tat gca gta ata gat cag gaa aca atg ggt gct cag   5055Glu Ser Gly Asp Tyr Ala Val Ile Asp Gln Glu Thr Met Gly Ala Gln

       1570                1575                1580gat gca tgc tct ctg cca tct gga tcg gtt gga act cag tct gac cta   5103Asp Ala Cys Ser Leu Pro Ser Gly Ser Val Gly Thr Gln Ser Asp Leu

   1585                1590                1595gga gca aac att gag ggt caa aat gtc aca aca gtg gct caa ctt ccc   5151Gly Ala Asn Ile Glu Gly Gln Asn Val Thr Thr Val Ala Gln Leu Pro   1600                1605                1610aca gat gga tca gat gca gtt gta acc ggt gga tct cct gta tca gat   5199Thr Asp Gly Ser Asp Ala Val Val Thr Gly Gly Ser Pro Val Ser Asp1615               1620                1625                1630cag tgt gcc cag gat gca tct cct atg cca tta tct tcg cct gga aat   5247Gln Cys Ala Gln Asp Ala Ser Pro Met Pro Leu Ser Ser Pro Gly Asn

           1635                1640                1645cac cct gat aca gca gtt aat atc gag ggt tta gat aac aca tca gta   5295His Pro Asp Thr Ala Val Asn Ile Glu Gly Leu Asp Asn Thr Set Val

       1650                1655                1660gct gag cct cat ata agt gga tca gat gca tgt gaa atg gaa att tca   5343Ala Glu Pro His Ile Ser Gly Ser Asp Ala Cys Glu Met Glu Ile Ser

   1665                1670                1675gaa cct ggt ccc caa gta gag cgg tca acc ttt gca aat ctt ttc cat   5391Glu Pro Gly Pro Gln Val Glu Arg Ser Thr Phe Ala Asn Leu Phe His   1680                1685                1690gaa ggt ggc gtg gag cat tca gca ggt gta aca gct ctt gtt cca tca   5439Glu Gly Gly Val Glu His Ser Ala Gly Val Thr Ala Leu Val Pro Ser1695               1700                1705                1710ctt ctt aac aat ggt acg gaa cag att gcc gtt caa cct gtt cct caa   5487Leu Leu Asn Asn Gly Thr Glu Gln Ile Ala Val Gln Pro Val Pro Gln

           1715                1720                1725ata cct ttc cct gtg ttc aac gac ccg ttt ctg cat gaa ctg gag aag   5535Ile Pro Phe Pro Val Phe Asn Asp Pro Phe Leu His Glu Leu Glu Lys

       1730                1735                1740ttg cgg aga gaa tca gag aac tca aag aag act ttt gaa gaa aaa aaa   5583Leu Arg Arg Glu Ser Glu Asn Ser Lys Lys Thr Phe Glu Glu Lys Lys

   1745                1750                1755tca atc ttg aaa gct gaa ctc gag agg aag atg gct gaa gta caa gca   5631Ser Ile Leu Lys Ala Glu Leu Glu Arg Lys Met Ala Glu Val Gln Ala   1760                1765                1770gag ttt cga aga aaa ttt cat gag gta gaa gcc gag cat aac acc aga   5679Glu Phe Arg Arg Lys Phe His Glu Val Glu Ala Glu His Asn Thr Arg1775               1780                1785                1790acg aca aag ata gag aag gat aag aat ctt gtt ata atg aac aaa ctg   5727Thr Thr Lys Ile Glu Lys Asp Lys Asn Leu Val Ile Met Asn Lys Leu

           1795                1800                1805ttg gcg aat gcg ttc ttg tcc aaa tgt act gac aag aag gta tct ccc   5775Leu Ala Asn Ala Phe Leu Ser Lys Cys Thr Asp Lys Lys Val Ser Pro

       1810                 1815               1820tca gga gct cca agg ggt aaa att cag cag cta gca cag aga gca gca   5823Ser Gly Ala Pro Arg Gly Lys Ile Gln Gln Leu Ala Gln Arg Ala Ala

   1825                1830                1835caa gtg agt gca ctg aga aat tac att gct cct cag cag ctt cag gca   5871Gln Val Ser Ala Leu Arg Asn Tyr Ile Ala Pro Gln Gln Leu Gln Ala   1840                1845                1850tct tct ttt cct gct cct gct ctg gtt tcg gct cct ctg caa ctt cag   5919Ser Ser Phe Pro Ala Pro Ala Leu Val Ser Ala Pro Leu Gln Leu Gln1855               1860                1865                1870caa tca tca ttt cct gct cct ggt ccg gct cct ctg cag cct cag gca   5967Gln Ser Ser Phe Pro Ala Pro Gly Pro Ala Pro Leu Gln Pro Gln Ala

            1875               1880                1885tct tcg ttt cct tct tca gtc tct cgt cca tca gcc ctt ctt ctg aat   6015Ser Ser Phe Pro Ser Ser Val Ser Arg Pro Ser Ala Leu Leu Leu Asn

       1890                1895                1900ttt gcg gtc tgt cca atg cct cag ccc aga cag cct ctc ata tcc aac   6063Phe Ala Val Cys Pro Met Pro Gln Pro Arg Gln Pro Leu Ile Ser Asn

   1905                1910                1915ata gct cca act cca tca gtt act cct gca aca aat cca ggt ctg cgt   6111Ile Ala Pro Thr Pro Ser Val Thr Pro Ala Thr Asn Pro Gly Leu Arg   1920                1925                1930tct cct gca cca cac cta aac tca tat aga cca tcc tct tca act ccc   6159Ser Pro Ala Pro His Leu Asn Ser Tyr Arg Pro Ser Ser Ser Thr Pro1935               1940                1945                1950gtc gcc aca gct act cca acc tcg tca gtg cct cct caa gct ttg aca   6207Val Ala Thr Ala Thr Pro Thr Ser Ser Val Pro Pro Gln Ala Leu Thr

           1955                1960                1965tat tca gct gtg tca att cag cag cag caa gaa caa caa ccg caa cag   6255Tyr Ser Ala Val Ser Ile Gln Gln Gln Gln Glu Gln Gln Pro Gln Gln

       1970                1975                1980agc ttg agc agt gga ttg cag agc aac aat gaa gtg gtt tgt ctt tct   6303Ser Leu Ser Ser Gly Leu Gln Ser Asn Asn Glu Val Val Cys Leu Ser

   1985                1990                1995gac gac gag tgacctaaga ggagagatgg ttagggtctt agttattgat           6352Asp Asp Glu   2000ttttagagag ttaataatag tatatatata tatgtataag taggttacct aatctctgtc 6412gttaatctaa tttagtgagt caggaaccga ctcgttggct aaggtctctc cttttgaaac 6472gcaacgttct actttcatgt atataaatac agtctgatca cacaacacaa attgatgatt 6532gaaaatacta ctgatttaac ttaaaaaaaa aaaaaaaaa                        6571<210>3<211>2001<212>PRT<213>拟南芥<400>3Met Lys Lys Asp Glu Lys Ile Gly Leu Thr Gly Arg Thr Ile Tyr Thr  1               5                  10                  15Arg Ser Leu Ala Ala Ser Ile Pro Ala Ser Val Glu Gln Glu Thr Pro

         20                  25                  30Gly Leu Arg Arg Ser Ser Arg Gly Thr Pro Ser Thr Lys Val Ile Thr

     35                  40                  45Pro Ala Ser Ala Thr Arg Lys Ser Glu Arg Leu Ala Pro Ser Pro Ala

 50                  55                  60Ser Val Ser Lys Lys Ser Gly Gly Ile Val Lys Asn Ser Thr Pro Ser 65                  70                  75                  80Ser Leu Arg Arg Ser Asn Arg Gly Lys Thr Glu Val Ser Leu Gln Ser

             85                  90                  95Ser Lys Gly Ser Asp Asn Ser Ile Arg Lys Gly Asp Thr Ser Pro Asp

        100                 105                 110Ile Glu Gln Arg Lys Asp Ser Val Glu Glu Ser Thr Asp Lys Ile Lys

    115                 120                 125Pro Ile Met Ser Ala Arg Ser Tyr Arg Ala Leu Phe Arg Gly Lys Leu

130                 135                 140Lys Glu Ser Glu Ala Leu Val Asp Ala Ser Pro Asn Glu Glu Glu Leu145                 150                 155                 160Val Val Val Gly Cys Ser Arg Arg Ile Pro Ala Gly Asn Asp Asp Val

            165                 170                 175Gln Gly Lys Thr Asp Cys Pro Pro Pro Ala Asp Ala Gly Ser Lys Arg

        180                 185                 190Leu Pro Val Asp Glu Thr Ser Leu Asp Lys Gly Thr Asp Phe Pro Leu

    195                 200                 205Lys Ser Val Thr Glu Thr Glu Lys Ile Val Leu Asp Ala Ser Pro Ile

210                 215                 220Val Glu Thr Gly Asp Asp Ser Val Ile Gly Ser Pro Ser Glu Asn Leu225                 230                 235                 240Glu Thr Gln Lys Leu Gln Asp Gly Lys Thr Asp Cys Ser Pro Pro Ala

            245                 250                 255Asn Ala Glu Ser Lys Thr Leu Pro Val Gly Glu Thr Ser Leu Glu Lys

        260                 265                 270Glu Tyr Pro Gln Lys Phe Gln Asp Asp Asn Thr Asp Cys Leu Pro Pro

    275                 280                 285Ala Asn Ala Glu Ser Lys Arg Leu Pro Val Gly Glu Thr Ser Leu Glu

290                 295                 300Lys Asp Thr Asp Phe Pro Leu Lys Ser Thr Thr Glu Thr Gly Lys Met305                 310                 315                 320Val Leu Tyr Ala Ser Pro Ile Val Glu Thr Arg Asp Asp Ser Val Ile

            325                 330                 335Cys Ser Pro Ser Thr Asn Leu Glu Thr Gln Lys Leu Leu Val Ser Lys

        340                 345                 350Thr Gly Leu Glu Thr Asp Ile Val Leu Pro Leu Lys Arg Lys Arg Asp

    355                 360                 365Thr Ala Glu Ile Glu Leu Asp Ala Cys Ala Thr Val Ala Asn Gly Asp

370                 375                 380Asp His Val Met Ser Ser Asp Gly Val Ile Pro Ser Pro Ser Gly Cys385                 390                 395                 400Lys Asn Asp Asn Arg Pro Glu Met Cys Asn Thr Cys Lys Lys Arg Gln

            405                 410                 415Lys Val Asn Gly Asp Cys Gln Asn Arg Ser Val Cys Ser Cys Ile Val

        420                 425                 430Gln Pro Val Glu Glu Ser Asp Asn Val Thr Gln Asp Met Lys Glu Thr

    435             440                     445Gly Pro Val Thr Ser Arg Glu Tyr Glu Glu Asn Gly Gln Ile Gln His

450                 455                 460Gly Lys Ser Ser Asp Pro Lys Phe Tyr Ser Ser Val Tyr Pro Glu Tyr465                 470                 475                 480Trp Val Pro Val Gln Leu Ser Asp Val Gln Leu Glu Gln Tyr Cys Gln

            485                 490                 495Thr Leu Phe Ser Lys Ser Leu Ser Leu Ser Ser Leu Ser Lys Ile Asp

        500                 505                 510Leu Gly Ala Leu Glu Glu Thr Leu Asn Ser Val Arg Lys Thr Cys Asp

    515                 520                 525His Pro Tyr Val Met Asp Ala Ser Leu Lys Gln Leu Leu Thr Lys Asn

530                 535                 540Leu Glu Leu His Glu Ile Leu Asp Val Glu Ile Lys Ala Ser Gly Lys545                 550                 555                 560Leu His Leu Leu Asp Lys Met Leu Thr His Ile Lys Lys Asn Gly Leu

            565                 570                 575Lys Ala Val Val Phe Tyr Gln Ala Thr Gln Thr Pro Glu Gly Leu Leu

        580                 585                 590Leu Gly Asn Ile Leu Glu Asp Phe Val Gly Gln Arg Phe Gly Pro Lys

    595                 600                 605Ser Tyr Glu His Gly Ile Tyr Ser Ser Lys Lys Asn Ser Ala Ile Asn

610                 615                 620Asn Phe Asn Lys Glu Ser Gln Cys Cys Val Leu Leu Leu Glu Thr Arg625                 630                 635                 640Ala Cys Ser Gln Thr Ile Lys Leu Leu Arg Ala Asp Ala Phe Ile Leu

            645                 650                 655Phe Gly Ser Ser Leu Asn Pro Ser His Asp Val Lys His Val Glu Lys

        660                 665                 670Ile Lys Ile Glu Ser Cys Ser Glu Arg Thr Lys Ile Phe Arg Leu Tyr

    675                 680                 685Ser Val Cys Thr Val Glu Glu Lys Ala Leu Ile Leu Ala Arg Gln Asn

690                 695                 700Met Arg Gln Asn Lys Ala Val Glu Asn Leu Asn Arg Ser Leu Thr His705                 710                 715                 720Ala Leu Leu Met Trp Gly Ala Ser Tyr Leu Phe Asp Lys Leu Asp His

            725                 730                 735Phe His Ser Ser Glu Thr Pro Asp Ser Gly Val Ser Phe Glu Gln Ser

        740                 745                 750Ile Met Asp Gly Val Ile His Glu Phe Ser Ser Ile Leu Ser Ser Lys

    755                 760                 765Gly Gly Glu Glu Asn Glu Val Lys Leu Cys Leu Leu Leu Glu Ala Lys

770                 775                 780His Ala Gln Gly Thr Tyr Ser Ser Asp Ser Thr Leu Phe Gly Glu Asp785                 790                 795                 800His Ile Lys Leu Ser Asp Glu Glu Ser Pro Asn Ile Phe Trp Ser Lys

            805                 810                 815Leu Leu Gly Gly Lys Asn Pro Met Trp Lys Tyr Pro Ser Asp Thr Pro

        820                 825                 830Gln Arg Asn Arg Lys Arg Val Gln Tyr Phe Glu Gly Ser Glu Ala Ser

    835                 840                 845Pro Lys Thr Gly Asp Gly Gly Asn Ala Lys Lys Arg Lys Lys Ala Ser

850                 855                 860Asp Asp Val Thr Asp Pro Arg Val Thr Asp Pro Pro Val Asp Asp Asp865                 870                 875                 880Glu Arg Lys Ala Ser Gly Lys Asp His Met Gly Ala Leu Glu Ser Pro

            885                 890                 895Lys Val Ile Thr Leu Gln Ser Ser Cys Lys Ser Ser Gly Thr Asp Gly

        900                 905                 910Thr Leu Asp Gly Asn Asp Ala Phe Gly Leu Tyr Ser Met Gly Ser His

    915                 920                 925Ile Ser Gly Ile Pro Glu Asp Met Leu Ala Ser Gln Asp Trp Gly Lys

930                 935                 940Ile Pro Asp Glu Ser Gln Arg Arg Leu His Thr Val Leu Lys Pro Lys945                 950                 955                 960Met Ala Lys Leu Cys Gln Val Leu His Leu Ser Asp Ala Cys Thr Ser

            965                 970                 975Met Val Gly Asn Phe Leu Glu Tyr Val Ile Glu Asn His Arg Ile Tyr

        980                 985                 990Glu Glu Pro Ala Thr Thr Phe Gln Ala Phe Gln Ile Ala Leu Ser Trp

    995                1000                1005Ile Ala Ala Leu Leu Val Lys Gln Ile Leu Ser His Lys Glu Ser Leu   1010                1015                1020Val Arg Ala Asn Ser Glu Leu Ala Phe Lys Cys Ser Arg Val Glu Val025                1030                1035                1040Asp Tyr Ile Tyr Ser Ile Leu Ser Cys Met Lys Ser Leu Phe Leu Glu

           1045                1050                1055His Thr Gln Gly Leu Gln Phe Asp Cys Phe Gly Thr Asn Ser Lys Gln

       1060                1065                1070Ser Val Val Ser Thr Lys Leu Val Asn Glu Ser Leu Ser Gly Ala Thr

       1075            1080                1085Val Arg Asp Glu Lys Ile Asn Thr Lys Ser Met Arg Asn Ser Ser Glu   1090                1095                1100Asp Glu Glu Cys Met Thr Glu Lys Arg Cys Ser His Tyr Ser Thr Ala105                1110                1115                1120Thr Arg Asp Ile Glu Lys Thr Ile Ser Gly Ile Lys Lys Lys Tyr Lys

           1125                1130                1135Lys Gln Val Gln Lys Leu Val Gln Glu His Glu Glu Lys Lys Met Glu

       1140                1145                1150Leu Leu Asn Met Tyr Ala Asp Lys Lys Gln Lys Leu Glu Thr Ser Lys

   1155                1160                1165Ser Val Glu Ala Ala Val Ile Arg Ile Thr Cys Ser Arg Thr Ser Thr   1170                1175                1180Gln Val Gly Asp Leu Lys Leu Leu Asp His Asn Tyr Glu Arg Lys Phe185                1190                1195                1200Asp Glu Ile Lys Ser Glu Lys Asn Glu Cys Leu Lys Ser Leu Glu Gln

           1205                1210                1215Met His Glu Val Ala Lys Lys Lys Leu Ala Glu Asp Glu Ala Cys Trp

       1220                1225                1230Ile Asn Arg Ile Lys Ser Trp Ala Ala Lys Leu Lys Val Cys Val Pro

   1235                1240                1245Ile Gln Ser Gly Asn Asn Lys His Phe Ser Gly Ser Ser Asn Ile Ser   1250                1255                1260Gln Asn Ala Pro Asp Val Gln Ile Cys Asn Asn Ala Asn Val Glu Ala265                1270                1275                1280Thr Tyr Ala Asp Thr Asn Cys Met Ala Ser Lys Val Asn Gln Val Pro

           1285                1290                1295Glu Ala Glu Asn Thr Leu Gly Thr Met Ser Gly Gly Ser Thr Gln Gln

       1300                1305                1310Val His Glu Met Val Asp Val Arg Asn Asp Glu Thr Met Asp Val Ser

   1315                1320                1325Ala Leu Ser Arg Glu Gln Leu Thr Lys Ser Gln Ser Asn Glu His Ala   1330                1335                1340Ser Ile Thr Val Pro Glu Ile Leu Ile Pro Ala Asp Cys Gln Glu Glu345                1350                1355                1360Phe Ala Ala Leu Asn Val His Leu Ser Glu Asp Gln Asn Cys Asp Arg

           1365                1370                1375Ile Thr Ser Ala Ala Ser Asp Glu Asp Val Ser Ser Arg Val Pro Glu

       1380                1385                1390Val Ser Gln Ser Leu Glu Asn Leu Ser Ala Ser Pro Glu Phe Ser Leu

   1395                1400                1405Asn Arg Glu Glu Ala Leu Val Thr Thr Glu Asn Arg Arg Thr Ser His   1410                1415                1420Val Gly Phe Asp Thr Asp Asn Ile Leu Asp Gln Gln Asn Arg Glu Asp425                1430                1435                1440Cys Ser Leu Asp Gln Glu Ile Pro Asp Glu Leu Ala Met Pro Val Gln

           1445                1450                1455His Leu Ala Ser Val Val Glu Thr Arg Gly Ala Ala Glu Ser Asp Gln

       1460                1465                1470Tyr Gly Gln Asp Ile Cys Pro Met Pro Ser Ser Leu Ala Gly Lys Gln

   1475                1480                1485Pro Asp Pro Ala Ala Asn Thr Glu Ser Glu Asn Leu Glu Glu Ala Ile   1490                1495                1500Glu Pro Gln Ser Ala Gly Ser Glu Thr Val Glu Thr Thr Asp Phe Ala505                1510                1515                1520Ala Ser His Gln Gly Asp Gln Val Thr Cys Pro Leu Leu Ser Ser Pro

           1525                1530                1535Thr Gly Asn Gln Pro Ala Pro Glu Ala Asn Ile Glu Gly Gln Asn Ile

       1540                1545                1550Asn Thr Ser Ala Glu Pro His Val Ala Gly Pro Asp Ala Val Glu Ser

   1555                1560                1565Gly Asp Tyr Ala Val Ile Asp Gln Glu Thr Met Gly Ala Gln Asp Ala   1570                1575                1580Cys Ser Leu Pro Ser Gly Ser Val Gly Thr Gln Ser Asp Leu Gly Ala585                1590                1595                1600Asn Ile Glu Gly Gln Asn Val Thr Thr Val Ala Gln Leu Pro Thr Asp

           1605                1610                1615Gly Ser Asp Ala Val Val Thr Gly Gly Ser Pro Val Ser Asp Gln Cys

       1620                1625                1630Ala Gln Asp Ala Ser Pro Met Pro Leu Ser Ser Pro Gly Asn His Pro

   1635                1640                1645Asp Thr Ala Val Asn Ile Glu Gly Leu Asp Asn Thr Ser Val Ala Glu   1650                1655                1660Pro His Ile Ser Gly Ser Asp Ala Cys Glu Met Glu Ile Ser Glu Pro665                1670                1675                1680Gly Pro Gln Val Glu Arg Ser Thr Phe Ala Asn Leu Phe His Glu Gly

           1685                1690                1695Gly Val Glu His Ser Ala Gly Val Thr Ala Leu Val Pro Ser Leu Leu

        1700               1705                1710Asn Asn Gly Thr Glu Gln Ile Ala Val Gln Pro Val Pro Gln Ile Pro

   1715                1720                1725Phe Pro Val Phe Asn Asp Pro Phe Leu His Glu Leu Glu Lys Leu Arg   1730                1735                1740Arg Glu Ser Glu Asn Ser Lys Lys Thr Phe Glu Glu Lys Lys Ser Ile745                1750                1755                1760Leu Lys Ala Glu Leu Glu Arg Lys Met Ala Glu Val Gln Ala Glu Phe

           1765                1770                1775Arg Arg Lys Phe His Glu Val Glu Ala Glu His Asn Thr Arg Thr Thr

       1780                1785                1790Lys Ile Glu Lys Asp Lys Asn Leu Val Ile Met Asn Lys Leu Leu Ala

   1795                1800                1805Asn Ala Phe Leu Ser Lys Cys Thr Asp Lys Lys Val Ser Pro Ser Gly   1810                1815                1820Ala Pro Arg Gly Lys Ile Gln Gln Leu Ala Gln Arg Ala Ala Gln Val825                1830                1835                1840Ser Ala Leu Arg Asn Tyr Ile Ala Pro Gln Gln Leu Gln Ala Ser Ser

           1845                1850                1855Phe Pro Ala Pro Ala Leu Val Ser Ala Pro Leu Gln Leu Gln Gln Ser

       1860                1865                1870Ser Phe Pro Ala Pro Gly Pro Ala Pro Leu Gln Pro Gln Ala Ser Ser

   1875                1880                1885Phe Pro Ser Ser Val Ser Arg Pro Ser Ala Leu Leu Leu Asn Phe Ala   1890                1895                1900Val Cys Pro Met Pro Gln Pro Arg Gln Pro Leu Ile Ser Asn Ile Ala905                1910                1915                1920Pro Thr Pro Ser Val Thr Pro Ala Thr Asn Pro Gly Leu Arg Ser Pro

           1925                1930                1935Ala Pro His Leu Asn Ser Tyr Arg Pro Ser Ser Ser Thr Pro Val Ala

       1940                1945                1950Thr Ala Thr Pro Thr Ser Ser Val Pro Pro Gln Ala Leu Thr Tyr Ser

   1955                1960                1965Ala Val Ser Ile Gln Gln Gln Gln Glu Gln Gln Pro Gln Gln Ser Leu   1970                1975                1980Ser Ser Gly Leu Gln Ser Asn Asn Glu Val Val Cys Leu Ser Asp Asp985                1990                 1995               2000Glu<210>4<211>21<212>DNA<213>人工序列<220><223>人工序列描述:合成寡核苷酸<400>4 catctacggc aatgtaccag c                                             21<210>5<211>21<212>DNA<213>人工序列<220><223>人工序列描述:合成寡核苷酸<400>5gatgggaatt ggctgagtgg c                                           21<210>6<211>21<212>DNA<213>人工序列<220><223>人工序列描述:合成寡核苷酸<400>6cagttccaaa cgtaaaacgg c                                               21<210>7<211>15<212>DNA<213>人工序列<220><223>人工序列描述:合成寡核苷酸<400>7ntcgastwts gwgtt                                                      15<210>8<211>16<212>DNA<213>人工序列<220><223>人工序列描述:合成寡核苷酸<400>8ngtcgaswga nawgaa                                                   16<210>9<211>16<212>DNA<213>人工序列<220><223>人工序列描述:合成寡核苷酸<400>9wgtgnagwan canaga                                                   16<210>10<211>16<212>DNA<213>人工序列<220><223>人工序列描述:合成寡核苷酸  <400>10  wggwancwga wangca                                                      16  <210>11  <211>16  <212>DNA  <213>人工序列  <220>  <223>人工序列描述:合成寡核苷酸  <400>11  wcgwwgawca ngncga                                                      16  <210>12  <211>16  <212>DNA  <213>人工序列  <220>  <223>人工序列描述:合成寡核苷酸  <400>12  wgcnagtnag wanaag                                                      16  <210>13  <211>16  <212>DNA  <213>人工序列  <220>  <223>人工序列描述:合成寡核苷酸  <400>13  awgcangncw ganata                                                      16  <210>14  <211>24  <212>DNA  <213>人工序列  <220>  <223>人工序列描述:合成寡核苷酸  <400>14ctgtacatac tgagtacaat cgga                                         24<210>15<211>25<212>DNA<213>人工序列<220><223>人工序列描述:合成寡核苷酸<400>15gcttcaattc ctgcctcagt tgaac                                        25<210>16<211>24<212>DNA<213>人工序列<220><223>人工序列描述:合成寡核苷酸<400>16ctctacgtgc ttaacatcat gcga                                         24<210>17<211>25<212>DNA<213>人工序列<220><223>人工序列描述:合成寡核苷酸<400>17ccagcttctg ctactagaaa gtcag                                        25<210>18<211>25<212>DNA<213>人工序列<220><223>人工序列描述:合成寡核苷酸<400>18ctggagttgc atgaaatcct ggatg                                        25  <210>19  <211>25  <212>DNA  <213>人工序列  <220>  <223>人工序列描述:合成寡核苷酸<400>19gctctttgta agctgttcac gagac                                       25<210>20<211>24<212>DNA<213>人工序列<220><223>人工序列描述:合成寡核苷酸<400>20tcgcatgatg ttaagcacgt agag                                        24<210>21<211>25<212>DNA<213>人工序列<220><223>人工序列描述:合成寡核苷酸<400>21gagtactggt ccgtgaacag gtaat                                       25<210>22<211>25<212>DNA<213>人工序列<220><223>人工序列描述:合成寡核苷酸<400>22atgcttgcac aagcatggtc ggaaa                                       25<210>23<211>25<212>DNA<213>人工序列<220><223>人工序列描述:合成寡核苷酸<400>23tgcaacatcg tgcatttgct ccaga                                       25<210>24<211>25<212>DNA<213>人工序列<220><223>人工序列描述:合成寡核苷酸<400>24cacaagcatg agtttttcct tccgg                                       25<210>25<211>25<212>DNA<213>人工序列<220><223>人工序列描述:合成寡核苷酸<400>25ctgactttct agtagcagaa gctgg                                       25<210>26<211>519<212>DNA<213>甘蓝<220><223>seg1-23<400>26gaattcctgn nttacggcat ccttaataga ctgttcaaat ggaactcctg aacctggggt 60tccactccca tggaagtgtt ccagcttatc aaataaatat gatgcccccc acatgagcaa 120tgcatgtgtg agaggacggt ttaggttctc tagaggctta ttttgcctag caagaatcag 180ggttttttct tcaactgtaa acactgagta caaccggaaa atcttagttc tttcagaaca 240cgactcaacc tttatcttct ctaagagctt aacgtcatgc gatggattca ggctgcttcc 300aaaaagtata aaagactcag cgcgtaagag tttaatgctt tgactacagg cacgtatttc 360cagcagcaga ataaaacact cactctcctt gttgaaattg tttatagcgt tcttcttcga 420gaggcagacc ccatgctcat aggaattttg accaaatctt tgcatcagaa aatcttcgag 480aatattacca agcagaagcc cctcagggct atgtattgc                        519<210>27<211>419<212>DNA<213>甘蓝<220><223>seq1-27<400>27gaattcagga tcaaaagggt tgccggttgg agaaactggt ttagagaaag gctctgattt 60tcctgtggaa gtaactaagg atatagagaa gacagtggtt gattcatccc ccatggttga 120aactgaggat ggcagtgtta taggttcacc atccgagaat ccagaaccac aaaagcttcg 180tgacagtgaa actagcttgg aaaccgatat agacttggct ctgaaaagaa aaagagacac 240tgcagaaatt gtgatggatg catgtacaaa tgcagatgac cgcattatga gtactgatgg 300ggttattcct tttccacccg tgtgcacaaa tattaatcaa cccgaaaggt gtggcacatg 360tcaaaaacgg caaaagtaag aatttccgac tgttgtctgt cgttttgaaa ccatttgcc  419<210>28<211>467<212>DNA<213>甘蓝<220><223>seq1-43<400>28gaattctcgt ccatactttc ttccgatgtt ggagaagaaa atgaaggcaa gctgtgtcta 60cttttggaag ccaagcatgc tcagggaagt tacagcactg atgctactct atttggtgaa 120gaacatgtca agttatcaga tgaaagtcca aatatgtttt ggtcaaagct gttgagtgga 180aagaacccta tgtggaaata ctgttcggat actcctcaaa ggagtcgaaa aagagtacgg 240catcttcagg gctatgagga gactaccaaa gttggcaatg gcggaaactt aaagaagaaa 300aagaaggctt cagatgatgt cacagtagat aacgctgaga gaaaagcctc tggaaaggat 360cacatgggta aaacagttca cttcctgctc ctttacctct agtgttcatt gaatgttcca 420tttactttgc ttactatctt tccttcaggg catttggagt caccaaa               467<210>29<211>490<212>DNA<213>甘蓝<220><223>seq1-47<400>29gaattcagct tttaaaactg atctctgctc acagataatt taagagtcag tgaaaattga 60gataaaacga accaaaactg gaggtaacag atactctgag aacaactaac cttttcttca 120taagtcttct ttgtgttctc tgattctctc cgcagcttct ccagttcatg ctgaaatggg 180tcactgaaca cagggaaagg tacttgagga acaggtggag tggcattctg tcccgtagca 240ttgttaagct gtgaagaaac aggagctgtt acacctgctg gaggctccac aacaccttca 300tcgacaacgt ctgcgtaaaa ggtattacca gattgtcagt ttctctggca aacacatacg 360ttatacttaa atgcaaaaga gcagttactg acttgcaaag gttggttgtt ctacttgagc 420atcaggttct gctacttcca tttcacatgc ttctgatcca gttgtgcgag gcgcagccat 480tgttgtgttg                                                      490<210>30<211>515<212>DNA<213>甘蓝<220><223>2-33<400>30tctagagaag aggtggatta tgtatattct tttctgtact gcatgaagag tctattcgtg 60gggcgcacac aaggtttcca agaaaagggt gaagaatgca tggctgagaa aagaggtagc 120cattatagct cagtaaccaa ggatgttgaa aagactatta gcgacatcaa aaagaaatgc 180agtaagagcc tgcataagct tgtacaaacc ctcgaggaag aaaagatgga cctgatgaat 240aggaatgctg tcaagaagca ggaacttcag aattgtaaaa aggtggaagc atcatttatt 300cgtgtcacct attcaggtat aaatactcag agcttacatg atgctctcca acggctggaa 360tgtacttttg aaagaaagtt tgatgatctc aaaggagagt tggatgaatg ccttgaaagt 420ttagagcaaa taaacgaggc tggaaagaag aagttggctg aagatgaagc ctgttggatt 480agtcggatag agaaatgggc acgagctgaa ttaag                            515<210>31<211>574<212>DNA<213>甘蓝<220><223>seq2-37<400>31tctagaccaa actattaaac gctaaacata agaagattag atcactcgtc atcagagaga 60cagaccacat cattgctcct ctgcaatcca ctccccaagt tctgtggttg ttcttgctgc 120tgaataaacg catttgaata tggtaaaggg ttggagatga gaggttgtct tggttgaggc 180attgtgcagt acggagccga agcagtatga ttcctcagtg cgcttacttg tgttgctctc 240tgtgctagct gctggattct aactggagaa agaaaaaaag aaaaaaaagg tgttattatg 300acttcataac cttatatctt taaaaaacaa ttatgcttct attattcgaa cacttgccca 360ttggagttgc tgctgaggaa tgagaggaga ttctgctcgt acatttagac aagaacgcac 420tcgacaacag cttgttcttt ataacaagat tcttcctcgt ctgtaacttc gtctttctgg 480ctgcatgtac agcttgtacc tcatgaaact ttctctgata ctcttcttgt aattcagcta 540tcttcttctc gaatttagct ttcaagactg cttt                             574<210>32<211>466<212>DNA<213>甘蓝<220><223>seq2-53<400>32tctagattgt aattttaaat ttacaacaaa ttttgaaagg gtcagcgatg agtttgcaaa 60tctccgtgtt tcctccagca ttgctcagcc agttcaagaa cctgatcact tggcacaggt 120tggtttcttc ttgctttact ttggacacct gtttaatatt ggcctgtcaa atttacttat 180ccttttactt ctaaactgca aattctggtc tgcattgcat tgtgatatga aggtatctgg 240acccgcttca agcagagact atggggagga caggcagaat atgcaacaag ataaatcaca 300tgaccgaaag ttgtcatcga tgtatccaga gtattgggtt ccagtgcagc tatcagatgt 360acagatagag caatactgtc ggactctctt ctccaaatct tcatctcttt cttcgctgtc 420gaggactgat cctgttcgag ctcttgaaca aactctcagt tctgta                466<210>33<211>417<212>DNA<213>甘蓝<220><223>seq2-57<400>33tctagagcaa ttgaaaccta attccgattt tgcgcgggcc agagattctt cacggttgaa 60cttttgctta acgaaagaga ctgcaatcca aatctggaag tgcattatta agaacgtatt 120cagcaatatt cataaattat gcaacaatca aaggccttac gttgtggcct acaaagcatg 180gattttgtta gatattagta gctagtctaa ttcaagcaat taatggaagt ttctatccta 240tgactggaaa gttaaacatt cccacaaaag cagtgatgcc acagatgatg aagaagaaaa 300atgcatatac tatggaagtg aatgctatca taccacagct atctggaagg cctgcaatgt 360tgtagctggc tctttgcaga cacggtggtt gtcaataata tattcaagaa ctttttc    417

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号