首页> 中国专利> 小鼠白血病病毒逆转录酶突变体及其表达方法与应用

小鼠白血病病毒逆转录酶突变体及其表达方法与应用

摘要

本发明公开了小鼠白血病病毒逆转录酶突变体及其表达方法与应用。该小鼠白血病病毒逆转录酶突变体,是将小鼠白血病病毒逆转录酶的自N端第84位谷氨酰胺残基取代为氨基酸残基X的蛋白质,其中X为侧链短于谷氨酰胺侧链的氨基酸。本发明的小鼠白血病病毒逆转录酶突变体具有比RT-F155V-H更高的RNA聚合酶比活性和RNA合成能力。

著录项

  • 公开/公告号CN1807605A

    专利类型发明专利

  • 公开/公告日2006-07-26

    原文格式PDF

  • 申请/专利权人 中国科学院生物物理研究所;

    申请/专利号CN200610001356.2

  • 发明设计人 高光侠;刘树峰;

    申请日2006-01-19

  • 分类号C12N9/00;C12N15/52;C12N15/33;C12N1/21;C12N15/63;C12N15/09;C12R1/19;

  • 代理机构北京纪凯知识产权代理有限公司;

  • 代理人关畅

  • 地址 100101 北京市朝阳区大屯路中国科学院生物物理研究所

  • 入库时间 2023-12-17 17:29:38

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2017-03-08

    未缴年费专利权终止 IPC(主分类):C12N9/00 授权公告日:20081015 终止日期:20160119 申请日:20060119

    专利权的终止

  • 2008-10-15

    授权

    授权

  • 2006-09-20

    实质审查的生效

    实质审查的生效

  • 2006-07-26

    公开

    公开

说明书

技术领域

本发明涉及一种逆转录酶突变体及其表达方法与应用,特别涉及小鼠白血病病毒逆转录酶突变体及其表达方法,与该小鼠白血病病毒逆转录酶突变体在合成RNA中的应用。

背景技术

根据对底物的选择特异性,传统上把核酸聚合酶分为DNA聚合酶和RNA聚合酶两大类。聚合酶对底物的选择通常是非常严格的,因为它们分别承担着遗传物质的复制和转录两个生物学最基本的功能。

然而对聚合酶的分类可能并非象想像的那么简单。DNA聚合酶和RNA聚合酶尽管在一级结构上没有同源性,但是它们的聚合酶结构域的高级结构却非常类似,呈一个半张开的右手状,包含有手掌,手指以及拇指亚结构域。另外,它们的催化机制也非常的类似。而对作为底物的脱氧核糖核苷酸(dNTPs)和核糖核苷酸(rNTPs)而言,它们的唯一区别就是rNTPs的2’-OH基团。这说明DNA聚合酶和RNA聚合酶之间可能存在着某种关联,或者说它们在进化上存在着某种相关性,有可能通过它们结构上的一个小的改变,来实现DNA聚合酶和RNA聚合酶的角色转换。

小鼠白血病病毒(Murine Leukemia Virus,简称MLV)逆转录酶(ReverseTranscriptase,简称RT,是由逆转录病毒编码的DNA聚合酶,能以RNA或DNA作为模板合成DNA。Guangxia Gao等于1997年发表在Proceedings of the NationalAcademy of sciences of the Unite States of America第407-411页的文章(专利号:US6136582)表明,当将MLV-RT的自N-端155位的苯丙氨酸(F155)突变成缬氨酸(V)时,RT-F155V能够利用RNA或者DNA作为模板将rNTPs参入到产物,也就是说RT具有了RNA聚合酶的活性。RT-F155V-H带有F155V和D524N双突变的MMLV RT,F155V突变使RT具有了参入rNTPs的能力,D524N突变将消除MMLV RT的RNase H活性,这样可以避免RT的RNase H活性对RNA产物的降解。

但是RT-F155V-H催化RNA合成的效率仍然很低,而且合成的RNA片段也很短。

发明内容

本发明的一个目的是提供小鼠白血病病毒逆转录酶突变体。

本发明所提供的小鼠白血病病毒逆转录酶突变体,是将小鼠白血病病毒逆转录酶的自N端第155位苯丙氨酸残基取代为缬氨酸、自N端第524位天门冬氨酸残基取代为天门冬酰胺残基和自N端第84位谷氨酰胺残基取代为氨基酸残基X的蛋白质,其中X为侧链短于谷氨酰胺侧链的氨基酸。该小鼠白血病病毒逆转录酶突变体的名称为RT-Q84X-F155V-H。

所述小鼠白血病病毒逆转录酶(MLV-RT)的氨基酸序列如序列3所示。

所述X可为丙氨酸、天门冬酰胺、天门冬氨酸或丝氨酸。

所述X为丙氨酸;所述小鼠白血病病毒逆转录酶突变体具有序列表中序列2的氨基酸残基序列,该小鼠白血病病毒逆转录酶突变体的名称为RT-Q84A-F155V-H。

上述小鼠白血病病毒逆转录酶突变体的编码基因也属于本发明的保护范围。

所述小鼠白血病病毒逆转录酶突变体具有序列表中序列2的氨基酸残基序列;所述小鼠白血病病毒逆转录酶突变体编码基因(RT-Q84A-F155V-H)具有序列表中序列1的自5′端第1515位至第3527位脱氧核苷酸的核苷酸序列。

本发明的另一个目的是提供一种表达RT-Q84A-F155V-H的方法。

该表达RT-Q84X-F155V-H的方法,是将含有RT-Q84X-F155V-H编码基因的表达载体转化到大肠杆菌中,培养阳性克隆,表达得到小鼠白血病病毒逆转录酶突变体。

所述含有RT-Q84X-F155V-H编码基因的表达载体是具有序列表中序列1的核苷酸序列的质粒pTacRT-Q84A-F155V-D524N。

所述大肠杆菌优选为Escherichia coli BL21。

本发明利用蛋白质工程方法,将一种DNA聚合酶小鼠白血病病毒逆转录酶(MLV-RT)改造成具有较高酶活性和RNA合成能力的RNA聚合酶。实验证明RT-Q84X-F155V-H具有比RT-F155V-H更高的RNA聚合酶比活性和RNA合成能力。

附图说明

图1是RT-Q84A-F155V-H纯化后的SDS-PAGE电泳检测图。

图2是RT-Q84A-F155V-H和RT-F155V-H的RNA聚合酶活性的比较图。

图3是RT-Q84A-F155V-H和RT-F155V-H合成RNA片段能力的比较图。

具体实施方式

本发明通过分析MLV-RT的晶体结构模型,发现该酶第84位的谷氨酰胺(Q84)位于酶的活性中心附近,参与调控酶的催化能力,其较长的侧链妨碍合成产物的延伸,影响RNA聚合酶的活性和合成RNA的能力。本发明将这个位于酶的活性中心的大的氨基酸残基替换成小的氨基酸残基,协助这些DNA聚合酶更好的容纳RNA产物。本发明将RT-F155V-H基因进行突变,使Q84残基突变成侧链较短的残基,产生了新的突变酶RT-F155V-Q84X,其中X为侧链短于谷氨酰胺侧链的氨基酸,如天冬酰胺(Asn)、丝氨酸(Ser)、丙氨酸(Ala)等。同时,本发明将Q84X突变引入RT-F155V-H中,使之成为RT-Q84X-F155V-H。本发明比较了将MLV-RT中第84位的谷氨酰胺突变为丙氨酸后产生的RT-Q84A-F155V-H和RT-F155V-H的RNA聚合酶活性及RNA合成能力,实验证明RT-Q84A-F155V-H具有比RT-F155V-H更高的RNA聚合酶比活性和RNA合成能力。

本发明还提供了一种在大肠杆菌E.coli中表达重组RT-Q84X-F155V-H逆转录酶的方法。

下面通过优选实例对本发明做更详细的描述。下述实施例中的实验方法,如无特别说明,均为常规方法。下述实施例中的百分含量,如无特别说明,均为质量百分含量。

实施例1、RT-Q84A-F155V-H的合成及其功能

本实施例中将RT-F155V-H(Guangxia Gao等于1997年发表在Proceedings ofthe National Academy of sciences of the Unite States of America第407-411页的文章,专利号:US6136582)中的第84位的谷氨酰胺突变为丙氨酸,使之成为RT-Q84A-F155V-H。

1、质粒pTacRT-Q84A-F155V-D524N的构建

RT-Q84A-F155V-H的定点突变采用将两段PCR产物AflII-EcoRI和EcoRI-MfeI替换掉pTacRT-F155V-D524N的AflII-MfeI片段(nt1467-2280)。引物Q84A-SP(5’CGGAATTCTGGTACCCTGCCAGTC)包含有一个由于同义突变产生的EcoRI酶切位点(用下划线表示),它和下游引物PCR扩增得到一个300bp的EcoRI-MfeI片段。引物Q84A-AP(5’CGGAATTCCCGCGTCCAACAGTCTCTGTA)同样包含有一个由于同义突变产生的EcoRI酶切位点以及突变的丙氨酸密码子(黑体表示),它和上游引物经PCR扩增得到一个500bp的AflII-EcoRI片段。所得重组质粒通过酶切鉴定为阳性克隆。具体方法如下:

(1)EcoRI-MfeI片段的合成

以pTacRT-F155V-D524N(Guangxia Gao等于1997年发表在Proceedings of theNational Academy of sciences of the Unite States of America第407-41l页的文章,专利号:US6136582)为模板,利用上游引物Q84A-SP和下游引物:MfeI-AP(5’-TGGGAGTCTGGTCCAGG-3’PCR扩增得到300bp的EcoRI-MfeI片段。其中,PCR的温度条件为:先95℃预变性2min;然后95℃30s,55℃1min,72℃1min,20个循环;最后72℃,10min补平末端。

(2)AflII-EcoRI片段的合成

以pTacRT-F155V-D524N(Guangxia Gao等于1997年发表在Proceedings of theNational Academy of sciences of the Unite States of America第407-411页的文章,专利号:US6136582)为模板,利用上游引物:AflII-SP(5’-GTGGAATTGTGAGCGGA-3’)和下游引物Q84A-AP PCR扩增得到一个500bp的AflII-EcoRI片段。其中,PCR的温度条件为:先95℃预变性2min;然后95℃ 30s,55℃ 1min,72℃ 1min,20个循环;最后72℃,10min补平末端。

(3)质粒pTacRT-Q84A-F155V-D524N的构建

将经AflII和EcoRI酶切后的AflII-EcoRI片段,EcoRI和MfeI酶切后的EcoRI-MfeI片段和经AflII和MfeI酶切pTacRT-F155V-D524N(Guangxia Gao等于1997年发表在Proceedings of the National Academy of sciences of the UniteStates of America第407-411页的文章,专利号:US6136582)后得到的6.7kb片段连接,得到AflII-EcoRI和EcoRI-MfeI替换掉pTacRT-F155V-D524N的AflII-MfeI片段(nt1467-2280)的质粒pTacRT-Q84A-F155V-D524N,测序表明pTacRT-Q84A-F155V-D524N(序列1)含有具有序列表中序列1的自5′端第1515位至第3527位脱氧核苷酸的小鼠白血病病毒逆转录酶突变体编码基因RT-Q84A-F155V-H,编码具有序列表中序列2的氨基酸序列的小鼠白血病病毒逆转录酶突变体RT-Q84A-F155V-H。

2、RT-Q84A-F155V-H在大肠杆菌中的诱导和表达

将pTacRT-Q84A-F155V-D524N转化Escherichia coli BL21,挑取单菌落接种于含100μg/ml氨苄青霉素的LB液体培养基中,37℃培养至0D600≈0.5时,加入IPTG至终浓度0.5mM,37℃继续培养2-3小时,收集菌体,将菌体用预冷的50mMTris-HCl(pH 7.5)洗涤一次后备用。

3、RT-Q84A-F155V-H的纯化

将收集的菌体悬浮于缓冲液A(20mM PBS,pH 7.4,0.5M NaCl),冻融后,加入溶菌酶至终浓度0.5mg/ml,4℃消化30min,超声波破碎3次,每次20秒,离心,收集上清。经过金属螯合层析柱HiTrap chelating HP column(购自Pharmacia)分离纯化后,纯度即达80%以上,收集活性蛋白峰,经过离子交换层析柱MonoS(购自Pharmacia)进一步分离纯化后,电泳检测考马斯亮蓝染色,结果显示该蛋白为一分子量约为76KD的均一条带,未见杂质(图1),达到对RT进行酶学研究分析的要求。图1中各泳道分别为:M:分子量标准;1:RT-Q84A-F155V-H;2、RT-F155V-H(Guangxia Gao等于1997年发表在Proceedings of the National Academy ofsciences of the Unite States of America第407-411页的文章;US6136582)。

4、RT-Q84A-F155V-H的RNA聚合酶活性测定及动力学分析

50μl反应体系中包括40ng RT纯酶样品,60mM Tris.HCl(pH 8.0),75mM NaCl,0.7mM MnCl2,5mM DTT,12μg/ml Poly(rA)模板,6μg/ml oligo(dT)18引物,10μCi/ml(1Ci=37GBq)32P标记的UTP以及12μM未标记的UTP,反应于37℃进行。分别于反应开始后不同时间点取样4μl点于DE81滤纸,终止反应。然后将DE81滤纸用2×SSC洗涤三次,95%乙醇漂洗两次,将滤纸晾干后,放射自显影。定量分析采用液闪计数仪测定。

动力学分析采用公知的双倒数作图法进行。用每个样品中“保留在DE81滤纸的放射强度/同一样品总的放射强度”来表示参入到产物中的UTP的量。

选用poly(rA)-oligo(dT)18作为模板-引物,rUTP为底物对这三个变体酶进行RNA聚合酶酶活分析,结果显示,当将Q84替换成A后,能提高RT-F155V-H的RNA聚合酶的活性(图2,比较RT-Q84A-F155V-H和RT-F155V-H)。将Q84突变成天冬酰氨(N)(比Q少一个甲基基团)得到的RT-Q84N-F155V-H(RT-Q84N-F155V-H也由671个氨基酸残基组成,除自氨基端第84位氨基酸残基为Asn外,其它氨基酸残基与序列2相同,可参照RT-Q84A-F155V-H的表达方法进行制备),同样能提高RT-F155V-H的RNA聚合酶活性(图2,RT-Q84N-F155V-H))。作为对照,将Q84替换成大的氨基酸残基如RT-Q84R-F155V-H(RT-Q84R-F155V-H也由671个氨基酸残基组成,除自氨基端第84位氨基酸残基为Arg外,其它氨基酸残基与序列2相同,可参照RT-Q84A-F155V-H的表达方法进行制备)时,则不能提高RT-F155V-H的RNA聚合酶活性(图2,RT-Q84R-F155V-H)。需要指出的是,是F155V突变使得MMLV RT具有了RNA聚合酶活性,只带有Q84A和D524N双突变的RT-Q84A-H(RT-Q84A-H也由671个氨基酸残基组成,除自氨基端第84位氨基酸残基为Ala、第155位氨基酸残基为Phe、第524位氨基酸残基为Asn外,其它氨基酸残基与序列2相同,可按常规方法制备)与RT-WT-H(RT-WT-H也是由671个氨基酸残基组成,除自氨基端第84位氨基酸残基为Gln、第155位氨基酸残基为Phe、第524位氨基酸残基为Asn外,其它氨基酸残基与序列2相同,可按常规方法制备)一样,不具有RNA聚合酶活性。

动力学分析显示,在以UTP为底物时,RT-Q84A-F155V-H和RT-F155V-H具有相似的Km(分别为2.98μM和2.88μM),而RT-Q84A-F155V-H的最大反应速率Vmax值则是RT-F155V-H的4.3倍(分别为9.94nmol.min-1.ng-1和2.31nmol.min-1.ng-1)(见表1)。

表1.RT-Q84A-F155V-H与RT-F155V-H RNA聚合酶动力学参数比较。

  酶  rUTP  Vmax  (nmol.min-1.ng-1)  Km(μM)  RT-F155V-H  2.31±0.30  2.88±0.67  RT-Q84A-F155V-H  9.94±0.90  2.98±0.72

5、RT合成RNA实验

将寡核苷酸P21(5’-AAGCCCCACATACAGAGACTG-3’)用[γ-32P]ATP进行末端标记。此标记产物*P21先过G25柱纯化,然后与作为模板的一段寡核苷酸T36(3’-TTCGGGGTGTATGTCTCTGACAACCTGGTCGTCCCT-5’)退火。退火反应先在65℃保温10min,然后缓慢降温至室温。RNA合成反应60μl反应体系中包括3μg RT纯酶样品,60mM Tris.HCl(pH 8.0),75mM NaCl,0.7mM MnCl2,5mM DTT,0.1μM*P21/T36以及500μM未标记的超纯的rNTP(Amersham)。反应于37℃进行,反应开始后于不同时间点取样中止反应。然后通过23%尿素PAGE分离产物,放射自显影检测,采用PhosphorImager定量。

和Gguangxia Gao等1997年发表的结果一致,RT-F155V-H在反应120min后仍然只能合成7个核苷酸的一段RNA(图3,泳道6箭头示)。与之相比较,经过30min反应RT-Q84A-F155V-H就能合成出更长的RNA产物。并且RT-Q84A-F155V-H合成RNA的速率要比RT-F155V-H快得多(图3,比较第2和7,3和8,4和9,5和10,6和11泳道)。同样的反应条件下,以dNTPs作为底物充分延伸得到的全长DNA(36nt)的迁移速率明显比RT-Q84A-F155V-H合成的最长的RNA快,表明RT-Q84A-F155V-H的合成产物不是由于dNTPs的污染造成的。RT-Q84A-F155V-H合成的最长RNA产物是一段全长的15-nt RNA(图3,第11泳道)。图3中,泳道1为*P21的电泳结果,泳道2、3、4、5、6分别为RT-F155V-H反应5、10、30、60和120分钟的产物电泳结果,泳道7、8、9、10、11分别为RT-Q84A-F155V-H反应5、10、30、60和120分钟的产物电泳结果,泳道12为同样的反应条件下,以dNTPs作为底物RT-Q84A-F155V-H合成的DNA电泳结果。

                              序列表

<160>3

<210>1

<211>7488

<212>DNA

<213>人工序列

<220>

<223>

<400>1

ccgacaccat cgaatggtgc aaaacctttc gcggtatggc atgatagcgc ccggaagaga      60

gtcaattcag ggtggtgaat gtgaaaccag taacgttata cgatgtcgca gagtatgccg     120

gtgtctctta tcagaccgtt tcccgcgtgg tgaaccaggc cagccacgtt tctgcgaaaa     180

cgcgggaaaa agtggaagcg gcgatggcgg agctgaatta cattcccaac cgcgtggcac     240

aacaactggc gggcaaacag tcgttgctga ttggcgttgc cacctccagt ctggccctgc     300

acgcgccgtc gcaaattgtc gcggcgatta aatctcgcgc cgatcaactg ggtgccagcg     360

tggtggtgtc gatggtagaa cgaagcggcg tcgaagcctg taaagcggcg gtgcacaatc     420

ttctcgcgca acgcgtcagt gggctgatca ttaactatcc gctggatgac caggatgcca     480

ttgctgtgga agctgcctgc actaatgttc cggcgttatt tcttgatgtc tctgaccaga     540

cacccatcaa cagtattatt ttctcccatg aagacggtac gcgactgggc gtggagcatc     600

tggtcgcatt gggtcaccag caaatcgcgc tgttagcggg cccattaagt tctgtctcgg     660

cgcgtctgcg tctggctggc tggcataaat atctcactcg caatcaaatt cagccgatag     720

cggaacggga aggcgactgg agtgccatgt ccggttttca acaaaccatg caaatgctga     780

atgagggcat cgttcccact gcgatgctgg ttgccaacga tcagatggcg ctgggcgcaa     840

tgcgcgccat taccgagtcc gggctgcgcg ttggtgcgga tatctcggta gtgggatacg     900

acgataccga agacagctca tgttatatcc cgccgttaac caccatcaaa caggattttc     960

gcctgctggg gcaaaccagc gtggaccgct tgctgcaact ctctcagggc caggcggtga    1020

agggcaatca gctgttgccc gtctcactgg tgaaaagaaa aaccaccctg gcgcccaata    1080

cgcaaaccgc ctctccccgc gcgttggccg attcattaat gcagctggca cgacaggttt    1140

cccgactgga aagcgggcag tgagcgcaac gcaattaatg tgagttagct cactcattag    1200

gcacaattct catgtttgac agcttatcat cgactgcacg gtgcaccaat gcttctggcg    1260

tcaggcagcc atcggaagct gtggtatggc tgtgcaggtc gtaaatcact gcataattcg    1320

tgtcgctcaa ggcgcactcc cgttctggat aatgtttttt gcgccgacat cataacggtt    1380

ctggcaaata ttctgaaatg agctgttgac aattaatcat cggctcgtat aatgtgtgga    1440

attgtgagcg gataacaatt tgaattctta agatttgtga ggggataaca atttcacaca    1500

ggaaacagaa tatgacccta aatatagaag atgagcatcg gctacatgag acctcaaaag    1560

agccagatgt ttctctaggg tccacatggc tgtctgattt tcctcaggcc tgggcggaaa    1620

ccgggggcat gggactggca gttcgccaag ctcctctgat catacctctg aaagcaacct    1680

ctacccccgt gtccataaaa caatacccca tgtcacaaga agccagactg gggatcaagc    1740

cccacataca gagactgttg gacgcgggaa tcctggtacc ctgccagtcc ccctggaaca    1800

cgcccctgct acccgttaag aaaccaggga ctaatgatta taggcctgtc caggatctga    1860

gagaagtcaa caagcgggtg gaagacatcc accccaccgt gcccaaccct tacaacctct    1920

tgagcgggct cccaccgtcc caccagtggt acactgtgct tgatcttaag gatgccgttt    1980

tctgcctgag actccacccc accagtcagc ctctcttcgc ctttgagtgg agagatccag    2040

agatgggaat ctcaggacaa ttgacctgga ccagactccc acagggtttc aaaaacagtc    2100

ccaccctgtt tgatgaggca ctgcacagag acctagcaga cttccggatc cagcacccag    2160

acttgatcct gctacagtac gtggatgact tactgctggc cgccacttct gagctagact    2220

gccaacaagg tactcgggcc ctgttacaaa ccctagggaa cctcgggtat cgggcctcgg    2280

ccaagaaagc ccaaatttgc cagaaacagg tcaagtatct ggggtatctt ctaaaagagg    2340

gtcagagatg gctgactgag gccagaaaag agactgtgat ggggcagcct actccgaaga    2400

cccctcgaca actaagggag ttcctaggga cggcaggctt ctgtcgcctc tggatccctg    2460

ggtttgcaga aatggcagcc cccttgtacc ctctcaccaa aacggggact ctgtttaatt    2520

ggggcccaga ccaacaaaag gcctatcaag aaatcaagca agctcttcta actgccccag    2580

ccctggggtt gccagatttg actaagccct ttgaactctt tgtcgacgag aagcagggct    2640

acgccaaagg tgtcctaacg caaaaactgg gaccttggcg tcggccggtg gcctacctgt    2700

ccaaaaagct agacccagta gcagctgggt ggcccccttg cctacggatg gtagcagcca    2760

ttgccgtact gacaaaggat gcaggcaagc taaccatggg acagccacta gtcattctgg    2820

ccccccatgc agtagaggca ctagtcaaac aaccccccga ccgctggctt tccaacgccc    2880

ggatgactca ctatcaggcc ttgcttttgg acacggaccg ggtccagttc ggaccggtgg    2940

tagccctgaa cccggctacg ctgctcccac tgcctgagga agggctgcaa cacaactgcc    3000

ttgatatcct ggccgaagcc cacggaaccc gacccgacct aacggaccag ccgctcccag    3060

acgccgacca cacctggtat acgaatggaa gcagtctctt acaagaggga cagcgtaagg    3120

cgggagctgc ggtgaccacc gagaccgagg taatctgggc taaagccctg ccagccggga    3180

catccgctca gcgggctgaa ctgatagcac tcacccaggc cctaaagatg gcagaaggta    3240

agaagctaaa tgtttatact gatagccgtt atgcttttgc tactgcccat atccatggag    3300

aaatatacag aaggcgtggg ttgctcacat cagaaggcaa agagatcaaa aataaagacg    3360

agatcttggc cctactaaaa gccctctttc tgcccaaaag acttagcata atccattgtc    3420

caggacatca aaagggacac agcgccgagg ctagaggcaa ccggatggct gaccaagcgg    3480

cccgaaaggc agccatcaca gagactccag acacctctac cctcctccat caccatcacc    3540

atcactagtc tagagtcgac ctgcaggcaa gcttggcact ggccgtcgtt ttacaacgtc    3600

gtgactggga aaaccctggc gttacccaac ttaatcgcct tgcagcacat ccccctttcg    3660

ccagctggcg taatagcgaa gaggcccgca ccgatcgccc ttcccaacag ttgcgcagcc    3720

tgaatggcga atggcagctt ggctgttttg gcggatgaga taagattttc agcctgatac    3780

agattaaatc agaacgcaga agcggtctga taaaacagaa tttgcctggc ggcagtagcg    3840

cggtggtccc acctgacccc atgccgaact cagaagtgaa acgccgtagc gccgatggta    3900

gtgtggggtc tccccatgcg agagtaggga actgccaggc atcaaataaa acgaaaggct    3960

cagtcgaaag actgggcctt tcgttttatc tgttgtttgt cggtgaacgc tctcctgagt    4020

aggacaaatc cgccgggagc ggatttgaac gttgcgaagc aacggcccgg agggtggcgg    4080

gcaggacgcc cgccataaac tgccaggcat caaattaagc agaaggccat cctgacggat    4140

ggcctttttg cgtttctaca aactcttttt gtttattttt ctaaatacat tcaaatatgt    4200

atccgctcat gagacaataa ccctgataaa tgcttcaata atattgaaaa aggaagagta    4260

tgagtattca acatttccgt gtcgccctta ttcccttttt tgcggcattt tgccttcctg    4320

tttttgctca cccagaaacg ctggtgaaag taaaagatgc tgaagatcag ttgggtgcac    4380

gagtgggtta catcgaactg gatctcaaca gcggtaagat ccttgagagt tttcgccccg    4440

aagaacgttc tccaatgatg agcactttta aagttctgct atgtggcgcg gtattatccc    4500

gtgttgacgc cgggcaagag caactcggtc gccgcataca ctattctcag aatgacttgg    4560

ttgagtactc accagtcaca gaaaagcatc ttacggatgg catgacagta agagaattat    4620

gcagtgctgc cataaccatg agtgataaca ctgcggccaa cttacttctg acaacgatcg    4680

gaggaccgaa ggagctaacc gcttttttgc acaacatggg ggatcatgta actcgccttg    4740

atcgttggga accggagctg aatgaagcca taccaaacga cgagcgtgac accacgatgc    4800

ctgtagcaat ggcaacaacg ttgcgcaaac tattaactgg cgaactactt actctagctt    4860

cccggcaaca attaatagac tggatggagg cggataaagt tgcaggacca cttctgcgct    4920

cggcccttcc ggctggctgg tttattgctg ataaatctgg agccggtgag cgtgggtctc    4980

gcggtatcat tgcagcactg gggccagatg gtaagccctc ccgtatcgta gttatctaca    5040

cgacggggag tcaggcaact atggatgaac gaaatagaca gatcgctgag ataggtgcct    5100

cactgattaa gcattggtaa ctgtcagacc aagtttactc atatatactt tagattgatt    5160

taccccggtt gataatcaga aaagccccaa aaacaggaag attgtataag caaatattta    5220

aattgtaaac gttaatattt tgttaaaatt cgcgttaaat ttttgttaaa tcagctcatt    5280

ttttaaccaa taggccgaaa tcggcaaaat cccttataaa tcaaaagaat agcccgagat    5340

agggttgagt gttgttccag tttggaacaa gagtccacta ttaaagaacg tggactccaa    5400

cgtcaaaggg cgaaaaaccg tctatcaggg cgatggccca ctacgtgaac catcacccaa    5460

atcaagtttt ttggggtcga ggtgccgtaa agcactaaat cggaacccta aagggagccc    5520

ccgatttaga gcttgacggg gaaagccggc gaacgtggcg agaaaggaag ggaagaaagc    5580

gaaaggagcg ggcgctaggg cgctggcaag tgtagcggtc acgctgcgcg taaccaccac    5640

acccgccgcg cttaatgcgc cgctacaggg cgcgtaaaag gatctaggtg aagatccttt    5700

ttgataatct catgaccaaa atcccttaac gtgagttttc gttccactga gcgtcagacc    5760

ccgtagaaaa gatcaaagga tcttcttgag atcctttttt tctgcgcgta atctgctgct    5820

tgcaaacaaa aaaaccaccg ctaccagcgg tggtttgttt gccggatcaa gagctaccaa    5880

ctctttttcc gaaggtaact ggcttcagca gagcgcagat accaaatact gtccttctag    5940

tgtagccgta gttaggccac cacttcaaga actctgtagc accgcctaca tacctcgctc    6000

tgctaatcct gttaccagtg gctgctgcca gtggcgataa gtcgtgtctt accgggttgg    6060

actcaagacg atagttaccg gataaggcgc agcggtcggg ctgaacgggg ggttcgtgca    6120

cacagcccag cttggagcga acgacctaca ccgaactgag atacctacag cgtgagctat    6180

gagaaagcgc cacgcttccc gaagggagaa aggcggacag gtatccggta agcggcaggg    6240

tcggaacagg agagcgcacg agggagcttc cagggggaaa cgcctggtat ctttatagtc    6300

ctgtcgggtt tcgccacctc tgacttgagc gtcgattttt gtgatgctcg tcaggggggc    6360

ggagcctatg gaaaaacgcc agcaacgcgg cctttttacg gttcctggcc ttttgctggc    6420

cttttgctca catgttcttt cctgcgttat cccctgattc tgtggataac cgtattaccg    6480

cctttgagtg agctgatacc gctcgccgca gccgaacgac cgagcgcagc gagtcagtga    6540

gcgaggaagc ggaagagcgc ctgatgcggt attttctcct tacgcatctg tgcggtattt    6600

cacaccgcat atggtgcact ctcagtacaa tctgctctga tgccgcatag ttaagccagt    6660

atacactccg ctatcgctac gtgactgggt catggctgcg ccccgacacc cgccaacacc    6720

cgctgacgcg ccctgacggg cttgtctgct cccggcatcc gcttacagac aagctgtgac    6780

cgtctccggg agctgcatgt gtcagaggtt ttcaccgtca tcaccgaaac gcgcgaggca    6840

gctgcggtaa agctcatcag cgtggtcgtg cagcgattca cagatgtctg cctgttcatc    6900

cgcgtccagc tcgttgagtt tctccagaag cgttaatgtc tggcttctga taaagcgggc    6960

catgttaagg gcggtttttt cctgtttggt cacttgatgc ctccgtgtaa gggggaattt    7020

ctgttcatgg gggtaatgat accgatgaaa cgagagagga tgctcacgat acgggttact    7080

gatgatgaac atgcccggtt actggaacgt tgtgagggta aacaactggc ggtatggatg    7140

cggcgggacc agagaaaaat cactcagggt caatgccagc gcttcgttaa tacagatgta    7200

ggtgttccac agggtagcca gcagcatcct gcgatgcaga tccggaacat aatggtgcag    7260

ggcgctgact tccgcgtttc cagactttac gaaacacgga aaccgaagac cattcatgtt    7320

gttgctcagg tcgcagacgt tttgcagcag cagtcgcttc acgttcgctc gcgtatcggt    7380

gattcattct gctaaccagt aaggcaaccc cgccagccta gccgggtcct caacgacagg    7440

agcacgatca tgcgcacccg tggccaggac ccaacgctgc ccgaaatt                 7488

<210>2

<211>671

<212>PRT

<213>人工序列

<220>

<223>

<400>2

Thr Leu Asn Ile Glu Asp Glu His Arg Leu His Glu Thr Ser Lys Glu

1               5                   10                  15

Pro Asp Val Ser Leu Gly Ser Thr Trp Leu Ser Asp Phe Pro Gln Ala

            20                  25                  30

Trp Ala Glu Thr Gly Gly Met Gly Leu Ala Val Arg Gln Ala Pro Leu

        35                  40                  45

Ile Ile Pro Leu Lys Ala Thr Ser Thr Pro Val Ser Ile Lys Gln Tyr

    50                  55                  60

Pro Met Ser Gln Glu Ala Arg Leu Gly Ile Lys Pro His Ile Gln Arg

65                  70                  75                  80

Leu Leu Asp Ala Gly Ile Leu Val Pro Cys Gln Ser Pro Trp Asn Thr

                85                  90                  95

Pro Leu Leu Pro Val Lys Lys Pro Gly Thr Asn Asp Tyr Arg Pro Val

            100                 105                 110

Gln Asp Leu Arg Glu Val Asn Lys Arg Val Glu Asp Ile His Pro Thr

        115                 120                 125

Val Pro Asn Pro Tyr Asn Leu Leu Ser Gly Leu Pro Pro Ser His Gln

    130                 135                 140

Trp Tyr Thr Val Leu Asp Leu Lys Asp Ala Val Phe Cys Leu Arg Leu

145                 150                 155                 160

His Pro Thr Ser Gln Pro Leu Phe Ala Phe Glu Trp Arg Asp Pro Glu

                165                 170                 175

Met Gly Ile Ser Gly Gln Leu Thr Trp Thr Arg Leu Pro Gln Gly Phe

            180                 185                 190

Lys Asn Ser Pro Thr Leu Phe Asp Glu Ala Leu His Arg Asp Leu Ala

        195                 200                 205

Asp Phe Arg Ile Gln His Pro Asp Leu Ile Leu Leu Gln Tyr Val Asp

    210                 215                 220

Asp Leu Leu Leu Ala Ala Thr Ser Glu Leu Asp Cys Gln Gln Gly Thr

225                 230                 235                 240

Arg Ala Leu Leu Gln Thr Leu Gly Asn Leu Gly Tyr Arg Ala Ser Ala

                245                 250                 255

Lys Lys Ala Gln Ile Cys Gln Lys Gln Val Lys Tyr Leu Gly Tyr Leu

            260                 265                 270

Leu Lys Glu Gly Gln Arg Trp Leu Thr Glu Ala Arg Lys Glu Thr Val

        275                 280                 285

Met Gly Gln Pro Thr Pro Lys Thr Pro Arg Gln Leu Arg Glu Phe Leu

    290                 295                 300

Gly Thr Ala Gly Phe Cys Arg Leu Trp Ile Pro Gly Phe Ala Glu Met

305                 310                 315                 320

Ala Ala Pro Leu Tyr Pro Leu Thr Lys Thr Gly Thr Leu Phe Asn Trp

                 325                330                 335

Gly Pro Asp Gln Gln Lys Ala Tyr Gln Glu Ile Lys Gln Ala Leu Leu

            340                 345                 350

Thr Ala Pro Ala Leu Gly Leu Pro Asp Leu Thr Lys Pro Phe Glu Leu

        355                 360                 365

Phe Val Asp Glu Lys Gln Gly Tyr Ala Lys Gly Val Leu Thr Gln Lys

    370                 375                 380

Leu Gly Pro Trp Arg Arg Pro Val Ala Tyr Leu Ser Lys Lys Leu Asp

385                 390                 395                 400

Pro Val Ala Ala Gly Trp Pro Pro Cys Leu Arg Met Val Ala Ala Ile

                405                 410                 415

Ala Val Leu Thr Lys Asp Ala Gly Lys Leu Thr Met Gly Gln Pro Leu

            420                 425                 430

Val Ile Leu Ala Pro His Ala Val Glu Ala Leu Val Lys Gln Pro Pro

        435                 440                 445

Asp Arg Trp Leu Ser Asn Ala Arg Met Thr His Tyr Gln Ala Leu Leu

    450                 455                 460

Leu Asp Thr Asp Arg Val Gln Phe Gly Pro Val Val Ala Leu Asn Pro

465                 470                 475                 480

Ala Thr Leu Leu Pro Leu Pro Glu Glu Gly Leu Gln His Asn Cys Leu

                485                 490                 495

Asp Ile Leu Ala Glu Ala His Gly Thr Arg Pro Asp Leu Thr Asp Gln

            500                 505                 510

Pro Leu Pro Asp Ala Asp His Thr Trp Tyr Thr Asn Gly Ser Ser Leu

        515                 520                 525

Leu Gln Glu Gly Gln Arg Lys Ala Gly Ala Ala Val Thr Thr Glu Thr

    530                 535                 540

Glu Val Ile Trp Ala Lys Ala Leu Pro Ala Gly Thr Ser Ala Gln Arg

545                 550                 555                 560

Ala Glu Leu Ile Ala Leu Thr Gln Ala Leu Lys Met Ala Glu Gly Lys

                565                 570                 575

Lys Leu Asn Val Tyr Thr Asp Ser Arg Tyr Ala Phe Ala Thr Ala His

            580                 585                 590

Ile His Gly Glu Ile Tyr Arg Arg Arg Gly Leu Leu Thr Ser Glu Gly

        595                 600                 605

Lys Glu Ile Lys Asn Lys Asp Glu Ile Leu Ala Leu Leu Lys Ala Leu

    610                 615                 620

Phe Leu Pro Lys Arg Leu Ser Ile Ile His Cys Pro Gly His Gln Lys

625                 630                 635                 640

Gly His Ser Ala Glu Ala Arg Gly Asn Arg Met Ala Asp Gln Ala Ala

                645                 650                 655

Arg Lys Ala Ala Ile Thr Glu Thr Pro Asp Thr Ser Thr Leu Leu

            660                 665                 670

<210>3

<211>671

<212>PRT

<213>小鼠白血病病毒(Murine Leukemia Virus)

<400>3

Thr Leu Asn Ile Glu Asp Glu His Arg Leu His Glu Thr Ser Lys Glu

1               5                   10                  15

Pro Asp Val Ser Leu Gly Ser Thr Trp Leu Ser Asp Phe Pro Gln Ala

            20                  25                  30

Trp Ala Glu Thr Gly Gly Met Gly Leu Ala Val Arg Gln Ala Pro Leu

        35                  40                  45

Ile Ile Pro Leu Lys Ala Thr Ser Thr Pro Val Ser Ile Lys Gln Tyr

    50                  55                  60

Pro Met Ser Gln Glu Ala Arg Leu Gly Ile Lys Pro His Ile Gln Arg

65                  70                  75                  80

Leu Leu Asp Gln Gly Ile Leu Val Pro Cys Gln Ser Pro Trp Asn Thr

                85                  90                  95

Pro Leu Leu Pro Val Lys Lys Pro Gly Thr Asn Asp Tyr Arg Pro Val

            100                 105                 110

Gln Asp Leu Arg Glu Val Asn Lys Arg Val Glu Asp Ile His Pro Thr

        115                 120                 125

Val Pro Asn Pro Tyr Asn Leu Leu Ser Gly Leu Pro Pro Ser His Gln

    130                 135                 140

Trp Tyr Thr Val Leu Asp Leu Lys Asp Ala Phe Phe Cys Leu Arg Leu

145                 150                 155                 160

His Pro Thr Ser Gln Pro Leu Phe Ala Phe Glu Trp Arg Asp Pro Glu

                165                 170                 175

Met Gly Ile Ser Gly Gln Leu Thr Trp Thr Arg Leu Pro Gln Gly Phe

            180                 185                 190

Lys Asn Ser Pro Thr Leu Phe Asp Glu Ala Leu His Arg Asp Leu Ala

        195                 200                 205

Asp Phe Arg Ile Gln His Pro Asp Leu Ile Leu Leu Gln Tyr Val Asp

    210                 215                 220

Asp Leu Leu Leu Ala Ala Thr Ser Glu Leu Asp Cys Gln Gln Gly Thr

225                 230                 235                 240

Arg Ala Leu Leu Gln Thr Leu Gly Asn Leu Gly Tyr Arg Ala Ser Ala

                245                 250                 255

Lys Lys Ala Gln Ile Cys Gln Lys Gln Val Lys Tyr Leu Gly Tyr Leu

            260                 265                 270

Leu Lys Glu Gly Gln Arg Trp Leu Thr Glu Ala Arg Lys Glu Thr Val

        275                 280                 285

Met Gly Gln Pro Thr Pro Lys Thr Pro Arg Gln Leu Arg Glu Phe Leu

    290                 295                 300

Gly Thr Ala Gly Phe Cys Arg Leu Trp Ile Pro Gly Phe Ala Glu Met

305                 310                 315                 320

Ala Ala Pro Leu Tyr Pro Leu Thr Lys Thr Gly Thr Leu Phe Asn Trp

            325                 330                 335

Gly Pro Asp Gln Gln Lys Ala Tyr Gln Glu Ile Lys Gln Ala Leu Leu

            340                 345                 350

Thr Ala Pro Ala Leu Gly Leu Pro Asp Leu Thr Lys Pro Phe Glu Leu

        355                 360                 365

Phe Val Asp Glu Lys Gln Gly Tyr Ala Lys Gly Val Leu Thr Gln Lys

    370                 375                 380

Leu Gly Pro Trp Arg Arg Pro Val Ala Tyr Leu Ser Lys Lys Leu Asp

385                 390                 395                 400

Pro Val Ala Ala Gly Trp Pro Pro Cys Leu Arg Met Val Ala Ala Ile

                405                 410                 415

Ala Val Leu Thr Lys Asp Ala Gly Lys Leu Thr Met Gly Gln Pro Leu

            420                 425                 430

Val Ile Leu Ala Pro His Ala Val Glu Ala Leu Val Lys Gln Pro Pro

        435                 440                 445

Asp Arg Trp Leu Ser Asn Ala Arg Met Thr His Tyr Gln Ala Leu Leu

    450                 455                 460

Leu Asp Thr Asp Arg Val Gln Phe Gly Pro Val Val Ala Leu Asn Pro

465                 470                 475                 480

Ala Thr Leu Leu Pro Leu Pro Glu Glu Gly Leu Gln His Asn Cys Leu

                485                 490                 495

Asp Ile Leu Ala Glu Ala His Gly Thr Arg Pro Asp Leu Thr Asp Gln

            500                 505                 510

Pro Leu Pro Asp Ala Asp His Thr Trp Tyr Thr Asp Gly Ser Ser Leu

        515                 520                 525

Leu Gln Glu Gly Gln Arg Lys Ala Gly Ala Ala Val Thr Thr Glu Thr

    530                 535                 540

Glu Val Ile Trp Ala Lys Ala Leu Pro Ala Gly Thr Ser Ala Gln Arg

545                 550                 555                 560

Ala Glu Leu Ile Ala Leu Thr Gln Ala Leu Lys Met Ala Glu Gly Lys

                565                 570                 575

Lys Leu Asn Val Tyr Thr Asp Ser Arg Tyr Ala Phe Ala Thr Ala His

            580                 585                 590

Ile His Gly Glu Ile Tyr Arg Arg Arg Gly Leu Leu Thr Ser Glu Gly

        595                 600                 605

Lys Glu Ile Lys Asn Lys Asp Glu Ile Leu Ala Leu Leu Lys Ala Leu

    610                 615                 620

Phe Leu Pro Lys Arg Leu Ser Ile Ile His Cys Pro Gly His Gln Lys

625                 630                 635                 640

Gly His Ser Ala Glu Ala Arg Gly Asn Arg Met Ala Asp Gln Ala Ala

                645                 650                 655

Arg Lys Ala Ala Ile Thr Glu Thr Pro Asp Thr Ser Thr Leu Leu

            660                 665                 670

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号